0
Tải bản đầy đủ (.ppt) (76 trang)

phần tử có một trọng số và trọng số này giảm theo thời gian Các phần tử cũ hơn đóng góp

Một phần của tài liệu BÁO CÁO TỐT NGHIỆP NGHIÊN CỨU BỘ LỌC BLOOM VÀ ỨNG DỤNG (Trang 52 -57 )

theo thời gian. Các phần tử cũ hơn đóng góp

trọng số ít hơn tới tần số phần tử đó.

• Mô hình này thích hợp với các ứng dụng trong đó dữ liệu cũ có tác động vào kết quả khai phá,

đó dữ liệu cũ có tác động vào kết quả khai phá,

nhưng tác động này giảm theo thời gian.

c. Bộ đếm phân rã theo thời gian

• Bộ đếm phân rã theo thời gian hay còn gọi đơn giản là bộ đếm phân rã là một bộ đếm mà giá trị

giản là bộ đếm phân rã là một bộ đếm mà giá trị

của nó phân rã theo từng giai đoạn.

• Giá trị của bộ đếm giảm theo một hàm không âm, không tăng, gọi là hàm phân rã theo thời

âm, không tăng, gọi là hàm phân rã theo thời

gian (TDF). Một hàm TDF phải thoã mãn các

điều kiện sau:

» = 1

» là hàm không tăng» 0 ≤ ≤ 1 với mọi t ≥ 0

» 0 ≤ ≤ 1 với mọi t ≥ 0

)

0

(

φ

)

0

(

φ

)

0

(

φ

• Đặt f

e

là bộ đếm tần số của phần tử e trong S cho đến thời điểm hiện tại, t. Đặt f

e

(i) là bộ đếm

cho đến thời điểm hiện tại, t. Đặt f

e

(i) là bộ đếm

tần số của phần tử e từ t

i-1

đến t

i

.

• Ta có: . Do đó, giá trị phân rã của bộ đếm của phần tử e là:

đếm của phần tử e là:

• Cohen đã đưa ra các loại hàm TDF. Trong phần này chúng ta chọn hàm TDF là hàm mũ (đây là

này chúng ta chọn hàm TDF là hàm mũ (đây là

=

=

i i e e

f

f

( )

=

n i i e i e

t f

f

1 ) ( *

φ( ).

• T và λ là các tham số quyết định tốc độ phân rã của bộ đếm.

của bộ đếm.

• T là khoảng thời gian giữa 2 lần thực hiện hàm. Một khoảng thời gian T được đề cập đến như là

Một khoảng thời gian T được đề cập đến như là

một kỷ nguyên.

• Tham số λ € [0, 1], được gọi là hằng số phân rã hàm mũ hay đơn giản là hằng số phân rã, nó

hàm mũ hay đơn giản là hằng số phân rã, nó

điều khiển tốc độ phân rã theo hàm mũ.

• ESBF là cấu trúc cải tiến và mở rộng của CBF, đã khắc phục được tính không linh hoạt trong cách sử dụng bộ nhớ khi phân phối dữ liệu có độ lệch cao và tăng tốc độ truy cập bộ nhớ.

• Bộ lọc ESBF bao gồm một chuỗi EBF và số bộ lọc EBF trong ESBF có thể thay đổi.

• ESBF có thể bao gồm 1 hoặc nhiều EBF. Khi EBF hiện tại trong ESBF đầy so với giới hạn khả năng của nó thì thêm một EBF mới vào trong ESBF.

d. Bộ lọc ESBF

Một phần của tài liệu BÁO CÁO TỐT NGHIỆP NGHIÊN CỨU BỘ LỌC BLOOM VÀ ỨNG DỤNG (Trang 52 -57 )

×