Một số ký hiệu

Một phần của tài liệu 28042_1712202001920798LVNguyenHoangNhat (Trang 39 - 40)

7. Bố cục luận văn

2.1.1.Một số ký hiệu

DB: CSDL ban đầu

L : Tập hợp các tập phổ biến trong CSDL ban đầu. Lk : Tập large k-itemset trong DB.

s : Độ hỗ trợ tối thiểu

D : số lượng các giao dịch trong DB.

X.supportD : số lượng các giao dịch trong DB chứa X.

X.supportd : số lượng các giao dịch trong db chứa X. X.supportUD: số lượng các giao dịch trong DBdb chứa X. db : CSDL được thêm vào CSDL ban đầu.

d : số lượng các giao dịch trong db.

L : tập hợp các tập phổ biến trong CSDL DBdb

k

L : tập large k-itemset trong DBdb.

Một tập X là tập phổ biến trong CSDL DBdb nếu X.support ≥ s×(D+d)

Như vậy sẽ có 4 trường hợp xảy ra khi thêm các giao dịch mới vào CSDL.

Trường hợp 1: Một itemset là phổ biến (large) trong CSDL ban đầu và trong

các giao dịch được thêm vào.

Trường hợp 2: Một itemset là phổ biến (large) trong CSDL ban đầu nhưng là

không phổ biến (small) trong các giao dịch được thêm vào.

Trường hợp 3: Một itemset là không phổ biến (small) trong CSDL ban đầu nhưng là phổ biến (large) trong các giao dịch được thêm vào.

Trường hợp 4: Một itemset là không phổ biến (small) trong CSDL ban đầu và

trong các giao dịch được thêm vào.

Nhận xét: Trường hợp 1 thì itemset đó vẫn sẽ phổ biến trong CSDL sau khi được

cập nhật, trường hợp 4 thì itemset đó vẫn sẽ không phổ biến trong CSDL sau khi được cập nhật, do đó trường hợp 1 và 4 sẽ không ảnh hưởng đến kết quả của tập phổ biến khai phá được. Trường hợp 2 có thể sẽ loại bỏ đi một số itemset đã tồn tại trong tập phổ biến của CSDL gốc, còn trường hợp 3 có thể sẽ bổ xung thêm một số itemset mới vào tập phổ biến đã được khai phá. Một thuật toán quản lý tốt tập phổ biến đã được khai phá trong trường hợp các giao dịch mới được thêm vào phải làm được một số công việc sau.

- Đánh giá xem các các itemset thuộc tập phổ biến (large itemset) trong CSDL ban đầu có còn phổ biến (large) trong CSDL sau khi được cập nhật hay không. - Tìm các itemset thuộc tập không phổ biến (small itemset) trong CSDL ban đầu có thể trở thành phổ biến (large) trong CSDL sau khi được cập nhật.

- Tìm những itemset chỉ xuất hiện trong những giao dịch được thêm vào và xác định xem chúng có phổ biến (large) trong CSDL sau khi được cập nhật không.

Một phần của tài liệu 28042_1712202001920798LVNguyenHoangNhat (Trang 39 - 40)