Thuật toán khai thác FWI dựa trên IWS-tree

Một phần của tài liệu (LUẬN án TIẾN sĩ) phát triển một số thuật toán hiệu quả khai thác tập mục trên cơ sở dữ liệu có sự phân cấp các mục (Trang 57 - 60)

Đầu vào thuật toán là CSDL trọng số D và minws. Dòng 1, P đƣợc gán

bằng . Từ dòng 2 đến dòng 4, P bằng tập 1-itemset thỏa mãn minws. Dòng 5, gọi hàm IWS-tree để tạo cây IWS-tree theo thuật tốn 3 ở Hình 2.3.

Sau đây là một ví dụ khai thác FWI trên CSDL trọng số theo thuật tốn IWS_FWI.

Ví dụ 2.7: Khai thác FWI trên CSDL DB trong ví dụ 1.3 với minws =

0,4. IWS và ws của các mục đƣợc xác định nhƣ trong Bảng 2.6.

Bảng 2.6. IWS của các mục

mục Tidset BitTable IWS ws

A 1, 3, 4, 5 000111012 {1(29)} 0,72

B 1, 2, 3, 4, 5, 6 001111112 {1(63)} 1,00

C 2, 4, 5, 6 001110102 {1(58)} 0,60

D 1, 3, 5, 6 001101012 {1(53)} 0,78

E 1, 2, 3, 4, 5 000111112 {1(31} 0,81

Trong ví dụ này, mỗi IWS chỉ có một đoạn với một phần tử duy nhất. Các giá trị ws của mục thỏa mãn minws. Do vậy, P = {A, B, C, D, E} và A, B,

C, D, E đƣợc thêm vào IWS-tree. Thuật toán đệ quy IWS_tree() đƣợc thực

hiện nhƣ sau:  Với nút A:

Hình 2.5. IWS-tree với nút A (minws = 0,4)

[] 𝐴 } 𝐴𝐴𝐵 } 𝐴𝐷 } 𝐴𝐸 } 𝐴𝐵𝐷 } 𝐴𝐵𝐸 } 𝐴𝐷𝐸 } 𝐴𝐵𝐷𝐸 } 𝐴𝐵𝐶 } 𝐵 } 𝐶 } 𝐷 } 𝐸 }

Kết nối hai nút A B. Ta có, IWS(A) IWS(B) = {1(29)}

{1(63)}, do đó IWS(AB) = {1(29)}. Dựa trên thuật tốn 2.2, ta có ws(AB)

= ws(A) = 0,72 minws, nên AB đƣợc thêm vào IWS-tree.

Tiếp theo, kết nối A và C. IWS(A) IWS(C) = {1(29)} {1(58)}, nên

IWS(AC) = {1(24)}. Do ws(AC) = 0,32 minws, nên AC không đƣợc thêm

vào IWS-tree.

Tƣơng tự nhƣ trên, các tập mục {AD, AE, ABC, ABD, ABE, ABDE} đƣợc thêm vào IWS-tree nhƣ trong Hình 2.5.

Với nút B:

Hình 2.6. IWS-tree với nút A và B (minws = 0,4)

Kết nối hai nút B C. Ta có, IWS(B) IWS(C) = {1(63)}

{1(58)}, nên IWS(BC) = {1(29)}. Do ws(BC) = 0,72 minws, nên BC

đƣợc chèn vào IWS-tree.

Tiếp theo, kết nối B D. Ta có, IWS(B) IWS(D) = {1(63)}

{1(53)}, nên IWS(BD) = {1(53)}. Do, ws(BD) = 0,78 minws, nên BD

đƣợc thêm vào IWS-tree.

Tƣơng tự, các tập mục {BE, BDE} đƣợc thêm vào IWS-tree nhƣ trong Hình 2.6.

Sau khi xét tƣơng tự với các nút C, D và E còn lại, IWS-tree đầy đủ đƣợc thể hiện nhƣ trong Hình 2.7. [] 𝐴 } 𝐵 } 𝐴𝐴𝐵 } 𝐴𝐷 } 𝐴𝐸 } 𝐵𝐶 } 𝐵𝐷 } 𝐵𝐸 } 𝐴𝐵𝐷 } 𝐴𝐵𝐸 } 𝐴𝐷𝐸 } 𝐴𝐵𝐷𝐸 } 𝐴𝐵𝐶 } 𝐵𝐷𝐸 }

Nhƣ vậy, với minws = 0,4 ta có tập các FWI theo: {A, B, C, D, E, AB, AD, AE, BC, BD, BE, DE, ABD, ABE, ADE, BDE, ABDE}.

Một phần của tài liệu (LUẬN án TIẾN sĩ) phát triển một số thuật toán hiệu quả khai thác tập mục trên cơ sở dữ liệu có sự phân cấp các mục (Trang 57 - 60)

Tải bản đầy đủ (PDF)

(120 trang)