Đầu vào thuật toán là CSDL trọng số D và minws. Dòng 1, P đƣợc gán
bằng . Từ dòng 2 đến dòng 4, P bằng tập 1-itemset thỏa mãn minws. Dòng 5, gọi hàm IWS-tree để tạo cây IWS-tree theo thuật tốn 3 ở Hình 2.3.
Sau đây là một ví dụ khai thác FWI trên CSDL trọng số theo thuật tốn IWS_FWI.
Ví dụ 2.7: Khai thác FWI trên CSDL DB trong ví dụ 1.3 với minws =
0,4. IWS và ws của các mục đƣợc xác định nhƣ trong Bảng 2.6.
Bảng 2.6. IWS của các mục
mục Tidset BitTable IWS ws
A 1, 3, 4, 5 000111012 {1(29)} 0,72
B 1, 2, 3, 4, 5, 6 001111112 {1(63)} 1,00
C 2, 4, 5, 6 001110102 {1(58)} 0,60
D 1, 3, 5, 6 001101012 {1(53)} 0,78
E 1, 2, 3, 4, 5 000111112 {1(31} 0,81
Trong ví dụ này, mỗi IWS chỉ có một đoạn với một phần tử duy nhất. Các giá trị ws của mục thỏa mãn minws. Do vậy, P = {A, B, C, D, E} và A, B,
C, D, E đƣợc thêm vào IWS-tree. Thuật toán đệ quy IWS_tree() đƣợc thực
hiện nhƣ sau: Với nút A:
Hình 2.5. IWS-tree với nút A (minws = 0,4)
[] 𝐴 } 𝐴𝐴𝐵 } 𝐴𝐷 } 𝐴𝐸 } 𝐴𝐵𝐷 } 𝐴𝐵𝐸 } 𝐴𝐷𝐸 } 𝐴𝐵𝐷𝐸 } 𝐴𝐵𝐶 } 𝐵 } 𝐶 } 𝐷 } 𝐸 }
Kết nối hai nút A và B. Ta có, IWS(A) IWS(B) = {1(29)}
{1(63)}, do đó IWS(AB) = {1(29)}. Dựa trên thuật tốn 2.2, ta có ws(AB)
= ws(A) = 0,72 minws, nên AB đƣợc thêm vào IWS-tree.
Tiếp theo, kết nối A và C. IWS(A) IWS(C) = {1(29)} {1(58)}, nên
IWS(AC) = {1(24)}. Do ws(AC) = 0,32 minws, nên AC không đƣợc thêm
vào IWS-tree.
Tƣơng tự nhƣ trên, các tập mục {AD, AE, ABC, ABD, ABE, ABDE} đƣợc thêm vào IWS-tree nhƣ trong Hình 2.5.
Với nút B:
Hình 2.6. IWS-tree với nút A và B (minws = 0,4)
Kết nối hai nút B và C. Ta có, IWS(B) IWS(C) = {1(63)}
{1(58)}, nên IWS(BC) = {1(29)}. Do ws(BC) = 0,72 minws, nên BC
đƣợc chèn vào IWS-tree.
Tiếp theo, kết nối B và D. Ta có, IWS(B) IWS(D) = {1(63)}
{1(53)}, nên IWS(BD) = {1(53)}. Do, ws(BD) = 0,78 minws, nên BD
đƣợc thêm vào IWS-tree.
Tƣơng tự, các tập mục {BE, BDE} đƣợc thêm vào IWS-tree nhƣ trong Hình 2.6.
Sau khi xét tƣơng tự với các nút C, D và E còn lại, IWS-tree đầy đủ đƣợc thể hiện nhƣ trong Hình 2.7. [] 𝐴 } 𝐵 } 𝐴𝐴𝐵 } 𝐴𝐷 } 𝐴𝐸 } 𝐵𝐶 } 𝐵𝐷 } 𝐵𝐸 } 𝐴𝐵𝐷 } 𝐴𝐵𝐸 } 𝐴𝐷𝐸 } 𝐴𝐵𝐷𝐸 } 𝐴𝐵𝐶 } 𝐵𝐷𝐸 }
Nhƣ vậy, với minws = 0,4 ta có tập các FWI theo: {A, B, C, D, E, AB, AD, AE, BC, BD, BE, DE, ABD, ABE, ADE, BDE, ABDE}.