Cây khai thác FCIs

Một phần của tài liệu Luận văn Thạc sĩ Công nghệ thông tin: Khai thác dàn tập phổ biến đóng sử dụng cấu trúc DSBV (Trang 44 - 47)

 APNL {CM, D} CML {D, P, N} DNL { P } PL { N } NL { } L { } APNLCM {D} APNLD {} CMLDN {P} CMLP {N} CMLN {} DNLP {} PNL {} APNLCMD {} CMLDNP {} CMLPN {} Tập Khơng phổ biến Tập Khơng đĩng Tập đĩng

34

Bước 5:

Tập các bao đĩng phổ biến tối tiểu được xác định cho một tập đĩng C từ cấu trúc DSBV của nĩ bằng cách áp dụng các chiến lược thảo luận trong phần 5.2.1. C được liên kết với các bao đĩng tối tiểu như một nút cha trong Dàn. Do khơng cịn FCI mới nào cĩ thể được khai thác từ “APNLCM” và cũng khơng cịn bao đĩng của “APNLCM”. Do đĩ "APNLCM" được chèn vào Dàn như một nút đầu tiên (hình 3.3).

Bước 6:

Để truyền thơng tin bao đĩng lên phía các FCIs được khai thác, cho đến thời điểm này, mọi tập phổ biến đĩng Ck+1 đều cập nhật DSBV về việc thu thập các tập đĩng Ck bằng DSBV riêng của nĩ. Nĩ cũng phải cập nhật DSBV cho các hạng mục của SLCk.

Bước 7:

Nhảy đến bước 3 và lặp lại các bước trên để hồn tất việc lấy tất cả các tập đĩng cho tất cả các nhánh. Xem xét mỗi tập đĩng của cây khai thác FCI theo thứ tự ngang để xác định mối quan hệ giữa cha và con của Dàn các tập đĩng theo cách từ dưới lên. Quay trở lại bước 3 và mơ phỏng các bước trên bằng cách sử dụng ví dụ hiện tại như sau:

"APNL" được kết hợp với mục thứ hai ("D") của nSL"APNL" cho ra “APNLD”. DBV và DSBV của nĩ được xác định bằng DBV"APNLD" = DBV"APNL" ∩ DBVD = {0, {29}} ∩ {0, {53}} = {0, {21}} và DSBV"APNLD" = . "APNLD" được chèn vào Dàn làm nút thứ hai và nhánh bắt đầu với "APNL" cũng sẽ kết thúc vì khơng cịn hạng mục nào trong nSL"APNL". Các tập hợp đĩng "APNLD" và "APNLCM" được xác định từ "APNL" của DSBV là các bao đĩng tối tiểu của "APNL" theo các chiến lược đã được định nghĩa. Sau đĩ, "APNL" được liên kết với các nút cĩ chứa các bao đĩng tối tiểu này trong Dàn như minh họa trong bước 5.

Tương tự, tập đĩng "CML" được khai thác bằng cách subsuming "CM" với "L" và danh sách non - subsuming của nĩ, nSL"CML" = {"D", "P", "N"} được xác định. "CMLDN" được khai thác từ "CML" theo cách đệ quy. Khơng thể mở rộng "CMLDN" với mục "P" ∈ nSIL"CMLDN" bởi vì độ hỗ trợ của "CMLDNP" nằm dưới minSup và

35

"CMLDN" được chèn vào Dàn. Tuy nhiên, "CMLP" được khai thác như một tập phổ biến đĩng với DSBV tương ứng là DSBV"CMLP" = DSBV"CML" ∩ DSBV"P" = {0, {24}} ∩ {0, {53}} = {0, {16}} và nĩ được coi là đĩng bởi vì sup(“CMLP”) ≠ sup(“APNLCM”), với “APNLCM” là tập bao của “CMLP”.

Mặc dù, tập phổ biến "CMLPN" được lấy từ việc mở rộng "CMLP" với "N", nĩ được coi là một tập khơng đĩng vì "APNLCM" là tập bao của "CMLPN" mà sup ("CMLPN" ) = sup ("APNLCM"). Vì vậy, "CMLPN" bị loại bỏ như là một tập khơng đĩng từ cây khai thác FCI (minh họa trong hình 3.2).

Một FCI khác là "CMLN", được phát hiện từ "CML" sau khi khai thác DBV“CMLN " và DSBV“CMLN". Trong khi chèn "CMLDN", "CMLP" và "CMLN" vào Dàn, chỉ "CMLN" được liên kết với "CMLDN" như một nút cha. Sau đĩ "CML" được đưa vào Dàn như một nút cha cho cả hai nút "CMLP" và "CMLN" bởi vì "CMLP" và "CMLN" được xác định là các bao đĩng tối tiểu của“CML” bằng các chiến lược được mơ tả trong Phần 5.2.2. Các tập đĩng cịn lại "DNL", "PL", "NL" và "L" được khai thác và do đĩ được chèn vào Dàn bằng cách duy trì quan hệ cha - con phù hợp theo hướng từ dưới lên.

Bước 8:

Output là các FCIs với Dàn của nĩ là L và thốt. Hình 3.2 minh họa việc khai thác tất cả các tập phổ biến đĩng và Hình 3.3 cho thấy tất cả các bước trung gian của việc thiết lập các mối quan hệ giữa các tập đĩng trong Dàn.

36

Một phần của tài liệu Luận văn Thạc sĩ Công nghệ thông tin: Khai thác dàn tập phổ biến đóng sử dụng cấu trúc DSBV (Trang 44 - 47)

Tải bản đầy đủ (PDF)

(72 trang)