Thuật tốn tính wus dựa trênMBiS

Một phần của tài liệu (LUẬN án TIẾN sĩ) phát triển một số thuật toán hiệu quả khai thác tập mục trên cơ sở dữ liệu có sự phân cấp các mục (Trang 69 - 71)

Việc tính wus của tập mục dựa trên MBiS rất đơn giản, do cấu trúc

MBiS lƣu các đầu và cuối đoạn bit 1 liên tiếp trên bit-vector. Do đó chỉ cần độ phức tạp O(1) để xác định các ID giao dịch. Nên độ phức tạp thuật toán

CALCULATION_WUS() là O(k) với k là số lƣợng các giao dịch chứa X. Nói

cách khác k chính là tổng số bit 1 trên bit-vector của tập mục X.

2.2.3.3. Thuật toán MBiS-FWUI

Lớp trên cùng (mức 0) của MBiS-tree đƣợc kí hiệu là []. Lớp thứ nhất chứa các 1-itemset thỏa mãn minwus. Mức thứ k chứa các k-itemset thỏa mãn

minwus.

Mỗi mức của MBiS-tree chứa các lớp tƣơng đƣơng, mỗi lớp tƣơng đƣơng đƣợc tạo thành từ một mục cha ở mức trên kết hợp lần lƣợt với các nút cùng lớp tƣơng đƣơng của mục cha đó. Các nút trong cùng một lớp tƣơng đƣơng chỉ khác nhau phần tử cuối cùng. Mức k chứa các k-itemset đƣợc tạo từ sự kết hợp các cặp nút từ mức (k - 1) gồm các (k - 1)-itemset. Mỗi nút đƣợc

thêm vào MBiS-tree nếu giá trị wus của tập mục đó minwus. Do vậy, MBiS-tree chứa tất cả các FWUI khai thác theo ngƣỡng minwus.

Quá trình xây dựng MBiS-tree theo mơ tả trên đƣợc trình bày bằng thuật tốn MBiS-FWUI.

Thuật tốn 2.7: MBiS_FWUI

Input: CSDL BD vàminwus;

Output: MBiS-tree chứa tất cả FWUI thỏa mãn minwus của DB Method name: MBiS_FWUI()

1 2 3 4 5 6 7 8 9 10 11 12 13 14 MBiS_FWUI() [] = j I|wus_ j minwus; MBiS-tree = ; P = ; FWUI_MINE(P); FWUI_mine( [P]) for all li P] do [Pi] = ;

for all lj [P], (with j i) do

X = li lj;

Y =INTERSECTION_MBiS(MBiS(li), MBiS(lj)); wus_X = CALCULATION_WUS(Y);

if (wus_X minwus) then

[Pi] = [Pi] {(X, Y, wus_X)}; MBiS-tree = MBiS-tree [Pi];

FWUI_MINE( [Pi])

Hình 2.24. Thuật toán khai thác FWUI dựa trên MBiS-tree

Đầu vào của thuật toán MBiS-FWUI là CSDL số lƣợng DB và minwus. Trƣớc hết, CSDL đƣợc quét một lần để tính wus của các mục (dịng 2), các

mục thỏa mãn minwus đƣợc đƣa vào mức 0 của MBiS (dòng 3). Từ dòng 6

đến dòng 9, kết nối một nút với các nút sau đó (j > i) trong cùng một lớp

theo thuật tốn 2.5. Dịng 11 tính wus theo thuật tốn 2.6. Dịng 12, tập mục X đƣợc kết nạp vào lớp Pi nếu thỏa mãn minwus. Dòng 13, lớp tƣơng đƣơng Pi

đƣợc kết nạp vào MBiS-tree. Cuối cùng, dòng 14 gọi đệ qui với lớp Pi.

2.2.4. Kết quả thực nghiệm

CSDL thực nghiệm và môi trƣờng thực nghiệm nhƣ trong mục 2.1.4. Số lƣợng cho các mục xuất hiện trong các giao dịch đƣợc thêm bằng cách sinh ngẫu nhiên trong khoảng từ 1 đến 10 đối với các CSDL: RETAIL, BMS-POS, CONNECT, ACCIDENTS.

Sau đây là hình các kết quả thực nghiệm với cấu trúc MBiS đƣợc sử dụng trong thuật toán MBiS_FWUI so sánh với các thuật toán khi cài đặt bằng cấu trúc DBV và DIFFSET.

2.2.4.1. So sánh thời gian thực thi:

Một phần của tài liệu (LUẬN án TIẾN sĩ) phát triển một số thuật toán hiệu quả khai thác tập mục trên cơ sở dữ liệu có sự phân cấp các mục (Trang 69 - 71)

Tải bản đầy đủ (PDF)

(120 trang)