Thuật toán xây dựng cây CUFP-Tree

Một phần của tài liệu Luật kết hợp mờ và ứng dụng đối với một số bài toán dự báo (Trang 48 - 49)

Đầu vào: CSDL D với tập thuộc tính I và tập bản ghi T, độ hỗ trợ tối thiểu

fminsup và độ tin cậy tối thiểu fminconf.

Đầu ra:Cây CUFP-Tree .

Thuật toán được thực hiện theo các bước sau[19], [20]:

Bƣớc 1.Mờ hoá các thuộc tính mờ trong CSDL[18].

Bƣớc 2.Duyệt CSDL được hoàn thành trong Bước 1, để tính độ hỗ trợ

expCount(I) và tần suất xuất hiện f(I). Tần suất xuất hiện f(I) là số giao dịch chứa I có giá trị khác không.

expCount(I) được tính theo công thức sau:

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

Với n là số giao dịch trong CSDL, P(x, ) là xác suất tồn tạicủa một itemxtrongmộtgiao dịch .

Bƣớc 3.Dựa vào độ hỗ trợ expCount(I) được xác định trong Bước 2. Nếu độ hỗ trợ có giá trị lớn hơn hoặc bằngfminsup, đưaIvào tập phổ biến .

(2.16)

Bƣớc 4.Sắp xếp các item trong theo chiều giảm dần của tần suất xuất hiện f(I)

của I.

Bƣớc 5.Dựa vào , xây dựng Header_Table gồm: Item, expCount, và tần suất xuất hiện của item. Sắp xếp các item như trongBước 4.

Bƣớc 6.Khởi tạo cây CUFP-Treecó gốc là Null.

Bƣớc 7.Duyệt CSDL thu được trong Bước 1, loại bỏ các item không có trong . Sắp xếp các item trong các giao dịch như trongBước 4.

Bƣớc 8.Chèn các giao dịch đã được sắp xếp vào cây CUFP-Treetheo các bước sau:

Bƣớc 8.1. Nếu item I trong giao dịch xuất hiên là một phần tử đã tồn tại trên cây CUFP-Tree. Tính toán các giá trị: Nhân giá trị của item I với giá trị của các item của nút cha, sau đó cộng với các giá trị của phần tử tương ứng của mảng (gọi là mảng

expArr).

Bƣớc 8.2. Ngược lại, thêm một nút mới tương ứng vào cây. Tính toán các giá trị:

Nhân giá trị của item I với giá trị của các item của nút cha, sau đó cộng với các giá trị của phần tử tương ứng của mảng (gọi là mảng expArr). Chèn liên kết tương tư như trong thuật toán FP-tree [9].

Kết thúc các bước trên thu được cây CUFP-Tree .

Một phần của tài liệu Luật kết hợp mờ và ứng dụng đối với một số bài toán dự báo (Trang 48 - 49)

Tải bản đầy đủ (PDF)

(72 trang)