.10 Cấu trúc cây SOTrieIT

Một phần của tài liệu Phát triển thuật toán khai phá luật kết hợp dựa vào sự phân lớp dữ liệu (Trang 34 - 35)

Thuật tốn RARM tìm các tập mục dữ liệu thường xuyên theo các bước: Đầu tiên tạo SOTrieIT cho tất cả các mục dữ liệu, sau đó dùng thủ tục RARM để tìm tập mục dữ liệu thường xuyên theo ngưỡng S0 tùy ý.

Tạo SOTrieIT

SOTrieIT được tạo theo các bước:

Bước 1: Tạo nút gốc Root và n nút mức 1 ứng với n mục dữ liệu, gán số đếm

Bước 2: Duyệt qua cơ sở dữ liệu, ứng với mỗi giao tác, ta thực hiện:

- Duyệt qua các nút mức 1 của cây, tăng số đếm lên 1 tại những nút có mục dữ liệu xuất hiện trong giao tác.

- Tổ hợp các mục dữ liệu trong giao tác thành các cặp 2 mục dữ liệu, các phần tử trong cặp được xếp theo thứ tự xuất hiện trong danh mục các mục dữ liệu. Chèn từng cặp 2 mục dữ liệu này vào cây như sau: Tìm nút mức 1 có tên là tên mục dữ liệu thứ nhất trong cặp, xem tại nút này có nút con mức 2 có mục dữ liệu trùng với mục dữ liệu thứ hai trong cặp hay khơng. Nếu đã có thì tăng số đếm của nút con này lên 1, ngược lại, tạo một nút con mức 2, gán mục dữ liệu là mục dữ liệu thứ hai và có số đếm là 1.

Bước 3: Sắp xếp lại cây: Các nút mức 1 từ trái sang phải theo thứ tự giảm

dần của số đếm của mục dữ liệu. Trên mỗi nhánh con, sắp xếp các nút mức 2 từ trái sang phải theo thứ tự giảm dần của số đếm của mục dữ liệu.

Với dữ liệu ở bảng 1.1, tạo được cây SOTrieIT như sau:

Một phần của tài liệu Phát triển thuật toán khai phá luật kết hợp dựa vào sự phân lớp dữ liệu (Trang 34 - 35)

Tải bản đầy đủ (PDF)

(63 trang)