Nhận xét thuật toán COUI-Mine1

Một phần của tài liệu khai phá tập mục thường xuyên lợi ích cao trong cơ sở dữ liệu (Trang 54 - 55)

- Thuật toán COUI-Mine1 khai phá tập mục lợi ích cao với tối đa là ba lần duyệt cơ sở dữ liệu : hai lần để xây dựng cây TWUI-tree và một lần để tìm tập mục lợi ích cao từ tập các ứng viên lợi ích TWU cao. Quá trình khai phá chia thành hai bƣớc giống ý tƣởng của thuật toán Hai pha do Y.Liu đề xuất nhƣng hiệu quả hơn. Thuật toán không sinh ra khối lƣợng khổng lồ các ứng viên nhƣ thuật toán Hai pha do phƣơng pháp tìm các tập mục lợi ích TWU cao đƣợc giải quyết theo cách các giao tác cùng lợi ích TWU của nó đƣợc nén lên cây TWUI-tree, sau đó khai phá cây này hiệu quả theo ý tƣởng của thuật toán COFI-tree.

- Cây TWUI-tree có cấu trúc giống cây FP-tree, trƣờng độ hỗ trợ trong các nút của cây FP-tree đƣợc thay thành lợi ích TWU của mục dữ liệu, do đó có thể coi kích thƣớc của mỗi nút của hai cây là nhƣ nhau, kích thƣớc của hai cây về cơ bản giống nhau.CâyTWUI-tree có cấu trúc đơn giản, dễ dàng xây dựng và xử lý.

- Các cây COUI-tree thực chất là kết quả chiều của cây TWUI-tree cho từng mục dữ liệu. Cây COUI-tree của mục dữ liệu x biểu diễn các mục dữ liệu có lợi ích TWU lớn hơn hoặc bằng lợi ích TWU của x và cùng xuất hiện với x trong ít nhất một giao tác của cơ sở dữ liệu. Cách làm này đã chia bài toán thành nhiều bài toán nhỏ đơn giản hơn.

- Thuật toán COUI-Mine1 đƣợc phát triển dựa trên cấu trúc cây FP-tree và phƣơng pháp khai phá của thuật toán COUI-Mine1 nên chắc chắn đảm bảo tính dừng và hiệu quả.

Với những nhận xét trên và qua kết quả thử nghiệm có thể kết luận thuật toán COUI-Mine1 là một thuật toán hiệu quả để khai phá tập mục lợi ích cao.

Một phần của tài liệu khai phá tập mục thường xuyên lợi ích cao trong cơ sở dữ liệu (Trang 54 - 55)

Tải bản đầy đủ (PDF)

(88 trang)