Phương pháp tổng quát

Một phần của tài liệu Đồ án tốt nghiệp đại học nghiên cứu các thuật toán khai phá luật kết hợp có trọng số và ứng dụng (Trang 45 - 47)

b. Thuật toán sinh luật nhanh

2.3.2Phương pháp tổng quát

Dễ dàng nhận thấy, độ hỗ trợ của một tập hạng mục có trọng số luôn nhỏ hơn hoặc bằng độ hỗ trợ của bất kỳ tập khái quát nào của nó. Do vậy, với

một tập hạng mục có trọng số I bất kỳ, độ hỗ trợ của nó luôn nhỏ hơn hoặc bằng độ hỗ trợ của Item(I). Điều này gợi ý chúng ta đầu tiên tìm các tập phổ biến mà không xem xét trọng số, và sau đó kiểm tra yếu tố trọng số của mỗi tập hạng mục để tạo ra các WAR. Phương pháp chúng ta đưa ra gồm 2 phần:

1. Tạo ra các tập phổ biến. Trong bước này, chúng tôi bỏ qua trọng số được kết hợp với mỗi hạng mục trong tập các giao dịch.

2. Với mỗi tập phổ biến, tìm các luật kết hợp có trọng số mà thoả mãn ngưỡng độ hỗ trợ, độ tin cậy và mật độ.

Pha 1, tương tự như trong khai phá luật kết hợp truyền thống (đưa ra trong Phần I ở trên), nhiều giải thuật đã được thiết kế để giải quyết hiệu quả công việc này. Chúng ta sẽ tập trung vào pha thứ 2. Sau khi nhận được tập các tập phổ biến, gọi là F, chúng ta khảo sát chúng để tạo ra các luật kết hợp có trọng số. Cho trước một tập hạng mục I (n hạng mục), miền trọng số của tất cả các hạng mục tạo thành một không gian n chiều Pn = P x P x…x P với mỗi chiều tương ứng với trọng số của một hạng mục. Để đơn giản chúng ta giả sử miền trọng số của mỗi hạng mục là như nhau. Mỗi tập khái quát hoá của I tương ứng với một hộp n chiều trong không gian này. Mục đích của chúng ta là tìm hộp lớn nhất mà thoả mãn độ hỗ trợ, độ tin cậy, mật độ. Để đơn giản hoá quá trình này, chúng ta tách riêng không gian vào tập các ô lưới và chia pha thứ 2 thành 2 pha nhỏ:

1. Phân chia không gian và tạo các counter: mục đích là để nhận dạng các ô lưới thoả mãn yêu cầu về mật độ.

2. Tạo ra các luật kết hợp có trọng số: mục tiêu là tạo ra các WAR maximum từ các hộp đặc bao quanh các ô lưới dày kề nhau.

Bởi các hộp đặc (dense) thường không thoả mãn yêu cầu độ tin cậy, phương pháp co có thứ tự được phát triển để rút gọn các hộp đặc, đáp ứng độ tin cậy cần thiết.

Một phần của tài liệu Đồ án tốt nghiệp đại học nghiên cứu các thuật toán khai phá luật kết hợp có trọng số và ứng dụng (Trang 45 - 47)