Giới thiệu về thuật toán

Khai phá luật kết hợp có thuộc tính số đã được công nhận như là một vấn đề nghiên cứu có ảnh hưởng trong thập kỷ qua do sự phổ biến của CSDL số và tính hữu dụng của luật kết hợp trong cuộc sống thực. Tuy nhiên, sự kết hợp của các thuộc tính số này và các khoảng giá trị của chúng luôn luôn làm tăng việc

tạo ra một số lượng lớn khổng lồ các tập mục, bởi vậy làm giảm đáng kể hiệu quả khai phá.

Phần này trình bày một thuật toán khai phá được gọi là MFAMI, dùng cho khai phá luật kết hợp có thuộc tính số bằng cách sử dụng lý thuyết tập mờ. MFAMI được S. Lotfi và M.H. Sadreddini giới thiệu năm 2009. MFAMI sử dụng các tập mờ để biểu diễn các luật được phát hiện. Thuật toán này tránh việc tạo ra một số lượng lớn các tập ứng viên. Thay vào đó, việc sử dụng thông tin tương hỗ chỉ ra các mối quan hệ mạnh mẽ giữa các thuộc tính và các tập mục phổ biến tiềm năng cũng được phát hiện. Bằng cách sử dụng các tập phổ biến, S. Lotfi và M.H. Sadreddini đưa ra một thuật toán hiệu quả để phát hiện các luật. Với việc khai phá hiệu quả các luật, MFAMI sử dụng phân tích sai phân điều chỉnh (adjusted difference) với lợi thế là nó không đòi hỏi người dùng cung cấp hai giá trị ngưỡng minsup và minconf, mà hai ngưỡng này thường rất khó xác định. Thuật toán được đề xuất đã làm giảm đáng kể nỗ lực tạo ra các ứng viên và hiệu suất của việc khai phá được cải thiện đáng kể.

Các thí nghiệm cho thấy thuật toán này có khả năng phát hiện các luật kết hợp mờ có ý nghĩa và hữu ích một cách hiệu quả, tăng tốc quá trình khai phá và có được hầu hết các luật kết hợp với độ tin cậy cao [30].

Xu hướng trong khai phá dữ liệu

Luật kết hợp nhị phân