Một số hƣớng tiếp cận trong khai phá luật kết hợp

Một phần của tài liệu nghiên cứu tập mục thường xuyên và luật kết hợp (Trang 27 - 29)

Khai phá luật kết hợp đã đƣợc nghiên cứu và phát triển theo nhiều hƣớng khác nhau. Có những đề xuất cải tiến thuật toán, có những đề xuất tìm kiếm luật có ý nghĩa hơn…Sau đây là một số hƣớng tiếp cận chính:

- Luật kết hợp nhị phân (binary association rule): Là hƣớng nghiên cứu đầu tiên của luật kết hợp. Theo dạng luật kết hợp này thì các items chỉ đƣợc quan tâm là có hay không xuất hiện trong cơ sở dữ liệu giao tác (Transaction database) chứ không quan tâm về mức độ hay tần xuất hiện. Thuật toán tiêu biểu cho khai phá luật kết hợp nhị phân là thuật toán Apriori.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

- Luật kết hợp có thuộc tính và thuộc tính hạng mục (Quantitative and categorial association rule): Các cơ sở dữ liệu thực tế thƣờng có các thuộc tính đa dạng (nhƣ nhị phân, số mục…) mà không nhất quán ở một dạng nào cả. Vì vậy để khai phá luật kết hợp với các CSDL này, các nhà nghiên cứu đề xuất một số phƣơng pháp rời rác hoá nhằm chuyển dạng luật này về dạng nhị phân để có thể áp dụng các thuật toán đã có.

- Luật kết hợp tiếp cận theo hƣớng tập thô (Mining association rules base on rough set): Tìm kiếm luật kết hợp dựa trên lý thuyết tập thô.

- Luật kết hợp nhiều mức (Multi level association rules): Với cách tiếp cận luật kết hợp này sẽ tìm thêm những luật có dạng: Mua máy tính  Mua hệ điều hành Windows AND Mua phần mềm văn phòng Microsoft Office…

- Luật kết hợp mờ (Fuzzy association rules): Với những khó khăn gặp phải khi rời rạc hoá các thuộc tính số, các nhà nghiên cứu đề xuất luật kết hợp mờ, khắc phục hạn chế đó và chuyển luật kết hợp về một dạng gần hơn.

- Luật kết hợp với thuộc tính đƣợc đánh trọng số (Association rule with weighted Item): Các thuộc tính trong CSDL thƣờng không có vai trò nhƣ nhau. Có một số thuộc tính quan trọng và đƣợc chú trọng hơn các thuộc tính khác. Vì vậy trong quá trình tìm kiếm luật các thuộc tính đƣợc đánh trọng số theo mức độ xác định nào đó. Nhờ vậy ta thu đƣợc những luật “hiếm”.

- Luật kết hợp song song (Parallel mining of association rule): nhu cầu song song hoá và xử lý phân tán là rất cần thiết vì kích thƣớc dữ liệu ngày càng lớn nên đòi hỏi tốc độ xử lý phải đƣợc đảm bảo.

Trên đây là một số hƣớng chính của khai phá luật kết hợp cho phép tìm kiếm luật kết hợp một cách linh hoạt trong những CSDL lớn.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

CHƢƠNG 3: MỘT SỐ PHƢƠNG PHÁP KHAI PHÁ DỮ LIỆU BẰNG LUẬT KẾT HỢP

Một phần của tài liệu nghiên cứu tập mục thường xuyên và luật kết hợp (Trang 27 - 29)

Tải bản đầy đủ (PDF)

(72 trang)