8. CẤU TRÚC ĐỀ TÀỊ
2.1. Bài tốn kinh điển dẫn đến việc KPLKH
Bài tốn giỏ mua hàng trong siêu thị.
Giả định chúng ta cĩ rất nhiều mặt hàng, ví dụ như "bánh mì", "sữa"... (coi là tính chất, hay trường). Khách hàng khi đi siêu thị sẽ bỏ vào giỏ mua hàng của họ một số mặt hàng nào đĩ, và chúng ta muốn tìm hiểu các khách hàng thường mua các mặt hàng nào đồng thời, thậm chí chúng ta khơng cần biết khách hàng cụ thể là aị Nhà quản lý dùng những thơng tin này để điều chỉnh việc nhập hàng về siêu thị, hay đơn giản là để bố trí sắp xếp các mặt hàng gần nhau, hoặc bán các mặt hàng đĩ theo một gĩi hàng, giúp cho khách hàng đỡ mất cơng tìm kiếm.
Bài tốn này hồn tồn cĩ thể áp dụng trong các lĩnh vực khác.
1/ Giỏ hàng = văn bản. Mặt hàng = từ. Khi đĩ, những từ hay đi cùng nhau sẽ giúp ta nhanh chĩng tìm ra các lối diễn đạt, hay các khái niệm cĩ mặt trong văn bản.
2/ Giỏ hàng = văn bản. Mặt hàng = câụ Khi đĩ, những văn bản cĩ nhiều câu giống nhau giúp phát hiện ra sự đạo văn, hay những web site đúp (mirror website).
KPLKH được mơ tả như sự tương quan của các sự kiện - những sự kiện xuất hiện thường xuyên một cách đồng thờị Nhiệm vụ chính của KPLKH là phát hiện ra các tập con cùng xuất hiện trong một khối lượng giao dịch lớn của một CSDL cho trước. Nĩi cách khác, thuật tốn KPLKH cho phép tạo ra các luật mơ tả các sự kiện xảy ra đồng thời (một cách thường xuyên) như thế
Phát hiện tri thức trong tập dữ liệu lớn
nàọ Các thuật tốn này trải qua 2 pha: pha đầu là đi tìm các sự kiện xảy ra thường xuyên, pha hai là tìm luật.