- Thông tin cá nhân…
4. M t s h ng ti p c n trong khai phá lu t k t h p
L nh v c khai thác lu t k t h p cho đ n nay đã đ c nghiên c u và phát tri n theo nhi u h ng khác nhau. Có nh ng đ xu t nh m c i ti n thu t toán, có đ xu t tìm ki m nh ng lu t có ý ngh a h n ... và có m t s h ng chính sau đây :
¬ Lu t k t h p nh phân (binary association rules)
Lu t k t h p nh phân là h ng nghiên c u đ u tiên c a lu t k t h p. Theo d ng lu t k t h p này thì các items ch đ c quan tâm là
có hay không xu t hi n trong c s d li u giao tác ch không quan tâm v m c đ hay t n xu t xu t hi n. Thu t toán tiêu bi u nh t c a khai phá d ng lu t này là thu t toán Apriori s đ c trong các ch ng ti p theo.
¬ Lu t k t h p có thu c tính s và thu c tính h ng m c (quantitative and categorial association rules)
Các c s d li u th c t th ng có các thu c tính đa d ng. Các thu c tính này có th d ng s l ng (quantitative) hay d ng phân lo i (categorial) . khai phá lu t k t h p v i các c s d li u này, các nhà nghiên c u đ xu t m t s ph ng pháp r i r c hoá nh m chuy n d ng lu t này v d ng nh phân đ có th áp d ng các thu t toán đã có.
¬ Lu t k t h p ti p c n theo h ng t p thô (mining association rules base on rough set)
tìm ki m lu t k t h p d a trên lí thuy t t p thô
¬ Lu t k t h p nhi u m c (multiple-level association rules)
V i cách ti p c n lu t k t h p th này s tìm ki m thêm nh ng lu t có d ng : mua máy tính PC⇒ mua h đi u hành Window AND mua ph n m m v n phòng Microsoft Office,…
¬ Lu t k t h p m (fuzzy association rules)
V i nh ng khó kh n g p ph i khi r i r c hoá các thu c tính s , các nhà nghiên c u đ xu t lu t k t h p m kh c ph c h n ch đó và chuy n lu t k t h p v m t d ng g n g i h n.
¬ Lu t k t h p v i thu c tính đ c đánh tr ng s (association rules with weighted items)
Các thu c tính trong c s d li u th ng không có vai trò nh nhau. Có m t s thu c tính quan tr ng và đ c chú tr ng h n các thu c tính khác. Vì v y trong quá trình tìm ki m lu t các thu c tính
đ c đánh tr ng s theo m c đ xác đnh nào đó. Nh v y ta thu
đ c nh ng lu t “hi m” (t c là có đ h tr th p nh ng mang nhi u ý ngh a ).
- 28 -
¬ Khai thác lu t k t h p song song (parallel mining of association rules)
Nhu c u song song hoá và x lí phân tán là c n thi t vì kích th c d li u ngày càng l n nên đòi h i t c đ x lí ph i đ c đ m b o.
Trên đây là nh ng bi n th c a khai phá lu t k t h p cho phép ta tìm ki m lu t k t h p m t cách linh ho t trong nh ng c s d li u l n. Bên c nh đó các nhà nghiên c u còn chú tr ng đ xu t các thu t toán nh m t ng t c quá trình tìm ki m lu t k t h p trong c s d li u.