Phát hiện luật kết hợp trong CSDL sinh ra rất nhiều luật trong khi người sử dụng lại chỉ quan tâm đến một phần trong các luật được phát hiện, chẳng hạn, chỉ
quan tâm đến các luật có chứa một mục dữ liệu cụ thể, vì vậy, các nghiên cứu phát hiện luật kết hợp theo ràng buộc mục dữ liệu ra đời.
Đầu vào: CSDL D, độ hỗ trợ cực tiểu minSup
Kết quả: Tập các tập phổ biến đóng C
CHARM(D Í I ´ O)
1. Nodes = {Ij ´ g(Ij) : Ij ỴI L½g(Ij)½³ minSup} 2. CHARM-EXTEND(Nodes, C)
CHARM-EXTEND(Nodes, C): 3. for each Xi ´ g(Xi) in Nodes 4. NewN = Ỉ and X = Xi
5. for each Xj ´ g(Xj) in Nodes, with j > i 6. X = XÈXj and Y = g(Xi)Çg(Xj)
7. CHARM-PROPERTY(Nodes, NewN) 8. if NewN ¹ Ỉ then CHARM-EXTEND(NewN) 9. C = CÈX // if X is not subsumed
CHARM-PROPERTY(Nodes, NewN): 10. if (½Y½³ minSup then
11. if g(Xi) = g(Xj) then //Property 1 12. Remove Xj from Nodes 13. Replace all Xi with X
14. else if g(Xi) Ì g(Xj) then //Property 2 15. Replace all Xi with X
16. else if g(Xi) É g(Xj) then //Property 3 17. Remove Xj from Nodes
18. Add X ´ Y to NewN
19. else if g(Xi) ¹ g(Xj) then //Property 4 20. Add X ´ Y to NewN
28
R. Srikant và cộng sự [74] đề xuất ràng buộc mục dữ liệu dạng biểu thức nhị phân thể hiện việc có xuất hiện hay không các mục ở trong luật. Các tác giả giới
thiệu ba cách kết hợp thuật toán Apriori với bước tiền xử lý để phát hiện luật dạng này và chỉ ra rằng việc kết hợp tiền xử lý làm giảm đáng kể thời gian thực hiện.
Trong [81], S.V. Tseng đề xuất bài tốn tìm luật kết hợp thỏa mãn điều kiện IS (IS Ì I), theo đó thuật tốn đi tìm luật từ các tập dữ liệu chứa IS thỏa mãn độ hỗ trợ và độ tin cậy cực tiểu. Sau khi tiền xử lý để nhận được thơng tin hữu ích về CSDL (như ước lượng số lượng luật ứng với điều kiện ràng buộc), áp dụng thuật toán
Apriori để phát hiện hiệu quả các luật kết hợp.