Bài ôn tập – Chương 6 – Khai phá luật kết hợp Cho các tập dữ liệu gồm các giao dịch (transactions) và các phần tử (items) được quan tâm cho mỗi giao dịch. Ngưỡng hỗ trợ tối thiểu (minimum support) và ngưỡng tin cậy tối thiểu (minimum confidence) được cho trước trong đoạn [0, 1] và cụ thể cho mỗi tập dữ liệu. Yêu cầu chung: (1) Thực hiện khai phá các tập phần tử phổ biến (frequent itemsets) dùng giải thuật Apriori và giải thuật FP-Growth với FP-tree. (2) Xác định các closed top-3 frequent itemsets từ kết quả (1). (3) Xác định các maximal top-3 frequent itemsets từ kết quả (1). (4) Thực hiện khai phá luật kết hợp (association rules) từ kết quả (1). Bài 1: minimum support = 0.5; minimum confidence = 0.8. TID Items 1 a, b, c, d, e, g, h 2 a, b, f, g 3 b, d, e, f, g 4 a, b, f, h 5 a, b, f, i 6 a, c, d, e, g, h 7 a, b, h, i 8 b, c, d, f, g 9 a, b, f, h 10 a, b, g, h Kết quả gợi ý: Frequent itemsets: {b}, support = 0.9; {a}, support = 0.8; {f}, support = 0.6; {g}, support = 0.6; {h}, support = 0.6; {b, h}, support = 0.5; {a, h}, support = 0.6; {b, g}, support = 0.5; {b, f}, support = 0.6; {b, a}, support = 0.7; {b, a, h}, support = 0.5. Strong association rules: {h} → {b}, support = 0.5, confidence = 0.83; {h} → {a}, support = 0.6, confidence = 1; {g} → {b}, support = 0.5, confidence = 0.83; 1 {f} → {b}, support = 0.6, confidence = 1; {a} → {b}, support = 0.7, confidence = 0.875; {h} → {b, a}, support = 0.5, confidence = 0.83; {b, h} → {a}, support = 0.5, confidence = 1; {a, h} → {b}, support = 0.5, confidence = 0.83. Bài 2: minimum support = 0.3; minimum confidence = 0.7. TID Items 1 x, z 2 u, v, w, x, y, z 3 u, w, y 4 v, x, z 5 u, y 6 w, x, y 7 x, y, z 8 u, z 9 v, y 10 v, w, x Kết quả gợi ý: Frequent itemsets: {x}, support = 0.6; {y}, support = 0.6; {z}, support = 0.5; {u}, support = 0.4; {v}, support = 0.4; {w}, support = 0.4; {x, y}, support = 0.3; {x, z}, support = 0.4; {x, v}, support = 0.3; {x, w}, support = 0.3; {y, u}, support = 0.3; {y, w}, support = 0.3. Strong association rules: {z} → {x}, support = 0.4, confidence = 0.8; {v} → {x}, support = 0.3, confidence = 0.75; {w} → {x}, support = 0.3, confidence = 0.75; {u} → {y}, support = 0.3, confidence = 0.75; {w} → {y}, support = 0.3, confidence = 0.75. Bài 3: minimum support = 0.2; minimum confidence = 0.75. TID Items 1 mi, be, di 2 br, bu, mi 3 mi, di, co 2 4 br, bu, co 5 be, co, di 6 mi, di, br, bu 7 br, bu, di 8 be, di 9 mi, di, br, bu 10 be, co Kết quả gợi ý: Frequent itemsets: {di}, support = 0.7; {br}, support = 0.5; {bu}, support = 0.5; {mi}, support = 0.5; {be}, support = 0.4; {co}, support = 0.4; {di, br}, support = 0.3; {di, bu}, support = 0.3; {di, mi}, support = 0.4; {di, be}, support = 0.3; {di, co}, support = 0.2; {br, bu}, support = 0.5; {br, mi}, support = 0.3; {bu, mi}, support = 0.3; {be, co}, support = 0.2; {di, br, bu}, support = 0.3; {di, br, mi}, support = 0.2; {di, bu, mi}, support = 0.2; {br, bu, mi}, support = 0.3; {di, br, bu, mi}, support = 0.2. Strong association rules: {mi} → {di}, support = 0.3, confidence = 0.8; {be} → {di}, support = 0.3, confidence = 0.75; {br} → {bu}, support = 0.5, confidence = 1; {bu} → {br}, support = 0.5, confidence = 1; {di, br} → {bu}, support = 0.3, confidence = 1; {di, bu} → {br}, support = 0.3, confidence = 1; {br, mi} → {bu}, support = 0.3, confidence = 1; {bu, mi} → {br}, support = 0.3, confidence = 1; {di, br, mi} → {bu}, support = 0.2, confidence = 1; {di, bu, mi} → {br}, support = 0.2, confidence = 1. Bài 4: minimum support = 0.3; minimum confidence = 0.9. TID Items 1 a, b, d, e 2 b, c, d 3 a, b, d, e 4 a, c, d, e 5 b, c, d, e 6 b, d, e 7 c, d 8 a, b, c 9 a, d, e 10 b, d Kết quả gợi ý: 3 Frequent itemsets: {d}, support = 0.9; {b}, support = 0.7; {e}, support = 0.6; {a}, support = 0.5; {c}, support = 0.5; {d, c}, support = 0.4; {b, c}, support = 0.3; {d, a}, support = 0.4; {b, a}, support = 0.3; {e, a}, support = 0.4; {d, e}, support = 0.6; {b, e}, support = 0.4; {d, b}, support = 0.6; {d, e, a}, support = 0.4; {d, b, e}, support = 0.4. Strong association rules: {e} → {d}, support = 0.6, confidence = 1; {b, e} → {d}, support = 0.4, confidence = 1; {d, a} → {e}, support = 0.4, confidence = 1; {a, e} → {d}, support = 0.4, confidence = 1. Bài 5: minimum support = 0.25; minimum confidence = 1. TID Items 1 I1, I2, I5 2 I2, I4 3 I2, I3 4 I1, I2, I4 5 I1, I3 6 I2, I3 7 I1, I3 8 I1, I2, I3, I5 Kết quả gợi ý: Frequent itemsets: {I2}, support = 0.75; {I1}, support = 0.625; {I3}, support = 0.625; {I4}, support = 0.25; {I5}, support = 0.25; {I2, I1}, support = 0.375; {I2, I3}, support = 0.375; {I2, I4}, support = 0.25; {I2, I5}, support = 0.25; {I1, I3}, support = 0.375; {I1, I5}, support = 0.25; {I2, I1, I5}, support = 0.25. 4 Strong association rules: {I4} → {I2}, support = 0.25, confidence = 1; {I5} → {I2}, support = 0.25, confidence = 1; {I5} → {I1}, support = 0.25, confidence = 1; {I5} → {I1, I2}, support = 0.25, confidence = 1; {I2, I5} → {I1}, support = 0.25, confidence = 1; {I1, I5} → {I2}, support = 0.25, confidence = 1. Bài 6: minimum support = 0.5; minimum confidence = 1. TID Items 1 a, b, d, e, g 2 c, e, i, f 3 a, b, d, h 4 a, b, c, d, g 5 b, c, d, i Kết quả gợi ý: Frequent itemsets: {b}, support = 0.8; {d}, support = 0.8; {a}, support = 0.6; {c}, support = 0.6; {b, d}, support = 0.6; {b, a}, support = 0.6; {d, a}, support = 0.6; {b, d, a}, support = 0.6. Strong association rules: {b} → {d}, support = 0.8, confidence = 1; {d} → {b}, support = 0.8, confidence = 1; {a} → {b}, support = 0.6, confidence = 1; {a} → {d}, support = 0.6, confidence = 1; {a} → {d, b}, support = 0.6, confidence = 1; {b, a} → {d}, support = 0.6, confidence = 1; {d, a} → {b}, support = 0.6, confidence = 1. 5