Với người dùng hoạt động u, ta có thể tìm thấy tất cả các luật kết hợp liên quan đến u, (∀ X →Y|X ⊆ Tu), Tu là tập các giao dịch của u. Từ đó, xác định được các sản phẩm có thể dùng để gợi ý cho người dùng u.
Để đưa ratop-N sản phẩm gợi ý cho người dùng u, áp dụng kỹ thuật lọc cộng tác [20].
Tính toán độ tương đồng giữa hai người dùng u và v, sim(u, v) sử dụng độ tương quan Pearson theo công thức (1.1).
Dự đoán các điểm đánh giá của người dùngu dành cho các sản phẩm được xác định từ tập luật kết hợp liên quan đến u dựa vào k người dùng tương đồng nhất với u. ru,i =ru+ P v∈Kusim(u, v)(rv,i−rv) P v∈Kusim(u, v) (2.4)
Đưa ra top-N sản phẩm gợi ý cho người dùng u.
Ví dụ: Cho ma trận dữ liệu R như sau:
U/I i1 i2 i3 i4 i5 u1 4 4 0 0 2 u2 3 3 0 2 3 u3 1 0 0 2 2 u4 0 4 2 0 0 u5 0 0 3 3 1
Giả sử cần đưa ra gợi ý cho người dùng hoạt động u5: u5 0 0 3 3 1
Cho biết độ hỗ trợ tối thiểuminsup= 2và độ tin cậy tối thiểuminconf = 60%. Bước 1: Tìm tất cả các tập phổ biến. Quy trình tìm tập phổ biến được thể hiện trong Hình 2.2. Thu được hai tập phổ biến là{i1, i2, i5} và {i1, i4, i5}
Bước 2: Sinh luật kết hợp từ các tập phổ biến. – Luật 1:{i1, i2} → {i5}. conf = 2/2 – Luật 2:{i1, i5} → {i2}. conf = 2/3 – Luật 3:{i2, i5} → {i1}. conf = 2/2 – Luật 4:{i1} → {i2, i5}. conf = 2/3 – Luật 5:{i2} → {i1, i5}. conf = 2/3 – Luật 6:{i5} → {i1, i2}. conf = 2/4 – Luật 7:{i1, i4} → {i5}. conf = 2/2 – Luật 8:{i1, i5} → {i4}. conf = 2/3 – Luật 9:{i4, i5} → {i1}. conf = 2/3 – Luật 10:{i1} → {i4, i5}. conf = 2/3 – Luật 11:{i4} → {i1, i5}. conf = 2/3 – Luật 12:{i5} → {i1, i4}. conf = 2/4
So sánh với minconf = 60% ⇒ các luật kết hợp được chấp nhận là luật 1, 2, 3, 4, 5, 7, 8, 9, 10, 11.
Bước 3: Với người dùng u5, ta có các luật của u5: {i4, i5} → {i1} và {i4} → {i1, i5}. Dựa vào các luật, ta thấy i1 là ứng cử viên gợi ý chou5
Bước 4: Áp dụng quy trình lọc cộng tác để dự đoán điểm đánh giá của người dùng u5 dành choi1.
Dùng độ đo tương quan Pearson để tính độ tương đồng giữa các người dùng. Sử dụng công thức (1.1), ta có: sim(u5, u1) = −0,989; sim(u5, u2) = −0,310; sim(u5, u3) = 0,165; sim(u5, u4) = −0,221. Giả sử chọn số hàng xóm k = 1, khi đó u3 là người dùng tương đồng nhất với u5. Ta có dự đoán đánh giá của người dùng u5 dành cho sản phẩmi1 được tính theo công thức (2.4) là: ru5,i1 = 1.4.
Hình 2.2: Sinh các tập phổ biến.