Kỹ thuật tƣ vấn mặt hàng phù hợp (Matching Product) cũng tƣơng tự nhƣ kỹ thuật tƣ vấn dựa trên ngƣời dùng (User-based) nhƣng thay vì tính toán theo ngƣời xem thì kỹ thuật này tính toán theo các bộ phim. Lúc này, tập dữ liệu sẽ lấy theo tên bộ phim với tên ngƣời xem và kết quả đánh giá tƣơng ứng. Ví dụ:
'Lady in the Water' = {'Lisa Rose': 2, 'Gene Seymour': 3}, 'Snakes on a Plane' = {'Lisa Rose': 3,'Gene Seymour': 4}
Kỹ thuật mặt hàng phù hợp (Matching Product) bao gồm 2 bƣớc:
- Bước 1: Tìm bộ phim tƣơng tự: Sau khi thu thập dữ liệu về những ngƣời xem đánh giá các bộ phim tƣơng ứng, hệ thống cần một cách để xác định cách những bộ phim có thị hiếu tƣơng tự. Hệ thống sẽ so sánh từng bộ phim với tất cả các bộ phim
NGUYỄN THÙY TRANG – K43 TIN HỌC KINH TẾ Trang 52 khác và tính toán một số điểm tƣơng tự. Tƣơng tự nhƣ kỹ thuật trên, tôi sẽ tính toán theo tƣơng quan Pearson.
Công thức tính toán tƣơng quan Pearson giữa 2 bộ phim:
Trong đó:
- là tổng các tích đánh giá của bộ phim x, y theo từng ngƣời xem.
- , là tổng các đánh giá của bộ phim x, y theo từng ngƣời xem.
- , là tổng các bình phƣơng đánh giá của bộ phim x, y theo từng ngƣời
xem.
- n là số ngƣời xem cóđánh giá chung bộ phim x, y.
Giá trị trả về nằm trong khoảng -1 và 1, tƣơng ứng từ hoàn toàn khác biệt cho đến tƣơng đồng.
- Bước 2: Từ kết quả bƣớc 1 để sắp xếp lại các điểm tƣơng quan đó theo chiều giảm dần và lấy 20 ngƣời dùng gần nhất.
Độ phức tạp của thuật toán:
Với cách tính tƣơng tự thuật toán tƣ vấn dựa trên ngƣời dùng, ở thuật toán này bao gồm các vòng lặp for để kiểm tra số ngƣời dùng đánh giá chung và vòng lặp for để tính toán danh sách 20 láng giềng gần nhất có độ phức tạp có độ phức tạp thuật toán là
; trong mỗi vòng lặp tính toán , , , , cần cập nhật lại giá trị
tổng sau đó và mỗi vòng lặp có độ phức tạp là . Vậy độ phức tạp thuật toán tƣ
vấn mặt hàng phù hợp là .