Lọc cộng tác (Collaborative Filtering) là một kỹ thuật đƣợc áp dụng khá thành công trong các hệ tƣ vấn, nó đƣợc dùng để đánh giá độ quan tâm của ngƣời dùng tới một mặt hàng mới. Trong các hệ thống lọc cộng tác, các dự đoán đƣợc đƣa ra dựa trên tập dữ liệu về sở thích ngƣời dùng – mặt hàng có liên quan tới ngƣời dùng hoặc mặt hàng. Tuy nhiên, trong trƣờng hợp dữ liệu ít, độ tƣơng tự trực tiếp giữa hai ngƣời dùng hoặc hai mặt hàng chỉ cung cấp rất ít thông tin cho ta dự đoán.
Hình 2.1. Hệ thống tƣ vấn lọc cộng tác của trang web Amazon.com
Phƣơng pháp tƣ vấn lọc cộng tác hoàn toàn khác so với phƣơng pháp tƣ vấn dựa trên nội dung. Thay vì giới thiệu các mặt hàng, vì chúng tƣơng tự nhƣ các mặt hàng ngƣời dùng đã thích trong quá khứ, cách tiếp cận lọc cộng tác tƣ vấn các mặt hàng dựa vào ý kiến của những ngƣời dùng khác. Thông thƣờng, bằng cách tính toán sự giống nhau của những ngƣời sử dụng, một tập hợp láng giềng gần nhất (nearest neighbor) các ngƣời dùng có sở thích tƣơng quan đáng kể với một ngƣời dùng nhất định sẽ đƣợc tìm thấy. Nhƣ vậy, trong phƣơng pháp này, ngƣời dùng chia sẻ sở thích
NGUYỄN THÙY TRANG – K43 TIN HỌC KINH TẾ Trang 25 của họ về từng mặt hàng mà họ đã từng tiêu dùng để những ngƣời dùng khác của hệ thống có những quyết định tốt hơn đối với những mặt hàng đó. Cách tiếp cận lọc cộng tác là kỹ thuật tƣ vấn thành công nhất và đƣợc chấp nhận rộng rãi cho đến nay.
Nhƣ vậy, phƣơng pháp lọc cộng tác là phƣơng pháp sử dụng các sở thích của ngƣời dùng để tạo ra các tƣ vấn. Phƣơng pháp lọc cộng tác bao gồm các kỹ thuật nhƣ kỹ thuật láng giềng, kỹ thuật mạng Bayesian, kỹ thuật mạng Neural kết hợp SVD (Singular value decomposition), kỹ thuật quy tắc quy nạp. Quá trình của một hệ thống lọc cộng tác dựa trên kỹ thuật láng giềng có thể đƣợc chia thành ba giai đoạn:
1. Giảm kích thƣớc: Chuyển đổi ma trận sở thích của ngƣời sử dụng ban đầu vào
một không gian có chiều thấp hơn để giải quyết các vấn đề về kích thƣớc.
2. Hình thành vùng lân cận: Đối với ngƣời sử dụng cần tƣ vấn, tính tƣơng đồng
giữa ngƣời đó với tất cả các ngƣời dùng khác hình thành nên một vùng lân cận với một số lƣợng ngƣời dùng có sở thích tƣơng tự với ngƣời sử dụng cần tƣ vấn.
3. Tƣ vấn: Tạo ra các tƣ vấn dựa trên sở thích của các láng giềng gần nhất với
ngƣời sử dụng cần tƣ vấn.
Hình 2.2. Quy trình phƣơng pháp lọc cộng tác