Ở cách thức lai tổ hợp riêng rẽ các hệ gợi ý ta sẽ kết hợp 2 hệ gợi ý một cách độc lập với nhau, ta cĩ 2 hướng để thực hiện điều này. Thứ nhất, ta cĩ thể tổ hợp tuyến tính đầu ra (đánh giá) của các hệ gợi ý thành phần vào một đầu ra duy nhất hoặc cĩ thể sử dụng một quy trình đánh giá nào đấy (mixed hybrid), hai là ta cĩ thể lựa chọn sử dụng mỗi hệ gợi ý riêng lẻ tùy theo trường hợp cụ thể (switching hybrid) . Ví dụ về cách thức lai thêm đặc trưng hệ gợi ý này vào hệ gợi ý kia chẳng hạn như là ta sử dụng các kỹ thuật giảm chiều (LSI) trên các hồ sơ của người dùng dưới dạng các vector từ và thêm vào kỹ thuật content-based truyền thống. Những năm gần đây thì nhiều nhà nghiên cứu đã bắt đầu đi theo con đường thứ 3 là xây dựng một mơ hình gợi ý hợp nhất từ các hệ thống thành phần, ví dụ như ta sử dụng các đặc trưng của lọc cộng tác và content-based vào một bộ phân lớp đơn rule-based [5].
49
CHƯƠNG 3 - XÂY DỰNG, ĐÁNH GIÁ HỆ GỢI Ý
3.1. Phát biểu bài tốn
Như đã nĩi ở các phần trước, một hệ gợi ý hiệu quả là một yếu tố rất quan trọng trong thành cơng của một hệ thống TMĐT.Trong khuơn khổ luận văn này ta sẽ ứng dụng các lý thuyết cơ sở để xây dựng và đánh giá một hệ thống gợi ý cụ thể sử dụng phương pháp lai dựa trên một bộ dữ liệu cĩ sẵn.
Mơ tả bộ dữ liệu:
Ta sử dụng bộ dữ liệu Movilens 100K, bộ dữ liệu này bao gồm 2 đối tượng chính là người dùng và sản phẩm cũng như các đánh giá của người dùng trên những sản phẩm này. Thơng tin người dùng bao gồm các thơng tin về nhân khẩu học như là ID, tuổi, giới tính, nghề nghiệp. Bộ dữ liệu này cĩ 100,000 đánh giá của 943 người dùng trên 1682 sản phẩm khác nhau.
User ID Item ID Đánh giá
196 242 3
186 302 3
22 377 1
244 51 2