4. Bố cục của luận án
1.2.2.2. Lọc nội dung dựa vào mô hình
Lọc nội dung dựa trên mô hình là phƣơng pháp sử dụng tập hồ sơ sản phẩm và tập hồ sơ ngƣời dùng để xây dựng nên mô hình huấn luyện. Mô hình dự đoán sau đó sẽ sử dụng kết quả của mô hình huấn luyện để sinh ra tƣ vấn cho ngƣời
dùng. Trong cách tiếp cận này, lọc nội dung có thể sử dụng các kỹ thuật học máy nhƣ mạng Bayes, phân cụm, cây quyết định, mạng nơron nhân tạo để tạo nên dự đoán.
Pazzani và Billsus [73] sử dụng bộ phân loại Bayes dựa trên những đánh giá
―thích‖ hoặc ―không thích‖ của ngƣời dùng để phân loại các sản phẩm. Trong đó, phƣơng pháp ƣớc lƣợng xác suất sản phẩm pjcó thuộc lớpCi hay không dựa vào tập các đặc trƣng nội dung k1,j,..,kn,j của sản phẩm đó.
Ci k j k j knj
P | 1, & 2, &..& , (1.6)
Panzanni và Billsus giả thiết các đặc trƣng nội dung xuất hiện độc lập nhau,
vì vậy xác suất ở trên tƣơng ứng với: x i j x i P k C C P( ) ( , | ) (1.7)
Vì P (kx,j| Ci) và P (Ci) có thể ƣớc lƣợng dựa vào tập dữ liệu huấn luyện. Do
vậy, sản phẩm pj đƣợc xem là thuộc lớp Ci nếu xác suất
Ci k j k j kn j
P | 1, & 2, &..& , có giá trị cao nhất thuộc lớp này.
Solombo [42]đề xuất mô hình lọc thích nghi, trong đó chú trọng đến việc quan sát mức phù hợp của tất cả các sản phẩm. Zhang [112] đề xuất mô hình tối ƣu tập các sản phẩm tƣơng tự dựa vào giá trị ngƣỡng. Trong đó, giá trị ngƣỡng đƣợc ƣớc lƣợng dựa trên tập sản phẩm thích hợp và tập tài liệu không thích hợp với mỗi hồ sơ ngƣời dùng.