Lọc nội dung dựa trên mô hình là phương pháp sử dụng tập hồ sơ sản phẩm và tập hồ sơ người dùng để xây dựng nên mô hình huấn luyện. Mô hình dựđoán sau đó sẽ sử dụng kết quả của mô hình huấn luyện để sinh ra tư vấn cho người
dùng. Trong cách tiếp cận này, lọc nội dung có thể sử dụng các kỹ thuật học máy như mạng Bayes, phân cụm, cây quyết định, mạng nơron nhân tạo để tạo nên dự đoán.
Pazzanivà Billsus [73] sử dụng bộ phân loại Bayes dựa trên những đánh giá “thích” hoặc “không thích” của người dùng để phân loại các sản phẩm. Trong đó, phương pháp ước lượng xác suất sản phẩm pjcó thuộc lớpCi hay không dựa vào tập các đặc trưng nội dung k1,j,..,kn,j của sản phẩm đó.
(Ci k j k j knj)
P | 1, & 2, &..& , (1.6)
Panzanni và Billsus giả thiết các đặc trưng nội dung xuất hiện độc lập nhau, vì vậy xác suất ở trên tương ứng với: ∏ x i j x i P k C C P( ) ( , | ) (1.7)
Vì P (kx,j| Ci) và P (Ci) có thểước lượng dựa vào tập dữ liệu huấn luyện. Do vậy, sản phẩm pj được xem là thuộc lớp Ci nếu xác suất
(Ci k j k j kn j)
P | 1, & 2, &..& , có giá trị cao nhất thuộc lớp này.
Solombo [42] đề xuất mô hình lọc thích nghi, trong đó chú trọng đến việc quan sát mức phù hợp của tất cả các sản phẩm. Zhang [112] đề xuất mô hình tối
ưu tập các sản phẩm tương tự dựa vào giá trị ngưỡng. Trong đó, giá trị ngưỡng
được ước lượng dựa trên tập sản phẩm thích hợp và tập tài liệu không thích hợp với mỗi hồ sơ người dùng.