Nhƣ đã trình bày trong mục 3.4 thì trong khuơn kh đồ án này chúng tơi sử dụng phƣơng pháp lai kết hợp (Mix). Do vấn đề thu thập dữ liệu đánh giá của ngƣời dùng cịn nhiều hạn chế nên chúng tơi sẽ chỉ tập trung vào các phƣơng pháp gợi ý theo nội dung là chủ yếu, vì vậy mà chúng tơi đề xuất khi trả về top 10 bài báo thì tỷ lệ 9:1 tƣơng ứng với phƣơng pháp lọc nội dung và phƣơng pháp lọc cộng tác. Ở phần này chúng ta chỉ cần cài đặt module lai đơn giản là kết hợp hai kết quả của từng phƣơng pháp riêng lẻ. Module này sẽ chọn top 9 của hệ thống gợi ý lọc theo nội dung và top 1 của gợi ý theo lọc cộng tác. Vấn đề trùng lặp bài báo giữa hai phƣơng pháp sẽ đƣợc giải quyết nhƣ sau: Chọn 9 bài báo trong lọc nội dung, tiếp chọn 1 bài báo trong lọc cộng tác, nếu bài báo lấy ra trong lọc cộng tác cĩ xuất hiện trong 9 bài báo của lọc nội dung thì chúng ta sẽ chọn bài tiếp theo trong danh sách những bài báo gợi ý theo lọc cộng tác mà khơng xuất hiện trong 9 bài báo thuộc gợi ý nội dung theo thứ tự giảm dần điểm số.
Chúng ta sẽ cĩ 4 phƣơng pháp lai khác nhau nhƣ sau:
Lai giữa hai phƣơng pháp gợi ý theo nội dung sử dụng hồ sơ ngƣời dùng tĩnh dựa vào trọng số tf-idf tăng cƣờng và lọc cộng tác (H.1).
Lai giữa hai phƣơng pháp gợi ý theo nội dung sử dụng hồ sơ ngƣời dùng động dựa vào trọng số tf-idf tăng cƣờng và lọc cộng tác (H.2).
Lai giữa hai phƣơng pháp gợi ý theo nội dung sử dụng hồ sơ ngƣời dùng tĩnh dựa trên mơ hình chủ đề ẩn LDA và lọc cộng tác (H.3).
Lai giữa hai phƣơng pháp gợi ý theo nội dung sử dụng hồ sơ ngƣời dùng động dựa trên mơ hình chủ đề ẩn LDA và lọc cộng tác (H.4).
80
Học viên thực hiện: Nguyễn Văn Thịnh CB130460 Khĩa 2013B Lớp CNTT1