Bộ dữ liệu Độ đo (i) User-based (ii) Item-based (iii) AR-based 41(%) 42(%)
MovieLen100K RMSE 2,451 2,585 1,270 48,18 50,87 MAE 1,928 1,997 1,086 43,67 45,62 MovieLen1M RMSE 2,757 2,911 1,738 36,96 40,30 MAE 2,370 2,432 1,421 40,04 41,57 MovieLen10M RMSE 2,784 3,334 2,014 27,66 39,59 MAE 2,603 3,105 1,899 27,05 38,84
Hình 3.5, 3.6 và 3.7 lần lượt là kết quả thực nghiệm của ba phương pháp (i), (ii), (iii) trên ba bộ dữ liệu MovieLen100K, MovieLen1M và MovieLen10M.
M1= ((i)−(iii))/(i)
(a) User - based CF
(b) Item - based CF
(c) AR - based CF
(a) User - based CF
(b) Item - based CF
(c) AR - based CF
(a) User - based CF
(b) Item - based CF
(c) AR - based CF
3.3 Đánh giá
Chứng cứ thực nghiệm cho thấy cách tiếp cận khai phá luật kết hợp tốt hơn hai phương pháp lọc cộng tác truyền thống về hiệu quả gợi ý trên cả hai độ đo RMSE và MAE (giảm độ lỗi). Cụ thể, điểm RMSE giảm trong khoảng từ 27,66% đến 50,87%; trong khi đó, điểm MAE giảm trong khoảng từ 27,05% đến 45,62%. Hình 3.8 thể hiện so sánh độ lỗi RMSE và MAE khi thực nghiệm các phương pháp trên các bộ dữ liệu.
(a) So sánh độ lỗi trên bộ dữ liệu MovieLen100K (b) So sánh độ lỗi trên bộ dữ liệu MovieLen1M
(c) So sánh độ lỗi trên bộ dữ liệu MovieLen10M
Kết luận
Trong phần này, chúng tôi tóm lược lại các kết quả chính của luận văn. Ngoài ra, chúng tôi trình bày một số hạn chế của luận văn và thảo luận về hướng phát triển cho các nghiên cứu tiếp theo trong tương lai.
1. Tóm lược các kết quả và đóng góp của luận văn
Trong luận văn này, chúng tôi đã trình bày nghiên cứu ứng dụng khai phá luật kết hợp cho hệ gợi ý. Chúng tôi đã (i) đề xuất mô hình ứng dụng luật kết hợp trong hệ gợi ý, (ii) cài đặt các thuật toán tìm tập phổ biến và sinh luật kết hợp; (iii) thực nghiệm so sánh, đánh giá hiệu quả của cách tiếp cận này với phương pháp lọc cộng tác truyền thống. Kết quả thực nghiệm trên các bộ dữ liệu MovieLen100K, MovieLen1M và MovieLen10M cho thấy cách tiếp cận này tốt hơn phương pháp lọc cộng tác truyền thống về hiệu quả gợi ý.
2. Hướng phát triển của luận văn
Trong tương lai, chúng tôi dự kiến mở rộng nghiên cứu này theo một số hướng: (i) thử nghiệm trên các miền dữ liệu khác như giáo dục, thương mại điện tử, vv; (ii) phân tích, so sánh hiệu quả ứng dụng các phương pháp khai phá dữ liệu khác như phân cụm, phân lớp trong hệ gợi ý. Ngoài ra, ứng dụng kỹ thuật học sâu trong hệ gợi ý đang là hướng nghiên cứu chúng tôi đang quan tâm.
Bài báo liên quan đến luận văn Lê Thị Xinh, Lê Quang Hùng, Vũ Sơn Lâm, Phan Thị Bích Hoa (2021), "Cách tiếp cận khai phá luật kết hợp cho hệ gợi ý", submitted to Hội thảo Quốc gia lần thứ XXIV "Một số vấn đề chọn lọc của Công nghệ thông tin và Truyền thông" (VNICT 2021).
Tài liệu tham khảo
