Bộ dữ liệu Độ đo (i) User-based (ii) Item-based (iii) AR-based 41(%) 42(%)
MovieLen100K RMSE 2,451 2,585 1,270 48,18 50,87 MAE 1,928 1,997 1,086 43,67 45,62 MovieLen1M RMSE 2,757 2,911 1,738 36,96 40,30 MAE 2,370 2,432 1,421 40,04 41,57 MovieLen10M RMSE 2,784 3,334 2,014 27,66 39,59 MAE 2,603 3,105 1,899 27,05 38,84
Hình 3.5, 3.6 và 3.7 lần lượt là kết quả thực nghiệm của ba phương pháp (i), (ii), (iii) trên ba bộ dữ liệu MovieLen100K, MovieLen1M và MovieLen10M.
2
M1= ((i)−(iii))/(i)
3
(a) User - based CF
(b) Item - based CF
(c) AR - based CF
(a) User - based CF
(b) Item - based CF
(c) AR - based CF
(a) User - based CF
(b) Item - based CF
(c) AR - based CF
3.3 Đánh giá
Chứng cứ thực nghiệm cho thấy cách tiếp cận khai phá luật kết hợp tốt hơn hai phương pháp lọc cộng tác truyền thống về hiệu quả gợi ý trên cả hai độ đo RMSE và MAE (giảm độ lỗi). Cụ thể, điểm RMSE giảm trong khoảng từ 27,66% đến 50,87%; trong khi đó, điểm MAE giảm trong khoảng từ 27,05% đến 45,62%. Hình 3.8 thể hiện so sánh độ lỗi RMSE và MAE khi thực nghiệm các phương pháp trên các bộ dữ liệu.
(a) So sánh độ lỗi trên bộ dữ liệu MovieLen100K (b) So sánh độ lỗi trên bộ dữ liệu MovieLen1M
(c) So sánh độ lỗi trên bộ dữ liệu MovieLen10M
Kết luận
Trong phần này, chúng tôi tóm lược lại các kết quả chính của luận văn. Ngoài ra, chúng tôi trình bày một số hạn chế của luận văn và thảo luận về hướng phát triển cho các nghiên cứu tiếp theo trong tương lai.
1. Tóm lược các kết quả và đóng góp của luận văn
Trong luận văn này, chúng tôi đã trình bày nghiên cứu ứng dụng khai phá luật kết hợp cho hệ gợi ý. Chúng tôi đã (i) đề xuất mô hình ứng dụng luật kết hợp trong hệ gợi ý, (ii) cài đặt các thuật toán tìm tập phổ biến và sinh luật kết hợp; (iii) thực nghiệm so sánh, đánh giá hiệu quả của cách tiếp cận này với phương pháp lọc cộng tác truyền thống. Kết quả thực nghiệm trên các bộ dữ liệu MovieLen100K, MovieLen1M và MovieLen10M cho thấy cách tiếp cận này tốt hơn phương pháp lọc cộng tác truyền thống về hiệu quả gợi ý.
2. Hướng phát triển của luận văn
Trong tương lai, chúng tôi dự kiến mở rộng nghiên cứu này theo một số hướng: (i) thử nghiệm trên các miền dữ liệu khác như giáo dục, thương mại điện tử, vv; (ii) phân tích, so sánh hiệu quả ứng dụng các phương pháp khai phá dữ liệu khác như phân cụm, phân lớp trong hệ gợi ý. Ngoài ra, ứng dụng kỹ thuật học sâu trong hệ gợi ý đang là hướng nghiên cứu chúng tôi đang quan tâm.
Bài báo liên quan đến luận văn Lê Thị Xinh, Lê Quang Hùng, Vũ Sơn Lâm, Phan Thị Bích Hoa (2021), "Cách tiếp cận khai phá luật kết hợp cho hệ gợi ý", submitted to Hội thảo Quốc gia lần thứ XXIV "Một số vấn đề chọn lọc của Công nghệ thông tin và Truyền thông" (VNICT 2021).
Tài liệu tham khảo
[1] Adomavicius, G. and Tuzhilin, A. (2011). Context-aware recommender sys- tems. InRecommender systems handbook, pages 217–253. Springer.
[2] Agrawal, R., Srikant, R., et al. (1994). Fast algorithms for mining association rules. InProc. 20th int. conf. very large data bases, VLDB, volume 1215, pages 487–499. Citeseer.
[3] Al-Bashiri, H., Abdulgabber, M. A., Romli, A., and Hujainah, F. (2017). Col- laborative filtering recommender system: Overview and challenges. Advanced Science Letters, 23(9):9045–9049.
[4] Baidada, M., Mansouri, K., and Poirier, F. (2018). Hybrid recommendation approach in online learning environments. In International Conference Europe Middle East & North Africa Information Systems and Technologies to Support Learning, pages 39–43. Springer.
[5] Ekstrand, M. D. (2020). Lenskit for python: Next-generation software for rec- ommender systems experiments. InProceedings of the 29th ACM International Conference on Information & Knowledge Management, pages 2999–3006. [6] Geetha, G., Safa, M., Fancy, C., and Saranya, D. (2018). A hybrid approach
using collaborative filtering and content based filtering for recommender sys- tem. InJournal of Physics: Conference Series, volume 1000, page 012101. IOP Publishing.
[7] Gunawardana, A. and Shani, G. (2009). A survey of accuracy evaluation met- rics of recommendation tasks. Journal of Machine Learning Research, 10(12). [8] Harper, F. M. and Konstan, J. A. (2015). The movielens datasets: History and
[9] Ji, H., Li, J., Ren, C., and He, M. (2013). Hybrid collaborative filtering model for improved recommendation. InProceedings of 2013 IEEE International Con- ference on Service Operations and Logistics, and Informatics, pages 142–145. IEEE.
[10] Karbhari, N., Deshmukh, A., and Shinde, V. D. (2017). Recommendation system using content filtering: A case study for college campus placement. In 2017 International Conference on Energy, Communication, Data Analytics and Soft Computing (ICECDS), pages 963–965. IEEE.
[11] Le, Q.-H., Vu, S.-L., Nguyen, T.-K.-P., and Le, T.-X. (2021). A state-of-the- art survey on context-aware recommender systems and applications. Interna- tional Journal of Knowledge and Systems Science (IJKSS), 12(3):1–20.
[12] Le, T.-X., Le, Q.-H., Nguyen, T.-K.-P., Lương, T.-T., and Le, A.-C. (2020). Ứng dụng một số phương pháp khai phá dữ liệu trong hệ gợi ý. Hội thảo quốc gia lần thứ XXIII: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông – Quảng Ninh, pages 471–476.
[13] Leskovec, J., Rajaraman, A., and Ullman, J. D. (2020). Mining of massive data sets. Cambridge university press.
[14] Quang-Hung, L. and Thi-Xinh, L. (2021). Exploring set-inspired similarity measures for collaborative filtering recommendation. Proceedings of the 13th IEEE International Conference on Knowledge and Systems Engineering (KSE 2021), accepted.
[15] Ricci, F., Rokach, L., and Shapira, B. (2011). Introduction to recommender systems handbook. In Recommender systems handbook, pages 1–35. Springer. [16] Ricci, F., Rokach, L., and Shapira, B. (2015). Recommender systems: in-
troduction and challenges. In Recommender systems handbook, pages 1–34. Springer.
[17] Shani, G. and Gunawardana, A. (2011). Evaluating recommendation systems. InRecommender systems handbook, pages 257–297. Springer.
[18] Shirkhorshidi, A. S., Aghabozorgi, S., and Wah, T. Y. (2015). A comparison study on similarity and dissimilarity measures in clustering continuous data. PloS one, 10(12):e0144059.
[19] Smetsers, R. (2013). Association rule mining for recommender systems. PhD thesis, Tilburg University.
[20] Stephen, S. C., Xie, H., and Rai, S. (2017). Measures of similarity in memory- based collaborative filtering recommender system: A comparison. InProceedings of the 4th Multidisciplinary International Social Networks Conference, pages 1– 8.
[21] Thorat, P. B., Goudar, R., and Barve, S. (2015). Survey on collaborative filtering, content-based filtering and hybrid recommendation system. Interna- tional Journal of Computer Applications, 110(4):31–36.
[22] Vu, S.-L., Le, Q.-H., and Nguyen, V.-V. (2020). Đánh giá hệ gợi ý: Khảo sát và thực nghiệm. Hội thảo quốc gia lần thứ XXIII: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông – Quảng Ninh, pages 65–72.
[23] Wang, H., Zhang, P., Lu, T., Gu, H., and Gu, N. (2017). Hybrid recommen- dation model based on incremental collaborative filtering and content-based al- gorithms. In2017 IEEE 21st International Conference on Computer Supported Cooperative Work in Design (CSCWD), pages 337–342. IEEE.