Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 67 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
67
Dung lượng
1,17 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM THÀNH PHỐ HỒ CHÍ MINH Vy Vân NÂNG CAO HIỆU NĂNG HỆ TƯ VẤN DỰA TRÊN THỪA SỐ HÓA MA TRẬN LUẬN VĂN THẠC SĨ MÁY TÍNH Thành phố Hồ Chí Minh – 2018 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM THÀNH PHỐ HỒ CHÍ MINH Vy Vân NÂNG CAO HIỆU NĂNG HỆ TƯ VẤN DỰA TRÊN THỪA SỐ HÓA MA TRẬN Chuyên ngành : Khoa Học Máy Tính Mã số : 8480101 LUẬN VĂN THẠC SĨ MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS HỒ BẢO QUỐC Thành phố Hồ Chí Minh - 2018 MỤC LỤC Lời cam đoan Lời cám ơn Danh mục thuật ngữ viết tắt Danh mục bảng Danh mục hình vẽ Chương GIỚI THIỆU 1.1 Giới thiệu 1.2 Mục tiêu luận văn 1.3 Nội dung thực 1.4 Giới hạn luận văn 1.5 Tóm tắt đóng góp luận văn 1.5.1 Đóng góp mặt khoa học 1.5.2 Đóng góp mặt thực tiễn 1.6 Tổ chức luận văn Chương CÁC HỆ THỐNG TƯ VẤN 2.1 Tổng quan hệ thống tư vấn 2.2 Các hệ thống tư vấn lọc cộng tác 15 2.2.1 Phương pháp lân cận gần 16 2.2.2 Các mơ hình thống kê ngẫu nhiên (Statistical Random Effects Models) 17 2.2.3 Phương pháp thừa số hóa ma trận 19 2.2.4 Bài tốn thừa số hóa ma trận không âm 26 Chương TƯ VẤN THƠNG TIN DỰA TRÊN THỪA SỐ HĨA MA TRẬN KHÔNG ÂM 28 3.1 Cách tiếp cận 28 3.2 Các thuật toán đề xuất cho hệ thống 31 3.2.1 Khởi tạo giá trị ban đầu cho hai ma trận thành phần 31 3.2.2 Hàm chi phí cho tốn thừa số hóa ma trận khơng âm 33 3.2.3 Thuật toán đề xuất nâng cao hiệu cho tốn thừa số hóa ma trận khơng âm 40 Chương KẾT QUẢ THỰC NGHIỆM 43 4.1 Qui trình thực nghiệm 43 4.1.1 Tập liệu Dataset 44 4.1.2 Các thước đo đánh giá 44 4.2 Kết thực nghiệm 45 4.2.1 Độ xác 46 4.2.2 Độ hội tụ 47 4.2.3 Thời gian thực thi 48 Chương TỔNG KẾT 50 5.1 Kết đạt 50 5.1.1 Về mặt lý thuyết 50 5.1.2 Về mặt thực nghiệm 51 5.2 Ưu nhược điểm phương pháp đề xuất 52 5.3 Hướng mở rộng tương lai 52 TÀI LIỆU THAM KHẢO 54 LỜI CAM ĐOAN Tôi xin cam đoan luận văn tự thân tìm hiểu, nghiên cứu hướng dẫn PGS.TS Hồ Bảo Quốc Các số liệu sử dụng phân tích có nguồn gốc rõ ràng Các kết nghiên cứu luận văn hoàn toàn trung thực, khách quan chưa cơng bố nghiên cứu khác Các tài liệu tham khảo trích dẫn thích đầy đủ Học viên thực Vy Vân LỜI CÁM ƠN Đầu tiên, xin bày tỏ lòng biết ơn chân thành sâu sắc đến PGS.TS Hồ Bảo Quốc – giảng viên hướng dẫn luận văn Trong q trình làm luận văn, Thầy ln hỗ trợ, động viên, hết lịng hướng dẫn tơi hồn thành luận văn Tôi xin gửi lời cảm ơn chân thành đến Quý Thầy Cô − Trường Đại học Sư Phạm TP HCM truyền đạt kiến thức q báu cho tơi q trình học tập Đồng thời, xin gửi lời cảm ơn chân thành đến bạn đồng nghiệp Trường THPT chuyên Lương Thế Vinh – Đồng Nai hỗ trợ tạo điều kiện cho thời gian qua Cuối cùng, xin bày tỏ lòng biết ơn sâu sắc gia đình, người sát cánh tơi suốt q trình học tập thực luận văn TP HCM, tháng 09 năm 2018 Học viên thực Vy Vân DANH MỤC THUẬT NGỮ VIẾT TẮT Thuật ngữ tiếng Anh Viết tắt Collaborative Filtering CF Content-based CB Frobenius - Kullback Leibler - Itakura Saito FKI Latent Semantic Indexing LSI Matrix Factorization MF Mean Absolute Error MAE Mean Measure of Divergence MMD Method of Moments MM Non-negative Matrix Factorization NMF Pearson Correlation Coefficient PCC Pearson-Jaccard Principal Component Analysis Recommender System Root Mean Square Error PJ PCA RS RMSE Singular Value Decomposition SVD Stochastic Gradient Descent SGD DANH MỤC CÁC BẢNG Bảng 2.1 Minh họa ma trận đánh giá thưa R cho toán tư vấn 28 Bảng 4.1 So sánh số MAE RMSE thuật toán đề xuất với số thuật toán khác 46 Bảng 4.2 Bảng so sánh thời gian thực thi số thuật toán khác 49 DANH MỤC HÌNH VẼ Hình 2.1 Một số hướng nghiên cứu tiếp cận hệ thống tư vấn 10 Hình 2.2 Ma trận đánh giá phân tích thành ma trận low-rank U I 21 Hình 3.1 Kiến trúc NMF cho phương pháp đề xuất 30 Hình 3.2 Đồ thị hàm phân kì beta biểu diễn giá trị = 2, 1, tương ứng 35 Hình 4.1 Minh họa độ hội tụ phương pháp đề xuất số phương pháp khác 48 Chương GIỚI THIỆU 1.1 Giới thiệu Đầu tiên, ý tưởng đơn giản hệ thống tư vấn xuất vào đầu năm 1990 nhằm khai thác ý kiến hàng triệu người dùng (users) trực tuyến với mong muốn giúp users dễ dàng tìm kiếm nội dung hữu ích thú vị [1] Trải qua thực tế, ý tưởng đơn giản ban đầu chứng minh tính hiệu Hệ thống tư vấn thu thập thơng tin sở thích users cho tập hợp items (ví dụ: phim, hát, sách, truyện cười, tiện ích, ứng dụng, trang web, điểm đến du lịch tài liệu học trực tuyến) Thông tin thể cách rõ ràng (thường cách thu thập xếp hạng đánh giá users) ngầm định (thường theo dõi hành vi users, chẳng hạn hát nghe, tải xuống ứng dụng, truy cập trang web đọc sách) Hệ thống tư vấn sử dụng thông tin hồ sơ người dùng (như tuổi tác, quốc tịch, giới tính), thơng tin xã hội (như người theo dõi, theo dõi đăng) thường sử dụng hệ thống website, mạng xã hội Một xu hướng khác quan tâm, sử dụng thơng tin từ Internet (ví dụ: vị trí GPS, RFID, tín hiệu sức khỏe theo thời gian thực) Hiện nay, hệ thống tư vấn Internet trở nên phổ biến, điều tạo điều kiện cho việc áp dụng hệ thống tư vấn lĩnh vực đa dạng khác Các nghiên cứu thường tập trung vào tư vấn giới thiệu phim, tư vấn âm nhạc, chương trình truyền hình, sách, tài liệu, e-learning, thương mại điện tử tìm kiếm thơng tin [2] Thơng qua nguồn thông tin khác từ users, hệ thống tư vấn sử dụng thơng tin để cung cấp dự đoán đưa đề xuất hàng hóa 44 phương pháp đề xuất thay đổi trình thử nghiệm để tìm giá trị tốt 4.1.1 Tập liệu Dataset Có số loại liệu chuẩn cho hệ thống tư vấn Luận văn tiến hành thí nghiệm với liệu sử dụng thực tế tập liệu MovieLens [7] GroupLens Research tập hợp tạo số liệu đánh giá có sẵn từ trang web MovieLens Tập liệu bao gồm 100.000 ratings (các ratings số nguyên từ đến 5) cho 1642 phim 943 users, users đánh giá 20 phim 4.1.2 Các thước đo đánh giá Độ xác Có số loại biện pháp để đánh giá hiệu phương pháp tiếp cận CF [37], [38] Luận văn sử dụng hai số phổ biến, Mean Absolute Error (MAE) Root Mean Squared Error (RMSE) để đo lường đánh giá chất lượng tư vấn độ xác Chỉ số MAE xác định [8]: 𝑀𝐴𝐸 = ∑𝑢,𝑖|𝑅𝑢𝑖 − 𝑅̂𝑢𝑖 | |𝑅𝑡𝑒𝑠𝑡 | (4-1) Trong 𝑅̂𝑢𝑖 biểu thị cho dự đốn xếp hạng user u cho item i Rtest biểu thị số lượng ratings làm thí nghiệm Chỉ số RMSE xác định [8]: 𝑅𝑀𝑆𝐸 = √ |𝑅 𝑡𝑒𝑠𝑡 | ∑𝑢,𝑖(𝑅𝑢𝑖 − 𝑅̂𝑢𝑖 ) (4-2) 45 Từ định nghĩa [8], giá trị MAE RMSE nhỏ có nghĩa độ xác tốt Độ hội tụ Để đánh giá độ hội tụ (C) thuật toán, ta dựa vào hàm chi phí (cost function) Giá trị hàm chi phí giảm nhiều sau lần lặp tức độ hội tụ thuật toán lớn 𝐶= Với: 𝑒1 −𝑒𝑛 𝑛 - 𝑒𝑛 giá trị hàm chi phí vòng lặp thứ n - n số vòng lặp thực Nếu C mang giá trị lớn nghĩa độ hộ tụ nhanh, ngược lại giá trị nhỏ độ hội tụ chậm C mang giá trị âm, nghĩa thuật tốn khơng hội tụ Thời gian thực thi thuật toán So sánh thời gian thực thi thuật toán đề xuất phương pháp khác nhóm lọc cộng tác để đối chiếu xem thuật tốn đề xuất có ưu/ nhược điểm thời gian so với thuật tốn cịn lại 4.2 Kết thực nghiệm Kết cho thấy hiệu suất cao thu cách thiết lập tham số cho giá trị sau: 𝜑1 = 𝜑2 = 0.1 số vòng lặp tối đa 30 (max-iter =30) 𝜎 = 0.5 𝛼 = 0.2, 𝛽 = 0.4, 𝛾 = 0.4 Các giá trị xác định theo kinh nghiệm trình tiến hành thí nghiệm sơ tác giả không tuyên bố giá trị tối ưu 46 4.2.1 Độ xác Để thể tính hiệu phương pháp đề xuất đề xuất, luận văn so sánh kết dựa kết tư vấn phương pháp sau: Neighborhood-based Collaborative filtering: Đây phương pháp lọc cộng tác xác định mức độ quan tâm user tới item dựa users khác gần giống với user Việc gần giống users xác định thông qua mức độ quan tâm users tới items khác mà hệ thống biết Ví dụ, A B thích phim tình cảm Hàn Quốc, A thích phim “Trái tim mùa thu”, nhiều khả B thích phim MF: Đây phương pháp thừa số hóa ma trận trình bày phần 2.2.3 NMF bản: Đây phương pháp thừa số hóa ma trận khơng âm đơn giản nhất, cách khởi tạo ngẫu nhiên hệ số cho hai ma trận thành phần ban đầu, sau tính hàm chi phí cơng thức bình phương khoảng cách Euclid sử dụng phương pháp Gradient Descent để huấn luyện cho thuật tốn Phân tích số MAE RMSE thể bảng 4.1 Nếu độ lệch chuẩn (chỉ số RMSE) phương pháp cao, tức phương pháp có độ xác Chúng ta thấy phương pháp đề xuất có giá trị MAE RMSE thấp so với phương pháp lại Bảng 4.1 So sánh số MAE RMSE thuật toán đề xuất với số thuật toán khác Thuật toán MAE RMSE Neighborhood-based [39] 0.799 1.018 MF [40] 0.841 1.05 NMF 0.758 0.963 47 Phương pháp đề xuất 0.749 0.959 4.2.2 Độ hội tụ Để minh họa đồ họa cho hội tụ thuật toán đề xuất, tác giả biểu diễn số lần lặp (epochs) trục hoành phép đo hàm chi phí (costfunction) trục tung Điều minh họa q trình hội tụ thuật tốn đề xuất số lần lặp tăng lên Hình 4.1 thể số hàm chi phí tập liệu MovieLens thay đổi số lần lặp phương pháp đề xuất số phương pháp khác Đồ thị cho thấy, nhờ khởi tạo có lợi, giá trị ban đầu hàm chi phí phương pháp đề xuất thấp phương pháp MF thông thường Đồ thị Hình 4.1 cịn độ hội tụ phương pháp đề xuất (Combine) trội phương pháp MF số vịng lặp sử dụng q trình huấn luyện để đạt tới cực tiểu phương pháp đề xuất (15 vòng lặp) nửa so với phương pháp MF (30 vịng lặp) Ngồi ra, đồ thị so sánh phương pháp đề xuất với phương pháp thông thường khác Euclid, Itakura-Saito, Kullback-Leibler 48 Hình 4.1 Minh họa độ hội tụ phương pháp đề xuất số phương pháp khác 4.2.3 Thời gian thực thi Trong trình thử nghiệm, luận văn cân nhắc tới thời gian thực thi chương trình Kết cho thấy thời gian thực thi phương pháp đề xuất có tương đối cao số phương pháp khác, đặc biệt so với phương pháp NMF (Bảng 4-2) Tuy nhiên, thời gian thực thi chương trình khơng q lớn chấp nhận điều kiện thực tế Sở dĩ phương pháp đề xuất có thời gian thực thi chương trình cao NMF điều dễ hiểu, giai đoạn khởi tạo, phương pháp NMF cần khởi tạo giá trị ngẫu nhiên khơng âm cho hai ma trận U, I cịn phương pháp đề xuất khoảng thời gian tính độ tương đồng users, items để làm sở 49 điền giá trị cho hai ma trận thành phần U, I ban đầu Việc tính tốn làm ảnh hưởng tới thời gian thực thi toàn chương trình Bảng 4.2 Bảng so sánh thời gian thực thi số thuật toán khác Thuật toán Thời gian (s) Neighborhood-based 12s MF 68s NMF 15s Phương pháp đề xuất 31s 50 Chương TỔNG KẾT 5.1 Kết đạt 5.1.1 Về mặt lý thuyết Tiến hành nghiên cứu cơng trình nghiên cứu có liên quan đến phương pháp thừa số hóa ma trận Tìm hiểu trạng hệ thống tư vấn, phân tích ưu khuyết điểm phương pháp áp dụng phổ biến Tìm hiểu phương pháp thừa số hóa ma trận với thuật toán tư vấn: Phương pháp lân cận gần nhất, mơ hình thống kê, MF, NMF, … Nghiên cứu thuật toán Machine learning Luận văn đề xuất độ đo PJ cách tính hàm chi phí FKI việc khai thác hiệu tốn thừa số hóa ma trận không âm hệ thống tư vấn Ý tưởng cách tiếp cận đề xuất luận văn tác động vào trình khởi tạo cho hai ma trận thành phần ban đầu xây dựng công thức cập nhật giúp tối ưu hóa q trình lặp để toán hội tụ nhanh Để thực ý tưởng cách tiếp cận nêu trên, luận văn có sử dụng số kiến thức tốn thừa số hóa ma trận, đạo hàm riêng hàm đa biến, thuật giải tối ưu hóa vịng lặp machine learning số độ đo cần thiết để tích hợp cho tốn Trên sở đó, luận văn kết hợp linh hoạt đề xuất thuật toán riêng dựa sở phương pháp NMF với việc đánh hệ số cho ma trận khởi tạo dựa công thức PJ tính mức độ tương đồng users items với nhau, thay đơn khởi tạo cho hai ma trận thành phần ban đầu cách ngẫu nhiên nghiên cứu trước thường làm Đặc biệt, q trình tối ưu hóa hàm lỗi q trình lặp cho thuật tốn, luận văn đề xuất công thức cập nhật FKI, 51 kết hợp độ đo bình phương khoảng cách Euclid, độ phân kì KullbackLeibler độ phân kì Itakura-Saito 5.1.2 Về mặt thực nghiệm Luận văn sử dụng liệu mẫu MovieLens cho phương án cải tiến đề xuất với thuật toán khác để đối chiếu kết Kết thực nghiệm cho thấy việc kết hợp phương pháp đánh hệ số ban đầu cho ma trận khởi tạo xây dựng luật cập nhật cho hai ma trận thành phần trình thực bước lặp mang lại kết tốt việc sử dụng phương pháp thừa số hóa ma trận bản, tức đánh hệ số ngẫu nhiên cho hai ma trận khởi tạo dùng công thức cập nhật ma trận thành phần dùng độ đo nhất, ví dụ bình phương khoảng cách Euclid Ngồi ra, việc lựa chọn phương pháp tối ưu hóa machine learning ảnh hưởng đến kết hội tụ thuật toán Luận văn phân tích ưu khuyết điểm thuật tốn đề xuất nhằm giúp định hướng cho việc lựa chọn áp dụng thuật toán cho đạt hiệu cao Ưu điểm thuật toán đề xuất cho kết có độ xác cao số thuật tốn theo hướng thừa số hóa ma trận Thuật tốn hiệu kích thước ma trận đánh giá đủ lớn, thuật tốn khác gặp vấn đề tốc độ xử lí, phương pháp thừa số hóa ma trận, số chiều liệu giảm đáng kể khiến cho thuật toán chiếm ưu lớn so với phương pháp không sử dụng thừa số hóa ma trận khác Ngồi ra, việc khởi tạo có lợi ban đầu cho hai ma trận thành phần với việc sử dụng công thức cập nhật lai hóa stochastic gradient descent khiến thuật tốn hội tụ nhanh 52 5.2 Ưu nhược điểm phương pháp đề xuất Từ kết phân tích phần 4.2 Ta nhận thấy ưu nhược điểm phương pháp đề xuất sau: Về ưu điểm: Nhờ việc khởi tạo có lợi cho hai ma trận ban đầu U I, với việc kết hợp tuyến tính hàm chi phí Frobenius-norm, Kullback-Leibler Itakura-Saito hàm chi phí cơng thức cập nhật cho hai ma trận U, I ta dễ dàng nhận thấy phương pháp đề xuất có độ xác độ hội tụ tốt phương pháp thừa số hóa ma trận thơng thường Về nhược điểm: Do việc khởi tạo ban đầu phương pháp đề xuất địi hỏi thời gian tính tốn hai ma trận tương đồng users items dẫn đến thời gian tổng thể phương pháp đề xuất lâu phương pháp thừa số hóa ma trận khơng âm thơng thường Ngun phương pháp thừa số hóa ma trận không âm thông thường gần không tốn thời gian cho việc khởi tạo nhờ phát sinh ngẫu nhiên hệ số cho hai ma trận ban đầu U I 5.3 Hướng mở rộng tương lai Trong tương lai, luận văn dự kiến tiếp tục nghiên cứu số hướng phát triển sau: Nghiên cứu thêm phương pháp độ đo khác sử dụng để tính tốn mức độ tương đồng users items để tìm cách khởi tạo có lợi cho hai ma trận thành phần ban đầu Việc tìm tối ưu hóa tồn cục cho tốn thừa số hóa ma trận vấn đề thách thức giai đoạn nay, luận văn dự kiến khai thác số mạnh toán học công cụ hỗ trợ để áp dụng cải thiện chất lượng tư vấn theo hướng thừa số hóa ma trận không âm đưa lời giải tối ưu hóa tồn cục 53 Nghiên cứu thử nghiệm mở rộng thuật toán đề xuất kết hợp với phương pháp khác SVD phương pháp xác suất Probabilistic-Matrix-Factorization 54 TÀI LIỆU THAM KHẢO [1] D Jannach, M Zanker, A Felfernig, and G Friedrich, Recommender System An Introduction, New York: Cambridge University Press, 2011 [2] J Bobadilla, F Ortega, A Hernando, and A Gutiérrez, "Recommender systems survey," Elsevier, vol 46, pp 109-132, 2013 [3] M Pazzani, "A framework for collaborative, content-based, and demographic," Artificial Intelligence Review, no Special Issue on Data Mining on the internet, pp 393-408, 1999 [4] Y Koren, R Bell, and C Volinsky, "Matrix factorization techniques for Recommender systems," Computer, vol 42(8), pp 30-37, 2009 [5] B Kumar, "A novel latent factor model for recommender system," Journal of Information System and Technology Management, vol 13, 2016 [6] A Datta, S Kovaleva, P Mardziel, and S Sen, "Latent Factor Interpretations for Collaborative Filtering," arXiv, 2018 [Online] Available: https://arxiv.org/pdf/1711.10816.pdf, Last updated 30/09/2018 [7] "Grouplens," [Online] Available: https://grouplens.org/datasets/movielens/, Last updated 30/09/2018 [8] F Ricci, L Rokach, and B Shapira, Recommender Systems Handbook, Springer, 2011 [9] M J Pazzani, and D Billsus, "Content-based Recommendation Systems," LNCS, vol 4321, 2007 [10] C C Aggawal, "Content-based Recommender Systems," in Recommender Systems Textbook, Switzerland, Springer International Publishing, pp 139-166, 2016 [11] J B Schafer, D Frankowski, J Herlocker, and S Sen, "Collaborative Filtering Recommender Systems," LNCS, vol 4321, 2007 55 [12] J L Herlocker, J A Konstan, L G Terveen, and J Riedl, " Evaluating collaborative filtering recommender systems," ACM Transaction on Information Systems, vol 22(1), 2004 [13] C C Aggawal, "Neighborhood-Based Collaborative Filtering," in Recommender Systems Textbook, Switzerland, Springer International Publishing, pp 29-70, 2016 [14] C C Aggawal, "Model-Based Collaborative Filtering," in Recommender Systems Textbook, Switzerland, Springer International Publishing, pp 71138, 2016 [15] T Hofmann, "Latent semantic analysis for collaborative filtering," ACM Transactions on Information Systems, vol 1, pp 89- 115, 2004 [16] C L Zitnick, and T Kanade, " Maximum entropy for collaborative filtering," in Proceedings of the 20th conference on Uncertainty in artificial intelligence, Arlington, Virginia, USA, 2004 [17] D M Blei, A Y Ng, and M I Jordan, "Latent dirichlet allocation," Journal of Machine Learning Research, vol 3, 2003 [18] J S Breese, D Heckerman, and C Kadie, " Empirical Analysis of Predictive Algorithms for Collaborative Filtering," in Proceedings of the 14th Conference on Uncertainty In Artificial Intelligence (UAI’98), Wisconsin, USA, 1998 [19] M H Aghdam, M Analoui, and P Kabiri, "A Novel Non-Negative Matrix Factorization Method for Recommender Systems," Natural Science Publishing Journal, Applied Mathematics& Information Sciences, vol 9, 2015 [20] M Aleksandrova, A Brun, A Boyer, and O Chertov, "Identifying representative users in matrix factorization-based recommender systems: application to solving the content-less new item cold-start problem," Journal of Intelligent Information Systems, vol 48, no 2, pp 365-397, 2017 [21] P Perry, "Fast Moment-Based Estimation for Hierarchical Models," in JRSS-B, 2016 56 [22] K Gao, and A Owen, "Efficient Moment Calculations for Variance Components in Large Unbalanced Crossed Random Effects Models," technical report, 2016 [23] D D Lee, and H S Seung , "Learning the parts of objects by nonnegative matrix factorization," Nature, vol 401, pp 788-791, 1999 [24] C Cichocki, and A Phan, "Fast local algorithms for large scale nonnegative matrix and tensor factorizations," 2009 [25] C Févotte, N Bertin, and J L Durrieu, "Nonnegative Matrix Factorization with the Itakura-Saito Divergence: With Application to Music Analysis," Neural Computation, vol 21 (3), p 793–830, 2009 [26] C Fevotte, and J Idier, "Algorithms for nonnegative matrix factorization with beta-divergence," Neural Computation, 2011 [27] D D Lee, and H S Seung, "Algorithms for Non-negative Matrix Factorization," NIPS, 2001 [28] L Gong, and A K Nandi, "An enhanced initialization method for nonnegative matrix factorization," IEEE international workshop on machine learning for signal processing, pp 22-25, 2013 [29] M H Aghdam, M Analoui, and P Kabiri, "Collaborative filtering using non-negative matrix factorisation," Journal of Information Science, pp 113, 2016 [30] Suryakant, and T Mahara, "A New Similarity Measure Based on Mean Measure of Divergence for Collaborative Filtering in Sparse Environment," Procedia Computer Science , vol 89, pp 450-456, 2016 [31] A Agarwal, and M Chauhan, "Similarity Measures used in Recommender Systems: A Study," International Journal of Engineering Technology Science and Research (IJETSR), vol 4, no 6, pp 619-626, 2017 [32] A Banerjee, S Merugu, I S Dhillon, and J Ghosh, "Clustering with Bregman Divergences," Journal of Machine Learning Research , vol 6, p 1705–1749, 2005 57 [33] Bottou, and Léon, Online Algorithms and Stochastic Approximations, Cambridge University Press, 1998 [34] J J Burred, "J.J Burred," 2014 [Online] www.jjburred.com/research/pdf/jjburred_nmf_updates.pdf (jjburred@jjburred.com), Last updated 30/09/2018 Available: [35] A Koso, and N Takahashi, "Derivation of Multiplicative Update Rules for Nonnegative Matrix Factorization with Regularization Terms," in International Symposium on Nonlinear Theory and Its Applications, Cancun, Mexico, 2017 [36] D.J.Evans, and E.A.Lipitakis, "A normalized implicit conjugate gradient method for the solution of large sparse systems of linear equations," Computer Methods in Applied Mechanics and Engineering, vol 23, no 1, pp 1-19, 1980 [37] B Sarwar, G Karypis, J Konstan, and J Riedl, "Item-based collaborative filtering recommendation algorithms," in Proceedings of the 10th international conference on World Wide Web, New York, NY, USA, 2001 [38] F H Olmo, and E Gaudioso, "Evaluation of recommender systems: A new approach," Expert Systems with Applications, vol 3, pp 790-804 , 2008 [39] V H Tiep, "Machine Learning bản," [Online] Available: https://machinelearningcoban.com/2017/05/24/collaborativefiltering/, Last updated 30/09/2018 [40] V H Tiep, "Machine Learning bản," [Online] Available: https://machinelearningcoban.com/2017/05/31/matrixfactorization/, Last updated 30/09/2018 [41] J S Breese, D Heckerman, and C Kadie, "Empirical analysis of predictive algorithms for collaborative filtering," in 14th Conference on Uncertainty in Artificial Intelligence, 1998 58 [42] J L Herlocker, J A Konstan, J T Riedl, and L G Terveen, "Evaluating collaborative filtering recommender systems," ACM Transactions on Information Systems, vol 22, pp 5-53, 2004 ... việc nâng cao hiệu hệ tư vấn dựa thừa số hóa ma trận Mục tiêu cụ thể: Nghiên cứu phương pháp tiếp cận nhằm nâng cao chất lượng hệ i thống tư vấn theo hướng thừa số hóa ma trận Nghiên cứu hệ thống... pháp thừa số hóa ma trận Một hướng tiếp cận khác cho CF dựa MF, tức phân tích ma trận thành nhân tử hay nói cách khác thừa số hóa ma trận Ý tư? ??ng việc thừa số hóa ma trận cho hệ thống tư vấn tồn... 17 2.2.3 Phương pháp thừa số hóa ma trận 19 2.2.4 Bài toán thừa số hóa ma trận khơng âm 26 Chương TƯ VẤN THÔNG TIN DỰA TRÊN THỪA SỐ HĨA MA TRẬN KHƠNG ÂM 28 3.1 Cách