Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 67 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
67
Dung lượng
1,2 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM THÀNH PHỐ HỒ CHÍ MINH Vy Vân NÂNG CAO HIỆU NĂNG HỆ TƯ VẤN DỰA TRÊN THỪA SỐ HÓA MA TRẬN LUẬN VĂN THẠC SĨ MÁY TÍNH Thành phố Hồ Chí Minh – 2018 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM THÀNH PHỐ HỒ CHÍ MINH Vy Vân NÂNG CAO HIỆU NĂNG HỆ TƯ VẤN DỰA TRÊN THỪA SỐ HÓA MA TRẬN Chuyên ngành : Khoa Học Máy Tính Mã số : 8480101 LUẬN VĂN THẠC SĨ MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS HỒ BẢO QUỐC Thành phố Hồ Chí Minh - 2018 MỤC LỤC Lời cam đoan Lời cám ơn Danh mục thuật ngữ viết tắt Danh mục bảng Danh mục hình vẽ Chương GIỚI THIỆU 1.1 Giới thiệu 1.2 Mục tiêu luận văn 1.3 Nội dung thực 1.4 Giới hạn luận văn 1.5 Tóm tắt đóng góp luận văn 1.5.1 Đóng góp mặt khoa học 1.5.2 Đóng góp mặt thực tiễn 1.6 Tổ chức luận văn Chương CÁC HỆ THỐNG TƯ VẤN 2.1 Tổng quan hệ thống tư vấn 2.2 Các hệ thống tư vấn lọc cộng tác 15 2.2.1 Phương pháp lân cận gần 16 2.2.2 Các mơ hình thống kê ngẫu nhiên (Statistical Random Effects Models) 17 2.2.3 Phương pháp thừa số hóa ma trận 19 2.2.4 Bài tốn thừa số hóa ma trận không âm 26 Chương TƯ VẤN THƠNG TIN DỰA TRÊN THỪA SỐ HĨA MA TRẬN KHÔNG ÂM 28 3.1 Cách tiếp cận 28 3.2 Các thuật toán đề xuất cho hệ thống 31 3.2.1 Khởi tạo giá trị ban đầu cho hai ma trận thành phần 31 3.2.2 Hàm chi phí cho tốn thừa số hóa ma trận khơng âm 33 3.2.3 Thuật toán đề xuất nâng cao hiệu cho tốn thừa số hóa ma trận khơng âm 40 Chương KẾT QUẢ THỰC NGHIỆM 43 4.1 Qui trình thực nghiệm 43 4.1.1 Tập liệu Dataset 44 4.1.2 Các thước đo đánh giá 44 4.2 Kết thực nghiệm 45 4.2.1 Độ xác 46 4.2.2 Độ hội tụ 47 4.2.3 Thời gian thực thi 48 Chương TỔNG KẾT 50 5.1 Kết đạt 50 5.1.1 Về mặt lý thuyết 50 5.1.2 Về mặt thực nghiệm 51 5.2 Ưu nhược điểm phương pháp đề xuất 52 5.3 Hướng mở rộng tương lai 52 TÀI LIỆU THAM KHẢO 54 LỜI CAM ĐOAN Tôi xin cam đoan luận văn tự thân tìm hiểu, nghiên cứu hướng dẫn PGS.TS Hồ Bảo Quốc Các số liệu sử dụng phân tích có nguồn gốc rõ ràng Các kết nghiên cứu luận văn hoàn toàn trung thực, khách quan chưa cơng bố nghiên cứu khác Các tài liệu tham khảo trích dẫn thích đầy đủ Học viên thực Vy Vân LỜI CÁM ƠN Đầu tiên, xin bày tỏ lòng biết ơn chân thành sâu sắc đến PGS.TS Hồ Bảo Quốc – giảng viên hướng dẫn luận văn Trong q trình làm luận văn, Thầy ln hỗ trợ, động viên, hết lịng hướng dẫn tơi hồn thành luận văn Tôi xin gửi lời cảm ơn chân thành đến Quý Thầy Cô − Trường Đại học Sư Phạm TP HCM truyền đạt kiến thức q báu cho tơi q trình học tập Đồng thời, xin gửi lời cảm ơn chân thành đến bạn đồng nghiệp Trường THPT chuyên Lương Thế Vinh – Đồng Nai hỗ trợ tạo điều kiện cho thời gian qua Cuối cùng, xin bày tỏ lòng biết ơn sâu sắc gia đình, người sát cánh tơi suốt q trình học tập thực luận văn TP HCM, tháng 09 năm 2018 Học viên thực Vy Vân DANH MỤC THUẬT NGỮ VIẾT TẮT Thuật ngữ tiếng Anh Viết tắt Collaborative Filtering CF Content-based CB Frobenius - Kullback Leibler - Itakura Saito FKI Latent Semantic Indexing LSI Matrix Factorization MF Mean Absolute Error MAE Mean Measure of Divergence MMD Method of Moments MM Non-negative Matrix Factorization NMF Pearson Correlation Coefficient PCC Pearson-Jaccard Principal Component Analysis Recommender System Root Mean Square Error PJ PCA RS RMSE Singular Value Decomposition SVD Stochastic Gradient Descent SGD DANH MỤC CÁC BẢNG Bảng 2.1 Minh họa ma trận đánh giá thưa R cho toán tư vấn 28 Bảng 4.1 So sánh số MAE RMSE thuật toán đề xuất với số thuật toán khác 46 Bảng 4.2 Bảng so sánh thời gian thực thi số thuật toán khác 49 DANH MỤC HÌNH VẼ Hình 2.1 Một số hướng nghiên cứu tiếp cận hệ thống tư vấn 10 Hình 2.2 Ma trận đánh giá phân tích thành ma trận low-rank U I 21 Hình 3.1 Kiến trúc NMF cho phương pháp đề xuất 30 Hình 3.2 Đồ thị hàm phân kì beta biểu diễn giá trị = 2, 1, tương ứng 35 Hình 4.1 Minh họa độ hội tụ phương pháp đề xuất số phương pháp khác 48 Chương GIỚI THIỆU 1.1 Giới thiệu Đầu tiên, ý tưởng đơn giản hệ thống tư vấn xuất vào đầu năm 1990 nhằm khai thác ý kiến hàng triệu người dùng (users) trực tuyến với mong muốn giúp users dễ dàng tìm kiếm nội dung hữu ích thú vị [1] Trải qua thực tế, ý tưởng đơn giản ban đầu chứng minh tính hiệu Hệ thống tư vấn thu thập thơng tin sở thích users cho tập hợp items (ví dụ: phim, hát, sách, truyện cười, tiện ích, ứng dụng, trang web, điểm đến du lịch tài liệu học trực tuyến) Thông tin thể cách rõ ràng (thường cách thu thập xếp hạng đánh giá users) ngầm định (thường theo dõi hành vi users, chẳng hạn hát nghe, tải xuống ứng dụng, truy cập trang web đọc sách) Hệ thống tư vấn sử dụng thông tin hồ sơ người dùng (như tuổi tác, quốc tịch, giới tính), thơng tin xã hội (như người theo dõi, theo dõi đăng) thường sử dụng hệ thống website, mạng xã hội Một xu hướng khác quan tâm, sử dụng thơng tin từ Internet (ví dụ: vị trí GPS, RFID, tín hiệu sức khỏe theo thời gian thực) Hiện nay, hệ thống tư vấn Internet trở nên phổ biến, điều tạo điều kiện cho việc áp dụng hệ thống tư vấn lĩnh vực đa dạng khác Các nghiên cứu thường tập trung vào tư vấn giới thiệu phim, tư vấn âm nhạc, chương trình truyền hình, sách, tài liệu, e-learning, thương mại điện tử tìm kiếm thơng tin [2] Thơng qua nguồn thông tin khác từ users, hệ thống tư vấn sử dụng thơng tin để cung cấp dự đoán đưa đề xuất hàng hóa ... chọn áp dụng thu? ??t toán cho đạt hiệu cao Ưu điểm thu? ??t toán đề xuất cho kết có độ xác cao số thu? ??t tốn theo hướng thừa số hóa ma trận Thu? ??t tốn hiệu kích thước ma trận đánh giá đủ lớn, thu? ??t tốn... công, công ty tư vấn phải áp dụng lý thuyết hệ thống tư vấn sang thực tiễn để chứng minh dự đoán xác, cung cấp tư vấn có giá trị - thường hình thức chọn vài items cụ thể để đề xuất tư vấn cho giao... 5.1 Kết đạt 50 5.1.1 Về mặt lý thuyết 50 5.1.2 Về mặt thực nghiệm 51 5.2 Ưu nhược điểm phương pháp đề xuất 52 5.3 Hướng mở rộng tư? ?ng lai 52 TÀI LIỆU THAM