1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu kỹ thuật matrix factorization trong phương pháp khuyến nghị lọc cộng tác cho hệ tư vấn phim

58 15 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 58
Dung lượng 1,4 MB

Nội dung

- ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KINH TẾ HUẾ KHOA HỆ THỐNG THÔNG TIN KINH TẾ tế H uế -oOo cK in h KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGHIÊN CỨU KỸ THUẬT MATRIX FACTORIZATION họ TRONG PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC SINH VIÊN THỰC HIỆN: HOÀNG THỊ HẢI YẾN Tr ườ ng Đ ại CỘNG TÁC CHO HỆ TƯ VẤN PHIM NIÊN KHÓA: 2015 - 2019 ĐẠI HỌC HUẾ - TRƯỜNG ĐẠI HỌC KINH TẾ HUẾ KHOA HỆ THỐNG THÔNG TIN KINH TẾ tế H uế -oOo - cK in h KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGHIÊN CỨU KỸ THUẬT MATRIX FACTORIZATION họ TRONG PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC Đ ại CỘNG TÁC CHO HỆ TƯ VẤN PHIM ng Sinh viên thực hiện: Hoàng Thị Hải Yến Giảng viên hướng dẫn ườ Lớp: K49A – Tin học kinh tế Tr Niên khóa: 2015 - 2019 Huế, tháng năm 2019 ThS.Lê Viết Mẫn - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM LỜI CẢM ƠN Trước tiên, xin cảm ơn tất giảng viên trường Đại học Kinh tế Huế trực tiếp giảng dạy cung cấp cho nhiều kiến thức tảng suốt thời gian học tập môi trường đại học Đặc biệt, xin chân thành cảm ơn sâu sắc đến ThS.Lê uế Viết Mẫn trực tiếp hướng dẫn, hỗ trợ giúp đỡ tơi suốt q trình thực tế H khóa luận Tiếp theo, tơi xin cảm ơn anh Phùng Duy Lương1 anh Trà Thanh Long2 giúp đưa nhiều ý tưởng thuật thực tốt đề tài giúp nhiều vấn đề h kỹ thuật in Cuối cùng, xin bày tỏ lòng biết ơn sâu sắc đến gia đình, bạn bè, người thân cK động viên, khích lệ chúng tơi suốt q trình thực đề tài họ Thừa Thiên Huế, ngày 03 tháng 05 năm 2019 Đ ại Sinh viên thực đề tài Tr ườ ng Hoàng Thị Hải Yến Phùng Duy Lương, Nhân viên công ty FPT Software TP Hồ Chí Minh Trà Thanh Long, Nhân viên cơng ty Cổ Phần Giải pháp Công nghệ thông tin Tân Cảng - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM MỤC LỤC PHẦN MỞ ĐẦU 1.Lý chọn đề tài 2.Mục tiêu đề tài uế 3.Đối tượng, phạm vi phương pháp nghiên cứu 4.Nội dung khóa luận tế H 5.Một số nghiên cứu liên quan CHƯƠNG I: TỔNG QUAN VỀ HỆ KHUYẾN NGHỊ 1.1.Giới thiệu hệ khuyến nghị h 1.2.Chức hệ khuyến nghị in 1.3.Các phương pháp hệ khuyến nghị .8 1.4.Các phương pháp phân chia liệu 13 cK CHƯƠNG II: GIỚI THIỆU PHƯƠNG PHÁP LỌC CỘNG TÁC VÀ KỸ THUẬT MATRIX FACTORIZATION 15 họ 2.1 Hệ thống khuyến nghị lọc cộng tác 15 2.1.1 Giới thiệu phương pháp lọc cộng tác 15 2.1.2 Phân loại 16 Đ ại 2.1.3 Phương pháp đánh giá 16 2.1.4 Ưu điểm phương pháp lọc cộng tác 17 2.2 Kỹ thuật Matrix Factorization 18 ng 2.3.Non-negative Matrix Factorization 22 2.4.Biased Matrix Factorization 22 ườ CHƯƠNG III: HỆ THỐNG KHUYẾN NGHỊ PHIM DỰA TRÊN KỸ THUẬT MATRIX FACTORIZATION CỦA PHƯƠNG PHÁP LỌC CỘNG TÁC 24 Tr 3.1 Giới thiệu hệ thống Website phim 24 3.1.1 Mô tả toán 24 3.1.2 Mô tả liệu MovieLens 25 3.1.3 Ưu nhược điểm liệu MovieLens 26 3.2 Phân tích thiết kế hệ thống .27 3.2.1 Sơ đồ chức kinh doanh (BFD) 27 HOÀNG THỊ HẢI YẾN - LỚP K49A THKT i - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM 3.2.2 Sơ đồ ngữ cảnh (CD) 28 3.2.3 Sơ đồ luồng liệu mức (DFD mức 0) 29 3.2.4 Sơ đồ luồng liệu mức 1.0 (DFD mức 1.0) 30 3.2.5 Sơ đồ luồng liệu mức 2.0 (DFD mức 2.0) 31 uế 3.2.6 Sơ đồ luồng liệu mức 3.0 (DFD mức 3.0) 31 3.2.7 Thiết kế sở liệu 33 tế H 3.2.8 Thiết kế hình 34 3.3 Giải thuật 39 3.3.1 Tiền xử lý liệu 39 3.3.2 Dữ liệu đầu vào 40 in h 3.3.3 Dữ liệu đầu 41 3.3.5 Cài đặt giải thuật 42 cK 3.4 Thử nghiệm đánh giá 43 3.4.1 Những vấn đề kiểm thử đánh giá hệ khuyến nghị 44 3.4.2 Kết đánh giá thực tế 45 họ 3.4.3 Kết luận chung 45 3.5 So sánh phương pháp 45 Đ ại KẾT LUẬN 47 TÀI LIỆU THAM KHẢO 48 Tài liệu tiếng anh 48 Tr ườ ng Tài liệu tiếng việt 49 HOÀNG THỊ HẢI YẾN - LỚP K49A THKT ii - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM PHỤ LỤC THUẬT NGỮ Collaborative Filtering NMF Non-negative Matrix Factorization BMF Biased Matrix Factorization RS Recommender Systems SGD Stochastic Gradient Descent Tr ườ ng Đ ại họ cK in h tế H uế CF HOÀNG THỊ HẢI YẾN - LỚP K49A THKT iii - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM DANH MỤC BẢNG BIỂU Bảng 1.1: Ví dụ ma trận Người dùng * Sản phẩm .11 Bảng 2.1: Ma trận đánh giá 15 Bảng 3.1: Tổng hợp liệu kiểm thử 26 uế Bảng 3.2: Danh sách bảng liệu 33 Bảng 3.3: Kết kiểm thử giải thuật Non-Negative Matrix Factorization Biased Tr ườ ng Đ ại họ cK in h tế H Matrix Factorization 45 HOÀNG THỊ HẢI YẾN - LỚP K49A THKT iv - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM DANH MỤC HÌNH ẢNH Hình 1.1: Mơ hình tổng qt hệ khuyến nghị Hình 2.1: Phân loại hệ thống khuyến nghị 18 Hình 2.2: Sự phân rã ma trận .19 uế Hình 2.3: Q trình dự đốn, sau phân rã ma trận 22 Hình 3.1: Sơ đồ chức kinh doanh (BFD) 28 tế H Hình 3.2: Sơ đồ ngữ cảnh (CD) 28 Hình 3.3: Sơ đồ DFD mức 29 Hình 3.4: Sơ đồ DFD mức 1.0 .30 h Hình 3.5: Sơ đồ DFD mức 2.0 .31 in Hình 3.6: Sơ đồ DFD mức 3.0 .32 Hình 3.7: Mơ hình sở liệu 33 cK Hình 3.8: Màn hình trang chủ người dùng không đăng nhập hệ thống 34 Hình 3.9: Màn hình trang chủ người dùng có đăng nhập hệ thống 33 họ Hình 3.10: Màn hình xem chi tiết phim 34 Hình 3.11: Màn hình tìm kiếm phim .35 Hình 3.12: Màn hình khuyến nghị phim cho người dùng .36 Đ ại Hình 3.13: Màn hình đăng nhập vào hệ thống 37 Hình 3.14: Màn hình đăng ký tài khoản 37 Hình 3.15: Ma trận đánh giá cho hệ thống khuyến nghị tài nguyên phim 38 Tr ườ ng Hình 3.16: Lưu đồ giải thuật 39 HOÀNG THỊ HẢI YẾN - LỚP K49A THKT v - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM PHẦN MỞ ĐẦU Lý chọn đề tài Sự phát triển Internet đưa vào giới với lượng lớn uế phần tử thông tin âm nhạc, phim, sách vở, trang web với đặc tính khác Kết thơng tin khổng lồ đó, người ta cảm thấy rối rắm câu tế H hỏi đặt “Cái nào, thơng tin thích hợp với tơi hơn?” nảy sinh tư họ…điều dẫn tới yêu cầu phải có phương pháp tự động thu thập thông tin đưa lời khuyên để hỗ trợ cho người dùng gợi ý kịp thời để tìm kiếm thơng tin cách xác tiết kiệm tối đa thời gian, liệu lớn h khuyến nghị có vai trò quan trọng Hệ khuyến nghị (Recommender System - RS) in thơng tin phù hợp số thơng tin khổng lồ chưa có trật tự, sử cK dụng kỹ thuật lọc để chọn loại thông tin đặc trưng nhằm hiển thị phần tử phù hợp với sở thích người dùng Theo cách này, hệ thống có tích hợp tính gợi ý thu hút người dùng hài lòng tin cậy Các hệ thống gợi ý họ tiêu biểu Amazon, Netflix, IMDb, Youtube, MovieLens… tăng số lượng khách hàng truy cập nhờ vào tính hỗ trợ định hệ thống Đ ại Trong hệ khuyến nghị, lọc cộng tác (Collaborative Filtering - CF) phương pháp khai thác khía cạnh thói quen, sở thích, kinh nghiệm người dùng từ đưa danh sách hạng mục khuyến nghị cho người dùng Nghiên cứu tập trung vào kỹ thuật tiếp cận hệ khuyến nghị, đặc biệt kỹ thuật Matrix ng Factorization – MF với số thuật toán tiêu biểu Kỹ thuật tăng tốc độ độ hữu ườ ích CF giảm thời gian xử lý gợi ý cho người dùng mặt hàng hay thơng tin mà họ thực cần, u thích Do đó, tơi thực đề tài “Nghiên cứu kỹ thuật Matrix Factorization Tr phương pháp lọc cộng tác cho hệ tư vấn phim” với mục tiêu nghiên cứu lý thuyết hệ khuyến nghị, kỹ thuật hệ khuyến nghị đặc biệt phương pháp lọc cộng tác kỹ thuật Matrix Factorization thuộc phương pháp lọc cộng tác Bên cạnh đó, khóa luận tìm hiểu phương pháp đánh giá kiểm thử hệ khuyến nghị bao gồm số đánh giá cách tính số Tiếp đến, khóa luận tập trung xây dựng website HOÀNG THỊ HẢI YẾN - LỚP K49A THKT - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM khuyến nghị phim sử dụng kỹ thuật Matrix Factorization phương pháp lọc cộng tác, phân tích đánh giá hiệu việc ứng dụng hệ khuyến nghị việc xây dựng website Mục tiêu đề tài uế Khóa luận thực với hai mục tiêu chính:  Mục tiêu tổng quát tế H - Dựa nghiên cứu lý thuyết hệ khuyến nghị phương pháp lọc cộng tác, khóa luận tập trung nghiên cứu kỹ thuật Matrix Factorization biến thể Bên cạnh tiến hành phân tích, so sánh với kỹ thuật truyền thống phương pháp lọc cộng tác từ cài đặt hệ thống tư vấn phim sử dụng kỹ thuật in h  Mục tiêu cụ thể - Nghiên cứu lý thuyết hệ khuyến nghị, kỹ thuật tiếp cận hệ khuyến cK nghị, phương pháp đánh giá kiểm thử hệ khuyến nghị - Nghiên cứu phương pháp lọc cộng tác đặc biệt kỹ thuật Matrix Factorization biến thể họ - Xây dựng hệ thống website có tích hợp phương pháp khuyến nghị lọc cộng tác nhằm hỗ trợ người dùng hiệu chất lượng Đ ại Đối tượng, phạm vi phương pháp nghiên cứu  Đối tượng - Hệ khuyến nghị ng - Phương pháp lọc cộng tác kỹ thuật Matrix Factorization - Phương pháp đánh giá hệ khuyến nghị ườ - Phương pháp xây dựng website tư vấn phim có áp dụng phương pháp lọc cộng tác Tr  Phạm vi nghiên cứu Tìm hiểu kỹ thuật lọc cộng tác, thuật tốn tương ứng cho kỹ thuật lọc cộng tác bao gồm phân tích ma trận (matrix factorization), phân tích ma trận khơng âm HỒNG THỊ HẢI YẾN - LỚP K49A THKT - ng Đ ại họ cK in h tế H uế NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM Hình 3.10: Màn hình xem chi tiết phim ườ d Màn hình tìm kiếm phim Khi hình người dùng tìm kiếm phim với từ khóa Tr cần Hệ thống đưa danh sách phim tìm thấy… HOÀNG THỊ HẢI YẾN - LỚP K49A THKT 36 - Đ ại họ cK in h tế H uế NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM ng Hình 3.11: Màn hình tìm kiếm phim e Màn hình khuyến nghị phim cho người dùng ườ Đây hình hệ thống Tab Phim đề cử hệ thống đưa danh sách gồm 20 phim đề xuất cho người dùng tương ứng với User đăng nhập Tr hệ thống HOÀNG THỊ HẢI YẾN - LỚP K49A THKT 37 - Tr ườ ng Đ ại họ cK in h tế H uế NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM Hình 3.12: Màn hình khuyến nghị phim cho người dùng HOÀNG THỊ HẢI YẾN - LỚP K49A THKT 38 - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM tế H uế f Màn hình đăng nhập vào hệ thống ng Đ ại họ cK in g Màn hình đăng ký tài khoản h Hình 3.13: Màn hình đăng nhập vào hệ thống Hình 3.14: Màn hình đăng ký tài khoản ườ 3.3 Giải thuật Tr 3.3.1 Tiền xử lý liệu Về phương pháp khuyến nghị lọc cộng tác nhóm, sử dụng thuật toán BMF dựa việc phân rã ma trận đánh gia đầu vào để đưa danh sách dự đoán Áp dụng cho toán khuyến nghị với tài nguyên phim, ánh xạ ma trận điểm đánh giá tương tự với ma trận điểm số người dùng Với danh sách phim ánh xạ vào hạng mục Khi đó, ma trận đánh giá áp dụng sau: HOÀNG THỊ HẢI YẾN - LỚP K49A THKT 39 - tế H uế NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM Hình 3.15: Ma trận đánh giá cho hệ thống khuyến nghị tài nguyên phim điểm số dự đoán cho người dùng thực xem phim h Giá trị dự đoán in Từ giá trị dự đốn, chúng tơi phân tích liệu phim người dùng tương ứng, sau đưa định danh sách tài nguyên phim cho người dùng cK Ở giai đoạn này, tơi trích xuất liệu từ sở liệu hệ thống5; liệu tơi trích xuất cụ thể bao gồm: danh sách người dùng hệ thống, danh sách phim họ hệ thống Cụ thể danh sách người dùng đại diện danh sách mã người dùng (mã nhất, dành cho người nhất); danh sách Đ ại phim đại diện danh sách mã phim (mã nhất) Từ danh sách liệu trích xuất, chúng tơi khởi tạo ma trận đánh giá lấp đầy giá trị thiếu với giá trị mặc định, liệu sẵn sàng cho công đoạn Dữ liệu đầu vào ng 3.3.2  Ma trận đánh giá V: Mã người dùng, mã phim, điểm số đánh giá ườ  Hệ số tiềm ẩn, số đặc tính quan tâm Tr  Ngưỡng lỗi cho phép  Hệ số tốc độ học  Hệ số tắc HỒNG THỊ HẢI YẾN - LỚP K49A THKT 40 - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM 3.3.3 Dữ liệu đầu  Hai ma trận , ma trận đánh giá người dùng ma trận đánh giá mức quan tâm đặc tính phim Từ dựng lại ma trận với điểm số đầy đủ cho ma trận đánh giá ban đầu , danh sách giá trị thiên vị tương ứng với phimp Danh sách tài nguyên tư vấn cho người dùng 3.3.4 tế H với người dùng uế  Giá trị thiên vị chung cho toàn hệ thống , danh sách giá trị thiên vị tương ứng Lưu đồ giải thuật h Bắt đầu in Trích xuất liệu từ sở liệu Tiền xử lý liệu cK Chuẩn bị liệu đầu vào cho BMF Khởi tạo ngẫu nhiên ma trận U,I họ Tính tốn giá trị thiên vị Tính sai số, độ lỗi Đ ại Cập nhật giá tri thiên vị Cập nhật giá trị cho U,I Cập nhật giá trị sai số tối thiểu Điều kiện dừng Tính tốn lại ma trận dự đốn Lấy danh sách dự đốn, tính tốn danh sách tư vấn Lưu danh sách tư vấn xuống sở liệu Tr ườ ng sai Kết thúc Hình 3.16: Lưu đồ giải thuật HOÀNG THỊ HẢI YẾN - LỚP K49A THKT 41 - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM 3.3.5 Cài đặt giải thuật Cài đặt thuật toán dự đoán với BFM 1: procedure FILM-TASK -BMF ( ∑ , , | ∈ ∑ | 5: end for 6: for each task ∑ 7: 8: end for 10: ← 11:for | , , , ∈ , ∈ | | | | 0, 0, ← 1, … , ← 1, … , | | ng 12:for | Đ ại 9: ← | , , ∈ , , ∈ | 13: ườ 14: for ← 1, … , | | ∑ Tr 15: 16: 17: ← 18: 19: uế | | be film-bias and task-bias 3: for each film 4: be latent factors of film tế H | | and a performance score h ← | | and ∈ a task, in Let ∈ cK | | Let 2: be a film, , , ,λ, ) họ ∈ Let , for ← ← ∗ ← 1, … , HOÀNG THỊ HẢI YẾN - LỚP K49A THKT ∗ ∗ ∗ ∗ 42 - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM ← 21: 22: if 23: if 24: + ∗( [ ] < [ ] < end for ∗ [ ]←0 ←0 ← 1, … , | | 30: for 31: 32: = + ( ← 1, … , End for end for h ← 1, … , | | = − in for 29: 33: − ∗ [ ][ ]) ∗ [ ][ ]) cK 28: ∗ [ ][ ]) end for + ∗( họ 27:for − [ ]←0 26:end for 27: ∗ tế H 25: + ∗( uế ← 20: + ) 35:if Đ ại 34:end for ≤ 36:end for return { , , ng 37:return { , , , , } ườ 38: end procedure , , } Tr 3.4 Thử nghiệm đánh giá Để kiểm chứng mức độ hiệu giải thuật so sánh giải thuật với nhau, yêu cầu thước đo đánh giá (metric evaluation), liệu huấn luyện liệu kiểm thử phải tuân theo “chuẩn chung” Trên thực tế, mức độ hiệu giải thuật phải kiểm nghiệm liệu (dataset) khác nhiều thước đo đánh giá (metric evaluation) Đặc biệt, giải thuật lọc cộng HOÀNG THỊ HẢI YẾN - LỚP K49A THKT 43 - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM tác, số đánh giá thường dùng MAE, RMSE để kiểm tra tính xác mức độ hiệu giải thuật Một vấn đề khác việc phân chia liệu kiểm thử địi hỏi u cầu cao khơng so với việc đưa giải thuật Nội dung chương trình bày chi tiết phương pháp phân chia liệu đánh giá thành liệu uế huấn luyện kiểm thử, kết kiểm thử thực nghiệm để đưa nhìn tổng quát liệu Movielens-100K [6] Movielens-1M [6] 3.4.1 tế H mức độ hiệu giải thuật Kết thực nghiệm tiến hành hai Những vấn đề kiểm thử đánh giá hệ khuyến nghị Thứ nhất, giải thuật khác hiệu hiệu h thực kiểm thử nhiều tập liệu khác Hiện nay, hầu hết liệu in kiểm thử có số lượng người dùng lớn nhiều so với sản phẩm, giải thuật cK hiệu thực tập liệu có số lượng người dùng nhỏ số lượng sản phẩm Tương tự, số tính chất khác mật độ phân bổ đánh giá, thang giá trị đánh giá thuộc tính khác liệu tác động không nhỏ đến việc họ đánh giá hiệu giải thuật [7] Thứ hai, mục đích việc đánh giá ảnh hưởng đến việc xác định hiệu Đ ại giải thuật Một số giải thuật tập trung vào việc đưa dự đoán đánh giá gần số giải thuật tập trung vào việc nâng cao mức độ phù hợp khuyến nghị với sở thích người dùng [7] Hay nói cách khác việc lựa chọn tiêu ng chí đánh giá kết hợp chúng cho phù hợp so sánh thuật toán khác quan trọng ườ Thứ ba, việc tìm kiếm, lựa chọn tập liệu kiểm thử tin cậy gặp nhiều Tr khó khăn Đây vấn đề khó khăn thực đánh giá nhiều giải thuật Thứ tư, việc phân chia liệu kiểm thử ảnh hưởng không nhỏ đến hiệu giải thuật tỉ lệ tập huấn luyện kiểm thử hay phương pháp phân chia liệu Trong hầu hết trình kiểm thử, liệu phân chia ngẫu nhiên thường khơng theo quy tắc, cách phân chia khác ảnh hưởng đến việc đánh giá mức độ hiệu giải thuật cách khách quan HOÀNG THỊ HẢI YẾN - LỚP K49A THKT 44 - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM 3.4.2 Kết đánh giá thực tế Thử nghiệm đánh giá khả đưa dự đốn thơng qua số MAE, RMSE Trong giá trị dự đốn đánh giá giữ nguyên kết thập phân không làm tròn, số thử nghiệm cho thấy việc làm trịn làm thấp giá trị uế MAE, nhiên làm tăng giá trị RMSE Non-Negative Matrix Biased Matrix giá Factorization Factorization MAE 0.7572 0.7221 RMSE 0.9634 Movielens-100K h Chỉ số đánh in Dữ liệu RMSE Kết luận chung 0.9149 0.7273 0.676 0.9155 0.853 cK MAE Movielens-1M 3.4.3 tế H Bảng 3.3: Kết kiểm thử giải thuật Non-Negative Matrix Factorization Biased Matrix Factorization họ Thông qua đánh giá trên, kết cho thấy giải thuật không phụ thuộc vào chất thuật tốn mà cịn phụ thuộc nhiều vào liệu Trong giới hạn thử Đ ại nghiệm này, nhìn chung, giải thuật Biased Matrix Factorization cho kết tốt giải thuật Non-Negative Matrix Factorization (giải thuật có số đánh giá thấp có ý nghĩa nằm miền giá trị {0;1}) Tuy nhiên, kết luận ng giải thuật hồn tồn tốt Việc lựa chọn giải thuật sử dụng phụ thuộc nhiều vào môi trường phát triển, triển khai ứng dụng, đặc biệt việc sử dụng không ườ gian lưu trữ việc đáp ứng tài nguyên Tr 3.5 So sánh phương pháp Ngồi kỹ thuật Matrix Factorization phương pháp lọc cộng tác cịn có hai cách tiếp cận theo mơ hình K láng giềng dựa người dùng (User-based) – dự đoán dựa tương tự giữ người dùng dựa mục tin (Item-based) – dự đoạn dựa tương tự mục tin đáp ứng đầy đủ trình tính tốn, kỹ thuật, cơng thức đưa kết tư vấn hiệu quả, phù hợp HOÀNG THỊ HẢI YẾN - LỚP K49A THKT 45 - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM kỹ thuật mặt hàng phù hợp (Matching Product) đưa kết tư vấn dựa tương quan phim kết đưa trùng lặp phim người xem xem qua Kỹ thuật Matrix Factorization đưa kết xác phù hợp so với Tr ườ ng Đ ại họ cK in h tế H việc tính tốn Matrix Factorization tiết kiệm thời gian uế phương pháp truyền thống Đặc biệt website phim liệu lớn nên HOÀNG THỊ HẢI YẾN - LỚP K49A THKT 46 - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM KẾT LUẬN Về mặt phát triển hệ thống website phim, triển khai thành công hệ thống với liệu mẫu MovieLens phát triển thêm nhiều chức cần thiết cho hệ thống nhằm đáp ứng nhu cầu cần thiết người dùng, với hiệu suất uế tính ổn định cao Trong q trình xây dựng hệ thống, tơi tìm hiểu vận dụng tế H tốt công nghệ lập trình ứng dụng, bật đó: Cơ sở liệu thiết kế bổ sung để tối ưu cho việc lưu trữ liệu mở rộng nguồn thu thập, ứng dụng cho việc áp dụng thuật toán khuyến nghị vào toán h khuyến nghị tài nguyên phim in Trên phương diện lý thuyết, luận văn tìm hiểu qua vấn đề hệ khuyến nghị hệ sở tri thức Đồng thời đề xuất hệ khuyến nghị nhằm dự đoán cK thu nhập liệu (hành vi) người dùng, từ đưa tư vấn tài nguyên phim cho người dùng dựa hành vi người dùng sẵn có họ Qua q trình thực nghiệm hệ thống, nhận thấy mơ hình đáp ứng u cầu khóa luận Các giá trị tính tốn mang giá trị thực tiễn cao hồn tồn Đ ại xác Đặc biệt giải khuyết điểm phương pháp khuyến nghị lọc cộng tác: tốc độ tính tốn, xuất người dùng sản phẩm mới… Tóm lại, phương pháp lọc cộng tác dựa vào nhớ phương pháp ng lọc cộng tác dựa mơ hình triển khai ma trận đánh giá mở rộng Để tận dụng ưu mơ hình đồ thị, tơi đề xuất xây dựng độ tương quan khai thác ườ gián tiếp mối quan hệ người dùng, sản phẩm, đặc trưng người dùng, đặc trưng sản phẩm để nâng cao kết dự đoán Kết thử nghiệm phương pháp tư vấn Tr kết hợp đề xuất cho thấy chất lượng tư vấn cải thiện đáng kể so với phương pháp tư vấn Chúng tơi tin tưởng rằng, mơ hình cho lại kết tốt phương pháp tư vấn dựa mơ hình HỒNG THỊ HẢI YẾN - LỚP K49A THKT 47 - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM TÀI LIỆU THAM KHẢO Tài liệu tiếng anh [1] H Sebastian Seung*t tDept of Brain and Cog Sci Massachusetts Institute of Technology Cambridge, MA 02138, Algorithms for Non-negative Matrix uế Factorization (tham khảo từ trang đến trang 7) tế H [2] Matrix Factorization Techniques for Recommender Systems, Patrick Seemann, December 16th, 2014 (tham khảo từ trang đến trang 26) [3] Recommender Systems Handbook 1st, Springer-Verlag New York, Inc New h York, NY, USA ©2010 (tham khảo từ trang đến trang 10) in [4] Thornburg, David (2000), “Technology in K-12 Education: Envisioning a New Future”; available from http://www.air-dc.org/forum/abthornburg.htm; accessed cK July 2002 (tham khảo từ trang đến trang 13) [5] X Su and T M Khoshgoftaar, “A survey of collaborative filtering trang đến trang 27) họ techniques,” Adv in Artif Intell., vol 2009, pp 4:2–4:2, Jan 2009 (tham khảo từ Available: Đ ại [11] "KDD Cup 2010 Educational Data Mining Challenge" 2010 [Online] http://www.kdd.org/kdd-cup/view/kdd-cup-2010-student-performance- evaluation/Data (tài liệu tham khảo online) ng [6] “Movilens” [Online] Available: http://grouplens.org/datasets/movielens/ (tài liệu tham khảo online) ườ [7] J L Herlocker, J A Konstan, L G Terveen, and J T Riedl, “Evaluating collaborative filtering recommender systems,” ACM Trans Inf Syst., vol 22, no 1, Tr pp 5–53, Jan 2004 (tham khảo từ trang đến trang 49) [8] P Cremonesi, R Turrin, E Lentini, and M Matteucci, “An Evaluation Methodology for Collaborative Recommender Systems” in Proceedings of the 2008 International Conference on Automated solutions for Cross Media Content and Multichannel Distribution, 2008, pp 224–231 (tham khảo từ trang đến trang 14) HOÀNG THỊ HẢI YẾN - LỚP K49A THKT 48 - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM [9] M D Ekstrand, J T Riedl and J A Konstan, “Collaborative Filtering Recommender System” Foundations and Trends in Human–Computer Interaction, Vol 4, No2, 2010, pp 81:173 Recommendation in Heterogeneous Networks” UMAP 2014: 49-60 tế H Tài liệu tiếng việt uế [10] Robin D Burke, Fatemeh Vahedian, Bamshad Mobasher, “Hybrid [11] Nguyễn Thái Nghe, Huỳnh Xuân Hiệp 2012 Ứng dụng kỹ thuật phân rã ma trận đa quan hệ xây dựng hệ trợ giảng thông minh, Kỷ yếu Hội thảo quốc gia lần in Khoa học Kỹ thuật ISBN: 893-5048-931578 h thứ XV: Một số vấn đề chọn lọc CNTT&TT (@2012), trang 470-477 Nhà xuất [12] Nguyễn Hùng Dũng, Nguyễn Thái Nghe 2014 Hệ thống gợi ý sản phẩm cK bán hàng trực tuyến sử dụng kỹ thuật lọc cộng tác Tạp chí Khoa học Trường Đại học Cần Thơ, số 31a (2014), trang 36-51 ISSN: 1859-2333 họ [13] Triệu Vĩnh Viêm, Triệu Yến Yến, Nguyễn Thái Nghe 2013 Xây dựng hệ thống gợi ý phim dựa mơ hình nhân tố láng giềng Số chun đề: Cơng nghệ Thơng tin (2013): 170-179, Tạp chí Khoa học Trường Đại học Cần Thơ, ISSN: 1859- Đ ại 2333 [14] Nguyễn Thị Thùy Trang - Nghiên cứu phương pháp lọc cộng tác cho hệ ng thống tư vấn phim – K43 Tin học kinh tế (Khóa luận tốt nghiệp) < https://drive.google.com/file/d/0B6SflM2wxmikUFJPVW9INndMNDQ/edit> ườ [15] Nguyễn Minh Đức - Nghiên cứu mô hình đa tác tử hút đẩy cho phương Tr pháp lọc cộng tác – K44 Tin học kinh tế (Khóa luận tốt nghiệp) < https://drive.google.com/file/d/0B6SflM2wxmikWDFYWVdncHhxMXc/edit> [16] Claypool, M., Gokhale, A., Miranda, T., Murnikov, P., Netes, D., Sartin, M “Combining content-based and collaborative filters in an online newspaper” In: Proceedings of ACM SIGIR workshop on recommender systems, vol 60 Citeseer (1999) HOÀNG THỊ HẢI YẾN - LỚP K49A THKT 49 - NGHIÊN CỨU PHƯƠNG PHÁP KHUYẾN NGHỊ LỌC CỘNG TÁC CHO HỆ TƯ VẤN PHIM [17] Claypool, M., Gokhale, A., Miranda, T., Murnikov, P., Netes, D., Sartin, M “Combining content-based and collaborative filters in an online newspaper” In: Proceedings of ACM SIGIR workshop on recommender systems, vol 60 Citeseer (1999) uế [18] Claypool, M., Gokhale, A., Miranda, T., Murnikov, P., Netes, D., & Sartin, M : Combining contentbased and collaborative fillters in an online newspaper Tr ườ ng Đ ại họ cK in h tế H Proceedings of ACM SIGIR Workshop on Recommender Systems.(1999) HOÀNG THỊ HẢI YẾN - LỚP K49A THKT 50

Ngày đăng: 28/08/2023, 20:48

w