Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 60 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
60
Dung lượng
2,15 MB
Nội dung
ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOA - - PHẠM HOÀNG TRƢƠNG NGHIÊN CỨU VÀ ỨNG DỤNG KỸ THUẬT SVD VÀO HỆ THỐNG GỢI Ý LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Đà Nẵng - Năm 2018 ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOA - - PHẠM HOÀNG TRƢƠNG NGHIÊN CỨU VÀ ỨNG DỤNG KỸ THUẬT SVD VÀO HỆ THỐNG GỢI Ý Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60.48.01.01 LUẬN VĂN THẠC SĨ Ngƣời hƣớng dẫn khoa học: TS NGUYỄN VĂN HIỆU Đà Nẵng - Năm 2018 LỜI CAM ĐOAN Tôi xin cam đoan: Những nội dung luận văn thực hướng dẫn trực tiếp TS Nguyễn Văn Hiệu Mọi tham khảo dùng luận văn trích dẫn rõ ràng tên tác giả, tên cơng trình, thời gian, địa điểm cơng bố Mọi chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tơi xin chịu hồn tồn trách nhiệm Tác giả luận văn Phạm Hoàng Trƣơng MỤC LỤC LỜI CAM ĐOAN MỤC LỤC ANH MỤC C C TỪ VI T TẮT DANH MỤC CÁC CÁC BẢNG DANH MỤC CÁC HÌNH MỞ ĐẦU 1 Lý chọn đề tài Mục tiêu nhiệm vụ đề tài Đối tƣợng phạm vi nghiên cứu Phƣơng pháp nghiên cứu Ý nghĩa khoa học thực tiễn đề tài Bố cục luận văn Chƣơng - TỔNG QUAN DU LỊCH QUẢNG NGÃI VÀ HỆ THỐNG GỢI Ý…… 1.1 TỔNG QUAN VỀ DU LỊCH QUẢNG NGÃI 1.2 CÁC PHƢƠNG PHÁP GỢI Ý 1.2.1 Phƣơng pháp gợi ý dựa nội dung 1.2.2 Phƣơng pháp gợi ý dựa lọc cộng tác 1.2.3 Phƣơng pháp gợi ý lai 11 1.3 HỆ THỐNG GỢI Ý 11 1.3.1 Giới thiệu .11 1.3.2 Bài toán tổng quát hệ thống gợi ý 14 1.3.3 Chức hệ thống gợi ý 15 1.3.4 Dữ liệu nguồn tri thức .18 1.3.4.1 Sản phẩm 18 1.3.4.2 Ngƣời dùng .19 1.3.4.3 Giao dịch 19 KẾT LUẬN CHƢƠNG 20 Chƣơng – CÁC KỸ THUẬT PHÂN RÃ 21 2.1 KỸ THUẬT SVD 21 2.1.1 Giới thiệu .21 2.1.2 Phát biểu toán 22 2.1.3 Ý tƣởng thực 22 2.1.4 Hƣớng tiếp cận Truncated SVD 23 2.1.5 Thuật toán SVD 25 2.2 KỸ THUẬT PHÂN RÃ MA TRẬN-MF 27 2.2.1 Giới thiệu 27 2.2.2 Ý tƣởng thực 28 2.2.3 Thuật toán MF 31 2.3 KỸ THUẬT NN-MF 31 2.3.1 Giới thiệu 31 2.3.2 Thuật toán NN-MF 32 KẾT LUẬN CHƢƠNG 33 Chƣơng - XÂY DỰNG HỆ THỐNG GỢI Ý VÀ Đ NH GI 34 3.1 MÔ TẢ HỆ THỐNG 34 3.2 PHÂN TÍCH, THIẾT KẾ VÀ XÂY DỰNG HỆ THỐNG .37 3.2.1 Sơ đồ ca sử dụng 38 3.2.2 Sơ đồ hoạt động sơ đồ 40 3.2.3 Cơ sở liệu 43 3.2.4 Một số giao diện minh họa hệ thống 46 3.3 ĐÁNH GIÁ KẾT QUẢ THỬ NGHIỆM 50 3.3.1 Phƣơng pháp Truncated SVD 50 3.3.2 Phƣơng pháp MF 51 3.3.3 Phƣơng pháp NN-MF 52 KẾT LUẬN CHƢƠNG 54 K T LUẬN VÀ HƢỚNG PHÁT TRIỂN 55 Kết luận 55 Hƣớng phát triển 56 TÀI LIỆU THAM KHẢO PHỤ LỤC TÓM TẮT LUẬN VĂN NGHIÊN CỨU VÀ ỨNG DỤNG KỸ THUẬT SVD VÀO HỆ THỐNG GỢI Ý Học viên:Phạm Hoàng Trƣơng Mã số: 60.48.01 Khóa: K33 Chuyên ngành: Khoa học máy tính Trƣờng Đại học Bách khoa - ĐHĐN Tóm tắt - Hệ thống gợi ý (Recommender Systems - RS) đƣợc ứng dụng rộng rãi nhiều lĩnh vực (nhƣ thƣơng mại điện tử, giải trí, giáo dục, ) nhằm dự đốn sở thích ngƣời dùng nhờ vào thơng tin cá nhân phản hồi (đánh giá) họ Luận văn tập trung nghiên cứu hệ thống gợi ý theo ngữ cảnh, áp dụng cho gợi ý địa điểm du lịch phù hợp với ngƣời dùng Hệ thống kết hợp phƣơng pháp SVD (Singular Value Decomposition), phƣơng pháp phân rã ma trận MF (matrix factorization), phƣơng pháp phân rã ma trận không âm NN-MF (Nonnegative Matrix Factorization) nhằm tăng độ xác cho hệ thống Sau xây dựng hệ thống tích hợp giải thuật gợi ý, thu thập thông tin từ ngƣời dùng thực nhằm đánh giá hiệu hệ thống đề xuất Thực nghiệm cho thấy việc ứng dụng giải pháp hỗ trợ phát triển du lịch hồn tồn khả thi Từ khóa - Hệ thống gợi ý, kỹ thuật SVD, kỹ thuật phân rã ma trận MF, kỹ thuật NN-MF RESEARCH AND APPLICATION SVD RECOMMENDATION SYSTEMS Abstract - Recommender Systems are widely used in many areas, such as in ecommerce (for online shopping), in entertainments (for movie recommendation, music recommendation, etc) and so on, to predict users‟ preference based on their past preferences/behaviors In this work, propose an approach for Research Recommender Systems Then applying this approach for a recommendation system so that the system can recommend appropriate places to tourists This system combines several approaches such as Singular Value Decomposition, matrix factorization, Nonnegative Matrix Factorization to improve the prediction accuracy of the model Experimental results show that this is a promising approach for building Tourist Recommender Systems Key words - Recommender Systems, Singular Value Decomposition, matrix factorization, Nonnegative Matrix Factorization ANH MỤC C C TỪ VI T TẮT CF SVD MF RS NN-MF Collaborative filtering (Lọc cộng tác) Singular Value Decomposition (Kỹ thuật phân rã giá trị đơn) Matrix Factorization (Kỹ thuật phân rã ma trận) Recommender Systems (Hệ thống gợi ý) Nonnegative Matrix Factorization (Kỹ thuật phân rã ma trận không âm) DANH MỤC CÁC BẢNG Số hiệu bảng 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 3.11 3.12 3.13 3.14 3.15 3.16 3.17 Tên bảng Bảng khách hàng Bảng loại tin Bảng địa điểm Bảng quảng cáo Bảng đánh giá Bảng loại hình Bảng đặt lịch tham quan Bảng quản trị Bảng Menu Bảng liên hệ Bảng tin tức Trang 44 Tập liệu thử nghiệm 45 45 45 46 46 46 46 46 47 47 49 Kết chạy thực thi Kết chạy thực thi với liệu input2.txt Kết chạy thực thi Mức độ cải thiện Kết thử nghiệm tổng quát độ đo RMSE 50 50 51 52 52 DANH MỤC CÁC HÌNH Số hiệu hình 1.1 1.2 2.1 Tên hình Trang 10 15 24 2.3 2.4 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 3.11 3.12 3.13 3.14 3.15 Minh hoạ hệ thống gợi ý Ma trận đánh giá ngƣời dùng SVD cho ma trận a khi: mn (hình dƣới) Biểu diễn svd dạng thu gọn biểu diễn ma trận dƣới dạng tổng ma trận có rank Minh họa kỹ thuật phân rã ma trận Minh hoạ dự đoán ngƣời dùng thứ cho item thứ Quy trình sử dụng website Sơ đồ kiến trúc tổng thể hệ thống Sơ đồ ca sử dụng tổng quát hệ thống Sơ đồ ca sử dụng khách hàng Sơ đồ ca sử dụng ngƣời quản trị Sơ đồ hoạt động chức gợi ý Sơ đồ chức gợi ý Sơ đồ hoạt động chức cập nhật nội dung Sơ đồ chức cập nhật nội dung Sơ đồ hoạt động chức đánh giá Sơ đồ chức đánh giá Sơ đồ quan hệ sở liệu Giao diện liên hệ Giao diện đăng nhập Giao diện đăng ký 3.16 Giao diện hệ thống 49 3.17 Giao diện gợi ý địa điểm du lịch 49 3.18 Giao diện thu thập thông tin đánh giá ngƣời dùng 50 3.19 Giao diện tiện ích 50 3.20 Biểu đồ đƣờng so sánh nghiên cứu với kịch thử nghiệm 53 3.21 Biểu đồ cột so sánh nghiên cứu với kịch thử nghiệm 53 2.2 25 29 31 36 38 39 40 40 41 41 42 42 43 43 44 47 48 48 36 - Địa điểm du lịch: thông tin gồm: tên địa điểm du lịch, địa chỉ, hình ảnh đại diện, số thơng tin khác - Thông tin ngữ cảnh: bạn đồng hành, thời gian đi, thời tiết, vị trí khoảng cách ngƣời dùng - Thông tin đánh giá: ngƣời dùng đăng nhập thành viên họ tham gia đánh giá xếp hạng, đƣợc quyền bình luận xem bình luận thành viên khác Thơng tin đánh giá bao gồm: địa điểm du lịch đƣợc đánh giá ngƣời dùng, thông tin ngữ cảnh, kết đánh giá, ngày đánh giá Và thông tin bình luận nhƣ: địa điểm đƣợc bình luận, nội dung bình luận, ngày đăng Hệ thống đƣợc phân quyền cho nhóm ngƣời dùng thành viên quản trị Trong nh m người quản trị có đầy đủ quyền hệ thống nhƣ: cập nhật địa điểm du lịch, thống kê số lƣợt truy cập trung bình đánh giá địa điểm du lịch, thống kê số lƣợt đánh giá liệt kê đánh giá thành viên,… cịn nhóm thành viên có số quyền hệ thống nhƣ: xem thông tin địa điểm du lịch muốn đi, đánh giá xếp hạng bình luận, xem tin tức/sự kiện, đƣợc hệ thống gợi ý đƣờng Khi sử dụng chức gợi ý, ngƣời dùng thành viên (chƣa có đánh giá nào) hệ thống gợi ý dựa theo chủ đề mà họ thích nhƣ: Kiến trúc – Văn hóa – Lịch sử; Mua sắm; Vui chơi giải trí;… Hệ thống gợi ý cho ngƣời dùng địa điểm du lịch phù hợp với chủ đề mà ngƣời dùng chọn có nhiều ngƣời đánh giá cao (trung bình đánh giá cao nhất) 37 Sơ đồ kiến trúc hệ thống đƣợc mơ tả nhƣ sau: Hình 3.2 Sơ đ kiến trúc tổng thể hệ thống 3.2 PHÂN TÍCH, THI T K VÀ XÂY ỰNG HỆ THỐNG Để hạn chế sơ đồ không cần thiết, luận văn tập trung xây dựng sơ đồ cho chức gợi ý địa điểm du lịch 38 3.2.1 Sơ đồ ca sử dụng - Sơ đồ ca sử dụng tổng quát Hình 3.3 Sơ đ ca sử d ng tổng quát hệ thống 39 - Sơ đồ ca sử dụng phụ Hình 3.4 Sơ đ ca sử d ng khách hàng Hình 3.5 Sơ đ ca sử d ng người quản trị 40 3.2.2 Sơ đồ hoạt động sơ đồ - Sơ đồ hoạt động chức gợi ý địa điểm du lịch Hình 3.6 Sơ đồ hoạt động chức gợi ý - Sơ đồ chức gợi ý địa điểm du lịch Hình 3.7 Sơ đ chức gợi ý 41 - Sơ đồ hoạt động chức cập nhật nội dung Hình 3.8 Sơ đ hoạt động chức cập nhật nội dung - Sơ đồ chức cập nhật nội dung Hình 3.9 Sơ đ chức cập nhật nội dung 42 - Sơ đồ hoạt động chức đánh giá Hình 3.10 Sơ đ hoạt động chức đánh giá - Sơ đồ chức đánh giá Hình 3.11 Sơ đ chức đánh giá 43 3.2.3 Cơ sở liệu Hình 3.12 Sơ đ quan hệ s liệu Mô tả liệu: Bảng 3.1 Bảng khách hàng Tên trƣờng Thuộc tính makh int tenkh tendn nvarchar(250) varchar(15) matkhau varchar(15) ngaysinh datetime gioitinh bit diachi nvarchar(100) dienthoai email int varchar(50) Ghi Khóa chính; Mã khách hàng Tên đầy đủ khách hàng Tên đăng nhập khách hàng Mật đăng nhập khách hàng Ngày tháng năm sinh Giới tính khách hàng Địa khách hàng Điện thoại khách hàng Email khách hàng 44 Bảng 3.2 Bảng loại tin Tên trƣờng idlt Ten url thutu anhien Thuộc tính int nvarchar(100) varchar(255) int bit Ghi Khóa chính; ID loại tin Tên loại tin Đƣờng dẫn Thứ tự loại tin Ảnh hiển thị loại tin Bảng 3.3 Bảng địa điểm Tên trƣờng madiadiem Thuộc tính int tendiadiem dongia noidung hinhanh khuyenmai diadiemhot matinh vote nvarchar(500) int ntext varchar(250) bit bit int int Ghi Khóa chính; Mã địa điểm du lịch Tên địa điểm du lịch Đơn giá Nội dung Hình ảnh Khuyến Địa điểm hấp dẫn Mã tỉnh thành Đánh giá địa điểm du lịch Bảng 3.4 Bảng quảng cáo Tên trƣờng Thuộc tính Stt tencty hinhminhHoa url ngaybatdau ngayhethan chieucao chieurong anhien int nvarchar(200) varchar(20) varchar(255) datetime datetime int int bit Ghi Khóa chính; Số thứ tự Tên cơng ty Hình minh họa Đƣờng dẫn Ngày bắt đầu Ngày hết hạn Chiều cao Chiều rộng Ảnh hiển thị 45 Bảng 3.5 Bảng đánh giá Tên trƣờng Thuộc tính Id int makh madiadiem diem int int int Ghi Khóa chính; ID đánh giá Mã khách hàng Mã địa điểm du lịch Điểm đánh giá Bảng 3.6 Bảng loại hình Tên trƣờng ID Thuộc tính int Ten GhiChu nvarchar(250) nvarchar(250) Ghi Khóa chính; ID loại hình gợi ý Tên loại hình gợi ý Ghi Bảng 3.7 Bảng đặt lịch tham quan Tên trƣờng Thuộc tính Ma int makh madiadiem dongia int int int Ghi Khóa chính; Mã đặt lịch Mã khách hàng Mã địa điểm du lịch Đơn giá Bảng 3.8 Bảng quản trị Tên trƣờng Thuộc tính idquantri int username varchar(15) matkhau varchar(15) Ghi Khóa chính; ID ngƣời quản trị Tên đăng nhập ngƣời quản trị Mật đăng nhập ngƣời quản trị Bảng 3.9 Bảng Menu Tên trƣờng Thuộc tính idmenu Int tenmenu urlhinh anhien nvarchar(100) nvarchar(255) Bit Ghi Khóa chính; ID menu Tên menu Đƣờng dẫn Ảnh hiển thị 46 Bảng 3.10 Bảng liên hệ Tên trƣờng Thuộc tính malienhe int hoten chucdanh congty diachi dienthoai email noidung nvarchar(50) nvarchar(100) nvarchar(255) nvarchar(100) int varchar(50) ntext Ghi Khóa chính; Mã liên hệ Họ tên ngƣời liên hệ Chức danh Công ty Địa Điện thoại Email liên hệ Nội dung Bảng 3.11 Bảng tin tức Tên trƣờng Thuộc tính Idtin int tieude tomtat urlhinh noidung solanxem tinnoibat ntext ntext varchar(255) datetime ntext int bit 3.2.4 Một số giao diện minh họa hệ thống Hình 3.13 Giao diện đăng nhập Ghi Khóa chính; ID tin tức Tiêu đề tin tức Tóm tắt Đƣờng dẫn Ngày đăng tin Nội dung tin tức Số lần xem Tin bật 47 Hình 3.14 Giao diện đăng k Hình 3.15 Giao diện liên hệ 48 Hình 3.16 Giao diện hệ thống Tải FULL (96 trang): bit.ly/2Ywib4t Dự phịng: fb.com/KhoTaiLieuAZ Hình 3.17 Giao diện gợi địa điểm ưu thích 49 Hình 3.18 Giao diện thu thập thông tin đánh giá người dùng Hệ thống thử nghiệm cài đặt thành công hai phƣơng pháp gợi ý đƣợc thể menu tiện ích hệ thống Tải FULL (96 trang): bit.ly/2Ywib4t Dự phòng: fb.com/KhoTaiLieuAZ Hình 3.19 Giao diện tiện ích 50 3.3 Đ NH GI K T QUẢ THỬ NGHIỆM Tập liệu thử Tập liệu thử bao gồm file input có giá trị kích thƣớc nhƣ sau (Các file liệu test đƣợc đính kèm theo) Bảng 3.12 Tập liệu thử nghiệm Số lƣợng user 10 20 25 50 100 Tên file Kịch Kịch Kịch Kịch Kịch Số lƣợng item 10 50 80 100 200 ratings 100 1000 2000 5000 20000 3.3.1 Phƣơng pháp Truncated SVD Bảng 3.13 cho thấy Kết chạy thực thi với tốc độ học 0.01, tốc độ luyện 10, giá trị khởi gán cho phần từ 0.5, regularization 0.025, mức độ cải thiện để dừng sớm 0.0000052, số lần lặp tối thiểu 100, số lần lặp tối đa 1000 Một liệu đầu vào đƣợc chạy 100 lần để tính trung bình thời gian thực thi độ lệch Bảng 3.13 kết thử nghiệm độ đo Số cột Số chiều tối đa Thời gian thực thi (Mili giây) RMSE chuẩn Frobenius loại 10 10 73ms 0.597 35.656 Kịch 20 50 16 173ms 0.502 252.012 Kịch 25 80 20 294ms 0.481 464.46 Kịch 50 100 40 1166ms 0.42 884.762 Kịch 100 200 80 4748ms 0.424 3595.902 Bộ liệu đầu vào Số hàng Kịch e4ed360a ... - Nghiên cứu, tìm hiểu kỹ thuật SVD - Đề xuất mơ hình gợi ý sử dụng kỹ thuật SVD - Phân tích thiết kế hệ thống gợi ý địa điểm du lịch sử dụng kỹ thuật SVD 3 - Xây dựng đánh giá hệ thống gợi ý. .. pháp gợi ý Ngoài ra, chƣơng giới thiệu hệ thống gợi ý, nêu chức năng, phát biểu toán tổng quát hệ thống gợi ý, sở liệu nguồn tri thức để ứng dụng kỹ thuật vào hệ thống gợi ý 21 Chƣơng – CÁC KỸ THUẬT... trợ kỹ thuật đa phƣơng tiện - Tìm kiếm gợi tin tư ng: Một số ngƣời dùng không tin tƣởng vào hệ thống gợi ý, họ tham gia vào hệ thống để thấy đƣợc hệ thống đƣa gợi ý tốt tới mức Do đó, số hệ thống