(Luận văn thạc sĩ) tích hợp thông tin ngữ cảnh trong hệ gợi ý

59 2 0
(Luận văn thạc sĩ) tích hợp thông tin ngữ cảnh trong hệ gợi ý

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯƠNG ĐẠI HỌC QUY NHƠN ĐÀO CHÍ THANH TÍCH HỢP THƠNG TIN NGỮ CẢNH TRONG HỆ GỢI Ý h LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Mã số: 60.48.01.01 Bình Định - Năm 2020 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN ĐÀO CHÍ THANH ĐỀ TÀI TÍCH HỢP THƠNG TIN NGỮ CẢNH TRONG HỆ GỢI Ý h Chuyên ngành : KHOA HỌC MÁY TÍNH Mã số : 60 48 01 01 Người hướng dẫn : TS LÊ QUANG HÙNG LỜI CAM ĐOAN Tôi xin cam đoan kết trình bày luận văn trình nghiên cứu hướng dẫn cán hướng dẫn Các số liệu, kết trình bày luận án hoàn toàn trung thực Các liệu tham khảo trích dẫn đầy đủ Quy Nhơn, ngày tháng năm 2020 Đào Chí Thanh h i TĨM TẮT Hệ gợi ý (recommender systems) lớp hệ thống lọc thơng tin, phương tiện có giá trị để giải vấn đề tải thơng tin Với mục đích đưa gợi ý sản phẩm, dịch vụ phù hợp với người dùng dựa hành vi họ khứ dựa tương đồng sở thích với người dùng khác Hệ gợi ý ứng dụng nhiều lĩnh vực khác nhau, đặc biệt thương mại điện tử (ví dụ: Amazon1 , Netflix2 , ) Việc gợi ý sản phẩm phù hợp góp phần làm tăng doanh số bán hàng số lượng truy cập vào hệ thống, đồng thời giúp cho khách hàng có thông tin thú vị sản phẩm họ muốn tìm dễ dàng h Các hướng tiếp cận xây dựng hệ gợi ý chia thành ba loại: hướng tiếp cận lọc cộng tác, hướng tiếp cận dựa nội dung hướng tiếp cận kết hợp lọc cộng tác với dựa nội dung Hướng tiếp cận thứ khai thác thuộc tính sản phẩm, xác định đặc điểm chung sản phẩm người dùng quan tâm, từ gợi ý cho người dùng sản phẩm có đặc điểm tương tự Hướng tiếp cận thứ hai khai thác liệu sở thích người dùng khứ tương đồng người dùng sản phẩm để đưa gợi ý Nói cách khác, hệ thống lọc cộng tác giúp người dùng lựa chọn sản phẩm dựa vào ý kiến, đánh giá người khác Hệ gợi ý truyền thống dựa thông tin người dùng sản phẩm để đưa gợi ý dự đoán đánh giá cho cặp người dùng-sản phẩm chưa biết Tuy nhiên, hệ gợi ý truyền thống chưa đầy đủ, chưa phù hợp với địa điểm, thời gian, điều ảnh hưởng đến đánh giá người dùng sản phẩm (ảnh hưởng chất lượng gợi ý) Thông tin ngữ cảnh (thời gian, địa điểm, thời tiết, tâm trạng, ) đóng vai trị quan trọng ảnh hưởng đến trải nghiệm sản phẩm người dùng Sở thích người dùng thay đổi tùy vào ngữ cảnh Chẳng hạn, người dùng chọn đến nhà hàng khác họ với trẻ nhỏ https://www.amazon.com https://www.netflix.com ii thay với bạn bè Người dùng chọn đến Đà Lạt với khí hậu mát mẻ mùa hè mùa đông Hệ gợi ý theo ngữ cảnh mở rộng hệ gợi ý truyền thống, đưa gợi ý đến người dùng có xem xét đến thông tin ngữ cảnh Trong luận văn này, chúng tơi nghiên cứu tích hợp thơng tin ngữ cảnh hệ gợi ý, bao gồm: Lọc trước ngữ cảnh: thông tin ngữ cảnh dùng để lựa chọn xây dựng tập liệu phù hợp với ngữ cảnh đưa vào Sau đó, hệ gợi ý truyền thống áp dụng lên tập liệu đưa gợi ý phù hợp Lọc sau ngữ cảnh: hệ gợi ý truyền thống sử dụng trực tiếp tập liệu đầu vào mà không cần quan tâm tới yếu tố ngữ cảnh Sau đó, thơng tin ngữ cảnh sử dụng để điều chỉnh kết đầu Mơ hình hóa ngữ cảnh: thơng tin ngữ cảnh tích hợp trực tiếp hàm gợi ý h Thực nghiệm tiến hành miền liệu du lịch âm nhạc cho thấy hiệu hệ gợi ý theo ngữ cảnh so với hệ gợi ý truyền thống Từ khóa: Hệ gợi ý, ngữ cảnh, lọc trước theo ngữ cảnh, lọc sau theo ngữ cảnh, mơ hình hóa ngữ cảnh iii LỜI CẢM ƠN h Đầu tiên xin gửi lời cảm ơn sâu sắc tới thầy TS Lê Quang Hùng thầy Vũ Sơn Lâm, Khoa Công nghệ Thông tin, Trường Đại học Quy Nhơn, người định hướng đề tài tận tình hướng dẫn, bảo cho tơi suốt trình thực luận văn tốt nghiệp Tôi xin trân trọng cảm ơn thầy, cô Khoa Công nghệ Thông tin, Trường Đại học Quy Nhơn tận tình giảng dạy, hướng dẫn nghiên cứu khoa học cho suốt thời gian theo học trường trình làm luận văn Xin cảm ơn anh, chị, em bạn học viên khoa học máy tính, người giúp đỡ, động viên tinh thần chia sẻ kinh nghiệm q báu giúp tơi vượt qua khó khăn, vướng mắc để hồn thành luận văn Mặc dù cố gắng, tin luận văn tơi cịn nhiều thiếu sót có nhiều nội dung hồn thiện tốt Tơi mong nhận ý kiến đánh giá, phê bình góp ý thầy cơ, anh chị bạn Trân trọng, Quy Nhơn, ngày tháng năm 2020 Đào Chí Thanh Luận văn sản phẩm đề tài Khoa học Công nghệ: "Nghiên cứu ứng dụng học máy tích hợp thơng tin ngữ cảnh hệ thống gợi ý du lịch", mã số B2020-DQN-08 (Bộ Giáo dục Đào tạo) iv Mục lục Danh mục hình vẽ vii Danh mục bảng ix GIỚI THIỆU 1.1 Tổng quan hệ gợi ý 1.1.1 Bài toán hệ gợi ý 1.1.2 Cách tiếp cận giải toán 1.1.2.1 Lọc cộng tác 1.1.2.2 Dựa vào nội dung 1.1.2.3 Cách tiếp cận kết hợp 1.1.3 Miền ứng dụng hệ gợi ý 1.1.3.1 Thương mại điện tử 1.1.3.2 Giải trí 1.1.3.3 Giáo dục 1.2 Đánh giá hệ gợi ý 1.2.1 Các phương pháp đánh giá 1.2.1.1 Phương pháp đánh giá trực tuyến 1.2.1.2 Phương pháp thực nghiệm không trực tuyến 1.2.1.3 Phương pháp nghiên cứu người dùng 1.2.2 Các độ đo 1.2.2.1 Độ đo RMSE MAE 1.2.2.2 Độ đo NRMSE NMAE 1.3 Thách thức hệ gợi ý truyền thống 1.4 Ngữ cảnh hệ gợi ý 1.4.1 Khái niệm ngữ cảnh 1.4.2 Thu thập thông tin ngữ cảnh 1.5 Tổng kết chương TÍCH HỢP THƠNG TIN NGỮ CẢNH TRONG HỆ GỢI Ý 2.1 Hệ gợi ý theo ngữ cảnh 2.2 Các phương pháp tích hợp thông tin ngữ cảnh hệ gợi ý 2.2.1 Lọc trước theo ngữ cảnh 2.2.2 Lọc sau ngữ cảnh 2.2.3 Mơ hình hóa ngữ cảnh 16 16 17 18 21 22 h 3 4 6 6 7 7 8 9 10 11 11 12 13 15 v 2.3 2.2.3.1 Cách tiếp cận dựa kinh nghiệm 23 2.2.3.2 Cách tiếp cận dựa mơ hình 24 Kết luận chương 33 THỰC NGHIỆM 3.1 Dữ liệu thực nghiệm 3.2 Cài đặt thực nghiệm 3.3 Kết thực nghiệm: 3.4 Kết luận chương Tài liệu tham khảo 35 35 37 40 41 44 h vi CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Chữ viết tắt Diễn giải SGD Stochastic Gradient Descent OLAP MSE Online Analytical Processing Context-awareness Recommender System Mean Square Error RMSE Root Mean Square Error MAE Mean Base Error RS CF FM BFM CAMF CARS h CRD Tiếng Anh Recommender System Collaborative Filter Matrix Factorization Biases Matrix Factorization Context-aware Matrix Factorization Contextual Rating Deviation vii Tiếng Việt Hệ gợi ý Lọc cộng tác Phân rã ma trận Phân rã ma trận thiên vị Phân rã ma trận dựa ngữ cảnh Độ lệch xếp hạng ngữ cảnh Kỹ thuật giảm gradient ngẫu nhiên Phân tích liệu trực tuyến Hệ gợi ý theo hướng ngữ cảnh Sai số bình phương trung bình Căn bậc hai Sai số bình phương trung bình Sai số tuyệt đối trung bình Danh sách hình vẽ 1.1 Minh họa phương pháp lọc cộng tác 2.1 2.2 2.3 2.4 Các phương pháp tích hợp thơng tin ngữ cảnh hệ gợi ý Bước hiệu chỉnh danh sách gợi ý lọc sau theo ngữ cảnh kỹ thuật phân rã ma trận X thành ma trận nhỏ Tối ưu hóa 18 22 25 27 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 Bộ liệu có định dạng mơ tả Bộ liệu có định dạng mô tả Cấu trúc công cụ nguồn mở CARSKIT Bộ liệu có định dạng mơ tả Tích hợp cơng cụ nguồn mở CARSKIT vào Eclipse Java 2018 Cấu hình tập tin setting.conf công cụ CARSKIT Tập tin results công cụ CARSKIT Độ sai số CAMF va MF theo RMSE với liệu Travel-STS Độ sai số CAMF MF theo RMSE với liệu InCarMusic 36 37 38 38 39 39 40 41 41 h viii

Ngày đăng: 01/12/2023, 14:34

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan