Luận văn thạc sĩ khoa học máy tính phương pháp lọc cộng tác và ứng dụng trong hệ thống gợi ý bán hàng trực tuyến

20 0 0
Luận văn thạc sĩ khoa học máy tính phương pháp lọc cộng tác và ứng dụng trong hệ thống gợi ý bán hàng trực tuyến

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ĐỖ THỊ THANH HÀ PHƯƠNG PHÁP LỌC CỘNG TÁC VÀ ỨNG DỤNG TRONG HỆ THỐNG GỢI Ý BÁN HÀNG TRỰC TUYẾN LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN - 2020 i i LỜI CAM ĐOAN Tơi xin cam đoan cơng trình nghiên cứu riêng hướng dẫn trực tiếp PGS.TS Đồn Văn Ban Mọi trích dẫn sử dụng báo cáo ghi rõ nguồn tài liệu tham khảo theo qui định Mọi chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tơi xin chịu hồn tồn trách nhiệm Học viên Đỗ Thị Thanh Hà ii LỜI CẢM ƠN Trước hết, tơi xin tỏ lịng biết ơn gửi lời cám ơn chân thành đến thầy PGS.TS Đoàn Văn Ban, người trực tiếp hướng dẫn luận văn, tận tình bảo hướng dẫn tơi tìm hướng nghiên cứu, tiếp cận thực tế, tìm kiếm tài liệu, xử lý phân tích số liệu,… nhờ tơi hồn thành luận văn cao học Tơi xin chân thành cảm ơn q thầy cô Khoa Công nghệ thông tin - trường Đại học Công nghệ Thông tin Truyền thông, Đại học Thái Nguyên truyền đạt cho kiến thức bổ ích suốt hai năm học vừa qua Xin chân thành cảm ơn anh chị em lớp cao học Khoa học máy tính khố 17 bạn đồng nghiệp ln động viên, hỗ trợ tơi q trình học tập nghiên cứu thực đề tài Cuối cùng, xin gửi đến cha mẹ người thân gia đình hỗ trợ, tạo điều kiện thuận lợi cho suốt thời gian qua đặc biệt thời gian tơi theo học khóa thạc sỹ trường Đại học Công nghệ Thông tin Truyền thông, Đại học Thái Nguyên Xin chân thành cảm ơn! Người thực Đỗ Thị Thanh Hà iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC BẢNG iv DANH MỤC HÌNH VẼ .v MỘT SỐ THUẬT NGỮ viii MỞ ĐẦU .1 CHƯƠNG HỆ THỐNG TƯ VẤN VÀ CÁC PHƯƠNG PHÁP LỌC THÔNG TIN 1.1 Hệ tư vấn .5 1.1.1 Giới thiệu hệ thống tư vấn 1.1.2 Bài toán tư vấn người dùng .7 1.1.3 Qui trình xây dựng hệ tư vấn .9 1.2 Các phương pháp lọc tin .10 1.2.1 Phân loại hệ thống tư vấn 10 1.2.2 Phương pháp tư vấn dựa nội dung 11 1.2.3 Phương pháp tư vấn dựa lọc cộng tác 17 1.2.4 Tư vấn dựa cách tiếp cận kết hợp .23 1.3 Kiến trúc tổng quát hệ thống lọc thông tin 25 1.4 Ứng dụng phương pháp lọc tin hệ thống tư vấn 26 1.5 Kết luận chương .28 CHƯƠNG 2.PHƯƠNG PHÁP THUẬT LỌC CỘNG TÁC DỰA TRÊN SẢN PHẨM 29 2.1 Các phương pháp lọc cộng tác 29 2.1.1 Giới thiệu phương pháp lọc cộng tác 29 2.1.2 Ưu nhược điểm phương pháp lọc cộng tác 30 2.2 Lọc cộng tác dựa sản phẩm 32 2.3 Các thuật tốn tính độ tương tự 34 iv 2.4 Tính tốn dự đốn tư vấn .37 2.4.1 Dự đốn dựa trung bình đánh giá sản phẩm lân cận 37 2.4.2 Dự đoán dựa tổng trọng số (Weighted Sum) 38 2.4.3 Dự đoán dựa tổng trọng số với đánh giá trung bình người dùng 38 2.4.4 Dự đoán dựa tổng trọng số với trung bình đánh giá lên sản phẩm 39 2.5 Đánh giá yếu tố ảnh hưởng đến độ xác kết tư vấn 40 2.5.1 Đánh giá độ tin cậy thuật toán 40 2.5.2 Các yếu tố ảnh hưởng đến độ xác tư vấn 42 2.6 Kết luận chương .44 CHƯƠNG ỨNG DỤNG PHƯƠNG PHÁP LỌC CỘNG TÁC DỰA TRÊN SẢN PHẨM TRONG HỆ THỐNG GỢI Ý BÁN HÀNG TRỰC TUYẾN 45 3.1 Xây dựng hệ thống gợi ý cho website bán hàng trực tuyến .45 3.1.1 Đặc tả hệ thống 45 3.1.2 Môi trường phát triển .46 3.1.3 Thiết kế bảng liệu .46 3.2 Ví dụ lọc cộng tác dựa sản phẩm 49 3.3 Thuật tốn xử lý hệ thống .53 3.3.1 Thuật toán khách hàng đánh giá sản phẩm 53 3.3.2 Thuật toán khách hàng chấm điểm sản phẩm 54 3.3.3 Thuật toán gợi ý sản phẩm cho khách hàng 55 3.4 Các giao diện hệ thống .56 3.5 Kết luận chương .60 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN .61 TÀI LIỆU THAM KHẢO .62 v iv DANH MỤC BẢNG BIỂU Bảng 1: Bảng đánh giá người dùng với sản phẩm 33 Bảng 2: Dữ liệu đánh giá sản phẩm 49 Bảng 3: Ma trận utility matrix 50 Bảng 4: Giá trị trung bình đánh giá item 50 ̂………………………………………………………51 Bảng 5: Ma trận chuẩn hóa Y Bảng 6: Độ tương tự item S 51 Bảng 7: Ma trận sau dự đoán ŷ 52 Bảng 8: Ma trận dự đoán thang điểm .53 v vi DANH MỤC HÌNH VẼ Hình 1.1: Một số lĩnh vực ứng dụng hệ thống gợi ý Hình 1.2 Ví dụ ma trận đánh giá tổng quát Hình 1.3: Phân loại hướng tiếp cận xây dựng hệ thống gợi ý 11 Hình 1.4 Minh họa phương pháp tư vấn dựa lọc nội dung .12 Hình 1.5: Minh họa phương pháp tư vấn dựa lọc cộng tác .18 Hình 1.6: Quy trình hệ thống tư vấn dựa lọc cộng tác 19 Hình 1.7: Kiến trúc tổng quát hệ thống lọc thông tin 25 Hình 1.8: Hệ thống gợi ý sản phẩm Amazon .28 Hình 2.1: Tách sản phẩm đánh giá tính tốn độ tương tự 34 Hình 2.2: Giải thuật lọc cộng tác dựa sản phẩm, tính dự đốn 37 Hình 2.3: Mơ hình hệ thống lọc cộng tác dựa sản phẩm 40 Hình 3.1: Giải thuật khách hàng đánh giá sản phẩm 54 Hình 3.2: Khách hàng chấm điểm sản phẩm 55 Hình 3.3: Giải thuật xử lý gợi ý sản phẩm 56 Hình 3.4: Giao diện trang chủ 58 Hình 3.5: Giao diện trang danh sách sản phẩm .58 Hình 3.6: Giao diện gợi ý sản phẩm cho sản phẩm chưa có đánh giá 59 Hình 3.7: Giao diện gợi ý sản phẩm cho sản phẩm có đánh giá 59 Hình 3.8: Giao diện gợi ý sản phẩm cho thành viên cụ thể .59 vivii MỘT SỐ THUẬT NGỮ STT Tiếng Anh User Tiếng Việt Người dùng, người sử dụng Giải thích Chỉ người dùng hệ thống để tìm kiếm lựa chọn sản phẩm Chỉ sản phẩm hệ thống như: Item Sản phẩm, mục sản phẩm, phim, ảnh, nhạc, trang web, đoạn văn bản, … Chỉ mức độ thích người dùng với sản phẩm Rating có nhiều biểu Rating Đánh giá hiện: đánh giá thích khơng thích, hay đánh già theo mức độ từ 1-5 đại diện từ khơng thích đến thích CF có tên Neighborhood-based Collaborative Filtering (NBCF) Khi CF Lọc cộng tác nói CF, ngầm hiểu phương pháp Neighborhood-based sử dụng MỞ ĐẦU  Lí chọn đề tài Sự phát triển mạnh mẽ thương mại điện tử (E-Commerce) tác nhân đem lại nhiều lợi ích to lớn cho kinh tế tồn cầu Nhờ có thương mại điện tử, nhiều loại hình kinh doanh hình thành, có mua bán hàng trực tuyến Với hình thức này, người tiêu dùng tiếp cận với hàng hóa cách dễ dàng nhanh chóng nhiều so với phương thức mua bán truyền thống Hiện nay, với phương châm phục vụ khách hàng cách tốt nhất, hệ thống bán hàng trực tuyến tạo nhiều điều kiện thuận lợi để người mua hàng tiếp cận nhiều mặt hàng lúc Tuy nhiên, việc trình bày trang trí nhiều mặt hàng website gây khơng khó khăn cho người mua Họ khó chọn cho sản phẩm ưng ý Trong kinh doanh, để khách hàng đến mua sản phẩm ưng ý lời tư vấn, trợ giúp quan trọng Với phương thức bán hàng truyền thống lời tư vấn từ người bán hàng tạo lợi lớn cho cửa hàng Do đó, để phương thức bán hàng qua mạng phát triển thực hiệu bên cạnh lợi vốn có mình, việc có thêm “người trợ giúp” cần thiết Vì vậy, cần thiết phải sử dụng hệ thống gợi ý (Recommender Systems - RS) đóng vai trị người hỗ trợ khách hàng đưa định mua hàng đắn Bằng cách xác định mục đích nhu cầu khách hàng, hệ thống đưa tập gợi ý giúp cho người mua dễ dàng chọn lựa sản phẩm yêu thích Qua hiệu suất việc mua bán hàng trực tuyến tăng cao cách đáng kể [6] Hệ thống gợi ý phát triển theo nhiều cách tiếp cận khác Một hướng tiếp cận tập trung nghiên cứu áp dụng thành cơng nhiều hệ gợi ý phương pháp lọc cộng tác (Collaborative filtering) Thực chất, lọc cộng tác hình thức tư vấn tự động cách dựa tương tự người dùng sản phẩm hệ thống đưa dự đoán quan tâm người dùng tới sản phẩm, đưa gợi ý sản phẩm cho người dùng Việc xây dựng hệ thống gợi ý vấn đề nhiều nhà khoa học nước quan tâm [4, 7] Trong hệ thống gợi ý, lọc cộng tác kỹ thuật dùng để đánh giá độ quan tâm người dùng sản phẩm (từ mức độ tìm hiểu thuật toán [2] việc cải tiến [5] áp dụng việc xây dựng website bán hàng trực tuyến [6]) Kỹ thuật áp dụng thành công nhiều ứng dụng Trong hệ thống lọc cộng tác, sở thích người dùng sản phẩm dự đoán dựa liệu sở thích người dùng – sản phẩm (hoặc đánh giá người dùng sản phẩm) khứ Các nghiên cứu ngồi nước góp phần lớn cho việc xây dựng website bán hàng trực tuyến website mua sắm trực tuyến Amazon (www.amazon.com) cung cấp cho khách hàng sản phẩm mà họ quan tâm, cổng video clip YouTube (www.youtube.com), gợi ý phim MovieLens (www.movielens.org) [10] Tuy nhiên, để phát triển mạnh thuật toán lọc cộng tác hệ thống gợi ý nói chung hay hệ thống gợi ý sản phẩm nói riêng cịn nhiều câu hỏi cần lời giải đáp Cụ thể như: Khi xây dựng hệ thống gợi ý bán hàng trực tuyến, tiếp cận theo hướng dựa nhớ (Memory-based) hay dựa mơ hình (Modelbased) hiệu hơn? Trong hướng tiếp cận theo Memory-based nên tư vấn dựa người dùng (User based) hay sản phẩm (Items based)? Nếu tiếp cận theo hướng Model-based nên sử dụng mơ hình mạng Nơ ron hay Mạng Bayessian? … Trong cách tiếp cận, sử dụng độ đo để nắm bắt xác việc khách hàng cho sản phẩm tốt? Làm để dự báo tốt gợi ý tốt đồng thời, …[1, 10] Với lý trên, tác giả chọn đề tài “Phương pháp lọc cộng tác ứng dụng hệ thống gợi ý bán hàng trực tuyến” làm đề tài nghiên cứu luận văn tốt nghiệp thạc sĩ chuyên ngành Khoa học máy tính  Mục tiêu nghiên cứu Nghiên cứu ứng dụng phương pháp lọc cộng tác toán xây dựng hệ thống tư vấn Tập trung vào phân tích, so sánh, đánh giá hiệu phương pháp lọc cộng tác dựa người dùng lọc cộng tác dựa sản phẩm ứng dụng toán xây dựng hệ thống gợi ý bán hàng trực tuyến  Đối tượng phạm vi nghiên cứu Đối tượng: Phương pháp lọc cộng tác, hệ thống gợi ý bán hàng trực tuyến Phạm vi nghiên cứu: Khảo sát đánh giá thuật hiệu thuật toán lọc cộng tác dựa người dùng thuật toán lọc cộng tác dựa sản phẩm hệ thống gợi ý bán hàng trực tuyến Quá trình đánh giá thực số mẫu liệu chuẩn có sẵn [15]  Phương pháp nghiên cứu - Đọc tài liệu, phân tích, tổng hợp - Thu thập liệu, thống kê, phân tích liệu - Mơ đánh giá kết - Kết hợp nghiên cứu lý thuyết, tìm hiểu tình hình ứng dụng, đánh giá khả ứng dụng đề xuất giải pháp  Ý nghĩa khoa học thực tiễn đề tài Nghiên cứu phương pháp lọc cộng tác Chứng minh khả ứng dụng lọc cộng tác cho toán xây dựng hệ thống gợi ý sản phẩm bán hàng trực tuyến Khuyến nghị phương pháp tiếp cận hiệu phương pháp lọc cộng tác 4 Đề tài nghiên cứu bước trình tư vấn, giải pháp khắc phục yếu tố ảnh hưởng đến chất lượng, nhằm cải thiện kết tư vấn sản phẩm phù hợp với yêu cầu thực tế người dùng Với mục tiêu trên, luận văn trình bày ba chương Chương 1: Hệ thống tư vấn phương pháp lọc thông tin Chương giới thiệu toán tư vấn hệ thống gợi ý, phân tích ứng dụng hệ thống gợi ý thực tế Các phương pháp lọc tin ứng dụng hệ thống gợi ý Chương 2: Phương pháp thuật lọc cộng tác dựa sản phẩm Chương trình bày phương pháp lọc cộng dựa vào người dùng, lọc cộng tác dựa sản phẩm, phương pháp lọc cộng tác dựa mơ hình khả ứng dụng toán xây dựng hệ thống gợi ý Chương 3: Ứng dụng phương pháp lọc cộng tác dựa sản phẩm hệ thống gợi ý bán hàng trực tuyến Chương cài đặt thử nghiệm phương pháp lọc cộng tác sản phẩm cho website bán hàng thời trang CHƯƠNG HỆ THỐNG TƯ VẤN VÀ CÁC PHƯƠNG PHÁP LỌC THÔNG TIN 1.1 Hệ tư vấn 1.1.1 Giới thiệu hệ thống tư vấn Hệ thống tư vấn (Recommender Systems – RS) [8] phân tích thơng tin sở thích người dùng (user) sản phẩm (item) để cung cấp khuyến nghị item phù hợp với mong muốn sở thích người dùng Trên thực tế, hệ thống gợi ý cố gắng thu thập sở thích người dùng mơ hình hóa tương tác người dùng sản phẩm Hệ thống gợi ý sử dụng thông tin sản phẩm tri thức chuyên gia hay tri thức khai phá liệu học từ hành vi người dùng để đưa gợi ý sản phẩm mà họ thích hàng ngàn hàng vạn sản phẩm có hệ thống Các website thương mại điện tử ví dụ như: sách, phim, nhạc, báo, sử dụng hệ thống gợi ý để cung cấp thông tin giúp cho người dùng định lựa chọn sản phẩm Các sản phẩm gợi ý dựa số lượng sản phẩm bán, dựa thông tin cá nhân người dùng, dựa phân tích hành vi mua hàng trước người dùng để đưa dự đoán hành vi mua hàng tương lai khách hàng Các dạng gợi ý bao gồm: gợi ý sản phẩm tới người tiêu dùng, thông tin sản phẩm mang tính cá nhân hóa, tổng kết ý kiến cộng đồng, cung cấp chia sẻ, phê bình, đánh giá mang tính cộng đồng liên quan tới u cầu, mục đích người dùng [10, 13, 16] Rất nhiều hệ thống lớn thu thập thông tin phản hồi từ khách hàng cách tường minh, Ebay, Amazon, LastFM, NetFlix, Youtube, người dùng trực tiếp đánh giá sản phẩm, bình chọn từ ★ (khơng thích) đến ★ ★★★ (rất thích); hay Youtube thu thập thơng tin qua like/disklike, hệ thống khác [10, 13, 16] Thông qua việc thu thập phản hồi tường minh, hệ thống dễ dàng xác định mức độ yêu thích người dùng sản phẩm, từ dự đốn sản phẩm mà người dùng thích để gợi ý cho họ Tuy nhiên, điều gây bất lợi người dùng lúc sẵn sàng/vui lịng để lại phản hồi họ, hệ thống phải nên tự xác định người dùng cần thơng qua phản hồi tiềm ẩn Một số ứng dụng hệ tư vấn tiếng giới giới thiệu Hình 1.1 [14] Hình 1.1: Một số lĩnh vực ứng dụng hệ thống gợi ý Trong kỹ thuật lọc cộng tác CF (Collaborative Filtering), việc đưa khuyến nghị sản phẩm người dùng xác định dựa quan điểm người dùng có sở thích với người dùng Hệ thống lọc cộng tác biểu diễn người dùng dựa đánh giá họ tập sản phẩm Hệ thống lựa chọn người dùng sở thích tùy thuộc vào độ đo tương tự tương quan Sau đó, đưa dự đoán sản phẩm chưa người dùng đánh giá quan tâm Cuối hệ thống gợi ý sản phẩm với mức độ dự đoán cao cho người dùng mục tiêu Kỹ thuật CF khẳng định thành công nhiều nghiên cứu thực nghiệm nhiều ứng dụng thực tế [8, 11, 12] Hệ thống gợi ý dạng hệ hỗ trợ định, cung cấp giải pháp mang tính cá nhân hóa mà khơng phải trải qua q trình tìm kiếm phức tạp Hệ gợi ý học từ người dùng gợi ý sản phẩm tốt số sản phẩm phù hợp 1.1.2 Bài toán tư vấn người dùng Cho tập hợp hữu hạn gồm 𝑁 người dùng 𝑈 = {𝑢1 , 𝑢1 , … , 𝑢𝑁 } 𝑀 sản phẩm 𝑃 = {𝑝1 , 𝑝2 , … , 𝑝𝑀 } Mỗi người dùng 𝑢𝑖 ∈ 𝑈 (với 𝑖 = 1, 2, … , 𝑁) biểu diễn thông qua |𝑇| đặc trưng nội dung 𝑇 = {𝑡1 , 𝑡2 , … , 𝑡|𝑇| } Các đặc trưng 𝑡𝑞 ∈ 𝑇 thông thường thông tin cá nhân người dùng Ví dụ 𝑢𝑖 ∈ 𝑈 người dùng đặc trưng nội dung biểu diễn người dùng 𝑢𝑖 T={giới tính, độ tuổi, nghề nghiệp, trình độ,…} Mỗi sản phẩm 𝑝𝑥 ∈ 𝑃 (với 𝑥 = 1, 2, … 𝑀) hàng hóa, phim, ảnh, tạp chí, tài liệu, sách, báo, dịch vụ dạng thông tin mà người dùng cần đến Mỗi sản phẩm 𝑝𝑥 ∈ 𝑃 biểu diễn thông qua |𝐶| đặc trưng nội dung 𝐶 = { 𝑐1 , 𝑐2 , … , 𝑐|𝐶| } Các đặc trưng 𝑐𝑠 ∈ 𝐶 nhận từ phương pháp trích chọn đặc trưng lĩnh vực truy vấn thơng tin Ví dụ 𝑝𝑥 ∈ 𝑃 phim đặc trưng nội dung biểu diễn phim 𝑝𝑥 𝐶 = {thể loại phim, nước sản xuất, hãng phim, diễn viên, đạo diễn, …} Mối quan hệ tập người dùng 𝑈 tập sản phẩm 𝑃 biểu diễn thông qua ma trận đánh giá 𝑅 = [𝑟𝑖𝑥 ] với 𝑖 = 1, 2, … , 𝑁; 𝑥 = 1, 2, … , 𝑀 (Hình 1.2) 8 Người dùng Sản phẩm … i … 𝑀 2 0 0 0 0 0 N 0 0 𝑎 ? u Hình 1.2 Ví dụ ma trận đánh giá tổng quát Giá trị 𝑟𝑖𝑥 thể đánh giá người dùng 𝑢𝑖 ∈ 𝑈 cho số sản phẩm 𝑝𝑥 ∈ 𝑃 Thông thường giá trị 𝑟𝑖𝑥 nhận giá trị thuộc miền 𝐹 = { 1, 2, … , 𝑔} thu thập trực tiếp cách hỏi ý kiến người dùng thu thập gián tiếp thông qua chế phản hồi người dùng Những giá trị 𝑟𝑖𝑥 = hiểu người dùng 𝑢𝑖 ∈ 𝑈 chưa biết đến không đánh giá sản phẩm 𝑝𝑥 ∈ 𝑃 , ô điền ký tự “?” giá trị cần hệ tư vấn đưa dự đoán đánh giá Tiếp đến, ta ký hiệu 𝑃𝑖  𝑃 tập sản phẩm 𝑝𝑥 ∈ 𝑃 đánh giá người dùng 𝑢𝑖 ∈ 𝑈 𝑢𝑎 ∈ 𝑈 gọi người dùng thời, người dùng cần tư vấn hay người dùng tích cực Khi đó, tồn hai dạng tốn điển hình hệ tư vấn là: - Dự đoán đánh giá người dùng 𝑢𝑎 với sản phẩm chưa có đánh giá trước - Tư vấn danh sách ngắn sản phẩm phù hợp với người dùng thời Cụ thể người dùng 𝑢𝑎 , hệ tư vấn chọn 𝐾 sản phẩm 𝑝𝑥 ∈ (𝑃\𝑃𝑎 ) phù hợp với người dùng 𝑢𝑎 để gợi ý cho họ 9 Việc giải toán tư vấn thực theo qui trình xây dựng hệ tư vấn mục 1.1.3 1.1.3 Qui trình xây dựng hệ tư vấn Qui trình tổng quát để giải toán tư vấn [14] thơng thường gồm có giai đoạn thể sau: Giai đoạn 1: Thu thập thông tin Ba loại thơng tin thường thu thập cho hệ tư vấn, gồm có: - Người dùng (User) biểu diễn thông qua đặc trưng thông tin cá nhân Thông qua biểu diễn này, hệ thống cho phép xây dựng hồ sơ người dùng (user’s profile) nhằm lưu trữ lại dấu vết đặc trưng nội dung sản phẩm sử dụng người dùng - Sản phẩm (Item) biểu diễn thông qua đặc trưng thông tin sản phẩm Thông qua biểu diễn này, hệ thống cho phép xây dựng hồ sơ sản phẩm (item’s profile) nhằm lưu trữ lại dấu vết đặc trưng người dùng sử dụng sản phẩm - Phản hồi người dùng với sản phẩm (Feedback), biểu diễn thông qua giá trị đánh giá người dùng với sản phẩm Giai đoạn 2: Xây dựng mơ hình Giai đoạn xây dựng mơ hình tư vấn thực nhiều hướng tiếp cận khác nhằm so sánh, đánh giá mối liên hệ thông tin thu thập giai đoạn Một số hướng tiếp cận điển hình biết đến như: dựa vào kinh nghiệm, học máy, lý thuyết xấp xỉ, [1] Mỗi hướng tiếp cận khai thác thông tin đầu vào theo cách khác hình thành phương pháp tư vấn khác Giai đoạn 3: Dự đoán đánh giá / Đưa tư vấn Dữ liệu đầu giai đoạn dùng để dự đoán đánh giá người dùng với sản phẩm chưa có đánh giá trước chọn 𝐾 sản phẩm phù hợp người dùng thời để gợi ý cho họ 10 1.2 Các phương pháp lọc tin 1.2.1 Phân loại hệ thống tư vấn Lọc thông tin lĩnh vực nghiên cứu q trình phân bổ thơng tin thích hợp gỡ bỏ thơng tin khơng thích hợp đến với người dùng Lọc thông tin cho hệ tư vấn tiếp cận theo hai xu hướng chính, lọc dựa vào nội dung sản phẩm lọc dựa vào thói quen sử dụng sản phẩm người hay gọi lọc cộng tác So với lọc theo nội dung, lọc cộng tác cho lại kết tốt lọc dạng thông tin Tuy nhiên, lọc cộng tác gặp phải vấn đề liệu thưa, người dùng sản phẩm cần tiếp tục nghiên cứu giải Kết hợp lọc cộng tác lọc nội dung để nâng cao chất lượng dự đoán tránh trạng liệu thưa lọc cộng tác tập trung nghiên cứu nhiều thời gian gần Các phương pháp lọc kết hợp hạn chế biểu diễn ước lương mức độ ảnh hưởng đặc trưng nội dung đến thói quen sử dụng sản phẩm người dùng [2, 5, 10, 12, 14] Có nhiều cách để dự đốn, ước lượng hạng/điểm cho sản phẩm sử dụng học máy, lý thuyết xấp xỉ, thuật toán dựa kinh nghiệm, … Theo [8], hệ thống gợi ý thường phân thành ba loại theo phương pháp lọc tin (xem Hình 1.3): Tư vấn dựa nội dung, tư vấn dựa cộng tác, tư vấn dựa cách tiếp cận kết hợp Tư vấn dựa nội dung: Cách tiếp cận lọc nội dung tạo hồ sơ cho người dùng sản phẩm để mơ tả chất Ví dụ, hồ sơ phim bao gồm thuộc tính liên quan đến thể loại nó, diễn viên tham gia, phổ biến phòng vé, v.v Hồ sơ người dùng bao gồm thơng tin nhân học câu trả lời cung cấp bảng câu hỏi phù hợp Các hồ sơ cho phép chương trình liên kết người dùng với sản phẩm phù hợp Tất nhiên, chiến lược dựa nội dung u cầu thu thập thơng tin bên ngồi khơng có sẵn khó thu thập 11 Tư vấn dựa cộng tác: Cách dựa hành vi người dùng trước Ví dụ: Giao dịch trước xếp hạng sản phẩm, mà khơng yêu cầu tạo hồ sơ rõ ràng Chiến thuật phân tích mối liên quan người dùng thuộc tính sản phẩm để định nghĩa quan hệ người dùng – sản phẩm Ưu điểm lọc cộng tác so với lọc nội dung không bị giới hạn miền, dẫn đến giải khía cạnh liệu thường khó nắm bắt khó khăn để đưa vào sử dụng lọc nội dung Tuy nhiên không hiệu phải xử lý với liệu thêm vào, điều mà lọc nội dung lại hiệu Tư vấn dựa cách tiếp cận kết hợp: Kết hợp hai phương pháp tiếp cận dựa nội dung cộng tác Hình 1.3: Phân loại hướng tiếp cận xây dựng hệ thống gợi ý 1.2.2 Phương pháp tư vấn dựa nội dung Lọc theo nội dung phương pháp thực dựa việc so sánh nội dung thông tin hay mô tả hàng hóa, để tìm sản phẩm tương tự với 12 mà người dùng quan tâm để giới thiệu cho họ sản phẩm Các phương pháp tiếp cận cho lọc theo nội dung chia thành hai phương pháp chính: lọc nội dung dựa vào nhớ lọc nội dung dựa vào mơ hình Những vấn đề cần tiếp tục nghiên cứu lọc nội dung vấn đề trích chọn đặc trưng người dùng [1, 8, 12] Với phương pháp tư vấn dựa nội dung, độ phù hợp r(u, i) sản phẩm i với người dùng u đánh giá dựa độ phù hợp r(u, i’) “tương tự” i Ví dụ, để gợi ý phim cho người dùng u, hệ thống gợi ý tìm đặc điểm phim u đánh giá cao diễn viên, đạo diễn, … sau phim tương tự với sở thích u giới thiệu Hướng tiếp cận dựa nội dung bắt nguồn từ nghiên cứu thu thập thông tin lọc thơng tin Do đó, nhiều hệ thống dựa nội dung tập trung vào tư vấn đối tượng chứa liệu văn tin tức, website Những tiến so với hướng tiếp cận cũ phương pháp tìm kiếm thơng tin có sử dụng hồ sơ người dùng (chứa thơng tin sở thích, nhu cầu, ) Hồ sơ xây dựng dựa thông tin người dùng cung cấp trực tiếp (khi trả lời khảo sát) gián tiếp (do khai phá thông tin từ giao dịch người dùng) Hình 1.4 Minh họa phương pháp tư vấn dựa lọc nội dung Giả sử ta xem Content(i) thông tin riêng sản phẩm, nghĩa tập đặc tính đặc trưng cho sản phẩm i Nó thường tính tốn thơng qua việc trích rút từ tập đặc tính sản phẩm i (nội dung nó) ứng ... hình khả ứng dụng toán xây dựng hệ thống gợi ý Chương 3: Ứng dụng phương pháp lọc cộng tác dựa sản phẩm hệ thống gợi ý bán hàng trực tuyến Chương cài đặt thử nghiệm phương pháp lọc cộng tác sản... tác ứng dụng hệ thống gợi ý bán hàng trực tuyến? ?? làm đề tài nghiên cứu luận văn tốt nghiệp thạc sĩ chuyên ngành Khoa học máy tính  Mục tiêu nghiên cứu Nghiên cứu ứng dụng phương pháp lọc cộng tác. .. tin ứng dụng hệ thống gợi ý Chương 2: Phương pháp thuật lọc cộng tác dựa sản phẩm Chương trình bày phương pháp lọc cộng dựa vào người dùng, lọc cộng tác dựa sản phẩm, phương pháp lọc cộng tác

Ngày đăng: 28/02/2023, 20:12

Tài liệu cùng người dùng

Tài liệu liên quan