1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khai phá dữ liệu ứng dụng trong hệ thống gợi ý

59 6 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 59
Dung lượng 1,91 MB

Nội dung

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC - 2017B TOÁN ỨNG DỤNG VÀ TIN HỌC – LÊ VĂN TUẤN LÊ VĂN TUẤN TÊN ĐỀ TÀI : KHAI PHÁ DỮ LIỆU ỨNG DỤNG TRONG HỆ THỐNG GỢI Ý LUẬN VĂN THẠC SĨ Chuyên ngành: TOÁN TIN CB170325 HÀ NỘI – 2020 TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ KHAI PHÁ DỮ LIỆU ỨNG DỤNG TRONG HỆ THỐNG GỢI Ý LÊ VĂN TUẤN TUAN.LVCB170325@sis.hust.edu.vn Ngành Toán Tin Giảng viên hướng dẫn: TS Lê Chí Ngọc Viện: Tốn ứng dụng Tin học HÀ NỘI, 05/2020 Lời cảm ơn Lời đầu tiên, xin chân thành cảm ơn tới TS Lê Chí Ngọc giúp đỡ tơi nhiều q trình tìm kiếm tài liệu hoàn thành luận văn Sự bảo tận tình thầy suốt trình từ ý tưởng ban đầu luận văn hoàn thành trợ giúp lớn Tôi xin cảm ơn bạn học lớp Cao học Toán Tin 2017, anh chị, bạn bè, đồng nghiệp tơi có đóng góp giúp tơi hồn chỉnh luận văn Cuối cùng, xin gửi lời cảm ơn gia đình tơi người ln bên cạnh động viên, ủng hộ tơi nhiều q trình học hồn thiện luận văn Luận văn tơi cịn có nhiều thiếu sót, mong nhận ý kiến đóng góp từ thầy, cơ, từ bạn đồng nghiệp để hồn thiện kiến thức mình, tiếp tục hướng nghiên cứu Tôi xin chân thành cảm ơn! Hà Nội, ngày tháng năm 2020 Học viên Lê Văn Tuấn Tóm tắt nội dung luận văn Trong thực tế ngày, gợi ý video liên quan xem video Youtube, hay Facebook gợi ý kết bạn, đến hàng gợi ý Amazon… Điều đặc biệt thứ gợi ý phù hợp với người dùng, làm người dùng sử dụng ngày nhiều sản phẩm họ Vậy họ làm điều đấy, có tới hàng nghìn, hàng vạn hàng Đó nhờ cơng nghệ hệ thống gợi ý, nhánh nhỏ ngành máy học, giúp người dùng tiếp cận phù hợp với hàng mong muốn vơ số hàng khác Hiện hệ thống gợi ý có mặt hầu hết nơi, ngành sản xuất, buôn bán Trong nội dung đề tài, sử dụng thuật toán học sâu kết hợp với phương pháp phân rã ma trận thành nhân tử để xây dựng mơ hình hệ thống gợi ý vừa tăng tốc độ tính tốn, dễ dàng cập nhật mơ cải thiện độ xác so với phương pháp thơng thường Đề tài sử dụng liệu người dùng nhà hàng website foody.vn để xây dựng mơ hình đưa gợi ý nhà hàng phù hợp tới người dùng HỌC VIÊN Ký ghi rõ họ tên Mục Lục MỞ ĐẦU CHƯƠNG 1.1 Hệ gợi ý 1.1.1 Sản phẩm 10 1.1.2 Người dùng 11 1.1.3 Sự tương tác 11 CHƯƠNG 14 2.1 Các kỹ thuật hệ thống gợi ý 14 2.1.1 Lọc dựa nội dung 14 2.1.2 Lọc cộng tác 17 2.1.3 Lọc theo nhân học 22 2.1.4 Lọc dựa tri thức 22 2.1.5 Lọc dựa cộng đồng 22 2.1.6 Hệ thống gợi ý hỗn hợp 22 2.1.7 Đánh giá 23 2.2 Mạng nơ ron học sâu 24 2.2.1 Mơ hình Perceptron 24 2.2.2 Hàm Sigmoid 26 2.2.3 Mạng nơ ron 28 2.2.4 Lan truyền thẳng 31 2.2.5 Lan truyền ngược 32 2.2.6 Mạng nơ ron sâu 34 2.2.7 Ứng dụng 35 2.3 Một số kết nghiên cứu liên quan CHƯƠNG 38 36 3.1 Hệ thống gợi ý 38 3.1.1 Hàm lỗi 40 3.1.2 Tối ưu hàm lỗi 40 3.2 Mơ hình học sâu 42 3.2.1 Mạng nơ ron sâu softmax 42 3.2.2 Kiến trúc mơ hình 44 3.2.3 Đầu softmax 44 3.2.4 Hàm lỗi 45 3.2.5 Nhúng softmax 46 3.3 Kiến trúc hệ thống 48 3.4 Một số kết 49 3.4.1 Dữ liệu 49 3.4.2 Độ xác 50 KẾT LUẬN 53 TÀI LIỆU THAM KHẢO 54 CHỈ MỤC 59 MỤC LỤC HÌNH VẼ Hình 1: Ví dụ minh họa lọc theo nội dung với sản phẩm google play store 14 Hình 2: Ví dụ ma trận tiện ích thể đánh giá phim 15 Hình 3: Ví dụ lọc cộng tác gợi ý phim cho người lớn, trẻ em 18 Hình 4: Minh họa perceptron 25 Hình 5: Ví dụ perceptron phân loại hai lớp 26 Hình 6: Đồ thị hàm sigmoid 27 Hình 7: Ví dụ mơ hình tốn học mạng nơ ron 28 Hình 8: Minh họa mạng nơ ron nhiều lớp 29 Hình 9: Minh họa mạng nơ ron với nhiều lớp ẩn 30 Hình 10: Minh họa mạng nơ ron sâu 35 Hình 11: Minh họa phương pháp phân rã ma trận thành nhân tử 39 Hình 12: Minh họa luồng vào liệu mơ hình học sâu 44 Hình 13: Minh họa phân phối xác suất đầu lớp softmax 45 Hình 14: Đầu lớp softmax so sánh với thực tế để đưa giá trị lỗi 46 Hình 15: Mơ hình tổng quan hệ gợi ý 48 Hình 16: Kiến trúc hệ thống 48 Hình 17: Bản mơ tả liệu đánh giá người dùng 49 Hình 18: Đồ thị biểu diễn thay đổi hàm lỗi liệu học liệu kiểm tra 50 Hình 19: Đồ thị biểu diễn độ xác trình học mơ hình 51 Hình 20: Đồ thị biểu diễn độ xác với phương pháp phân rã ma trận đơn 51 MỤC LỤC BẢNG Bảng 1: Một số kết so sánh mơ hình gợi ý 52 MỞ ĐẦU Hiện với phát triển mạnh mẽ ngành công nghiệp, mạng xã hội, thông tin, liệu xuất lúc nơi xung quanh Sự gia tăng không ngừng liệu từ mức độ terabytes đến mức độ petabytes nhiều Dữ liệu đến từ nhiều nguồn, từ trang mạng xã hội Facebook, Twitter, Instagram hay giao dịch thương mại, xã hội số, chứng khốn… Cùng với u cầu q trình phân tích, chiết xuất liệu ngày cao, khơng phải đáp ứng tính thời gian thực mà cịn phải đưa thơng tin hữu ích, quan trọng đống khổng lồ liệu thô, chưa xử lý… Tất yếu tố làm cho tốn phân tích xử lý liệu truyền thống trở nên không hiệu Như cần có cơng cụ tiên tiến hơn, phương pháp hiệu để giải vấn đề Và kĩ thuật phát tri thức, khai phá liệu, máy học nghiên cứu, ứng dụng nhiều lĩnh vực khác toàn giới Học máy ngày len lõi vào ngóc ngách sống hàng ngày Giúp cải thiện, nâng cao hiệu suất làm việc, công việc dễ dàng Trong thực tế ngày, gợi ý video liên quan xem video Youtube, hay Facebook gợi ý kết bạn, đến hàng gợi ý Amazon… Điều đặc biệt thứ gợi ý phù hợp với người dùng, làm người dùng sử dụng ngày nhiều sản phẩm họ Vậy họ làm điều đấy, có tới hàng nghìn, hàng vạn hàng Đó nhờ công nghệ hệ thống gợi ý, nhánh nhỏ ngành máy học, giúp người dùng tiếp cận phù hợp với hàng mong muốn vơ số hàng khác Hiện hệ thống gợi ý có mặt hầu hết nơi, ngành sản xuất, buôn bán Ngày trước mà hệ thống gợi ý áp dụng với tính tốn ma trận đơn tới nay, với bùng nổ máy học, học tăng cường, học sâu, áp dụng vào hệ thống gợi ý cho kết ngày cải thiện độ xác tốc độ xử lý Một lĩnh vực mà hệ thống gợi ý cải thiện rõ rệt suất, hiệu bán hàng ngành kinh doanh nhà hàng Nhu cầu ăn uống cần thiết với người, gợi ý nhu cầu khách hàng tới nhà hàng đủ chất lượng phù hợp với sở thích khách hàng số hàng ngàn nhà hàng khác vấn đề lớn Khi mà tập khách hàng lớn, số lượng khách hàng nhiều phải kết hợp công nghệ xử lý liệu lớn kết hợp với hệ thống gợi ý để đưa kết tốt ví dụ Việt Nam nay, phát triển mạnh mẽ Foody, Grab, Goviet, Now… công ty, doanh nghiệp ngành thực phẩm, đồ ăn, giao hàng Với hàng triệu khách hàng giao dịch ngày, hệ thống phải hoạt động tốt, gợi ý sản phẩm hiệu Hệ thống gợi ý giúp người mua hàng giao dịch nhiều hơn, từ tăng doanh thu đáng kể Trong luận văn tổng hợp nghiên cứu, tìm hiểu tơi hệ thống gợi ý, bên cạnh áp dụng học sâu vào hệ thống Giúp khách hàng tìm nhà hàng phù hợp theo nhu cầu, sở thích, từ gia tăng suất, doanh thu cho nhà hàng Cấu trúc luận văn gồm ba chương Chương 1, giới thiệu hệ thống gợi ý mà nghiên cứu thời gian qua Chương trình bày áp dụng học sâu vào hệ thống gợi ý cuối Chương số kết đạt với tập liệu khách hàng nhà hàng hệ thống Foody Phần kết luận tổng kết lại vấn đề luận văn CHƯƠNG GIỚI THIỆU BÀI TỐN Cơng nghệ hệ thống gợi ý giúp đưa gợi ý phù hợp tới người dùng cuối [1, 2, 3] Có đa dạng gợi ý tới người dùng như: gợi ý sách cho người mua giống website amazon.com, gợi ý nhạc hay đến tin tức liên quan trang báo [2]… Tất thứ với mục đích gợi ý cho người dùng hệ thống gợi ý gọi chung “sản phẩm” Khi mà số lượng sản phẩm lớn khiến người dùng thiếu kinh nghiệm để chọn sản phẩm phù hợp, hệ thống gợi ý giải vấn đề Hệ thống gợi ý cá nhân hóa người dùng, từ tập hợp sở thích, thói quen cụ thể người để đưa gợi ý tốt Còn người dùng mới, chưa cá nhân hóa biện pháp hữu hiệu thường đưa gợi theo xu hướng, sản phẩm trội thời điểm [4] Hệ thống gợi ý thu thập thông tin từ người dùng qua hành vi họ, từ lần đánh giá, bình luận đến click (nhấn chuột), xem hay cho sản phẩm vào giỏ hàng hệ thống xử lý, với mục đích có thật nhiều thơng tin khách hàng tốt, để hệ thống cải thiện hiệu đưa kết xác lần người dùng Bên cạnh sản phẩm ý theo sở thích cá nhân, hệ thống gợi ý sản phẩm khác người có nét tương đồng với họ Để kết hiển thị chuẩn xác hài hòa Hệ thống gợi ý bắt đầu dần lên từ năm 1990 [5, 1, 6, 7], thời gian gần hệ thống gợi ý phát triển mạnh mẽ, số chủ đề đáng ý như: Các trang web tiếng lớn youtube.com, amazon.com, netflix.com, walmart.com… trọng phát triển hệ thống gợi ý vai trị quan trọng hệ thống [8] Họ đầu tư, phát triển Ví dụ Netflix trao thưởng tới triệu $ cho đội cải thiện độ xác hệ thống gợi ý 10% so với [9] Hình 13: Minh họa phân phối xác suất đầu lớp softmax Lớp softmax đưa vector đầu tới phân phối xác suất 3.2.4 Hàm lỗi Cuối cùng, để xác định hàm lỗi so sánh: ● 𝑝̂ đầu hàm softmax phân phối xác suất ● 𝑝 giá trị thực tế, đại diện cho sản phẩm mà người dùng đánh giá Ví dụ, sử dụng cross-entropy sử dụng để so sánh phân phối xác suất Gọi ℎ hàm lỗi, đó: 𝑙𝑜𝑠𝑠 = ℎ(𝑝, 𝑝̂ ) Hình 14: Đầu lớp softmax so sánh với thực tế để đưa giá trị lỗi 3.2.5 Nhúng softmax Xác suất sản phẩm 𝑗 xác định bởi: 𝑝̂𝑗 = 𝑒𝑥𝑝(〈𝜓(𝑥), 𝑉𝑗 〉) 𝑍 , với 𝑍 số chuẩn khơng phụ thuộc vào 𝑗 Nói cách khác, 𝑙𝑜𝑔 (𝑝̂𝑗 ) = 〈𝜓(𝑥), 𝑉𝑗 〉 − 𝑙𝑜𝑔 𝑍, xác suất theo log sản phẩm 𝑗 tích vector 𝑑 −chiều ● 𝜓(𝑥) ∈ 𝑅 𝐷 hàm kích hoạt, đầu lớp ẩn cuối ● 𝑉𝑗 ∈ 𝑅𝐷 vector trọng số nối lớp ẩn cuối tới đầu thứ 𝑗 Nhận xét: Trong cách dùng: mạng nơ ron sâu softmax phân tích ma trận thành nhân tử, hệ thống học vector 𝑉𝑗 sản phẩm thứ 𝑗 Trong phần phân tích ma trận thành nhân tử ta gọi ma trận 𝑋 ∈ 𝑅𝑀 𝑥 𝐾 mơ hình softmax ta gọi ma trận trọng số 𝑉 lớp softmax Tuy nhiên, thay học ma trận 𝑊 ∈ 𝑅𝐾 × 𝑁 phần trước, hệ thống học trọng số kết nối từ đầu vào hàm kích hoạt 𝜓(𝑥) ∈ 𝑅𝐷 Do đó, nghĩ mơ hình mạng nơ ron học sâu giống dạng khái quát phương pháp phân tích ma trận thành nhân tử, thay việc học người dùng hàm kích hoạt phi tuyến 𝜓(𝑥) Một khác biệt đầu vào, với phương pháp phân tích ma trận thành nhân tử, không sử dụng đặc điểm phụ sản phẩm, sử dụng mơ hình mạng nơ ron tháp đơi để áp dụng Mơ hình gồm mạng: ● Một mạng nơ ron nối đầu vào đặc điểm người dùng (𝑥) tới hàm kích hoạt 𝜓(𝑥) ● Một mạng nối đầu vào đặc điểm sản phẩm tới hàm kích hoạt 𝜙(𝑥) Đầu mơ hình lúc xách định tích 〈𝜓(𝑥), 𝜙(𝑥)〉 trước đưa vào lớp softmax Hình 15: Mơ hình tổng quan hệ gợi ý 3.3 Kiến trúc hệ thống Hình 16: Kiến trúc hệ thống 3.4 Một số kết 3.4.1 Dữ liệu Bộ liệu để sử dụng đề tài lấy từ website foody.com, website tổng hợp đầy đủ nhà hàng, quán ăn Việt Nam, với lượng người dùng sử dụng ngày lớn, đánh giá, bình luận người dùng lớn, giúp việc thực xây dựng mơ hình dễ dàng hoàn thiện Các nhà hàng Foody phân bổ nhiều tỉnh thành Việt Nam, phạm vi đề tài này, tập trung vào nhà hàng Hà Nội Vì nơi tập trung nhiều nhà hàng nhất, xây dựng mơ hình đưa dự đốn có ý nghĩa thực tế Tập liệu gồm 15,452 người dùng, 44,092 nhà hàng Có 184,877 ghi liệu đánh giá người dùng, bao gồm tám trường: user_id, restaurant_id, avg_vote, service_vote, food_vote, position_vote, atmosphere_vote, price_vote Hình 17: Bản mơ tả liệu đánh giá người dùng Trong đó: ● user_id: mã id người dùng ● restaurant_id: mã id nhà hàng ● avg_vote: đánh giá người dùng tổng thể nhà hàng ● service_vote: đánh giá người dùng dịch vụ nhà hàng ● food_vote: đánh giá người dùng đồ ăn nhà hàng ● position_vote: đánh giá người dùng vị trí nhà hàng ● atmosphere_vote: đánh giá người dùng khơng khí, khơng gian, thoải mái nhà hàng ● price_vote: đánh giá người dùng giá nhà hàng 3.4.2 Độ xác Thuật tốn xây dựng mơ hình chạy máy tính có xử lý intel core i5-7400 3.00GHz, nhớ 8G, card đồ họa GPU 4G Với thời gian học mơ hình phút 02 giây, hệ thống đạt số kết sau: Hình 18: Đồ thị biểu diễn thay đổi hàm lỗi liệu học liệu kiểm tra Hình 19: Đồ thị biểu diễn độ xác q trình học mơ hình Cùng tập liệu chạy với mơ hình phân rã ma trận thành nhân tử đơn thuần, mơ hình hồn thành thời gian chạy 1800 giây: Hình 20: Đồ thị biểu diễn độ xác với phương pháp phân rã ma trận đơn Bảng so sánh: Lọc cộng tác sử Phân rã ma dụng độ đo tương trận thành phân rã ma tự người trận thành nhân tử nhân tử dùng Thời gian Học sâu 393 636 302 7.256 1.405 0.92 chạy (giây) RMSE Bảng 1: Một số kết so sánh mơ hình gợi ý Nhận xét: Có thể dễ dàng nhận thấy mơ hình gợi ý kết hợp với học sâu cho thời gian tính tốn độ xác tốt Do sử dụng GPU tính tốn, việc học mơ hình nhanh nhiều so với việc sử dụng CPU đơn Bên cạnh đó, phạm vi đề tài, liệu xét mức độ bình thường nên phương pháp lọc cộng tác sử dụng độ tương tự người dùng biểu diễn đưa kết quả, mà lượng người dùng tăng lên nhiều, thời gian tính tốn khơng có ý nghĩa thực tế tràn nhớ khơng thể biểu diễn được, cần phải phân rã ma trận để xây dựng mơ hình Mức độ lỗi phương pháp phân rã ma trận sử dụng học sâu mức 5% chấp nhận được, ta sử dụng thêm nhiều đầu vào đánh giá khơng gian, địa điểm kết có khả cịn xác KẾT LUẬN Vấn đề gợi ý cho người dùng sản phẩm phù hợp với họ không lĩnh vực nhà hàng mà nhiều ngành nghề khác thương mại điện tử, sách báo, ca nhạc… để đưa gợi ý xác, phù hợp địi hỏi phải có mơ hình tốt Bên cạnh phát triển mạnh mẽ học sâu, học sâu dần cho thấy phương pháp tốt để giải tốn khó ngành nghề Trong tài liệu này, tận dụng học sâu để xây dựng mơ hình gợi ý kết hợp với phương pháp phân rã ma trận thành nhân tử Trong chương hai, chi tiết cách xây dựng mơ hình học sâu này, lớp ẩn thực học trọng số để đưa vector nhúng người dùng, sau kết hợp với vector nhúng sản phẩm để ma trận tiện ích chứa đánh giá người dùng tới sản phẩm Lớp đầu sử dụng hàm softmax (phần 2.2.3 chương 2) đưa xác suất lựa chọn sản phẩm, so sánh với liệu có sẵn để đánh giá giá trị lỗi, giúp mơ hình học sâu giảm độ lỗi mơ hình xuống thấp Các hướng nghiên cứu đề tài tập trung vào hai hướng chính: ● Phương pháp phân rã ma trận: Cải tiến phương pháp phân rã ma trận mạnh mẽ như: sử dụng phân rã ma trận không âm phân rã ma trận tăng dần ● Mơ hình học sâu: Hiện đầu vào mơ hình sử dụng dụng thêm tính chất người dùng, điều cải tiến cách thêm tính chất khác sản phẩm làm đầu vào, giúp tăng tính xác cho mơ hình Bên cạnh sử dụng số hàm phi tuyến khác kết hợp với hàm softmax lớp đầu mơ hình để đưa kết khác TÀI LIỆU THAM KHẢO [1] Mahmood, T., Ricci, F., “Improving recommender systems with adaptive conversational strategies,” C Cattuto, G Ruffo, F Menczer (eds.) Hypertext, ACM, 2009, p 73–82 [2] Resnick, P., Varian, H.R., “Recommender systems Communications of the ACM,” 1997, p 56–58 [3] R Burke, “Hybrid web recommender systems,” The Adaptive Web, Springer Berlin / Heidelberg, 2007, p 377–408 [4] D Jannach, “Finding preferred query relaxations in content-based recommenders,” 3rd International IEEE Conference on Intelligent Systems, 2006, p 355–360 [5] Goldberg, D., Nichols, D., Oki, B.M., Terry, D., “Using collaborative filtering to weave an information tapestry,” 1992, p 61–70 [6] McSherry, F., Mironov, I., “Differentially private recommender systems: building privacy into the net,” KDD ’09: Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining, ACM, New York, NY, USA, 2009, p 627–636 [7] Anand, S.S., Mobasher, B., “Intelligent techniques for web personalization,” Intelligent Techniques for Web Personalization, Springer, 2005, p 1–36 [8] Koren, Y., Bell, R.M., Volinsky, C., “Matrix factorization techniques for recommender systems IEEE Computer,” 2009, p 30–37 [9] grand A Toscher, M Jahrer, and R Bell, ““The BigChaos solution to the Netflix prize,”,” URL www.netflixprize.com/assets/GrandPrize2009 BPC BigChaos.pdf, 2009 [10] Montaner, M., Lopez, B., de la Rosa, J.L., “A taxonomy of recommender agents on the inter- ´ net,” 2003, p 285–330 [11] Billsus, D., Pazzani, M., “Learning probabilistic user models,” UM97 Workshop on Machine Learning for User Modeling, URL http://www.dfki.de/˜bauer/ um-ws/, 1997 [12] G Fisher, “User modeling in human-computer interaction,” User Modeling and User-Adapted Interaction, 2001, p 65–86 [13] Schafer, J.B., Frankowski, D., Herlocker, J., Sen, S., “Collaborative filtering recommender systems,” The Adaptive Web, Springer Berlin / Heidelberg, 2007, p 291–324 [14] Schafer, J.B., Konstan, J.A., Riedl, J., “E-commerce recommendation applications,” Data Mining and Knowledge Discovery, 2001, p 115–153 [15] Mahmood, T., Ricci, F., “Towards learning user-adaptive state models in a conversational recommender system,” A Hinneburg (ed.) LWA 2007: Lernen - Wissen - Adaption, Halle, September 2007, Workshop Proceedings, MartinLuther-University HalleWittenberg, 2007, p 373–378 [16] Bridge, D., Goker, M., McGinty, L., Smyth, B., “Case-based recommender systems,” The Knowledge Engineering, 2006, p 315–320 [17] Ricci, F., Cavada, D., Mirzadeh, N., Venturini, A., “Case-based travel recommendations,” Destination Recommendation Systems: Behavioural Foundations and Applications, CABI, 2006, p 67–93 [18] J Golbeck, “Generating predictive movie recommendations from trust in social networks,” Trust Management, 4th International Conference, iTrust 2006, Pisa, Italy, May 16-19, 2006, Proceedings, 2006, p 93–104 [19] MARVIN MINSKY and SEYMOUR PAPERT, “Perceptrons An Introduction to Computational Geometry,” M.I.T Press, Cambridge, Mass., 1969 [20] F Rosenblatt, “The perceptron, a perceiving and recognizing automaton Project Para,” Cornell Aeronautical Laboratory, 1957 [21] Cox, David R., “The regression analysis of binary sequences,” Journal of the Royal Statistical Society Series B (Methodological), 1958, pp 215-242 [22] L Deng, “ “A tutorial survey of architectures, algorithms, and applications for deep learning,” APSIPA Transactions on Signal and Information Processing, vol 3, 2014 [Online],” Available: https://doi.org/10.1017/atsip.2013.9 [23] Widrow, B., & Lehr, M., “30 years of adaptive neural networks: perceptron, madaline, and backpropagation,” Proceedings of the IEEE, 1990, pp 1415-1442 [24] Christopher D Manning, “Computational Linguistics and Deep Learning Computational Linguistics,” 2015, p 701–707 [25] Y Koren, “ “Factorization Meets the Neighborhood: A Multifaceted Collaborative Filtering Model,” Proc 14th ACM SIGKDD Int’l Conf Knowledge Discovery and Data Mining, ACM Press,” 2008, pp 426-434 [26] R Salakhutdinov and A Mnih, ““Probabilistic Matrix Factorization,” Proc Advances in Neural Information Processing Systems,” ACM Press, 2008, pp 12571264 [27] Girvan M, Newman M E, “Community structure in social and biological networks,” Proceedings of the national academy of sciences, 2002, p 7821– 7826 [28] Kumar R., Novak J.,Tomkins A., “Structure and evolution of online social networks,” Link mining: models, algorithms, and applications, Springer, 2010, p 337–357 [29] F C T Chua, H W Lauw, and E.-P Lim, “Predicting item adoption using social correlation,” Proceedings of the 2011 SIAM International Conference on Data Mining, 2011, p 367–378 [30] Xia F., Liu H., Lee I., and Cao L., “Scientific article recommendation: Exploiting common author relations and historical preferences,” IEEE Transactions on Big Data, vol 2, 2016, p 101–112 [31] Granovetter M S., “The strength of weak ties,” American journal of sociology, vol 78, 1973, p 1360–1380 [32] Song T., Yi C., and Huang J, “Whose recommendations you follow? An investigation of tie strength, shopping stage, and deal scarcity,” Information & Management, 2017 [33] Krackhardt D., Nohria N., and Eccles B., “The strength of strong ties,” Networks in the knowledge economy, 2003, p 82 [34] Aral S and Walker D, “Tie strength, embeddedness, and social influence: A large-scale networked experiment,” Management Science, vol 60, 2014, p 1352–1370 [35] Asabere N Y., Xia F., Meng Q., Li F., and Liu H., “Scholarly paper recommendation based on social awareness and folksonomy,” International Journal of Parallel, Emergent and Distributed Systems, vol 30, 2015, p 211–232 [36] F Xia, N Y Asabere, H Liu, N Deonauth, and F Li, “Folksonomy based socially-aware recommendation of scholarly papers for conference participants,” Proceedings of the 23rd International Conference on World Wide Web, 2014, p 781–786 [37] Asabere N Y., Acakpovi A., and Michael M., “Improving Socially-Aware Recommendation Accuracy Through Personality,” IEEE Transactions on Affective Computing, 2017 [38] Xia F., Wang W., Bekele T M., and Liu H., “Big Scholarly Data: A Survey,” IEEE Transactions on Big Data, vol 3, 2017, p 18–35 [39] Jannach, D., Zanker, M., Felfernig, A., Friedrich, G., “Recommender Systems An Introduction,” Cambridge University Press, 2010 CHỈ MỤC Mạng nơ ron Mạng nơ ron sâu D Độ đo tương tự 28 34 18 N H hệ thống gợi ý Hồ sơ người dùng Hồ sơ sản phẩm Người dùng 6, 7, 16 16 K Khoảng cách Cosine Khoảng cách Jaccard 19 19 L Lọc cộng tác Lọc dựa nội dung P Perceptron phân rã ma trận thành nhân tử 24 38 R Root Mean Squared Error 23 S 17 14 M Ma trận tiện ích 11 15 Sản phẩm Sự tương tác s𝑖𝑔𝑚𝑜𝑖𝑑 10 11 26 ... 1.1 Hệ gợi ý Hệ thống gợi ý hệ thống mà có q trình thu thập, xử lý đa dạng loại liệu để xây dựng mô hình đưa gợi ý từ chúng Dữ liệu chủ yếu thông tin sản phẩm, tương tác người dùng nhận gợi ý từ... (SIGMOD) Hệ thống gợi ý dần phổ biến ngành giáo dục khắp giới từ đại học tới sau đại học, khóa học dành riêng cho hệ thống gợi ý Hay ngày nhiều sách viết hệ thống gợi ý [4] Nhiều báo hệ thống gợi ý. .. nhiên Một phương pháp tiếp cận áp dụng học sâu vào hệ thống gợi ý, hứa hẹn nhiều thành tựu, tiến hệ thống gợi ý Đã có số nghiên cứu hay hệ thống thực tế sử dụng học sâu việc gợi ý sản phẩm cho

Ngày đăng: 08/12/2021, 23:50

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Mahmood, T., Ricci, F., “Improving recommender systems with adaptive conversational strategies,” trong C. Cattuto, G. Ruffo, F. Menczer (eds.) Hypertext, ACM, 2009, p. 73–82 Sách, tạp chí
Tiêu đề: Improving recommender systems with adaptive conversational strategies
[2] Resnick, P., Varian, H.R., “Recommender systems. Communications of the ACM,” 1997, p. 56–58 Sách, tạp chí
Tiêu đề: Recommender systems. Communications of the ACM
[3] R. Burke, “Hybrid web recommender systems,” trong The Adaptive Web, Springer Berlin / Heidelberg, 2007, p. 377–408 Sách, tạp chí
Tiêu đề: Hybrid web recommender systems
[4] D. Jannach, “Finding preferred query relaxations in content-based recommenders,” trong 3rd International IEEE Conference on Intelligent Systems, 2006, p. 355–360 Sách, tạp chí
Tiêu đề: Finding preferred query relaxations in content-based recommenders
[5] Goldberg, D., Nichols, D., Oki, B.M., Terry, D., “Using collaborative filtering to weave an information tapestry,” 1992, p. 61–70 Sách, tạp chí
Tiêu đề: Using collaborative filtering to weave an information tapestry
[6] McSherry, F., Mironov, I., “Differentially private recommender systems: building privacy into the net,” trong KDD ’09: Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining, ACM, New York, NY, USA, 2009, p. 627–636 Sách, tạp chí
Tiêu đề: Differentially private recommender systems: building privacy into the net
[7] Anand, S.S., Mobasher, B., “Intelligent techniques for web personalization,” trong Intelligent Techniques for Web Personalization, Springer, 2005, p. 1–36 Sách, tạp chí
Tiêu đề: Intelligent techniques for web personalization
[8] Koren, Y., Bell, R.M., Volinsky, C., “Matrix factorization techniques for recommender systems. IEEE Computer,” 2009, p. 30–37 Sách, tạp chí
Tiêu đề: Matrix factorization techniques for recommender systems. IEEE Computer
[9] A. Toscher, M. Jahrer, and R. Bell, ““The BigChaos solution to the Netflix grand prize,”,” URL www.netflixprize.com/assets/GrandPrize2009 BPC BigChaos.pdf, 2009 Sách, tạp chí
Tiêu đề: “The BigChaos solution to the Netflix grand prize,”
[10] Montaner, M., Lopez, B., de la Rosa, J.L., “A taxonomy of recommender agents on the inter- ´ net,” 2003, p. 285–330 Sách, tạp chí
Tiêu đề: A taxonomy of recommender agents on the inter- ´ net
[11] Billsus, D., Pazzani, M., “Learning probabilistic user models,” trong UM97 Workshop on Machine Learning for User Modeling, URL http://www.dfki.de/˜bauer/ um-ws/, 1997 Sách, tạp chí
Tiêu đề: Learning probabilistic user models
[12] G. Fisher, “User modeling in human-computer interaction,” trong User Modeling and User-Adapted Interaction, 2001, p. 65–86 Sách, tạp chí
Tiêu đề: User modeling in human-computer interaction
[13] Schafer, J.B., Frankowski, D., Herlocker, J., Sen, S., “Collaborative filtering recommender systems,” trong The Adaptive Web, Springer Berlin / Heidelberg, 2007, p. 291–324 Sách, tạp chí
Tiêu đề: Collaborative filtering recommender systems
[14] Schafer, J.B., Konstan, J.A., Riedl, J., “E-commerce recommendation applications,” trong Data Mining and Knowledge Discovery, 2001, p. 115–153 Sách, tạp chí
Tiêu đề: E-commerce recommendation applications
[15] Mahmood, T., Ricci, F., “Towards learning user-adaptive state models in a conversational recommender system,” trong A. Hinneburg (ed.) LWA 2007: Lernen - Wissen - Adaption, Halle, September 2007, Workshop Proceedings, Martin- Luther-University HalleWittenberg, 2007, p. 373–378 Sách, tạp chí
Tiêu đề: Towards learning user-adaptive state models in a conversational recommender system
[16] Bridge, D., Goker, M., McGinty, L., Smyth, B., “Case-based recommender systems,” trong The Knowledge Engineering, 2006, p. 315–320 Sách, tạp chí
Tiêu đề: Case-based recommender systems
[17] Ricci, F., Cavada, D., Mirzadeh, N., Venturini, A., “Case-based travel recommendations,” trong Destination Recommendation Systems: Behavioural Foundations and Applications, CABI, 2006, p. 67–93 Sách, tạp chí
Tiêu đề: Case-based travel recommendations
[18] J. Golbeck, “Generating predictive movie recommendations from trust in social networks,” trong Trust Management, 4th International Conference, iTrust 2006, Pisa, Italy, May 16-19, 2006, Proceedings, 2006, p. 93–104 Sách, tạp chí
Tiêu đề: Generating predictive movie recommendations from trust in social networks
[19] MARVIN MINSKY and SEYMOUR PAPERT, “Perceptrons. An Introduction to Computational Geometry,” M.I.T. Press, Cambridge, Mass., 1969 Sách, tạp chí
Tiêu đề: Perceptrons. An Introduction to Computational Geometry
[20] F. Rosenblatt, “The perceptron, a perceiving and recognizing automaton Project Para,” trong Cornell Aeronautical Laboratory, 1957 Sách, tạp chí
Tiêu đề: The perceptron, a perceiving and recognizing automaton Project Para

HÌNH ẢNH LIÊN QUAN

Hình 1: Ví dụ minh họa lọc theo nội dung với các sản phẩm trên google play store - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 1 Ví dụ minh họa lọc theo nội dung với các sản phẩm trên google play store (Trang 16)
a) Ma trận tiện ích - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
a Ma trận tiện ích (Trang 16)
Hình 2: Ví dụ về ma trận tiện ích thể hiện đánh giá về phim - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 2 Ví dụ về ma trận tiện ích thể hiện đánh giá về phim (Trang 17)
Hình 3: Ví dụ về lọc cộng tác gợi ý phim cho người lớn, trẻ em - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 3 Ví dụ về lọc cộng tác gợi ý phim cho người lớn, trẻ em (Trang 20)
Hình 4: Minh họa về perceptron - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 4 Minh họa về perceptron (Trang 26)
Dưới đây là một hình mô tả đơn giản perceptron với các tín hiệu đầu vào: - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
i đây là một hình mô tả đơn giản perceptron với các tín hiệu đầu vào: (Trang 26)
Hình 5: Ví dụ về perceptron phân loại hai lớp - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 5 Ví dụ về perceptron phân loại hai lớp (Trang 27)
Hình 6: Đồ thị hàm sigmoid - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 6 Đồ thị hàm sigmoid (Trang 28)
Một ví dụ về mô hình toán học của mạng nơ ron, hàm kích hoạt  - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
t ví dụ về mô hình toán học của mạng nơ ron, hàm kích hoạt (Trang 29)
Hình 8: Minh họa về mạng nơ ron nhiều lớp - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 8 Minh họa về mạng nơ ron nhiều lớp (Trang 30)
Hình 9: Minh họa về mạng nơ ron với nhiều lớp ẩn - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 9 Minh họa về mạng nơ ron với nhiều lớp ẩn (Trang 31)
Hình 10: Minh họa mạng nơ ron sâu - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 10 Minh họa mạng nơ ron sâu (Trang 35)
Hình 11: Minh họa phương pháp phân rã ma trận thành nhân tử - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 11 Minh họa phương pháp phân rã ma trận thành nhân tử (Trang 39)
Hình 12: Minh họa luồng ra vào dữ liệu của mô hình học sâu - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 12 Minh họa luồng ra vào dữ liệu của mô hình học sâu (Trang 44)
Hình 13: Minh họa phân phối xác suất của đầu ra lớp softmax - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 13 Minh họa phân phối xác suất của đầu ra lớp softmax (Trang 45)
Hình 14: Đầu ra lớp softmax sẽ được so sánh với thực tế để đưa giá trị lỗi - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 14 Đầu ra lớp softmax sẽ được so sánh với thực tế để đưa giá trị lỗi (Trang 46)
Hình 15: Mô hình tổng quan của hệ gợi ý - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 15 Mô hình tổng quan của hệ gợi ý (Trang 48)
Hình 16: Kiến trúc hệ thống - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 16 Kiến trúc hệ thống (Trang 48)
Hình 17: Bản mô tả dữ liệu đánh giá của người dùng - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 17 Bản mô tả dữ liệu đánh giá của người dùng (Trang 49)
Thuật toán xây dựng mô hình được chạy trên máy tính có bộ xử lý intel core i5-7400 3.00GHz, bộ nhớ trong 8G, card đồ họa GPU 4G - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
hu ật toán xây dựng mô hình được chạy trên máy tính có bộ xử lý intel core i5-7400 3.00GHz, bộ nhớ trong 8G, card đồ họa GPU 4G (Trang 50)
Cùng tập dữ liệu khi chạy với mô hình phân rã ma trận thành nhân tử đơn thuần, mô hình hoàn thành trong thời gian chạy 1800 giây:  - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
ng tập dữ liệu khi chạy với mô hình phân rã ma trận thành nhân tử đơn thuần, mô hình hoàn thành trong thời gian chạy 1800 giây: (Trang 51)
Hình 19: Đồ thị biểu diễn độ chính xác trong quá trình học mô hình - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Hình 19 Đồ thị biểu diễn độ chính xác trong quá trình học mô hình (Trang 51)
Bảng 1: Một số kết quả so sánh giữa các mô hình gợi ý - Khai phá dữ liệu ứng dụng trong hệ thống gợi ý
Bảng 1 Một số kết quả so sánh giữa các mô hình gợi ý (Trang 52)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN