Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 57 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Tiêu đề
Hệ Gợi Ý
Định dạng
Số trang
57
Dung lượng
1,59 MB
Nội dung
BÀI 8: HỆ GỢI Ý Nội dung Tổng quan hệ gợi ý Các phương pháp đánh giá Lọc cộng tác dựa kNN Lọc cộng tác dựa MF NCF Gợi ý theo phiên Tổng quan hệ gợi ý Tại cần hệ gợi ý ◼ ◼ ◼ Người dùng bị tải thông tin môi trường web Nhà bán hàng cần đưa sản phẩm phù hợp để ◼ Tăng doanh số bán hàng ◼ Nâng cao chất lượng dịch vụ Xu hướng cá nhân hóa số hóa tất yếu Hệ gợi ý vs hệ tìm kiếm ◼ ◼ Hệ tìm kiếm: Người dùng thể mong muốn thông qua câu truy vấn Hệ gợi ý: Người dùng chưa biết muốn Lĩnh vực ứng dụng ◼ ◼ ◼ ◼ ◼ ◼ Thương mại điện tử Giải trí trực tuyến Tin tức trực tuyến Forum, mạng xã hội Nghiên cứu khoa học Hẹn hò trực tuyến Lĩnh vực ứng dụng (tiếp) ◼ Amazon: ◼ ◼ ◼ Netflix: ◼ ◼ ◼ Gợi ý sản phẩm Tăng 30% doanh thu Gợi ý phim, chương trình TV Mang $1B năm Google News: ◼ ◼ Gợi ý tin tức Tăng gần 40% lưu lượng truy cập Lĩnh vực ứng dụng (tiếp) From Y Koren (2009) 2004 Các phương pháp gợi ý ◼ Gợi ý dựa nội dung: ◼ ◼ Lọc cộng tác: ◼ ◼ Gợi ý dựa người dùng có sở thích tương tự Gợi ý dựa phiên: ◼ ◼ Gợi ý dựa lịch sử giao dịch người dùng Gợi ý dựa chuỗi giao dịch Các phương pháp lai Cuộc thi Netflix Global average: 1.1296 Find better items erroneous User average: 1.0651 Movie average: 1.0533 Personalization Cinematch: 0.9514; baseline “Algorithmics” Static neighborhood: 0.9002 Static factorization: 0.8911 Time effects Dynamic neighborhood: 0.8885 Dynamic factorization: 0.8794 accurate Grand Prize: 0.8563; 10% improvement Inherent noise: ???? From Y Koren (2009) Cuộc thi Netflix (tiếp) Number of papers on recsys by years 10 Kiến trúc NCF 43 Tầng đầu vào ◼ Người dùng biểu diễn véc-tơ one-hot gồm M chiều ◼ ◼ ◼ M số người dùng Mỗi người dùng u có giá trị tương ứng, giá trị lại Sản phẩm biểu diễn véc-tơ one-hot gồm N chiều, N số sản phẩm 44 Tầng nhúng ◼ ◼ ◼ ◼ Biểu diễn người dùng sản phẩm độc lập M x K trọng số liên kết để biểu diễn người dùng N x K trọng số liên kết để biểu diễn sản phẩm Mơ hình thử nghiệm: K = 16 45 MLP ◼ ◼ Biểu diễn người dùng sản phẩm ghép nối để đưa vào mạng MLP nhiều tầng nhằm học tương tác phức tạp người dùng sản phẩm Mơ hình thử nghiệm: ◼ ◼ Hàm kích hoạt ReLU tầng với kích thước giảm dần 32 → 16 → 46 Hàm lỗi ◼ Phản hồi ẩn: ◼ ◼ ◼ ◼ 1: Người dùng tương tác với sản phẩm 0: Người dùng không tương tác với sản phẩm Bài tốn phân loại hai lớp có yếu tố xác suất Sử dụng hàm lỗi binary cross entropy 47 Gợi ý theo phiên ◼ Trong nhiều trường hợp, khó định danh người dùng thu thập đánh giá VD: ◼ ◼ ◼ Các website thương mại nhỏ Các trang tin tức Kĩ thuật gợi ý theo phiên ◼ ◼ Không yêu cầu định danh người dùng Mỗi phiên giao dịch, bao gồm thứ tự giao dịch sử dụng làm liệu huấn luyện mơ hình 48 Phát biểu tốn ◼ ◼ ◼ ◼ Đầu vào: Chuỗi sản phẩm i1, i2, …, in-1 Đầu ra: Gợi ý sản phẩm Đưa danh sách sản phẩm có xác suất lớn Pr(in| i1, i2, …, in-1) Phù hợp với phản hồi ẩn 49 Phản hồi ẩn from RENDLE ET AL “BPR: Bayesian Personalized Ranking from Implicit Feedback” 2009 50 Kiến trúc RNN item item item item item n item item item item item (n-1) Đầu Tầng ẩn Tầng đầu vào 51 Tầng đầu vào ◼ Biểu diễn sản phẩm thời điểm t dạng one-hot ◼ ◼ Giá trị ứng với vị trí sản phẩm tập từ vựng, giá trị khác = V – từ vựng: Số sản phẩm khác 52 Tầng nhúng ◼ Biến đổi biểu diễn one-hot thành biểu diễn K chiều ◼ ◼ K số nơ-ron tầng nhúng Số trọng số liên kết tầng đầu vào tầng nhúng V x K 53 Tầng hồi quy ◼ ◼ ◼ Tầng hồi quy lưu trữ thông tin khứ thông qua liên kết hồi quy Nhiều tầng hồi quy “chồng” (stack) lên để học đặc trưng trừu tượng mức cao Thay nhân bản, dùng nhân LSTM GRU 54 Tầng MLP ◼ ◼ ◼ Đầu tầng hồi quy dùng làm vào đầu vào tầng MLP để sinh dự đốn Tầng MLP bao gồm tầng ẩn để học hàm phi tuyến Tầng đầu MLP có V nơ-ron ứng với V sản phẩm 55 Hàm mát ◼ ◼ ◼ ◼ ◼ Hàm mát thứ hạng theo cặp N: số mẫu negative r̂i: Điểm sản phẩm mong muốn positive i r̂j: Điểm sản phẩm không mong muốn negative j Giả thiết phản hồi ẩn: Sản phẩm i lựa chọn nên mức độ ưu tiên i cao sản phẩm j lại 56 Thank you for your attentions!