Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 48 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
48
Dung lượng
3,18 MB
Nội dung
Xâydựnghệthốngquảngcáodựanơichốnkếthợpvớiđánhgiángườidùngmạngxãhộidiđộng www.egobile.com Thông tin đề tài GIẢNG VIÊN HƯỚNG DẪN TS Nguyễn Anh Tuấn NHÓM SINH VIÊN THỰC HIỆN Tào Quang Hùng – 07520160 Nguyễn Lương Yến Vy – 07520424 Nộidung Tổng quan đề tài Tình hình nghiên cứu ngồi nước Mơ hình khuyến nghị EgoRec Thực nghiệm đánhgiá mơ hình EgoRec Kết luận Hiện thực ứng dụng – Demo Tổng quan đề tài Tổng quan đề tài Quảngcáoxãhội – Động lực Tổng quan đề tài + + Hành vi đánhgiá Vị trí Ngữ cảnh hành vi gán nhãn (Rating) (Location) (Context + Tag) Recommender System Location Rating + Context + Tag Tình hình nghiên cứu Collaborative Filtering R Đánhgiá tương đồng R+C Kếthợp ngữ cảnh T Hành vi gán nhãn (tag) Tình hình nghiên cứu Collaborative Filtering Đánhgiá tương đồng R I1 I2 I3 I4 U1 ? 5 U2 ? U3 ? U4 4 ? U5 ? • Memory-based: lịch sử đánhgiángườidùng • Model-based: mơ hình lại hành vi đánhgiángườidùng Francesco Ricci, L R., Bracha Shapira, Paul B Kantor Recommender Systems Handbook, 2010 Tình hình nghiên cứu Ví dụ: • Ngườidùng A thích ăn lẩu vào cuối tuần • Ngườidùng B thích mua sắm vào buổi tối R+C Kếthợp ngữ cảnh Hynuchul Ahn, K.-j K., Ingoo Han, Mobile Advertisement Recommender System using Collaborative Filtering, 2006 Tình hình nghiên cứu nature, cool… Nature, photograph, cool… Tương đồng T Hành vi gán nhãn (tag) Tom Chao Zhou, H M., Michael R Lyu, Irwin King A User Recommendation Framework in Social Tagging Systems, 2010 10 Hiện thực – Demo 34 Thống kê đề tài STT Nộidung Số lượng Số lượng tập tin mã nguồn 483 tập tin Dung lượng mã nguồn Số lượng module Số lượng dòng mã nguồn 71,709 dòng Số lượng tập tin trình thực nghiệm 2,122 tập tin Dung lượng tập tin trình thực nghiệm Số lượng chủ đề trao đổi với giảng viên (mail) 127 chủ đề Tổng thời gian thực thi trình thực nghiệm 201.42 MB 30 module 830 MB Bảng thống kê đề tài 35 Thank You! www.egobile.com – Everything Goes On Mobile 36 Q&A: Mơ hình chuẩn hóa Movielen Mơ hình chuẩn hóa liệu Movielen MovieLen Chia liệu theo ngườidùngKếthợp movie 20 Tag’ (user, movie_genre, tag) Kếthợp user Rating Tag Movie (user, movie, rating, time) (user, movie, tag) (movie, genre) Tag’’ (group_user, movie_genre, tag) Bộ liệu sau tiền xử lý Q&A: Độ thưa liệu tag Bảng kết giảm độ thưa liệu gán nhãn Bảng liệu Movielen Trung bình 10 liệu Chia nhỏ + gốc nhỏ kếthợp movie 9,079 885 608 351 Số Tag thiết lập (tas) 47,957 2398 2663 1828 Số User_Movie có tag (user_movie) 27,712 1386 627 327 0.0001906 0.001966851 0.006978106 0.016075557 Giảm 10.32 lần Giảm 36.61 lần Giảm 84.34 lần Tag Độ thưa Chia nhỏ + kếthợp movie user Q&A: Độ thưa liệu tag Bộ liệu MovieLen Số lượng Tag 9,079 Số Tag thiết lập (tas) 47,957 (Số [user, movie, tag] bảng liệu tag) Số User_Movie tag (user_movie) 27,712 (Số [user, movie] bảng liệu tag) Tas / User 22.696 Tas / Movie 8.117 Q&A: Độ thưa liệu tag Ý nghĩa: User Movie Tag Tag’ 1 A A 1 B E A C - cho biết trung bình tag tag lần - cho biết xác suất xuất tag hành vi gán nhãn B D Q&A: Độ thưa liệu tag Bảng kết giảm độ thưa liệu gán nhãn Bảng liệu Movielen Trung bình 10 liệu Chia nhỏ + gốc nhỏ kếthợp movie 9,079 885 608 351 Số Tag thiết lập (tas) 47,957 2398 2663 1828 Số User_Movie có tag (user_movie) 27,712 1386 627 327 0.0001906 0.001966851 0.006978106 0.016075557 Giảm 10.32 lần Giảm 36.61 lần Giảm 84.34 lần Tag Độ thưa Chia nhỏ + kếthợp movie user Q&A: Tìm kiếm cấu trúc… Các cách phân nhóm: Cách 1: (a, b) (c, d) (e, f, g) Cách 2: (a, b, c, d) (e, f, g) Cách n: … ? Tìm cách phân nhóm tốt ? Rút ngắn chi phí tìm cách phân nhóm Q&A: Tìm kiếm cấu trúc… Các cách phân nhóm: Cách 1: (a, b) (c, d) (e, f, g) Ứng viên Cách 2: (a, b, c, d) (e, f, g) Ứng viên Cách n: … Ứng viên n ! Q&A: Tìm kiếm cấu trúc… ! Rút ngắn chi phí tìm nhóm Shortest Path Betweeness Chọn đỉnh để bắt đầu a a b c b c d e d e f g f g Q&A: Tìm kiếm cấu trúc… ! Rút ngắn chi phí tìm nhóm Shortest Path Betweeness Tính trọng số (0, 1) đỉnh cạnh a a 25/6 11/6 (1, 1) b c b c (1, 1) 5/6 5/6 e d 7/3 e d (2, 2) 2/3 f g 1/3 f (3, 3) (2, 1) g (3, 1) Q&A: Tìm kiếm cấu trúc… ! Rút ngắn chi phí tìm nhóm Shortest Path Betweeness Cắt cạnh có (0, 1) trọng số cao a a 25/6 11/6 (1, 1) b c (1, 1) b c d e 5/6 5/6 7/3 e d (2, 2) 2/3 1/3 f (3, 3) (2, 1) g (3, 1) f g Q&A: Tìm kiếm cấu trúc… ! Rút ngắn chi phí tìm nhóm Shortest Path Betweeness Tính Q thử đỉnh lại a a b c b c d e d e f g f g Q&A: Tìm kiếm cấu trúc… ! Rút ngắn chi phí tìm nhóm Ví dụ Newman Lần cắt đầu tiên: cụm, có đỉnh nằm sai cụm Lần cắt thứ 4: cụm, đỉnh số 10 nằm riêng cụm Shortest Path Betweeness ... EgoRec Thực nghiệm đánh giá mơ hình EgoRec Kết luận Hiện thực ứng dụng – Demo Tổng quan đề tài Tổng quan đề tài Quảng cáo xã hội – Động lực Tổng quan đề tài + + Hành vi đánh giá Vị trí Ngữ cảnh... I2 I3 I4 U1 ? 5 U2 ? U3 ? U4 4 ? U5 ? • Memory-based: lịch sử đánh giá người dùng • Model-based: mơ hình lại hành vi đánh giá người dùng Francesco Ricci, L R., Bracha Shapira, Paul B Kantor Recommender... MMBCF RC RT EgoRec Kết Dữ liệu đầu vào Đánh giá Mơ hình thực nghiệm tổng quan 23 Thực nghiệm đánh giá Phương pháp đánh giá 24 Thực nghiệm đánh giá Thông tin liệu MovieLen Số lượng User