Nghiên cứu phương pháp tư vấn dựa trên hành vi người dùng trong mạng xã hội (tóm tắt luận văn ngành khoa học máy tính)

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - NGUYỄN THỊ YẾN NGHIÊN CỨU PHƯƠNG PHÁP TƯ VẤN DỰA TRÊN HÀNH VI NGƯỜI DÙNG TRONG MẠNG XÃ HỘI Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 TĨM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI - 2016 Luận văn hoàn thành tại: HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG Người hướng dẫn khoa học: TS VŨ VĂN THỎA Phản biện 1: …………………………………………………………………… Phản biện 2: …………………………………………………………………… Luận văn bảo vệ trước Hội đồng chấm luận văn thạc sĩ Học viện Cơng nghệ Bưu Viễn thơng Vào lúc: ngày tháng năm 2017 Có thể tìm hiểu luận văn tại: - Thư viện Học viện Cơng nghệ Bưu Viễn thông MỞ ĐẦU Đặt vấn đề Hê ̣ ̣ tư vấ n (Recommender System) là ̣ thố ng có khả tư ̣ đô ̣ng phân tích, dư ̣ đoán và gơ ̣i ý thông tin mới phù hơ ̣p cho mỗ i người dùng dịch vụ Internet Các phương pháp xây dưṇ g ̣ tư vấn trước xem xét tâ ̣p người dùng ̣ gơ ̣i ý là tâ ̣p người dùng cố đinh ̣ có quyề n lơ ̣i gắ n bó mâ ̣t thiế t với ̣ thố ng và đươ ̣c hưởng lơ ̣i từ viêc̣ cung cấ p thông tin ̣ thố ng Sự đời mạng xã hội làm thay đổi phương thức trao đổi thông tin toàn cầ u Người dùng mạng xã hội tự chia sẻ bày tỏ quan điểm, ý tưởng, đánh giá tất vấn đề với cộng đồng quan hệ khác Sự tương tác người dùng với mối quan hệ xã hội tạo nên nguồn tài nguyên thông tin to lớn độc lập với nguồn tài ngun sẵn có hệ thớ ng gơ ̣i ý trước Chính vậy, tích hợp hệ tư vấn kết hợp với hành vi người dùng mạng xã hội góp phần cải thiện chất lượng tư vấn Với lý nêu trên, học viên lựa chọn đề tài “Nghiên cứu phương pháp tư vấn dựa hành vi người dùng mạng xã hội” để thực khuôn khổ luận văn thạc sĩ ngành khoa học máy tính Mục tiêu luận văn Mục tiêu nghiên cứu luận văn phương pháp tư vấn cộng tác kết hợp với hành vi friend, post, lile, comment người dùng ma ̣ng xã hội, đánh giá mức độ tương tự cặp người dùng tương tác mạng xã hội, để từ ứng dụng vào hệ tư vấn cho việc tư vấn đạt hiệu Các đóng góp luận văn - Nghiên cứu phương pháp xác định độ tương tự hành vi cặp người dùng mạng xã hội, bao gồm: phương pháp xác định độ tương tự hành vi friend, post, like, comment - Nghiên cứu phương pháp xây dựng hệ tư vấn dựa vào hành vi, hai hành vi, ba hành vi người dùng phương pháp kết hợp với tất hành vi người dùng - Xây dưṇ g tập liệu thử nghiệm cho các điạ điể m du lich ̣ (khách sạn) tâ ̣p người dùng ma ̣ng xã hô ̣i đánh giá Bố cục luận văn Bố cục luận văn gồm phần: Chương Độ tương đồng hành vi người dùng mạng xã hội 2 Chương Phương pháp tư vấn dựa hành vi người dùng Chương Thử nghiệm đánh giá CHƯƠNG 1: ĐỘ TƯƠNG ĐỒNG HÀNH VI NGƯỜI DÙNG TRÊN MẠNG XÃ HỘI 1.1 Giới thiệu mạng xã hội 1.1.1 Lịch sử hình thành 1.1.2 Cấu trúc chung mạng xã hội 1.1.3 Một số mạng xã hội phổ biến 1.2 Giới thiệu hành vi mạng xã hội Các hành vi mạng xã hội: - Đăng “Post” trang cá nhân - Thích “Like” nút đưa phản hồi tích cực đến thứ mà người dùng quan tâm - Nhận xét “Comment” người dùng đưa quan điểm hay nhận xét - Kết bạn “Add friend” với người mà người dùng muốn - Tham gia hay gia nhập nhóm, cộng đồng hành động người dùng quan tâm đến nội dung nhóm hay cộng đồng - Theo dõi “Follow” với người mà người dùng muốn - Tạo/tham gia kiện “Event” hành động người dùng quan tâm đến nội dung kiện - Chia sẻ “Share” đăng lên trang cá nhân 1.3 Độ tương đồng cặp người dùng dựa vào hành vi mạng xã hội Xét hệ thống gồm N người dùng U  u1 , u2 , , u N  M sản phẩm (hàng hóa, phim, ảnh, tạp chí, tài liệu, sách, báo, dịch vụ dạng thông tin mà người dùng cần đến) P   p1 , p2 , , pM  Trong mục này, luận văn đánh giá mức độ tương đồng hai người dùng u i, uj, ký hiệu cặp (i, j), i, j = 1, 2, , N (i≠ j) thông qua độ đo tương tự dựa vào hành vi mạng xã hội (gọi tắt độ tương tự) 2.1.1 1.3.1 Độ tương tự cặp người dùng dựa vào hành vi Like Mức độ hài lòng tập người dùng U tập sản phẩm P biểu diễn thông qua ma trận Like Li= {𝑙𝑖ix, 𝑖 = … 𝑁, 𝑥 = … 𝑀} Mỗi giá trị 𝑙𝑖𝑖𝑥 ∈ {0,1} biểu diễn khơng thích/thích người dùng 𝑖 ∈ 𝑈 sản phẩm 𝑥 ∈ 𝑃 Khơng tính tổng qt tốn, giả sử 𝑙𝑖𝑖𝑥 = người dùng 𝑖 ∈ 𝑈 like sản phẩm 𝑥 ∈ 𝑃, 𝑙𝑖𝑖𝑥 = người dùng khơng thích chưa biết đến sản phẩm 𝑥 ∈ 𝑃 Để xác định mức độ tương tự cặp người dùng, ta dựa vào ma trận Like: 𝐿𝑖𝐿 ={ 𝐿𝑖 𝐿𝑖 𝑇 𝐿𝑖 𝐿𝑖 𝑇 𝐿𝑖𝐿−2 𝑛ế𝑢 𝐿 = 𝑛ế𝑢 𝐿 = 4, 6, 8, (1.2) 3.1.1 1.3.2 Độ tương tự cặp người dùng dựa vào hành vi Post Mối quan hệ tập người dùng U tập sản phẩm P biểu diễn thông qua ma trận Post Po= {𝑝𝑜ix, 𝑖 = … 𝑁, 𝑥 = … 𝑀} Mỗi giá trị 𝑝𝑜𝑖𝑥 ∈ {1, 0} biểu diễn việc post tích cực, chưa post người dùng 𝑖 ∈ 𝑈 sản phẩm 𝑥 ∈ 𝑃 Để xác định mức độ tương tự cặp người dùng, ta dựa vào ma trận Post 𝑃𝑜𝐿 ={ 𝑃𝑜 𝑃𝑜𝑇 𝑛ế𝑢 𝐿 = 𝑇 𝐿−2 𝑃𝑜 𝑃𝑜 𝑃𝑜 𝑛ế𝑢 𝐿 = 4, 6, 8, (1.4) 4.1.1 1.3.3 Độ tương tự cặp người dùng dựa vào hành vi Comment Mối quan hệ tập người dùng U tập sản phẩm P biểu diễn thông qua ma trận Comment C= {𝑐ix, 𝑖 = … 𝑁, 𝑥 = … 𝑀} Mỗi giá trị 𝑐𝑖𝑥 ∈ {1, 0} biểu diễn việc comment tích cực,chưa comment tích cực người dùng 𝑖 ∈ 𝑈 sản phẩm 𝑥 ∈ 𝑃 Để xác định mức độ tương tự cặp người dùng, ta dựa vào ma trận Comment: 𝐶𝐿 = { 𝐶 𝐶 𝑇 𝐶 𝐶 𝑇 𝐶 𝐿−2 𝑛ế𝑢 𝐿 = 𝑛ế𝑢 𝐿 = 4, 6, 8, (1.6) 5.1.1 1.3.4 Độ tương tự cặp người dùng dựa vào hành vi Friend Mối quan hệ người dùng i với người dùng j (i ≠ j) tập người dùng U biểu diễn thông qua ma trận Friend F = {𝑓ij, 𝑖 = … 𝑁, 𝑗 = … 𝑁} Mỗi giá trị 𝑓𝑖𝑗 ∈ {0,1} biểu diễn mối quan hệ friend người dùng 𝑖 ∈ 𝑈 người dùng j ∈ 𝑈 Giá trị 𝑓𝑖𝑗 = hiểu người dùng i người dùng j kết bạn với Xác định mức độ tương tự cặp người dùng dựa vào ma trận Friend 𝐹𝐿 = { 𝐹 𝐹𝑇 𝐹 𝐹𝑇 𝐹𝐿−2 𝑛ế𝑢 𝐿 = 𝑛ế𝑢 𝐿 = 4, 6, 8, (1.8) 1.4 Kết luận chương Trong chương 1, luận văn giới thiệu mạng xã hội, hành vi người dùng mạng xã hội, phương pháp tính mức độ tương đồng cặp người dùng dựa vào hành vi người dùng mạng xã hội 5 Đây sở cho việc tích hợp hành vi người dùng mạng xã hội vào hệ tư vấn dựa toán tư vấn cổ điển sử dụng tập đánh giá sản phẩm kết hợp với hành vi Các kết đề xuất xây dựng phương pháp tư vấn dựa vào hành vi người dùng mạng xã hội trình bày chi tiết chương 6 CHƯƠNG 2: PHƯƠNG PHÁP TƯ VẤN DỰA TRÊN HÀNH VI NGƯỜI DÙNG 2.1 Phát biểu toán hệ tư vấn cộng tác dựa vào hành vi người dùng mạng xã hội Cho tập hợp hữu hạn gồm N người dùng U  u1 , u2 , , u N  , P   p1 , p2 , , pM  tập hữu hạn gồm M sản phẩm Mỗi sản phẩm pxP hàng hóa, phim, ảnh, tạp chí, tài liệu, sách, báo, dịch vụ dạng thông tin mà người dùng cần đến Mối quan hệ tập người dùng U tập sản phẩm P biểu diễn thông qua ma trận đánh giá R={ rix: i = 1, 2, N; x = 1, 2, M } Giá trị rix thể đánh giá người dùng uiU cho số sản phẩm pxP Ma trận R đầu vào hệ thống tư vấn cộng tác Hành vi Friend biểu diễn mối quan hệ bạn bè mạng xã hội tập người dùng U biểu diễn ma trận F = {f ij : i=1, 2, n; j=1, 2, ,n} Hành vi Post người dùng iU sản xP cho ma trận Po = {poix: i=1, 2, ,n; x =1, 2, ,m} Hành vi Like người dùng iU sản xP cho ma trận Li = {lix: i=1, 2, ,n; x =1, 2, ,m} Hành vi Comment người dùng iU sản xP cho ma trận C = {Cix: i=1, 2, ,n; x =1, 2, ,m} Tiếp đến ta ký hiệu, PiP tập sản phẩm xP đánh giá người dùng iU UxU tập người dùng iU đánh giá sản phẩm xP Với người dùng cần tư vấn iU (được gọi người dùng thời, người dùng cần tư vấn, hay người dùng tích cực), nhiệm vụ phương pháp tư vấn gợi ý K sản phẩm x(P\Pi) phù hợp người dùng i Có nhiều phương pháp đề xuất khác để giải toán lọc cộng tác Su Khoshgoftaar [2] phân loại phương pháp giải toán lọc cộng tác thành hai cách tiếp cận chính: Lọc cộng tác dựa vào nhớ (Memory-Based [3, 4, 5]) Lọc cộng tác dựa vào mơ hình (Model-Based [6, 7, 8]) Trong hai phương pháp này, phương pháp lọc cộng tác dựa vào nhớ sử dụng rộng dãi cho hệ thống lọc thông tin thực tế cài đặt đơn giản, độ xác cao, chi phí tính tốn thấp [9] Chính vậy, hướng tiếp cận luận văn tập trung nghiên cứu phát triển phương pháp lọc cộng tác dựa vào nhớ Lọc cộng tác dựa nhớ tiếp cận theo hai phương pháp chính: Phương pháp lọc dựa vào người dùng (UserBased) lọc dựa vào sản phẩm (ItemBased) Mỗi phương pháp có ưu điểm riêng khai thác khía cạnh liên quan đến người dùng sản phẩm Đặc điểm chung hai phương pháp sử dụng toàn tập liệu đánh giá để dự đoán quan điểm người dùng cần tư vấn (AU) sản phẩm mà họ chưa biết đến Về thực chất, phương pháp học lười (LL) hay học dựa ví dụ (IBL) sử dụng học máy Phương pháp thực theo hai bước: Tính tốn mức độ tương tự tạo nên dự đoán 7  Tính tốn mức độ tương tự sim(x, y): Mơ tả khoảng cách, liên quan, hay trọng số hai người dùng x y( hai sản phẩm x y)  Dự đoán: Đưa dự đoán cho người dùng cần tư vấn cách xác định tập láng giềng người dùng Tập láng giềng người dùng cần tư vấn xác định dựa mức độ tương tự cặp người dùng sản phẩm Trên sở bước hệ tư vấn cộng tác cổ điển, luận văn đề xuất phương pháp xây dựng hệ tư vấn cộng tác dựa vào hành vi người dùng Các kết đề xuất trình bày mục 2.2 Phương pháp tư vấn dựa vào hành vi 6.1.1 2.2.1 Phương pháp tư vấn dựa vào hành vi Like Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Like đề xuất thực qua bước sau: Bước 1: tìm K1 người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá Bước 2: tìm K2 người dùng láng giềng người dùng thời iU dựa vào ma trận Like Bước 3: tìm Ki người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá ma trận Like Bước 4: dự đoán quan điểm người dùng i sản phẩm xP\Pi cách lấy giá trị trung bình đánh giá người dùng j tập láng giềng Ki Bước 5: chọn K sản phẩm có mức độ tương tự cao tư vấn cho người dùng i 7.1.1 2.2.2 Phương pháp tư vấn dựa vào hành vi Post Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Post đề xuất thực qua bước sau: Bước 1: tìm K1 người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá Bước 2: tìm K2 người dùng láng giềng người dùng thời iU dựa vào ma trận Post Bước 3: tìm Ki người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá ma trận Post Bước 4: dự đoán quan điểm người dùng i sản phẩm xP\Pi cách lấy giá trị trung bình đánh giá người dùng j tập láng giềng Ki Bước 5: chọn K sản phẩm có mức độ tương tự cao tư vấn cho người dùng i 8 8.1.1 2.2.3 Phương pháp tư vấn dựa vào hành vi Comment Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Comment đề xuất thực qua bước sau: Bước 1: tìm K1 người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá Bước 2: tìm K2 người dùng láng giềng người dùng thời iU dựa vào ma trận Comment Bước 3: tìm Ki người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá ma trận Comment Bước 4: dự đoán quan điểm người dùng i sản phẩm xP\Pi cách lấy giá trị trung bình đánh giá người dùng j tập láng giềng Ki Bước 5: chọn K sản phẩm có mức độ tương tự cao tư vấn cho người dùng i 9.1.1 2.2.4 Phương pháp tư vấn dựa vào hành vi Friend Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Friend đề xuất thực qua bước sau: Bước 1: tìm K1 người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá Bước 2: tìm K2 người dùng láng giềng người dùng thời iU dựa vào ma trận Friend Bước 3: tìm Ki người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá ma trận Friend Bước 4: dự đoán quan điểm người dùng i sản phẩm xP\Pi cách lấy giá trị trung bình đánh giá người dùng j tập láng giềng Ki Bước 5: chọn K sản phẩm có mức độ tương tự cao tư vấn cho người dùng i 2.3 Phương pháp tư vấn kết hợp hai hành vi 10.1.1 2.3.1 Phương pháp tư vấn kết hợp hai hành vi Comment Friend Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Comment-Friend đề xuất thực qua bước sau: Bước 1: tìm K1 người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá Bước 2: tìm K2 người dùng láng giềng người dùng thời iU dựa vào ma trận Friend Bước 3: tìm K3 người dùng láng giềng người dùng thời iU dựa vào ma trận Comment 9 Bước 4: tìm Ki người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá ma trận Friend, ma trận Comment Bước 5: dự đoán quan điểm người dùng i sản phẩm xP\Pi cách lấy giá trị trung bình đánh giá người dùng j tập láng giềng Ki Bước 6: chọn K sản phẩm có mức độ tương tự cao tư vấn cho người dùng i 11.1.1 2.3.2 Phương pháp tư vấn kết hợp hai hành vi Comment Like Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Comment-Like đề xuất thực qua bước sau: Bước 1: tìm K1 người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá Bước 2: tìm K2 người dùng láng giềng người dùng thời iU dựa vào ma trận Comment Bước 3: tìm K3 người dùng láng giềng người dùng thời iU dựa vào ma trận Like Bước 4: tìm Ki người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá ma trận Comment, ma trận Like Bước 5: dự đoán quan điểm người dùng i sản phẩm xP\Pi cách lấy giá trị trung bình đánh giá người dùng j tập láng giềng Ki Bước 6: chọn K sản phẩm có mức độ tương tự cao tư vấn cho người dùng i 12.1.1 2.3.3 Phương pháp tư vấn kết hợp hai hành vi Comment Post Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Comment-Post đề xuất thực qua bước sau: Bước 1: tìm K1 người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá Bước 2: tìm K2 người dùng láng giềng người dùng thời iU dựa vào ma trận Comment Bước 3: tìm K3 người dùng láng giềng người dùng thời iU dựa vào ma trận Post Bước 4: tìm Ki người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá ma trận Comment, ma trận Post Tại bước 5: dự đoán quan điểm người dùng i sản phẩm xP\Pi cách lấy giá trị trung bình đánh giá người dùng j tập láng giềng Ki Bước 6: chọn K sản phẩm có mức độ tương tự cao tư vấn cho người dùng i 10 2.4 Phương pháp tư vấn kết hợp ba hành vi Trong phần này, luận văn trình bày phương pháp tư vấn kết hợp hành vi Comment, hành vi Like với hành vi Friend Post 13.1.1 2.4.1 Phương pháp tư vấn kết hợp ba hành vi Comment, Like, Friend Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Comment-Friend-Like đề xuất thực qua bước sau: Bước 1: tìm K1 người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá Bước 2: tìm K2 người dùng láng giềng người dùng thời iU dựa vào ma trận Friend Bước 3: tìm K3 người dùng láng giềng người dùng thời iU dựa vào ma trận Like Bước 4: tìm K4 người dùng láng giềng người dùng thời iU dựa vào ma trận Comment Bước 5: tìm Ki người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá ma trận Comment, ma trận Like, ma trận Friend Bước 6: dự đoán quan điểm người dùng i sản phẩm xP\Pi cách lấy giá trị trung bình đánh giá người dùng j tập láng giềng Ki Bước 7: chọn K sản phẩm có mức độ tương tự cao tư vấn cho người dùng i 14.1.1 2.4.2 Phương pháp tư vấn kết hợp ba hành vi Comment, Like, Post Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Like-Post-Comment đề xuất thực qua bước sau: Bước 1: tìm K1 người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá Bước 2: tìm K2 người dùng láng giềng người dùng thời iU dựa vào ma trận Post Bước 3: tìm K3 người dùng láng giềng người dùng thời iU dựa vào ma trận Like Bước 4: tìm K4 người dùng láng giềng người dùng thời iU dựa vào ma trận Comment Bước 5: tìm Ki người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá ma trận Comment, ma trận Like, ma trận Post Bước 6: dự đoán quan điểm người dùng i sản phẩm xP\Pi cách lấy giá trị trung bình đánh giá người dùng j tập láng giềng Ki Bước 7: chọn K sản phẩm có mức độ tương tự cao tư vấn cho người dùng i 11 2.5 Phương pháp tư vấn kết hợp bốn hành vi Comment, Like, Friend, Post Phương pháp tư vấn cộng tác dựa vào hành vi Combinated- Comment-Friend- Like-Post đề xuất thực qua bước sau: Bước 1: tìm K1 người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá Bước 2: tìm K2 người dùng láng giềng người dùng thời iU dựa vào ma trận Friend Bước 3: tìm K3 người dùng láng giềng người dùng thời iU dựa vào ma trận Post Bước 4: tìm K4 người dùng láng giềng người dùng thời iU dựa vào ma trận Like Bước 5: tìm K5 người dùng láng giềng người dùng thời iU dựa vào ma trận Comment Bước 6: tìm Ki người dùng láng giềng người dùng thời iU dựa vào ma trận đánh giá ma trận Friend, ma trận Like, ma trận Post, ma trận Comment Bước 7: dự đoán quan điểm người dùng i sản phẩm xP\Pi cách lấy giá trị trung bình đánh giá người dùng j tập láng giềng Ki Bước 8: chọn K sản phẩm có mức độ tương tự cao tư vấn cho người dùng i 2.6 Kết luận chương Trong chương 2, luận văn trình bày thuật toán kết hợp hành vi người dùng mạng xã hội vào hệ tư vấn, lấy hành vi rate kết hợp với hành vi cịn lại like, friend, post, comment Sau đó, lấy hành vi đánh giá kết hợp với hai hành vi, ba hành vi bốn hành vi Quá trình tư vấn xem xét thêm với hành vi người dùng sử dụng mạng xã hội Bằng cách ta thu hẹp lại số lượng người dùng tập láng giềng có mức độ tương tự 12 CHƯƠNG THỬ NGHIỆM VÀ ĐÁNH GIÁ 3.1 Dữ liệu thử nghiệm Luận văn thu thập liệu thực tế từ người dùng trang khách sạn trang mạng xã hội FaceBook Dữ liệu người dùng bao gồm: - 5090 người dùng - 753 khách sạn - 2702 hành vi Rate - 2585 hành vi Add Friend - 961 hành vi Post - 4629 hành vi Like - 1995 hành vi comment Các hành vi lấy từ mạng xã hội FaceBook là: Friend, Post, Like, Comment, Rate Mơ hình liệu hệ thống tư vấn khách sạn dựa hành vi người dùng mạng xã hội: Hình 3.1: Mơ hình liệu hệ thống HotelRecomendSystem 3.2 Phương pháp thử nghiệm Trong phạm vi luận văn thực thử nghiệm đánh giá dựa hai phương pháp sử dụng độ đo trung bình tuyệt đối lỗi MAE Tập liệu thử nghiệm chia thành hai tập huấn luyện Utrain tập kiểm tra Utest Trước tiên, toàn liệu thử nghiệm chia thành hai phần, phần Utr sử dụng làm liệu huấn luyện, phần lại Ute sử dụng để kiểm tra.Tập Utr chứa 85% đánh giá tập Ute chứa 15% đánh giá Dữ liệu huấn luyện sử dụng để xây dựng mơ hình theo thuật tốn mơ tả Với người dùng i thuộc tập liệu kiểm tra, đánh giá (đã có) người dùng chia làm hai phần Oi Pi.O i coi biết, Pi đánh giá cần dự đoán từ liệu huấn luyện Oi 13 Sai số dự đoán MAEi với khách hàng i thuộc tập liệu kiểm tra tính trung bình cộng sai số tuyệt đối hai giá trị dự đoán giá trị thực tất sản phẩm thuộc tập Pi 𝑀𝐴𝐸𝑖 = ∑ |𝑟̂𝑥𝑖 − 𝑟𝑥𝑖 | |𝑃𝑖 | 𝑥∈𝑃𝑖 Sai số dự đốn tồn tập liệu kiểm tra tính trung bình cộng sai số dự đoán cho khách hàng thuộc Utest 𝑀𝐴𝐸 = ∑𝑖∈𝑈𝑡𝑒𝑠𝑡 𝑀𝐴𝐸𝑖 |𝑈𝑡𝑒𝑠𝑡 | 3.3 Kết thử nghiệm Kịch 1: Thử nghiệm độ đo trung bình tuyệt đối lỗi MAE dựa hành vi đánh giá Số lượng người dùng tập láng giềng 80 R 0.4257 100 120 0.4391 0.4891 140 0.4911 Bảng 3.1: Giá trị MAE thử nghiệm dựa hành vi đánh giá Kịch 2: Thử nghiệm độ đo trung bình tuyệt đối lỗi MAE dựa việc kết hợp hành vi đánh giá với số hành vi Friend, Like, Post, Comment Việc lấy giao hành vi đánh giá hành vi khác thực sau: K=KR ∩ KX if K = ∅ then K = KR Số lượng người dùng tập láng giềng Phương pháp 80 RF 120 100 0.1995 140 0.2127 0.2220 0.2366 RP 0.2832 0.2964 0.3465 0.3484 RL 0.2241 0.2373 0.2845 0.3299 RC 0.2495 0.2020 0.2061 0.2028 Bảng 3.2: Giá trị MAE thử nghiệm dựa việc kết hợp với hành vi 14 Kết thử nghiệm cho thấy việc kết hợp với hành vi mạng xã hội có độ trung bình tuyệt đối lỗi MAE giảm đáng kể so với việc thử nghiệm dựa hành vi đánh giá ban đầu Trong phương pháp kết hợp Combinated-Comment cho kết tốt Kịch 3: Thử nghiệm độ đo trung bình tuyệt đối lỗi MAE dựa việc kết hợp hành vi đánh giá với hai hành vi người dùng mạng xã hội Trong đó: Việc lấy giao hành vi đanh giá hành vi khác thực với độ ưu tiên theo kết dựa thí nghiệm 2, RC, RL, RF, RP (độ ưu tiên giảm dần) Số lượng người dùng tập láng giềng Phương pháp 80 100 120 140 RLF 0.1371 0.1504 0.1561 0.2102 RLP 0.2241 0.2373 0.2845 0.3299 RCL 0.1986 0.2020 0.2061 0.2028 RFP 0.1995 0.2127 0.2220 0.2366 RCF 0.1984 0.1585 0.1212 0.1179 RCP 0.2495 0.2020 0.2061 0.2028 Bảng 3.3: Giá trị MAE thử nghiệm dựa việc kết hợp với hai hành vi Các phương pháp kết hợp với hai hành vi cho giá trị MAE nhỏ so với phương pháp kết hợp với hành vi thông thường Điều cho thấy việc kết hợp có hiệu quả, phương pháp Combinated-Comment-Friend tốt ứng với trường hợp k = 140 Kịch 4: Thử nghiệm độ đo trung bình tuyệt đối lỗi MAE dựa việc kết hợp hành vi đánh giá với hành vi Việc lấy giao hành vi đánh giá hành vi khác thực với độ ưu tiên theo kết dựa kịch 3, RCF, RCL, RCP, RLP, RFP, RLF (độ ưu tiên giảm dần) Số lượng người dùng tập láng giềng Phương pháp 80 100 120 140 RFPL 0.1371 0.1504 0.1561 0.2102 RFPC 0.1984 0.1585 0.1212 0.1179 RFLC 0.1361 0.1395 0.1016 0.1505 RPLC 0.1986 0.2020 0.2061 0.2028 Bảng 3.4: Giá trị MAE thử nghiệm dựa việc kết hợp với ba hành vi 15 Kết thử nghiệm dựa việc kết hợp hành vi đánh giá với ba hành vi người dùng mạng xã hội cho kết MAE nhỏ so với phương pháp kết hợp hai hành vi Trong RFLC ứng với số lượng người dùng tập láng giềng 140 cho kết tốt Thí nghiệm 5: Thử nghiệm độ đo trung bình tuyệt đối lỗi MAE dựa việc kết hợp hành vi đánh giá với tất hành vi người dùng mạng xã hội Việc lấy giao hành vi đánh giá hành vi khác thực với độ ưu tiên giảm dần theo kết dựa kịch 4, Rate, Friend, Like, Comment, Post Số lượng người dùng tập láng giềng Phương pháp RFPLC 80 100 120 0.1361 0.1395 0.1016 140 0.1505 Bảng 3.5: Giá trị MAE thử nghiệm dựa việc kết hợp với tất hành vi Kết thử nghiệm dựa việc kết hợp tất hành vi cho kết MAE với trường hợp nhỏ so với phương pháp kết hợp RFLC Điều giải thích việc khơng tồn người dùng tập láng giềng qua việc lấy giao hành vi đánh giá với hành vi, thay vào việc lấy giao dựa kết RFLC 3.4 Kết luận chương Kết thử nghiệm phương pháp tư vấn kết hợp đề xuất cho thấy chất lượng tư vấn cải thiện đáng kể so với phương pháp tư vấn Điều lý giải phương pháp tiếp cận luận văn xác định tốt mức độ tương tự cặp người dùng, phương pháp dự đốn thích hợp 16 KẾT LUẬN Kết đạt Đề tài hướng tới chủ đề có ý nghĩa lý thuyết thực tiễn khoa học máy tính cộng đồng nghiên cứu quan tâm Luận văn trình bày vấn đề liên quan đến mạng xã hội số phương pháp tư vấn dựa vào hành vi người dùng mạng xã hội Cụ thể là: Giới thiệu mạng xã hội, độ tương đồng cặp người dùng dựa vào hành vi mạng xã hội Luận văn trình bày phương pháp tư vấn dựa vào hành vi người dùng kết hợp hành vi người dùng mạng xã hội bao gồm: Phương pháp tư vấn kết hợp hành vi: - Phương pháp tư vấn kết hợp hành vi Like - Phương pháp tư vấn kết hợp hành vi Post - Phương pháp tư vấn kết hợp hành vi Comment - Phương pháp tư vấn kết hợp hành vi Friend Phương pháp tư vấn kết hợp hai hành vi: - Phương pháp tư vấn kết hợp hai hành vi Comment Friend - Phương pháp tư vấn kết hợp hai hành vi Comment Like - Phương pháp tư vấn kết hợp hai hành vi Comment Post Phương pháp tư vấn kết hợp ba hành vi: - Phương pháp tư vấn kết hợp ba hành vi Comment, Like, Friend - Phương pháp tư vấn kết hợp ba hành vi Comment, Like, Post Phương pháp tư vấn kết hợp bốn hành vi Comment, Like, Friend, Post Đề tài giới thiệu liệu thử nghiệm cho thuật tốn trình bày phương pháp tư vấn Thử nghiệm cài đặt Matlab cho thuật toán ứng với liệu thu thập Kết thử nghiệm đánh giá theo tiêu chí độ xác, sai số trung bình thời gian thực tư vấn Tuy nhiên trình thực cài đặt mơ hình thuật tốn số hạn chế sau: - Thưa thớt liệu người dùng: liệu sưu tập tay lên cịn hạn chế, q trình thu thập liệu, người dùng mạng xã hội không công khai danh sách bạn bè, hết hành vi, mối quan hệ người dùng với Đề tài sử dụng nhãn tích cực với văn comment post, chưa tính chưa xử lý khía cạnh nhãn tiêu cực 17 Hướng phát triển Hướng phát triển tương lai tiếp tục phát triển hệ thống với số lượng người dùng khách sạn lớn hơn, cập nhật liệu, phân loại thành tư vấn địa điểm nhà hàng, khu vui chơi giải trí, khơng gian làm việc 18 TÀI LIỆU THAM KHẢO [1] Nguyễn Duy Phương, Đỗ Thị Liên, Từ Minh Phương (2013), “Xác định độ tương tự cho người dùng sản phẩm lọc cộng tác dựa mơ hình đồ thị”, Fair Huế 2013 [2]C.C.Aggarwal, J.L Wolf, K.L Wu, and P.S.Yu, “Horting Hatches an Egg: A New Graph-Theoretic Approach to Collaborative Filtering”, Proc Fifth ACM SIGKDD Int’l Conf Knowledge Discovery and Data Mining (1999) [3]Charu C Aggarwal 2011 Social Network Data Analytics (1st ed.) Springer Publishing Company, Incorporated [4]J S Breese, D Heckerman, and C Kadie, “Empirical analysis of Predictive Algorithms for Collaborative Filtering”, In Proc of 14th Conf on Uncertainty in Artificial Intelligence, pp 43-52 (1998) [5] Aaron J Defazio and Tibério S Caetano, “A Graphical Model Formulation of Collaborative Filtering Neighbourhood Methods with Fast Maximum Entropy Training”, 2012 [6]M Deshpande, G Karypis,“Item-Based Top-N Recommendation Algorithms”, ACM Transactions on Information Systems Volume 22, Issue 1, pp 143 - 177 (2004) [7]T Hofmann, “Latent Semantic Models for Collaborative Filtering”, ACM Trans Information Systems, vol 22, No 1, pp 89-115 (2004) [8]J.L Herlocker, J.A Konstan, L.G Terveen, and J.T Riedl (2004), “Evaluating Collaborative Filtering o Recommender Systems”, ACM Trans Information Systems, vol 22, N 1, pp 5-53 [9]B Sarwar, G Karypis, J Konstan, and J Riedl, “Item-Based Collaborative Filtering Recommendation Algorithms”, WWW 2001: 285-295 (2001) [10]X Su, T M Khoshgoftaar (2009), “A Survey of Collaborative Filtering Techniques” Advances in Artificial Intelligence, vol 2009, pp.1-20 [11] Zan Huang, “Graph-Based analysis for e-commerce recommendation”, 2005 [12]R Jin, L Si, and C Zhai, “Preference-Based Graphic Models for Collaborative Filtering”, Proc 19th Conf Uncertainty in Artificial Intelligence (UAI 2003) [13]https://vi.wikipedia.org/wiki/D%E1%BB%8Bch_v%E1%BB%A5_m%E1%BA%A1ng_x%C3%A3_h% E1%BB%99i ... hội, độ tư? ?ng đồng cặp người dùng dựa vào hành vi mạng xã hội Luận văn trình bày phương pháp tư vấn dựa vào hành vi người dùng kết hợp hành vi người dùng mạng xã hội bao gồm: Phương pháp tư vấn. .. hợp hành vi: - Phương pháp tư vấn kết hợp hành vi Like - Phương pháp tư vấn kết hợp hành vi Post - Phương pháp tư vấn kết hợp hành vi Comment - Phương pháp tư vấn kết hợp hành vi Friend Phương pháp. .. 1.4 Kết luận chương Trong chương 1, luận văn giới thiệu mạng xã hội, hành vi người dùng mạng xã hội, phương pháp tính mức độ tư? ?ng đồng cặp người dùng dựa vào hành vi người dùng mạng xã hội 5

Định dạng
Số trang	20
Dung lượng	706,77 KB