Phát biểu bài toán hệ tư vấn cộng tác dựa vào hành- 123docz.net

sản phẩm kết hợp với các hành vi của người dùng trong mạng xã hội.

2.1. Phát biểu bài toán hệ tư vấn cộng tác dựa vào hành vi người dùng trong mạng xã hội trong mạng xã hội

Cho tập hợp hữu hạn gồm N người dùng U u u1, 2,...,uN, Pp p1, 2,...,pM là tập hữu hạn gồm M sản phẩm. Mỗi sản phẩm pxP có thể là hàng hóa, phim, ảnh, tạp chí, tài liệu, sách, báo, dịch vụ hoặc bất kỳ dạng thông tin nào mà người dùng cần đến. Mối quan hệ giữa tập người dùng U và tập sản phẩm P được biểu diễn thông qua ma trận đánh giá R={ rix: i = 1, 2, ..N; x = 1, 2,..M }. Giá trị rix thể hiện đánh giá của người dùng uiU cho một số sản phẩm pxP. Thông thường giá trị rixnhận một giá trị thuộc miền F = { 1, 2,.., g} được thu thập trực tiếp bằng cách hỏi ý kiến người dùng hoặc thu thập gián tiếp thông qua cơ chế phản hồi của người dùng. Giá trị rix =  được hiểu người dùng ui chưa đánh giá hoặc chưa bao giờ biết

đến sản phẩm px. Ma trận đánh giá của các hệ thống tư vấn thực tế thường rất thưa.

Các giá trị đánh giá rij= trên bộ dữ liệu MovieLens là là 98.7%, trên bộ dữ liệu

BookCrossing là 99.1%. Ma trận R chính là đầu vào của các hệ thống tư vấn cộng

tác.

Hành vi Friend biểu diễn mối quan hệ bạn bè trong mạng xã hội của tập người dùng U được biểu diễn bằng ma trận F = {fij : i=1, 2, ..n; j=1, 2,..,n}. Hành vi Post của người dùng iU đối với sản xP được cho bởi ma trận Po = {poix: i=1, 2,..,n; x =1, 2,..,m}. Hành vi Like của người dùng iU đối với sản xP được cho bởi ma trận L = {lix: i=1, 2,..,n; x =1, 2,..,m}. Hành vi Comment của người dùng iU đối với sản xP được cho bởi ma trận C = {Cix: i=1, 2,..,n; x =1, 2,..,m}.

người dùng cần được tư vấn iU (được gọi là người dùng hiện thời, người dùng cần được tư vấn, hay người dùng tích cực), nhiệm vụ của các phương pháp tư vấn là tư vấn K sản phẩm x(P\Pi) phù hợp nhất đối với người dùng i.

Có nhiều phương pháp đề xuất khác nhau để giải quyết bài toán lọc cộng tác. Su và Khoshgoftaar [10] phân loại các phương pháp giải quyết bài toán lọc cộng tác thành hai cách tiếp cận chính: Lọc cộng tác dựa vào bộ nhớ (Memory-Based [6, 9, 11]) và Lọc cộng tác dựa vào mô hình (Model-Based [2, 7, 12]).

Trong hai phương pháp này, phương pháp lọc cộng tác dựa vào bộ nhớ được sử dụng rộng dãi hơn cho các hệ thống lọc thông tin thực tế do cài đặt đơn giản, độ chính xác cao, chi phí tính toán thấp [8]. Chính vì vậy, hướng tiếp cận của luận văn tập trung nghiên cứu phát triển phương pháp lọc cộng tác dựa vào bộ nhớ.

Lọc cộng tác dựa trên bộ nhớ được tiếp cận theo hai phương pháp chính: Phương pháp lọc dựa vào người dùng (UserBased) và lọc dựa vào sản phẩm (ItemBased). Mỗi phương pháp đều có những ưu điểm riêng khai thác những khía cạnh liên quan đến người dùng hoặc sản phẩm. Đặc điểm chung của cả hai phương pháp này là sử dụng toàn bộ tập dữ liệu đánh giá để dự đoán quan điểm của người

dùng cần được tư vấn (AU) về các sản phẩm mà họ chưa hề biết đến. Về thực chất,

đây là phương pháp học lười (LL) hay học dựa trên ví dụ (IBL) được sử dụng trong học máy. Phương pháp được thực hiện theo hai bước: Tính toán mức độ tương tự và tạo nên dự đoán [1].

 Tính toán mức độ tương tự sim(x, y): Mô tả khoảng cách, sự liên quan, hay trọng số giữa hai người dùng x và y( hoặc giữa hai sản phẩm x và y).

 Dự đoán: Đưa ra dự đoán cho người dùng cần được tư vấn bằng cách xác định tập láng giềng của người dùng này. Tập láng giềng của người dùng cần tư vấn được xác định dựa trên mức độ tương tự giữa các cặp người dùng hoặc sản phẩm.

2.2. Phương pháp tư vấn dựa vào một hành vi

Xét ví dụ 2.1 sau đây:

Ví dụ 2.1: Giả sử ta thu thập được các đánh giá của một số người dùng với một số khách sạn. Giá trị đánh giá nằm trong khoảng từ 1 đến 5 được thể hiện trong bảng 2.1 dưới đây (giá trị đánh giá càng cao thể hiện mức độ đánh giá càng tốt của người dùng i đối với khách sạn x):

Bảng 2.1. Ma trận đánh giá người dùng-sản phẩm Grand Sunrise Calypso Suites Big Home Hagl Plaza Hanoi Zesty Hotel Hanoi Brother Inn Người dùng 1 5 4 5 Người dùng 2 4 2 Người dùng 3 3 2 3 3 Người dùng 4 4 4 5 Người dùng 5 5 ? ? 3 ? ?

Dấu “?” biểu diễn những đánh giá cần phải dự đoán của người dùng 5 đối với các khách sạn “Calypso Suites”, “Big Home”, “Hanoi Zesty Hotel” và “Hanoi Brother Inn”.

4 2 0

4 5

Tiếp theo phần này trình bày phương pháp tư vấn dựa vào từng hành vi đơn đó là Like, Post, Comment, Friend.

Phát biểu bài toán hệ tư vấn cộng tác dựa vào hành vi người dùng trong mạng xã hội