MỞ ĐẦU
1 Tính cấp thiết của đề tài
Với gia tăng chưa từng thấy lượng thông tin trên Internet hiện nay làm cho vấn đề quá tải thông tin trở nên tram trong đối với người dùng các dịch vụ trực tuyến Hệ tư vấn ra đời hướng đến việc giảm tải thông tin cho mỗi người dùng bằng cách đưa ra những gợi ý
thông tin phù hợp và gỡ bỏ những thông tin không phủ hợp cho mỗi người dùng.
Các hệ tư van được tiếp cận theo hai phương pháp chính: tư van dựa trên nội dung, tư van cộng tác Phương pháp tư vẫn nội dung được thực hiện dựa trên biểu diễn đặc trưng thông tin của các loại hàng hóa hoặc dịch vụ dé từ đó tìm ra những sản phẩm phù hợp với
những sản phâm người dùng đã từng sử dụng trong quá khứ Phương pháp tư vấn theo nội dung thực hiện khá tốt trên các dạng thông tin biểu diễn được bằng các đặc trưng nội dung
nhưng gặp nhiều hạn chế trong các dạng thông tin đa phương tiện Trái lại, tư vấn cộng tác
được thực hiện dựa trên đánh giá của cộng đồng người dùng có cùng chung sở thích dé dự
đoán những sản phẩm mới cho người dung cần được tư vấn Ưu điểm chính của phương pháp này là đơn giản và cho lại kết quả tốt trên tất cả các dạng thông tin Tuy vậy, phương pháp tư vấn cộng tác gặp một số khó khăn khi một người dùng mới tham gia hệ thống, vẫn
đề dữ liệu thưa.
Một hướng tiếp cận mới trong thời gian gần đây là làm thế nào khai thác được thế mạnh và hạn chế nhược điểm riêng của cả phương pháp tư vấn cộng tác và tư vấn nội dung Mặc dù đã có nhiều nghiên cứu hướng đến chủ dé này nhưng đây vẫn là van đề mở thu hút
được nhiều sự quan tâm nghiên cứu Chính vì vậy, em lựa chọn đề tài “Hệ tư vấn lai dựa
trên mô hình đồ thị” để thực hiện trong khuôn khổ luận văn thạc sĩ ngành hệ thống thông
Phương pháp tiếp cận kết hợp hay còn gọi là phương pháp lai (Hybrid Recommender
System) được tiếp cận theo ba xu hướng chính: kết hợp tuyến tính, kết hợp giữa lọc cộng tác
với lọc nội dung, kết hợp giữa lọc nội dung với lọc cộng tác, hợp nhất giữa lọc cộng tác và lọc nội dung Phương pháp kết hợp tuyến tính xây dựng hai engine tư van cộng tác và nội dung độc lập nhau sau đó kết hợp tuyến tính kết quả dự đoán của hai phương pháp làm kết quả tư van Phương pháp kết hợp giữa lọc cộng tác với lọc nội dung lay lọc cộng tác làm trung tâm và lọc nội dung được xem là thành phần hỗ trợ trong quá trình dự đoán Phương
Trang 2pháp kết hợp giữa lọc nội dung với lọc cộng tác lấy lọc nội dung làm trung tâm và lọc cộng tác được xem là thành phần hỗ trợ trong quá trình dự đoán Phương pháp hợp nhất thực hiện thống nhất chung cả lọc cộng tác va lọc nội dung trong một mô hình dự đoán Trong
luận văn em tập trung nghiên cứu phương pháp hợp nhất giữa tư van cộng tác và tư van nội
dung dựa vào đồ thị.
2 Mục đích và phạm vi nghiên cứu
Mục đích nhiên cứu: luận văn nghiên cứu các phương pháp tư vấn lai dựa vào mô hình đồ thị Trong đó tập trung nghiên cứu vào ba nội dung chính:
e Hợp nhất phương pháp biéu diễn giữa lọc cộng tác và lọc nội dung e Hợp nhất phương pháp dự đoán giữa lọc cộng tác và lọc nội dung.
e Hop nhất phương pháp đánh giá kết quả dự đoán giữa lọc cộng tác và lọc nội
Đối tượng và phạm vi nghiên cứu:
Đối tượng nghiên cứu của đề tài: Đối tượng nghiên cứu của đề tài là các hệ tư vấn, đi sâu nghiên cứu mô hình đồ thi cho hệ tư van.
Phạm vi nghiên cứu: Phạm vi nghiên cứu được giới hạn đối với các phương pháp tư
vân lai cho hệ tư vân.
3 Bố cục của luận văn
Dự kiến luận văn được cấu trúc thành 3 chương, trong đó Chương 1 giới thiệu hệ tư
vẫn cộng tác dựa vào đồ thị làm cơ sở ly thuyét dé mo rộng cho hệ tư van lai Chương 2 trình bày phương pháp tư vấn lai dựa vào đồ thị Chương 3 trình bày về phương pháp thử nghiệm, so sánh và đánh giá kết quả Phần cuối cùng là phần kết luận và hướng nghiên cứu tiếp theo của đề tài.
Trang 3CHUONG 1 HỆ TƯ VAN CỘNG TÁC DỰA TREN MÔ HÌNH DO THỊ
Lọc cộng tác là phương pháp phổ dụng hiện nay để xây dựng các hệ tư vấn Lọc
cộng tác được tiếp cận theo hai xu hướng chính: lọc cộng tác dựa vào bộ nhớ và lọc cộng
tác dựa vào mô hình Trong đó, lọc cộng tác dựa vào bộ nhớ, do tính chất đơn giản và hiệu quả nên phương pháp xây dựng hệ tư vấn dựa vào bộ nhớ được áp dụng rộng rãi cho các hệ
thống thương mại điện tử Trong chương này, luận văn trình bày một số van đề cơ bản về lọc cộng tác dựa trên mô hình đồ thị Nội dung của chương bao gồm:
e Phát biểu bài toán loc cộng tác
e Biéu diễn đồ thị cho bai toán tư vẫn lọc cộng tác
e_ Phương pháp tư vấn cộng tác theo người dùng dựa vào đồ thi e Phương pháp tư van cộng tác theo sản phẩm dựa vào đồ thị
e Hợp nhất phương pháp tư van theo người dùng và tư van sản phẩm dựa vào đồ thị 1.1 Phát biểu bài toán lọc cộng tác
Lọc cộng tác (CF) là một kỹ thuật được sử dụng rất pho biến, đặc biệt trong các ứng dụng thương mại điện tử, dành cho việc tư van các loại sản phẩm cho khách hàng Y tuong cua lọc cộng tác xuất phát từ việc mọi người thường nhận được các tư vấn tốt nhất từ những người có các điểm chung tương tự với mình CF tìm hiểu các kỹ thuật phù hợp giúp tìm
kiếm những người dùng láng giềng tương tự nhau và đưa ra các tư vấn dựa trên cơ sở đó Bài toán lọc cộng tác điển hình được phát biểu như sau:
Cho một tập hợp hữu hạn U = {u,1ạ, ,u„} là tập gồm N người dùng, P = ẤP, PĐ¿, - , Py} là tập gồm M sản phẩm.Mỗi sản phẩm p„ € P có thé là hàng hóa, phim, ảnh,
tạp chí, tai lệu, sách, báo, dich vụ hoặc bất kỳ dạng thông tin nào mà người dùng cần đến.
Mối quan hệ giữa tập người dùng U va tập sản phẩm P được biểu diễn thông qua ma trận đánh giá R = {n,,i=1 N,x = 1 M} Mỗi giá trị r;„ € {Ø,1,2, ,V} biểu diễn quan điểm của người dùng +; € U đối với sản phẩm p, € P Giá trị r;„ có thé thu thập trực tiếp bằng cách hỏi ý kiến người dùng hoặc thu thập gián tiếp thông qua cơ chế phản hồi của
người dùng Giá trị r;„ = Ø được hiểu rằng người dùng 1, chưa đánh giá hoặc chưa bao giờ
Trang 4biết đến sản phẩm p, Nhiệm vụ của lọc cộng tác là dự đoán quan điểm người dùng u, € U đối với những mặt hàng mới p, € P trên cơ sở đó tư van cho người dùng u, những sản phẩm được đánh giá cao.
Bảng 1.1 là một ví dụ về ma trận đánh giá cho hệ lọc cộng tác gồm có 4 người dùng U ={mu,u;,¿,u„} và 4 sản phẩm P = {p,, p>, 0x, Pa} Các giá trị đánh giá được biểu diễn có giá trị r;, = {Ø, 1,2,3,4,5} Những giá trị r;„ = Ø được hiểu là người dùng i € U chưa biết đến sản phẩm x € P Ô điền ký tự “?” là giá trị kết quả cần điền của các phương pháp
Điểu vàn: Ma trận đánh giá R Giải thuật Lọc công sie
(Rating Matrix) (CF Algorithm)
Dau ra
Giá trị cain tinh dự đoán
Hình 1.1 Các thành phần của hệ thống lọc cộng tác
Ma trận đánh giá R = (r;;) là thông tin đầu vào duy nhất của các phương pháp lọc
cộng tác Dựa trên ma trân đánh giá, các phương pháp lọc cộng tác thực hiện hai tác vụ: dự
Trang 5đoán quan điêm của người dùng hiện thời (Active User) vê các sản phâm có đánh giá cao
nhất phân b6 cho người dùng hiện thời Hình 1.1 mô tả các thành phan của hệ thống lọc
cộng tác.
1.2 Biểu diễn đồ thi cho bài toán tư vấn cộng tác
Giả sử ta có hệ lọc cộng tác gồm N người dùng U và M sản phẩm P với ma trận đánh
giá R = (nj:i = 1,2, ,N;j = 1,2, , M) Không mat đi tính tổng quát của bai toán, giả sử Nx = +h nếu người dùng i € U đánh giá sản phẩm x € P ở mức độ h, trong đó h € [0,1].
Tạ = {" néu người dùng i thich san phẩm X ở mức độh
Ø — nêu người dùng i chưa biết sản phâm x
Biểu diễn ma trận đánh giá theo (1.1) sẽ không ảnh hưởng tới các hệ thống lọc cộng tác sử dụng đánh giá nhị phân (0,1) hoặc có nhiều mức đánh giá trong khoảng [0,1] Đối với các bộ dữ liệu có giá trị đánh giá trong khoảng 7;, € {1,2, ,h}, ta chỉ cần thực hiện phép
hk As +2 A _ Tix
biên đôi đơn giản chuyên 7, = "
1.3 Phương pháp tư vấn cộng tác theo người dùng dựa vào đồ thị
1.3.1 Giới thiệu phương pháp UserBased
Phương pháp UserBased là phương pháp ước lượng mức độ tương tự giữa các cặp
người dùng dựa vào các độ đo tương tự dé từ đó sinh ra dự đoán các sản phẩm mới phù hợp với người dùng cần được tư van Phương pháp được tiến hành thong qua ba bước như dưới
Bước 1: Tính toán độ tương tự người dùng
Bước 2: Xác định tập láng giéng cho người dùng cần tư van
Bước 3: Tính toán đưa ra dự đoán
1.3.2 Phương pháp UserBased dựa trên mô hình đồ thị (UserBased-Graph)
Thuật toán UserBased có thé được thực hiện trên mô hình đồ thị bằng cách xem xét tất cả các đường đi từ đỉnh người dùng đến đỉnh người dùng
Gọi U!(N x N) là tổng trọng số các đường đi có độ dài L từ đỉnh i € U đến đỉnh
j €U trên đồ thị GG = 1,2, ,N;j = 1,2, ,N) DạG là đồ thị hai phía, nên đường đi từ
Trang 6đỉnh người dùng i đến đỉnh người dùng 7 trên đồ thị luôn có độ dài L chan.Vi tổng trọng số mỗi đường đi độ dài L được tính bằng tích của trọng số trên các cạnh nên tổng trọng số các đường đi độ dài L từ đỉnh người dùng đến đỉnh người dùng trên đồ thị G được xác định theo
- Ma trận trọng số C là biểu diễn đồ thị G = <V,E> cho lọc cộng tác -i € U là người dùng cần được tư van
- KR số lượng người dùng của tập láng giềng
Đầu ra: Dự đoán x: ?„|x € P\P;(quan điểm của người dùng i đối với các sản phẩm
mới x € P).
Các bước tiến hành:
Bước 1 Tính toán mức độ tương tự giữa các cặp người dùng:
L=2;//Thiết lập độ dài đường đi ban đầu
W(N x M) *WT(M x N) nếu L = 2
W(NxM)x*WT(MxN)+*U!*?(NxN) nếu L = 4,6,8,
L =L†2; //Tang độ dài đường di
Until (uj; # 0,V/ € {U\i});
Bước 2 Xác định tập láng giềng cho người dùng i € U.
vinx) =f
- Sắp xếp uj; # 0 theo thứ tự giảm dan (i # j).
- Chọn K người dùng j € U đầu tiên làm tập láng giéng của người dùng i (Ký hiệu
tập láng giềng của người dùng ¡ € U là K,).
Bước 3 Dự đoán quan điểm người dùng i đối với các sản pham x € P\P,.
te = 7D, TeJ€K¡
Bước 4: Chọn K sản pham có mức độ tương tự cao nhất tư vẫn cho người dùng i.
Hình 1.2 Thuật toán UserBased-Graph.
Trang 71.4 Phương pháp tư vấn cộng tác theo sản phẩm dựa vào đồ thị
1.4.1 Giới thiệu phương pháp ItemBased
Phương pháp ItemBased là phương pháp ước lượng mức độ tương tự giữa các cặp
sản phẩm dựa vào các độ đo tương tự dé từ đó sinh ra dự đoán các sản phẩm mới phù hợp với người dùng cần được tư van Phương pháp đều được tiến hành theo ba bước như sau.
Bước 1: Tính toán độ tương tự sản phẩm
Bước 2: Xác định tập láng giéng cho sản phẩm can tư van
Bước 3: Tính toán đưa ra dự đoán
1.4.2 Phương pháp ItemBased dựa trên mô hình đồ thị
Thuật toán ItemBased có thê được thực hiện trên mô hình đồ thị bằng cách xem xét tất cả các đường đi từ đỉnh sản phẩm đến đỉnh sản phẩm.
Gọi P“(M x M) là tông trọng số các đường đi có độ dài L từ đỉnh x € P đến đỉnh
y € P trên đồ thị G(x = 1,2, ,M; y = 1,2, , M) Do G là đồ thị hai phía, nên đường đi từ đỉnh sản pham x đến đỉnh sản phẩm y trên đồ thị luôn có độ dài L chan Vi tổng trọng số mỗi đường đi độ dài L được tính băng tích của trọng số trên các cạnh nên tổng trọng số các
đường đi độ dài L từ đỉnh sản phẩm đến đỉnh sản phẩm trên đồ thị G được xác định theo
Trang 8Bước 1 Tính toán mức độ tương tự giữa các cặp sản phẩm: L =2; //Thiét lập độ dài đường đi ban đầu
Bước 2 Xác định tập láng giéng cho sản phẩm x € P - Sắp xếp pk, # 0 theo thứ tự giảm dan (x # y).
- Chọn K sản phẩm y € P đầu tiên làm tập láng giéng của sản phẩm x (Ký hiệu tập
Bước 4: Chọn K sản phẩm có mức độ tương tự cao nhất tư van cho sản phẩm i.
Hình 1.3 Thuật toán ItemBased dựa trên đồ thị.
1.5 Hợp nhất phương pháp ItemBased và UserBased dựa trên vào đồ thị
Phương pháp Unify-Graph dự đoán mức độ phù hợp của sản phẩm đối với mỗi người dùng bang cách tìm kiếm tat cả các đường đi từ đỉnh người dùng đến đỉnh sản phẩm trên đồ
thi Đường đi từ đỉnh ¡€ U đến đỉnh x € P có độ dài L=l chính là ma trận trong số W(N xM) Tổng trọng số các đường di từ đỉnh đỉnh i € U đến đỉnh x € P có độ dài L
=3,5,7 được xác định theo công thức (1.4):
Trang 9- Ma trận trọng số C là biểu diễn đồ thị G =<V,E> cho lọc cộng tác -i € U là người dùng cần được tư van
- Klà số lượng sản phẩm cần được tư vấn Đầu ra:
- Dự đoán x: 7; | x € P\P; (quan điểm của người dùng i đối với sản phẩm mới x €
Các bước tiến hành:
Bước 1.7ính toán mức độ phù hợp giữa các cặp người dùng — sản phẩm:
L=1;//Thiết lập độ dài đường đi ban đầu
Bước 2 Sắp xếp w}, theo thứ tự giảm dan.
Bước 3 Chọn K sản phẩm x € P đầu tiên tư van cho người dùng i € U
Hình 1.4 Thuật toán hợp nhất dựa trên đồ thị.
1.6 Kết luận chương 1
Trong chương này, luận văn đã trình bày phương pháp tư vấn cộng tác dựa vào người
dùng và phương pháp tư vấn cộng tác dựa vào sản phẩm Trên cơ sở hai phương pháp cơ bản của lọc cộng tác dựa vào bộ nhớ, em tiễn hành xây dựng các thuật toán tương ứng dựa
trên biểu diễn đồ thị trọng số.Cách tiếp cận này sẽ hạn chế được ảnh hưởng được vẫn đề dữ
liệu thưa của lọc cộng tác.
Trang 10CHƯƠNG 2 HE TƯ VAN LAI DUA TREN MÔ HÌNH DO THỊ
Chương 2 kết hợp cả hai phương pháp lại lọc cộng tác và lọc nội dung với nhau để tận dụng được những ưu điểm của cả hai phương pháp sẽ góp phần cải thiện chất lượng dự đoán Trong chương này, luận văn sẽ trình bày mô hình kết hợp giữa lọc cộng tác và lọc nội dung dựa trên mô hình đồ thị Trong chương này, luận văn sẽ trình bày mô hình kết hợp
giữa lọc cộng tác và lọc nội dung dựa trên mô hình đồ thị Nội dung chương bao gồm: e Phát biểu bài toán cho hệ tư vẫn lai
e Biểu diễn đồ thị cho hệ tư van lai
e Phương pháp Hybrid-User-Based cho hệ tư van lai
e_ Phương pháp Hybrid-Item-Based cho hệ tư van lai e Phương pháp hợp nhất dựa vào đồ thị
e Kết luận chương 2
2.1 Phát biểu bài toán cho hệ tư van lai
Cho một tập hợp hữu hạn U = {u¿,1;, ,u„} là tập gồm N người dùng, P = {D1 Pa, - , pụ} là tập gồm M sản phẩm Mỗi sản phẩm p„ € P có thé là hàng hóa, phim,
ảnh, tạp chí, tài lệu, sách, báo, dịch vụ hoặc bất kỳ dạng thông tin nào mà người dùng cần
đến Mối quan hệ giữa tập người dùng U và tập sản phẩm P được biểu diễn thông qua ma trận đánh giá R = {r;„,í = 1 N,x = 1 M} Giá trị r,„ thé hiện đánh giá của người dùng u; € U cho một số sản phẩm p, € P Thông thường giá trị r„„ nhận một giá trị thuộc miền R = {1,2, , g} được thu thập trực tiếp bằng cách hỏi ý kiến người dùng hoặc thu thập gián tiếp thông qua cơ chế phản hồi của người dùng Giá trị r;„ = Ø được hiểu người dùng u;
chưa đánh giá hoặc chưa bao giờ biết đến sản phẩm p, Ma trận đánh giá của các hệ thống
tư vấn thực tế thường rất thưa Mật độ các giá tri r„z0 nhỏ hơn 1%, hầu hết các giá tri Ny còn lại là @ Ma trận R chính là đầu vào của các hệ thống tư vẫn cộng tác Đề thuận tiện trong trình bày, ta viết ø„ € P ngắn gon lax € P; và u; € U là i € U Các ký tự i,j luôn được dùng dé chỉ tập người dùng trong các mục tiếp theo của luận văn
Mỗi sản phẩm x€P được biểu diễn thông qua |C|đặc trưng nội dung C =
{cu C2, , cic}: Các đặc trưng c, € C nhận được từ các phương pháp trích chon đặc trưng
(feature selection) trong lĩnh vực truy vấn thông tin Ví dụ x € P là một phim thì các đặc
Trang 11trưng nội dung biểu diễn một phim có thé là C = {thé loại phim, nước sản xuất, hãng phim, diễn viên, đạo diễn } Gọi wy = {Wx,W;¿, « Wzlel} là vector trọng số các giá trị đặc
trưng nội dung sản phẩm x € P Khi đó, ma trận trọng số W = {w,,:x = 1,2 M,s = 1,2 |C|} chính là đầu vào của các hệ thống tư van theo nội dung sản phâm Dé thuận tiện trong trình bày, ta viết c, € C ngắn gọn là s EC Ký tự s luôn được dùng dé chỉ tập đặc trưng nội dung sản phẩm trong các mục tiếp theo của luận văn.
Mỗi người dùng i €U được biểu diễn thông qua |T| đặc trưng nội dung 7 =
{t,, tz, , tyr) } Các đặc trưng ty € T thông thường là thông tin cá nhân của mỗi người dùng
(Demographic Information) Ví dụ i € U là một người dùng thì các đặc trưng nội dung biểu diễn người dùng i có thé là 7 = {giới tính, độ tuổi, nghề nghiệp, trình độ, } Gọi 10 = {Pin Địa, Mi! là vector trọng số biểu diễn các giá trị đặc trưng nội dung người dùng ¡€U Khi đó, ma trận trọng số ƒ = {vigit = 1/2 N; q = 1,2 ,|T|} chính là đầu vào của các hệ thống tư vấn theo nội dung thông tin người dùng Để thuận tiện trong trình bày, ta viết tạ €T ngắn gọn là q ET Ký tự q luôn được dùng dé chỉ tập đặc trưng nội dung người dùng trong các mục tiếp theo của luận văn.
Tiếp đến ta ký hiệu, P, G P là tập các sản phẩm x € P được đánh giá bởi người dùng ¡ €U và U, G U là tập các người dùng i € U đã đánh giá sản pham x € P Với một người
dùng cần được tư van i € U (được gọi là người dùng hiện thời, người dùng cần được tư vấn,
hay người dùng tích cực), nhiệm vụ của các phương pháp tư vấn là gợi ý K sản phẩm
x €(P\P,) phù hợp nhất đối với người dùng i.
Có nhiều đề xuất khác nhau dé giải quyết bài toán tư van Tuy vậy, ta có thé chia các cách tiếp cận thành ba xu hướng chính: tư vấn theo nội dung, tư vẫn cộng tác, và tư van kết
hợp (còn được gọi là phương pháp lai) Hệ tư van theo nội dung đưa ra các phương pháp dự
đoán dựa trên ma trận trọng số các đặc trưng nội dung sản phẩm W = {w;,} hoặc ma trận
trọng số các đặc trưng nội dung người dùng V = {Vig} Hệ tư vẫn cộng tác đưa ra các phương pháp dự đoán dựa trên ma trận đánh giá R = {z;„} Hệ tư van lai đưa ra các phương
pháp dự đoán dựa trên cả 3 ma trận R, W và V.
Trong dé tài này, em đề xuất một mô hình hợp nhất giữa lọc cộng tác và lọc nội dung dựa trên biểu diễn đồ thị Mô hình được xây dựng băng cách lấy lọc cộng tác làm trung tâm, xây dựng hồ sơ người dùng dựa trên ma trận đánh giá dé thiết lập nên mối quan hệ trực tiếp
Trang 12giữa tập người dùng với tập đặc trưng nội dung sản phẩm Tiếp đến, em tiến hành xây dựng hồ sơ sản phẩm cũng dựa trên ma trận đánh giá dé thiết lập nên mối quan hệ trực tiếp giữa tập sản phẩm và tập đặc trưng nội dung người dùng Dựa trên mối quan hệ giữa tập người dùng với tập đặc trưng nội dung sản phẩm và mối quan hệ giữa tập sản phẩm với tập đặc trưng nội dung người dùng, em tìm cách xác định mối quan hệ tiềm ân giữa tập đặc trưng
sản phẩm và tập đặc trưng người dùng Bằng cách này, ta thu gọn được mô hình tư van kết
hợp tổng quát thành mô hình tư van cộng tác thuần túy 2.2 Biễu diễn đồ thị cho hệ tư vấn lai
Đề giải quyết bài toán tư vấn tông quát được phát biéu trong Mục 2.1 bằng mô hình
đồ thị ta cần giải quyết hai vấn đề: biểu diễn đồ thị cho bài toán tư vấn kết hợp và phương
pháp dự đoán trên đồ thị kết hợp Trong mục này, đồ án trình bày phương pháp biểu diễn đồ thị cho bài toán tư van kết hợp.
2.2.1 Mô hình dé thị tong quát
Không hạn chế tính tổng quát của bài toán phát biểu trong Mục 2.1, ta giả thiết giá trị
đánh giá của người dùng icU đối với sản pham xe? được xác định theo công thức (2.1) Mỗi sản phẩm xeP được biểu diễn thông qua IC| đặc trưng nội dung C = {c¡, ca„ ,cc¡} được xác định theo công thức (2.2) Mỗi người dùng ¿eU được biểu diễn thông qua I7| đặc trưng
nội dung T= {í¡, fs, , tr} được xác định theo công thức (2.3).
r ={° néu người dùng i đánh giá SP x ở mức độ 0 (0 € F) (2.1)
* Ìj_ nếu người dùng i chưa đánh giá hoặc chưa biết đến SP x ,
c= {i néu san phẩm x có đặc trưng s (2.2)
*s |0 néu sản phẩm x không có đặc trưng s ‘
t= {i néu người ding i có đặc trưng q (23)
4ˆ L0 nếu người dùng ¡ không có đặc trưng q :
Hệ tư vấn với ma trận đánh giá R = {r„:í = 1 N,x = 1 M}, ma trận đặc trưng
nội dung sản phẩm C ={cy;:x = 1,2, ,M; s = 1,2, , |C|} ma trận đặc trưng nội dung người dùng T = {tjg:i = 1,2, ,N; s =1,2, ,|T|} có thể biểu diễn dưới dạng đồ thị trọng số G = (2, E), trong đó Q1a tập đỉnh và E là tập cạnh Tập đỉnh 2 của đồ thị được xác định theo công thức (2.4) chính là hợp của tập người dùng U, tập sản phẩm P, tập đặc trưng
Trang 13nội dung sản phẩm C va tập đặc trưng nội dung người dùng T Tập cạnh E của đồ thị bao gồm 3 loại cạnh: cạnh (i, x) nói giữa đỉnh người dùng với đỉnh sản phẩm, cạnh (x,s) nối đỉnh sản phẩm với đặc trưng nội dung sản phẩm, cạnh (i,q) nối giữa đỉnh người dùng với
đỉnh đặc trưng nội dung của người dùng.
Q=UUPUCUT (2.4)
e=(i,x) néur, #0: ieU,xeP
e=(i,q) néut #0:ieU,qeT
Dựa trên biểu diễn đồ thị, phương pháp tư vẫn cộng tác được thực hiện dựa trên các cạnh nối giữa đỉnh người dùng i € U và đỉnh sản phẩm x € P với trọng số ?;„ Phương pháp
tư vấn theo nội dung sản phẩm được thực hiện trên các cạnh nối giữa đỉnh sản phẩm xEP
và đỉnh đặc trưng nội dung sản pham s € C Phương pháp tư vấn theo nội dung người dùng được thực hiện trên các cạnh nối giữa đỉnh người dùng i € U và đỉnh đặc trưng nội dung người dùng £ € T Phương pháp tư van kết hợp được thực hiện dựa trên cả ba loại cạnh
(i, x) (x,s)va (i, q)
2.2.2 Xây dựng hô sơ người dùng dựa trên ma trận đánh giá
Dé xây dựng được hồ sơ sử dụng sản phẩm của người dùng ta cần thực hiện hai nhiệm vụ: xác định được tập các sản phẩm người dùng đã từng truy cập hay sử dụng trong quá khứ và ước lượng trọng số mỗi đặc trưng nội dung sản phẩm trong hồ sơ người dùng Gọi P, G P được xác định theo công thức (2.6) là tập sản phẩm người dùng i € U đã đánh giá các sản phẩm x € P Khi đó, P; chính là tập sản phâm người dùng đã từng truy cập trong
quá khứ được các phương pháp tư vấn theo nội dung sử dụng trong khi xây dựng hồ sơ