1. Trang chủ
  2. » Luận Văn - Báo Cáo

Hệ tư vấn lai dựa trên mô hình đồ thị

26 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 26
Dung lượng 5,72 MB

Nội dung

Trang 1

MỞ ĐẦU

1 Tính cấp thiết của đề tài

Với gia tăng chưa từng thấy lượng thông tin trên Internet hiện nay làm cho vấn đề quá tải thông tin trở nên tram trong đối với người dùng các dịch vụ trực tuyến Hệ tư vấn ra đời hướng đến việc giảm tải thông tin cho mỗi người dùng bằng cách đưa ra những gợi ý

thông tin phù hợp và gỡ bỏ những thông tin không phủ hợp cho mỗi người dùng.

Các hệ tư van được tiếp cận theo hai phương pháp chính: tư van dựa trên nội dung, tư van cộng tác Phương pháp tư vẫn nội dung được thực hiện dựa trên biểu diễn đặc trưng thông tin của các loại hàng hóa hoặc dịch vụ dé từ đó tìm ra những sản phẩm phù hợp với

những sản phâm người dùng đã từng sử dụng trong quá khứ Phương pháp tư vấn theo nội dung thực hiện khá tốt trên các dạng thông tin biểu diễn được bằng các đặc trưng nội dung

nhưng gặp nhiều hạn chế trong các dạng thông tin đa phương tiện Trái lại, tư vấn cộng tác

được thực hiện dựa trên đánh giá của cộng đồng người dùng có cùng chung sở thích dé dự

đoán những sản phẩm mới cho người dung cần được tư vấn Ưu điểm chính của phương pháp này là đơn giản và cho lại kết quả tốt trên tất cả các dạng thông tin Tuy vậy, phương pháp tư vấn cộng tác gặp một số khó khăn khi một người dùng mới tham gia hệ thống, vẫn

đề dữ liệu thưa.

Một hướng tiếp cận mới trong thời gian gần đây là làm thế nào khai thác được thế mạnh và hạn chế nhược điểm riêng của cả phương pháp tư vấn cộng tác và tư vấn nội dung Mặc dù đã có nhiều nghiên cứu hướng đến chủ dé này nhưng đây vẫn là van đề mở thu hút

được nhiều sự quan tâm nghiên cứu Chính vì vậy, em lựa chọn đề tài “Hệ tư vấn lai dựa

trên mô hình đồ thị” để thực hiện trong khuôn khổ luận văn thạc sĩ ngành hệ thống thông

Phương pháp tiếp cận kết hợp hay còn gọi là phương pháp lai (Hybrid Recommender

System) được tiếp cận theo ba xu hướng chính: kết hợp tuyến tính, kết hợp giữa lọc cộng tác

với lọc nội dung, kết hợp giữa lọc nội dung với lọc cộng tác, hợp nhất giữa lọc cộng tác và lọc nội dung Phương pháp kết hợp tuyến tính xây dựng hai engine tư van cộng tác và nội dung độc lập nhau sau đó kết hợp tuyến tính kết quả dự đoán của hai phương pháp làm kết quả tư van Phương pháp kết hợp giữa lọc cộng tác với lọc nội dung lay lọc cộng tác làm trung tâm và lọc nội dung được xem là thành phần hỗ trợ trong quá trình dự đoán Phương

Trang 2

pháp kết hợp giữa lọc nội dung với lọc cộng tác lấy lọc nội dung làm trung tâm và lọc cộng tác được xem là thành phần hỗ trợ trong quá trình dự đoán Phương pháp hợp nhất thực hiện thống nhất chung cả lọc cộng tác va lọc nội dung trong một mô hình dự đoán Trong

luận văn em tập trung nghiên cứu phương pháp hợp nhất giữa tư van cộng tác và tư van nội

dung dựa vào đồ thị.

2 Mục đích và phạm vi nghiên cứu

Mục đích nhiên cứu: luận văn nghiên cứu các phương pháp tư vấn lai dựa vào mô hình đồ thị Trong đó tập trung nghiên cứu vào ba nội dung chính:

e Hợp nhất phương pháp biéu diễn giữa lọc cộng tác và lọc nội dung e Hợp nhất phương pháp dự đoán giữa lọc cộng tác và lọc nội dung.

e Hop nhất phương pháp đánh giá kết quả dự đoán giữa lọc cộng tác và lọc nội

Đối tượng và phạm vi nghiên cứu:

Đối tượng nghiên cứu của đề tài: Đối tượng nghiên cứu của đề tài là các hệ tư vấn, đi sâu nghiên cứu mô hình đồ thi cho hệ tư van.

Phạm vi nghiên cứu: Phạm vi nghiên cứu được giới hạn đối với các phương pháp tư

vân lai cho hệ tư vân.

3 Bố cục của luận văn

Dự kiến luận văn được cấu trúc thành 3 chương, trong đó Chương 1 giới thiệu hệ tư

vẫn cộng tác dựa vào đồ thị làm cơ sở ly thuyét dé mo rộng cho hệ tư van lai Chương 2 trình bày phương pháp tư vấn lai dựa vào đồ thị Chương 3 trình bày về phương pháp thử nghiệm, so sánh và đánh giá kết quả Phần cuối cùng là phần kết luận và hướng nghiên cứu tiếp theo của đề tài.

Trang 3

CHUONG 1 HỆ TƯ VAN CỘNG TÁC DỰA TREN MÔ HÌNH DO THỊ

Lọc cộng tác là phương pháp phổ dụng hiện nay để xây dựng các hệ tư vấn Lọc

cộng tác được tiếp cận theo hai xu hướng chính: lọc cộng tác dựa vào bộ nhớ và lọc cộng

tác dựa vào mô hình Trong đó, lọc cộng tác dựa vào bộ nhớ, do tính chất đơn giản và hiệu quả nên phương pháp xây dựng hệ tư vấn dựa vào bộ nhớ được áp dụng rộng rãi cho các hệ

thống thương mại điện tử Trong chương này, luận văn trình bày một số van đề cơ bản về lọc cộng tác dựa trên mô hình đồ thị Nội dung của chương bao gồm:

e Phát biểu bài toán loc cộng tác

e Biéu diễn đồ thị cho bai toán tư vẫn lọc cộng tác

e_ Phương pháp tư vấn cộng tác theo người dùng dựa vào đồ thi e Phương pháp tư van cộng tác theo sản phẩm dựa vào đồ thị

e Hợp nhất phương pháp tư van theo người dùng và tư van sản phẩm dựa vào đồ thị 1.1 Phát biểu bài toán lọc cộng tác

Lọc cộng tác (CF) là một kỹ thuật được sử dụng rất pho biến, đặc biệt trong các ứng dụng thương mại điện tử, dành cho việc tư van các loại sản phẩm cho khách hàng Y tuong cua lọc cộng tác xuất phát từ việc mọi người thường nhận được các tư vấn tốt nhất từ những người có các điểm chung tương tự với mình CF tìm hiểu các kỹ thuật phù hợp giúp tìm

kiếm những người dùng láng giềng tương tự nhau và đưa ra các tư vấn dựa trên cơ sở đó Bài toán lọc cộng tác điển hình được phát biểu như sau:

Cho một tập hợp hữu hạn U = {u,1ạ, ,u„} là tập gồm N người dùng, P = ẤP, PĐ¿, - , Py} là tập gồm M sản phẩm.Mỗi sản phẩm p„ € P có thé là hàng hóa, phim, ảnh,

tạp chí, tai lệu, sách, báo, dich vụ hoặc bất kỳ dạng thông tin nào mà người dùng cần đến.

Mối quan hệ giữa tập người dùng U va tập sản phẩm P được biểu diễn thông qua ma trận đánh giá R = {n,,i=1 N,x = 1 M} Mỗi giá trị r;„ € {Ø,1,2, ,V} biểu diễn quan điểm của người dùng +; € U đối với sản phẩm p, € P Giá trị r;„ có thé thu thập trực tiếp bằng cách hỏi ý kiến người dùng hoặc thu thập gián tiếp thông qua cơ chế phản hồi của

người dùng Giá trị r;„ = Ø được hiểu rằng người dùng 1, chưa đánh giá hoặc chưa bao giờ

Trang 4

biết đến sản phẩm p, Nhiệm vụ của lọc cộng tác là dự đoán quan điểm người dùng u, € U đối với những mặt hàng mới p, € P trên cơ sở đó tư van cho người dùng u, những sản phẩm được đánh giá cao.

Bảng 1.1 là một ví dụ về ma trận đánh giá cho hệ lọc cộng tác gồm có 4 người dùng U ={mu,u;,¿,u„} và 4 sản phẩm P = {p,, p>, 0x, Pa} Các giá trị đánh giá được biểu diễn có giá trị r;, = {Ø, 1,2,3,4,5} Những giá trị r;„ = Ø được hiểu là người dùng i € U chưa biết đến sản phẩm x € P Ô điền ký tự “?” là giá trị kết quả cần điền của các phương pháp

Điểu vàn: Ma trận đánh giá R Giải thuật Lọc công sie

(Rating Matrix) (CF Algorithm)

Dau ra

Giá trị cain tinh dự đoán

Hình 1.1 Các thành phần của hệ thống lọc cộng tác

Ma trận đánh giá R = (r;;) là thông tin đầu vào duy nhất của các phương pháp lọc

cộng tác Dựa trên ma trân đánh giá, các phương pháp lọc cộng tác thực hiện hai tác vụ: dự

Trang 5

đoán quan điêm của người dùng hiện thời (Active User) vê các sản phâm có đánh giá cao

nhất phân b6 cho người dùng hiện thời Hình 1.1 mô tả các thành phan của hệ thống lọc

cộng tác.

1.2 Biểu diễn đồ thi cho bài toán tư vấn cộng tác

Giả sử ta có hệ lọc cộng tác gồm N người dùng U và M sản phẩm P với ma trận đánh

giá R = (nj:i = 1,2, ,N;j = 1,2, , M) Không mat đi tính tổng quát của bai toán, giả sử Nx = +h nếu người dùng i € U đánh giá sản phẩm x € P ở mức độ h, trong đó h € [0,1].

Tạ = {" néu người dùng i thich san phẩm X ở mức độh

Ø — nêu người dùng i chưa biết sản phâm x

Biểu diễn ma trận đánh giá theo (1.1) sẽ không ảnh hưởng tới các hệ thống lọc cộng tác sử dụng đánh giá nhị phân (0,1) hoặc có nhiều mức đánh giá trong khoảng [0,1] Đối với các bộ dữ liệu có giá trị đánh giá trong khoảng 7;, € {1,2, ,h}, ta chỉ cần thực hiện phép

hk As +2 A _ Tix

biên đôi đơn giản chuyên 7, = "

1.3 Phương pháp tư vấn cộng tác theo người dùng dựa vào đồ thị

1.3.1 Giới thiệu phương pháp UserBased

Phương pháp UserBased là phương pháp ước lượng mức độ tương tự giữa các cặp

người dùng dựa vào các độ đo tương tự dé từ đó sinh ra dự đoán các sản phẩm mới phù hợp với người dùng cần được tư van Phương pháp được tiến hành thong qua ba bước như dưới

Bước 1: Tính toán độ tương tự người dùng

Bước 2: Xác định tập láng giéng cho người dùng cần tư van

Bước 3: Tính toán đưa ra dự đoán

1.3.2 Phương pháp UserBased dựa trên mô hình đồ thị (UserBased-Graph)

Thuật toán UserBased có thé được thực hiện trên mô hình đồ thị bằng cách xem xét tất cả các đường đi từ đỉnh người dùng đến đỉnh người dùng

Gọi U!(N x N) là tổng trọng số các đường đi có độ dài L từ đỉnh i € U đến đỉnh

j €U trên đồ thị GG = 1,2, ,N;j = 1,2, ,N) DạG là đồ thị hai phía, nên đường đi từ

Trang 6

đỉnh người dùng i đến đỉnh người dùng 7 trên đồ thị luôn có độ dài L chan.Vi tổng trọng số mỗi đường đi độ dài L được tính bằng tích của trọng số trên các cạnh nên tổng trọng số các đường đi độ dài L từ đỉnh người dùng đến đỉnh người dùng trên đồ thị G được xác định theo

- Ma trận trọng số C là biểu diễn đồ thị G = <V,E> cho lọc cộng tác -i € U là người dùng cần được tư van

- KR số lượng người dùng của tập láng giềng

Đầu ra: Dự đoán x: ?„|x € P\P;(quan điểm của người dùng i đối với các sản phẩm

mới x € P).

Các bước tiến hành:

Bước 1 Tính toán mức độ tương tự giữa các cặp người dùng:

L=2;//Thiết lập độ dài đường đi ban đầu

W(N x M) *WT(M x N) nếu L = 2

W(NxM)x*WT(MxN)+*U!*?(NxN) nếu L = 4,6,8,

L =L†2; //Tang độ dài đường di

Until (uj; # 0,V/ € {U\i});

Bước 2 Xác định tập láng giềng cho người dùng i € U.

vinx) =f

- Sắp xếp uj; # 0 theo thứ tự giảm dan (i # j).

- Chọn K người dùng j € U đầu tiên làm tập láng giéng của người dùng i (Ký hiệu

tập láng giềng của người dùng ¡ € U là K,).

Bước 3 Dự đoán quan điểm người dùng i đối với các sản pham x € P\P,.

te = 7D, TeJ€K¡

Bước 4: Chọn K sản pham có mức độ tương tự cao nhất tư vẫn cho người dùng i.

Hình 1.2 Thuật toán UserBased-Graph.

Trang 7

1.4 Phương pháp tư vấn cộng tác theo sản phẩm dựa vào đồ thị

1.4.1 Giới thiệu phương pháp ItemBased

Phương pháp ItemBased là phương pháp ước lượng mức độ tương tự giữa các cặp

sản phẩm dựa vào các độ đo tương tự dé từ đó sinh ra dự đoán các sản phẩm mới phù hợp với người dùng cần được tư van Phương pháp đều được tiến hành theo ba bước như sau.

Bước 1: Tính toán độ tương tự sản phẩm

Bước 2: Xác định tập láng giéng cho sản phẩm can tư van

Bước 3: Tính toán đưa ra dự đoán

1.4.2 Phương pháp ItemBased dựa trên mô hình đồ thị

Thuật toán ItemBased có thê được thực hiện trên mô hình đồ thị bằng cách xem xét tất cả các đường đi từ đỉnh sản phẩm đến đỉnh sản phẩm.

Gọi P“(M x M) là tông trọng số các đường đi có độ dài L từ đỉnh x € P đến đỉnh

y € P trên đồ thị G(x = 1,2, ,M; y = 1,2, , M) Do G là đồ thị hai phía, nên đường đi từ đỉnh sản pham x đến đỉnh sản phẩm y trên đồ thị luôn có độ dài L chan Vi tổng trọng số mỗi đường đi độ dài L được tính băng tích của trọng số trên các cạnh nên tổng trọng số các

đường đi độ dài L từ đỉnh sản phẩm đến đỉnh sản phẩm trên đồ thị G được xác định theo

Trang 8

Bước 1 Tính toán mức độ tương tự giữa các cặp sản phẩm: L =2; //Thiét lập độ dài đường đi ban đầu

Bước 2 Xác định tập láng giéng cho sản phẩm x € P - Sắp xếp pk, # 0 theo thứ tự giảm dan (x # y).

- Chọn K sản phẩm y € P đầu tiên làm tập láng giéng của sản phẩm x (Ký hiệu tập

Bước 4: Chọn K sản phẩm có mức độ tương tự cao nhất tư van cho sản phẩm i.

Hình 1.3 Thuật toán ItemBased dựa trên đồ thị.

1.5 Hợp nhất phương pháp ItemBased và UserBased dựa trên vào đồ thị

Phương pháp Unify-Graph dự đoán mức độ phù hợp của sản phẩm đối với mỗi người dùng bang cách tìm kiếm tat cả các đường đi từ đỉnh người dùng đến đỉnh sản phẩm trên đồ

thi Đường đi từ đỉnh ¡€ U đến đỉnh x € P có độ dài L=l chính là ma trận trong số W(N xM) Tổng trọng số các đường di từ đỉnh đỉnh i € U đến đỉnh x € P có độ dài L

=3,5,7 được xác định theo công thức (1.4):

Trang 9

- Ma trận trọng số C là biểu diễn đồ thị G =<V,E> cho lọc cộng tác -i € U là người dùng cần được tư van

- Klà số lượng sản phẩm cần được tư vấn Đầu ra:

- Dự đoán x: 7; | x € P\P; (quan điểm của người dùng i đối với sản phẩm mới x €

Các bước tiến hành:

Bước 1.7ính toán mức độ phù hợp giữa các cặp người dùng — sản phẩm:

L=1;//Thiết lập độ dài đường đi ban đầu

Bước 2 Sắp xếp w}, theo thứ tự giảm dan.

Bước 3 Chọn K sản phẩm x € P đầu tiên tư van cho người dùng i € U

Hình 1.4 Thuật toán hợp nhất dựa trên đồ thị.

1.6 Kết luận chương 1

Trong chương này, luận văn đã trình bày phương pháp tư vấn cộng tác dựa vào người

dùng và phương pháp tư vấn cộng tác dựa vào sản phẩm Trên cơ sở hai phương pháp cơ bản của lọc cộng tác dựa vào bộ nhớ, em tiễn hành xây dựng các thuật toán tương ứng dựa

trên biểu diễn đồ thị trọng số.Cách tiếp cận này sẽ hạn chế được ảnh hưởng được vẫn đề dữ

liệu thưa của lọc cộng tác.

Trang 10

CHƯƠNG 2 HE TƯ VAN LAI DUA TREN MÔ HÌNH DO THỊ

Chương 2 kết hợp cả hai phương pháp lại lọc cộng tác và lọc nội dung với nhau để tận dụng được những ưu điểm của cả hai phương pháp sẽ góp phần cải thiện chất lượng dự đoán Trong chương này, luận văn sẽ trình bày mô hình kết hợp giữa lọc cộng tác và lọc nội dung dựa trên mô hình đồ thị Trong chương này, luận văn sẽ trình bày mô hình kết hợp

giữa lọc cộng tác và lọc nội dung dựa trên mô hình đồ thị Nội dung chương bao gồm: e Phát biểu bài toán cho hệ tư vẫn lai

e Biểu diễn đồ thị cho hệ tư van lai

e Phương pháp Hybrid-User-Based cho hệ tư van lai

e_ Phương pháp Hybrid-Item-Based cho hệ tư van lai e Phương pháp hợp nhất dựa vào đồ thị

e Kết luận chương 2

2.1 Phát biểu bài toán cho hệ tư van lai

Cho một tập hợp hữu hạn U = {u¿,1;, ,u„} là tập gồm N người dùng, P = {D1 Pa, - , pụ} là tập gồm M sản phẩm Mỗi sản phẩm p„ € P có thé là hàng hóa, phim,

ảnh, tạp chí, tài lệu, sách, báo, dịch vụ hoặc bất kỳ dạng thông tin nào mà người dùng cần

đến Mối quan hệ giữa tập người dùng U và tập sản phẩm P được biểu diễn thông qua ma trận đánh giá R = {r;„,í = 1 N,x = 1 M} Giá trị r,„ thé hiện đánh giá của người dùng u; € U cho một số sản phẩm p, € P Thông thường giá trị r„„ nhận một giá trị thuộc miền R = {1,2, , g} được thu thập trực tiếp bằng cách hỏi ý kiến người dùng hoặc thu thập gián tiếp thông qua cơ chế phản hồi của người dùng Giá trị r;„ = Ø được hiểu người dùng u;

chưa đánh giá hoặc chưa bao giờ biết đến sản phẩm p, Ma trận đánh giá của các hệ thống

tư vấn thực tế thường rất thưa Mật độ các giá tri r„z0 nhỏ hơn 1%, hầu hết các giá tri Ny còn lại là @ Ma trận R chính là đầu vào của các hệ thống tư vẫn cộng tác Đề thuận tiện trong trình bày, ta viết ø„ € P ngắn gon lax € P; và u; € U là i € U Các ký tự i,j luôn được dùng dé chỉ tập người dùng trong các mục tiếp theo của luận văn

Mỗi sản phẩm x€P được biểu diễn thông qua |C|đặc trưng nội dung C =

{cu C2, , cic}: Các đặc trưng c, € C nhận được từ các phương pháp trích chon đặc trưng

(feature selection) trong lĩnh vực truy vấn thông tin Ví dụ x € P là một phim thì các đặc

Trang 11

trưng nội dung biểu diễn một phim có thé là C = {thé loại phim, nước sản xuất, hãng phim, diễn viên, đạo diễn } Gọi wy = {Wx,W;¿, « Wzlel} là vector trọng số các giá trị đặc

trưng nội dung sản phẩm x € P Khi đó, ma trận trọng số W = {w,,:x = 1,2 M,s = 1,2 |C|} chính là đầu vào của các hệ thống tư van theo nội dung sản phâm Dé thuận tiện trong trình bày, ta viết c, € C ngắn gọn là s EC Ký tự s luôn được dùng dé chỉ tập đặc trưng nội dung sản phẩm trong các mục tiếp theo của luận văn.

Mỗi người dùng i €U được biểu diễn thông qua |T| đặc trưng nội dung 7 =

{t,, tz, , tyr) } Các đặc trưng ty € T thông thường là thông tin cá nhân của mỗi người dùng

(Demographic Information) Ví dụ i € U là một người dùng thì các đặc trưng nội dung biểu diễn người dùng i có thé là 7 = {giới tính, độ tuổi, nghề nghiệp, trình độ, } Gọi 10 = {Pin Địa, Mi! là vector trọng số biểu diễn các giá trị đặc trưng nội dung người dùng ¡€U Khi đó, ma trận trọng số ƒ = {vigit = 1/2 N; q = 1,2 ,|T|} chính là đầu vào của các hệ thống tư vấn theo nội dung thông tin người dùng Để thuận tiện trong trình bày, ta viết tạ €T ngắn gọn là q ET Ký tự q luôn được dùng dé chỉ tập đặc trưng nội dung người dùng trong các mục tiếp theo của luận văn.

Tiếp đến ta ký hiệu, P, G P là tập các sản phẩm x € P được đánh giá bởi người dùng ¡ €U và U, G U là tập các người dùng i € U đã đánh giá sản pham x € P Với một người

dùng cần được tư van i € U (được gọi là người dùng hiện thời, người dùng cần được tư vấn,

hay người dùng tích cực), nhiệm vụ của các phương pháp tư vấn là gợi ý K sản phẩm

x €(P\P,) phù hợp nhất đối với người dùng i.

Có nhiều đề xuất khác nhau dé giải quyết bài toán tư van Tuy vậy, ta có thé chia các cách tiếp cận thành ba xu hướng chính: tư vấn theo nội dung, tư vẫn cộng tác, và tư van kết

hợp (còn được gọi là phương pháp lai) Hệ tư van theo nội dung đưa ra các phương pháp dự

đoán dựa trên ma trận trọng số các đặc trưng nội dung sản phẩm W = {w;,} hoặc ma trận

trọng số các đặc trưng nội dung người dùng V = {Vig} Hệ tư vẫn cộng tác đưa ra các phương pháp dự đoán dựa trên ma trận đánh giá R = {z;„} Hệ tư van lai đưa ra các phương

pháp dự đoán dựa trên cả 3 ma trận R, W và V.

Trong dé tài này, em đề xuất một mô hình hợp nhất giữa lọc cộng tác và lọc nội dung dựa trên biểu diễn đồ thị Mô hình được xây dựng băng cách lấy lọc cộng tác làm trung tâm, xây dựng hồ sơ người dùng dựa trên ma trận đánh giá dé thiết lập nên mối quan hệ trực tiếp

Trang 12

giữa tập người dùng với tập đặc trưng nội dung sản phẩm Tiếp đến, em tiến hành xây dựng hồ sơ sản phẩm cũng dựa trên ma trận đánh giá dé thiết lập nên mối quan hệ trực tiếp giữa tập sản phẩm và tập đặc trưng nội dung người dùng Dựa trên mối quan hệ giữa tập người dùng với tập đặc trưng nội dung sản phẩm và mối quan hệ giữa tập sản phẩm với tập đặc trưng nội dung người dùng, em tìm cách xác định mối quan hệ tiềm ân giữa tập đặc trưng

sản phẩm và tập đặc trưng người dùng Bằng cách này, ta thu gọn được mô hình tư van kết

hợp tổng quát thành mô hình tư van cộng tác thuần túy 2.2 Biễu diễn đồ thị cho hệ tư vấn lai

Đề giải quyết bài toán tư vấn tông quát được phát biéu trong Mục 2.1 bằng mô hình

đồ thị ta cần giải quyết hai vấn đề: biểu diễn đồ thị cho bài toán tư vấn kết hợp và phương

pháp dự đoán trên đồ thị kết hợp Trong mục này, đồ án trình bày phương pháp biểu diễn đồ thị cho bài toán tư van kết hợp.

2.2.1 Mô hình dé thị tong quát

Không hạn chế tính tổng quát của bài toán phát biểu trong Mục 2.1, ta giả thiết giá trị

đánh giá của người dùng icU đối với sản pham xe? được xác định theo công thức (2.1) Mỗi sản phẩm xeP được biểu diễn thông qua IC| đặc trưng nội dung C = {c¡, ca„ ,cc¡} được xác định theo công thức (2.2) Mỗi người dùng ¿eU được biểu diễn thông qua I7| đặc trưng

nội dung T= {í¡, fs, , tr} được xác định theo công thức (2.3).

r ={° néu người dùng i đánh giá SP x ở mức độ 0 (0 € F) (2.1)

* Ìj_ nếu người dùng i chưa đánh giá hoặc chưa biết đến SP x ,

c= {i néu san phẩm x có đặc trưng s (2.2)

*s |0 néu sản phẩm x không có đặc trưng s ‘

t= {i néu người ding i có đặc trưng q (23)

4ˆ L0 nếu người dùng ¡ không có đặc trưng q :

Hệ tư vấn với ma trận đánh giá R = {r„:í = 1 N,x = 1 M}, ma trận đặc trưng

nội dung sản phẩm C ={cy;:x = 1,2, ,M; s = 1,2, , |C|} ma trận đặc trưng nội dung người dùng T = {tjg:i = 1,2, ,N; s =1,2, ,|T|} có thể biểu diễn dưới dạng đồ thị trọng số G = (2, E), trong đó Q1a tập đỉnh và E là tập cạnh Tập đỉnh 2 của đồ thị được xác định theo công thức (2.4) chính là hợp của tập người dùng U, tập sản phẩm P, tập đặc trưng

Trang 13

nội dung sản phẩm C va tập đặc trưng nội dung người dùng T Tập cạnh E của đồ thị bao gồm 3 loại cạnh: cạnh (i, x) nói giữa đỉnh người dùng với đỉnh sản phẩm, cạnh (x,s) nối đỉnh sản phẩm với đặc trưng nội dung sản phẩm, cạnh (i,q) nối giữa đỉnh người dùng với

đỉnh đặc trưng nội dung của người dùng.

Q=UUPUCUT (2.4)

e=(i,x) néur, #0: ieU,xeP

e=(i,q) néut #0:ieU,qeT

Dựa trên biểu diễn đồ thị, phương pháp tư vẫn cộng tác được thực hiện dựa trên các cạnh nối giữa đỉnh người dùng i € U và đỉnh sản phẩm x € P với trọng số ?;„ Phương pháp

tư vấn theo nội dung sản phẩm được thực hiện trên các cạnh nối giữa đỉnh sản phẩm xEP

và đỉnh đặc trưng nội dung sản pham s € C Phương pháp tư vấn theo nội dung người dùng được thực hiện trên các cạnh nối giữa đỉnh người dùng i € U và đỉnh đặc trưng nội dung người dùng £ € T Phương pháp tư van kết hợp được thực hiện dựa trên cả ba loại cạnh

(i, x) (x,s)va (i, q)

2.2.2 Xây dựng hô sơ người dùng dựa trên ma trận đánh giá

Dé xây dựng được hồ sơ sử dụng sản phẩm của người dùng ta cần thực hiện hai nhiệm vụ: xác định được tập các sản phẩm người dùng đã từng truy cập hay sử dụng trong quá khứ và ước lượng trọng số mỗi đặc trưng nội dung sản phẩm trong hồ sơ người dùng Gọi P, G P được xác định theo công thức (2.6) là tập sản phẩm người dùng i € U đã đánh giá các sản phẩm x € P Khi đó, P; chính là tập sản phâm người dùng đã từng truy cập trong

quá khứ được các phương pháp tư vấn theo nội dung sử dụng trong khi xây dựng hồ sơ

Ngày đăng: 08/04/2024, 00:50

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w