Khai phá sở thích cá nhân hóa

Một phần của tài liệu THUẬT TOÁN xếp HẠNG địa điểm TRONG các ỨNG DỤNG DỊCH vụ dựa TRÊN địa điểm (LBS) có CHÚ ý tới đặc điểm RIÊNG NGƯỜI DÙNG (Trang 49 - 52)

Trên thực tế hay trên các mạng xã hội người dùng thường có nhiều sở thích khác nhau (thích mua sắm, thích đi du lịch, thích ăn uống…). Vì thế sở thích của người dùng sẽ được biểu diễn theo nhiều sở thích, và các sợ thích này có thể được biểu diễn theo sự phân cấp.

Đối với các mạng xã hội dựa trên địa điểm, người dùng thường có xu hướng đi nhiều địa điểm bởi người dùng thường có nhiều nhu cầu khác nhau như ăn uống, mua sắm, giải trí.

Trong luận văn này, tôi biểu diễn sở thích hay sự quan tâm của người dùng dựa trên các thể loại của các địa điểm mà người dùng tới thăm. Do mỗi người dùng có nhiều sở thích vì thế mỗi sở thích của từng người dùng sẽ được biểu diễn phân cấp thể loại (category). Tôi sử dụng ý tưởng từ công thức tính TF-IDF cho từng từ trong văn bản để tính trong số sở thích của mỗi user với từng thể loại. Trong đó, coi lịch sử tới thăm các

50

vị trí của người dùng tương ứng với một văn bản (document) và các thể loại được coi như là các terms trong một văn bản.

Công thức tính TF-IDF của một user u với một thể loại c’ gồm 2 phần [1]:

 Tính giá trị TF của thể loại c trong lịch sử thăm các vị trí của người dùng u.  Tình giá trị IDF của thể loại

(3.9) Trong đó:

 |{u.vi:vi.c=c’}| là số lượt tới thăm của người dùng u trong thể loại c’  U.ⱱ là tổng số lượt thăm của người dùng u

 |{u,:c’ € uj.C}|| tổng số người dùng đã thăm địa điểm có thể loại c’ trong toàn bộ user của hệ thống.

 𝒰: đây là tổng số lượng người dùng của hệ thống

Kết quả sau khi tính toán là sở thích của người dùng dược biểu diễn dưới dạng một cây phân cấp.

51

3.2.3.3 Thuật toán lựa chọn ứng viên dựa trên sở thích

Do số lượng các địa điểm rất lớn, ở mỗi nhóm địa điểm sẽ có những người dùng có sự hiểu biết cao về các địa điểm đó. Do đó chúng ta cần xác định những chuyên gia này cũng như xác định được những vị trí tiềm năng mà người dùng có thể thích.

Trong thành phần này, tôi sẽ giới thiệu thuật toán lựa chọn một tập người dùng chuyên gia (local experts) và các địa điểm tiềm năng trong khoảng địa lý đặc biệt của người dùng.

Mô tả các bước thực hiện thuật toán [1]:

 Dòng 1, 2: Tìm tất cả các đại điểm V’ trong khoảng địa lý và những người dùng U đã thăm các vị trí này.

 Dòng 4, 5: Thuật toán sẽ xử lý từ cấp độ thấp nhất của cây phân cấp sở thích của người dùng. Ở mỗi cấp độ này, chúng ta sẽ lấy trọng số nhỏ nhất của sở thích người dùng.

 Bước 7, 8: Tính số lượng người dùng cho mỗi thể loại c và tính số lượng người dùng có chuyên môn cao dựa trên thuật toán HITS.

 Từ tập người dùng lựa chọn ở trên, chúng ra có thể đưa ra danh sách các chuyên gia có sự hiểu biết về các địa điểm trong khoảng địa lý này và các địa điểm tiềm năng mà người dùng có thể tới.

52

Thuật toán lựa chọn các ứng viên dựa trên sở thích

Một phần của tài liệu THUẬT TOÁN xếp HẠNG địa điểm TRONG các ỨNG DỤNG DỊCH vụ dựa TRÊN địa điểm (LBS) có CHÚ ý tới đặc điểm RIÊNG NGƯỜI DÙNG (Trang 49 - 52)