Biểu diễn hồ sơ ngƣời dùng

Một phần của tài liệu Hệ gợi ý (Trang 50 - 52)

3.2.2.1. Xây dựng hồ sơ ngƣời dùng động (Dynamic profile).

Hồ sơ động đại diện cho những ngƣời cĩ sở thích thay đ i theo thời gian, một hồ sơ động đƣợc tính nhƣ sau:

= ∑ (3-7)

Ở đây:

 là số lƣợng bài báo đọc trong ngày.

 là vector đặc trƣng của tài liệu (bài báo).

 là hệ số tốn học theo thời gian. = λ , ti là hiệu khoảng cách giữa thời gian đọc bài cho đến ngày hiện tại (tính theo số ngày).

 là số ngày khảo sát.

Hồ sơ động đƣợc biểu diễn thơng qua các bài báo mà đã đƣợc biểu diễn nội dung nhƣ phần trên. Để biểu diễn đƣợc hồ sơ ngƣời dùng chúng ta lƣu lại tất cả lịch sử thao tác (đánh giá) của ngƣời dùng. Đồng thời phƣơng pháp biểu diễn này cũng chú trọng đến yếu tố thời gian vì tin tức cĩ tính thời gian (giá trị tin tức sẽ bị giảm dần theo thời gian).

3.2.2.2. Xây dựng hồ sơ ngƣời dùng tĩnh (Static profile).

Hồ sơ tĩnh đại diện cho những ngƣời dùng cĩ sở thích khơng ảnh hƣởng bởi thời gian. Một hồ sơ ngƣời dùng tĩnh đƣợc định nghĩa nhƣ sau:

= ∑

(3-8)

Ở đây:

 là số lƣợng bài báo đọc trong ngày.

 là vector đặc trƣng biểu diễn tài liệu (bài báo).

50

Học viên thực hiện: Nguyễn Văn Thịnh CB130460 Khĩa 2013B Lớp CNTT1

Vời cách biểu diễn hồ sơ tĩnh thì cũng cần cĩ lịch sử thao tác (các đánh giá) của ngƣời dùng để gợi ý cho ngƣời dùng. Khác phƣơng pháp hồ sơ động thì phƣơng pháp này khơng xét theo yếu tố thời gian, thay vào đĩ chỉ là t ng của tất cả bài báo (đã đƣợc biểu diễn nội dung theo các phần ở trên) và chia cho số ngày mà chúng ta khảo sát.

Ví dụ: với ngƣời dùng a đã đọc những bài báo C, D trong 2 ngày. Giả sử những bài báo này đƣợc biểu diễn theo phƣơng pháp trọng số tf-idf cĩ vector đặc trƣng nhƣ sau:

 C = (c1, c2, …, cn) với n t ng số từ khác nhau trong bài báo C, ci là trọng số tf-idf của từ i trong bài báo.

 D = (d1, d2, …, dm) ) với m t ng số từ khác nhau trong bài báo D, dj là trọng số tf-idf của từ j trong bài báo.

Từ dữ liệu lịch sử thao tác của ngƣời dùng ta thấy ngƣời dùng đọc 2 bài báo C và D nên ta tiến hành biểu diễn hồ sơ ngƣời dùng a khảo sát trong 2 ngày nhƣ sau:

{ ( ) à ấ 𝑖 à𝑖 á ấ 𝑖 à𝑖 á ấ 𝑖 à𝑖 á ơ ấ 𝑖 à𝑖 á ặ Với:  Từ k trong tập từ điển V

 : trọng số của từ k trong bài báo C

 Trọng số của từ k trong bài báo D

Nhƣ vậy hồ sơ ngƣời dùng a sẽ đƣợc biểu diễn bằng vector đặc trƣng Pa= (p1, p2, …, pv), v kích thƣớc bộ từ điển.

51

Học viên thực hiện: Nguyễn Văn Thịnh CB130460 Khĩa 2013B Lớp CNTT1

Các phƣơng pháp để giới thiệu bài báo cho ngƣời dùng đƣợc thực hiện thơng qua độ tƣơng đồng cosine. Độ tƣơng đồng cosine thể hiện mức độ tƣơng đồng giữa vector đặc trƣng của bài báo và hồ sơ ngƣời dùng cần gợi ý:

similarity ( , ⃗ ) cos ( , ⃗ ) ‖ ‖ ‖ ⃗ ‖ . ⃗ (3-9)

Một phần của tài liệu Hệ gợi ý (Trang 50 - 52)

Tải bản đầy đủ (PDF)

(91 trang)