6. Cấu trúc của đề tài
3.1. Tổng quan về bài toán khuyến nghị
3.1.2. Phát biểu bài toán hệ thống khuyến nghị
Cho hai tập hữu hạn gồm M người dùng 𝑈 = {𝑢1, 𝑢2, … , 𝑢𝑀} và N đối
tượng 𝑉 = {𝑣1, 𝑣2, … , 𝑣𝑁}.
Mỗi người dùng 𝑢𝑖 ∈ 𝑈 (với i = 1, 2, …, M) được biểu diễn thông qua |𝐶|
đặc trưng nội dung 𝐶 = {𝑐1, 𝑐2, … , 𝑐|𝐶|}. Các đặc trưng 𝑐𝑡 ∈ 𝐶 thường là các thông
tin đặc điểm liên quan cá nhân mỗi người dùng. Ví dụ 𝑢𝑖 ∈ 𝑈 là một người dùng
thì các đặc trưng nội dung biểu diễn người dùng 𝑢𝑖 có thể là 𝐶 = {𝑔𝑖ớ𝑖 𝑡í𝑛ℎ, độ 𝑡𝑢ổ𝑖, 𝑛𝑔ℎề 𝑛𝑔ℎ𝑖ệ𝑝 … }.
Mỗi đối tượng 𝑣𝑗 ∈ 𝑉 (với j = 1, 2, …, N) có thể là hàng hóa, phim ảnh,
sách báo, tin tức hoặc bất kỳ dạng thông tin nào mà người dùng sử dụng, được biểu diễn thông qua |𝑇| đặc trưng nội dung 𝑃 = {𝑝1, 𝑝2, … , 𝑝|𝑇|}. Các đặc trưng 𝑝𝑞 ∈ 𝑃
nhận được từ các phương pháp trích chọn đặc trưng trong lĩnh vực truy vấn thơng tin. Ví dụ 𝑣𝑗 ∈ 𝑉 là một bài nhạc thì các đặc trưng nội dung biểu diễn 𝑣𝑗 có thể là
Mối quan hệ giữa tập người dùng U và tập đối tượng V được biểu diễn thông qua ma trận đánh giá 𝑅 = [𝑟𝑖𝑗] với i = 1, 2, …, M và j = 1, 2, …, N.
Đối tượng 1 2 … j … N Ng ườ i d ù n g 1 5 3 4 2 4 3 2 3 2 5 0 2 3 … 2 1 3 1 4 1 i 0 1 3 1 2 4 … 1 4 4 3 3 2 M 2 0 4 3 5 3 x 3 2 4 ? 4 2 Hình 3.2. Ví dụ một ma trận đánh giá tổng quát
Giá trị 𝑟𝑖𝑗 thể hiện đánh giá của người dùng 𝑢𝑖 ∈ 𝑈 cho đối tượng 𝑣𝑗 ∈ 𝑉.
Thông thường giá trị 𝑟𝑖𝑗 được thu thập trực tiếp bằng cách hỏi ý kiến người dùng hoặc thu thập gián tiếp thông qua cơ chế phản hồi của người dùng. Những giá trị
𝑟𝑖𝑗 = 0 được hiểu là người dùng chưa biết đến hoặc không đánh giá đối tượng,
những giá trị chưa biết là giá trị cần hệ thống khuyến nghị đưa ra dự đoán đánh giá. Gọi 𝑢𝑥 là người dùng cần được tư vấn, khi đó có hai bài tốn điển hình của hệ thống khuyến nghị là:
- Dự đoán đánh giá của người dùng 𝑢𝑥 với các đối tượng chưa có đánh giá trước đó.
- Đưa ra một danh sách ngắn các đối tượng được dự đoán là phù hợp nhất với người dùng cần được tư vấn.