4. Bố cục của luận án
1.3.1. Bài toán lọc cộng tác
Ký hiệu U = {u1, u2,…, uN} là tập gồm N ngƣời dùng, P = {p1, p2,.., pM} là tập gồm M sản phẩm mà ngƣời dùng có thể lựa chọn. Mỗi sản phẩm piP có
thể là hàng hóa, phim, ảnh, tạp chí, tài liệu, sách, báo, dịch vụ hoặc bất kỳ dạng thông tin nào mà ngƣời dùng cần đến.
Tiếp theo, ký hiệu R={ rij }, i = 1..N, j = 1..M là ma trận đánh giá, trong đó mỗi ngƣời dùng uiU đƣa ra đánh giá của mình cho một số sản phẩm pjP
bằng một số rij. Giá trị rij phản ánh mức độ ƣa thích của ngƣời dùng ui đối với sản phẩm pj. Giá trị rij có thể đƣợc thu thập trực tiếp bằng cách hỏi ý kiến ngƣời dùng hoặc thu thập gián tiếp thông qua cơ chế phản hồi của ngƣời dùng. Giá trị
rij = trong trƣờng hợp ngƣời dùng ui chƣa đánh giá hoặc chƣa bao giờ biết đến sản phẩm pj.
Với một ngƣời dùng cần đƣợc tƣ vấn ua (đƣợc gọi là ngƣời dùng hiện thời, ngƣời dùng cần đƣợc tƣ vấn, hay ngƣời dùng tích cực), bài toán lọc cộng
tác là bài toán dự đoán đánh giá của ua đối với những mặt hàng mà ua chƣa đánh giá (raj = ), trên cơ sở đó tƣ vấn cho ua những sản phẩm đƣợc đánh giá cao.
Bảng 1.2 thể hiện một ví dụ với ma trận đánh giá R = (rij) trong hệ gồm 5 ngƣời dùng U = {u1, u2, u3, u4, u5} và 4 sản phẩm P = {p1, p2, p3, p4 }. Mỗi ngƣời dùng đều đƣa ra các đánh giá của mình về các sản phẩm theo thang bậc {, 1, 2, 3, 4, 5}. Giá trị rij= đƣợc hiểu là ngƣời dùng ui chƣa đánh giá hoặc chƣa bao giờ biết đến sản phẩm pj. Các giá trị r5,2 =? là sản phẩm hệ thống cần dự đoán cho ngƣời dùng u5. Bảng 1.2. Ví dụ về ma trận đánh giá của lọc cộng tác p1 p2 p3 p4 u1 2 1 3 5 u2 4 2 1 u3 3 2 4 u4 4 4 u5 4 ? 5 5 Hình 1.2. Các thành phần của hệ thống lọc cộng tác
Ma trận đánh giá R = (rij) là thông tin đầu vào duy nhất của các phƣơng pháp lọc cộng tác. Dựa trên ma trận đánh giá, các phƣơng pháp lọc cộng tác thực hiện hai tác vụ: Dự đoán quan điểm của ngƣời dùng hiện thời (Active User) về các sản phẩm mà họ chƣa đánh giá, đồng thời đƣa ra một danh sách các sản phẩm có đánh giá cao nhất phân bổ cho ngƣời dùng hiện thời. Hình 1.2 mô tả các thành phần của hệ thống lọc cộng tác.