p1 p2 p3 p4 p5
u1 5 2 4 4
u2 4 5 3
u3 4 5 2 3
u4 5 3 4 ? ?
Mỗi ví dụ huấn luyện đƣợc biểu diễn dƣới dạng một véc tơ đặc trƣng. Mỗi đặc trƣng tƣơng ứng với một ngƣời dùng khác ngƣời dùng cần dự đoán (ngƣời dùng u1, u2, u3). Giá trị khác rỗng của ma trận đánh giá là giá trị các đặc trƣng (ví dụ r1,1, r1,2, r2,3, r2,4 là các giá trị đặc trƣng ứng với ngƣời dùng u1, u2). Nhãn phân loại cho các ví dụ huấn luyện là những đánh giá khác của ngƣời dùng hiện thời (ví dụ r4,1, r42, r4,3 là các nhãn phân loại cho ngƣời dùng u4).
Một vấn đề đặt ra trong biểu diễn này là nhiều giá trị đặc trƣng có giá trị rỗng (rij =) chƣa đƣợc điền giá trị (ví dụ r1,3, r2,1). Để khắc phục điều này, ta chỉ cần thực hiện một biến đổi đơn giản đƣa ma trận đánh giá R = { rij | rij = , 1, 2,..,V} thành ma trận R = { rij | rij = -1, 0, 1 }. Trong đó, các giá trị rij> đƣợc biến đổi thành +1; các giá trị rij đƣợc biến đổi thành -1; rij = đƣợc biến đổi thành 0; là một giá trị ngƣỡng đƣợc xác định tùy thuộc vào tập dữ liệu kiểm nghiệm. Ở đây, giá trị rij = 1 biểu diễn nguời dùng ui ―thích‖ sản phẩm pj, rij=-1 biểu diễn nguời dùng ui ―không thích‖ sản phẩm pj, rij = 0 biểu diễn nguời dùng
ui chƣa đánh giá hoặc chƣa bao giờ biết đến sản phẩm pj.
Ví dụ với ma trận đánh giá đƣợc cho trong Bảng 2.2, ma trận đầu vào cho các bài toán phân loại đƣợc chuyển đổi thành ma trận trong Bảng 2.3. Các giá trị
rij > 3 đƣợc chuyển đổi thành +1, các giá trị rij3 đƣợc chuyển đổi thành -1, những giá trị còn lại đƣợc điền là giá trị 0.