6. Cấu trúc của đề tài
3.2. Các phương pháp và độ đo đánh giá hệ thống khuyến nghị
3.2.2. Đánh giá độ chính xác của dự đốn
3.2.2.1. Sai số tuyệt đối trung bình (MAE)
Một độ đo phổ biến nhất được sử dụng đánh giá sai số giữa giá trị đánh giá dự đoán và giá trị đánh giá thực tế trong hệ khuyến nghị là độ đo Sai số tuyệt đối trung bình (Mean Absolute Error – MAE).
Sai số dự đoán 𝑀𝐴𝐸𝑢 với mỗi người dùng 𝑢 thuộc tập kiểm tra 𝑅𝑡𝑒𝑠𝑡 được tính bằng trung bình cộng của sai số tuyệt đối giữa giá trị dự đoán và giá trị thực của đánh giá của người dùng 𝑢 đối với tất cả các đối tượng đã được người dùng 𝑢 đánh giá trong tập kiểm tra.
𝑀𝐴𝐸𝑢 = 1
𝑛∑ |𝑟̂𝑢
𝑖− 𝑟𝑢𝑖|
𝑛
𝑖=1 (3.2)
với n là số đối tượng được đánh giá của người dùng u, 𝑟̂𝑢𝑖 và 𝑟𝑢𝑖 lần lượt là dự đoán và đánh giá thực của người dùng u đối với đối tượng i trong tập kiểm tra 𝑅𝑡𝑒𝑠𝑡.
Sai số dự đốn trên tồn tập dữ liệu kiểm tra được tính bằng trung bình cộng sai số dự đoán cho mỗi người dùng thuộc𝑅𝑡𝑒𝑠𝑡.
𝑀𝐴𝐸 =∑𝑢∈𝑅𝑡𝑒𝑠𝑡𝑀𝐴𝐸𝑢
|𝑈𝑢∈𝑅𝑡𝑒𝑠𝑡| (3.2)
3.2.2.2. Sai số bình phương trung bình dưới căn (RMSE)
Một độ đo thông dụng khác cũng được sử dụng để đánh giá giá trị dự đốn là bình phương trung bình lỗi lấy căn (Root Mean Square Error – RMSE). RMSE được tính bằng căn bậc hai của trung bình bình phương giữa giá trị thực và giá trị dự đoán. 𝑅𝑀𝑆𝐸𝑢 = √1 𝑛∑ (𝑟̂𝑢 𝑖− 𝑟𝑢 𝑖)2 𝑛 𝑖=1 (3.3) 𝑅𝑀𝑆𝐸 = ∑𝑢∈𝑅𝑡𝑒𝑠𝑡𝑅𝑀𝑆𝐸𝑢 |𝑈𝑢∈𝑅𝑡𝑒𝑠𝑡| (3.4)
Độ đo RMSE rất nhạy với những hệ thống có sai số lớn, ví dụ xét một tập có bốn đối tượng cần được dự đốn, thì RMSE sẽ đánh giá tốt hệ thống có giá trị sai số là 2 cho ba đối tượng và 0 cho đối tượng thứ tư, trong khi MAE sẽ cho ra kết quả tốt với hệ thống có giá trị sai số là 3 với một dự đoán và sai số là 0 cho ba dự đốn cịn lại.
Giá trị MAE, RMSE càng nhỏ chứng tỏ hệ thống khuyến nghị đã đưa ra những dự đốn càng chính xác.