Chương 5 THỰC NGHIỆM
5.3. Kết quả thực nghiệm và bàn luận
5.3.2. Kết quả thực nghiệm 2: Thống kê theo độ đo MAE cho Amazon
phim
Với bộ dữ liệu 100K của Amazon, kết quả thực nghiệm thể hiện trong bảng 5.3 (theo cả hai tỷ lệ phân chia 50% huấn luyện và 50% kiểm tra cũng như 65% huấn luyện và 35% kiểm tra) cho thấy cách tiếp cận liên lĩnh vực cho sai số theo độ đo MAE thấp hơn so với cách tiếp cận chỉ dựa trên một lĩnh vực. Phương pháp cải tiến của luận văn cũng giúp giảm sai sót trong tư vấn so với phương pháp CRF gốc.
0.345 0.35 0.355 0.36 0.365 0.37 0.375 0.38 Tr50-Ts50 Tr65-Ts35 TV1_sách TV1_phim CRF CRF_cải tiến
Bảng 5. 3. Kết quả thực nghiệm theo độ đo MAE trên Amzon 100K.
Thuật toán Tỉ lệ (huấn luyện: kiểm tra)
50%:50% 65%:35%
Thuật toán tư vấn dựa trên một lĩnh
vực sách 0.341 0.344
Thuật toán tư vấn dựa trên một lĩnh
vực phim 0.335 0.335
Thuật toán tư vấn liên lĩnh vực CRF 0.320 0.319
Thuật toán tư vấn liên lĩnh vực CRF
cải tiến 0.312 0.312
Kết quả thực nghiệm thể hiện ở biểu đồ hình 5.3 cho thấy kết quả tư vấn của các thuật toán dựa trên hai lĩnh vực tốt hơn thuật toán chỉ dựa trên một lĩnh vực theo độ đo MAE. Rõ ràng sự phối hợp cả hai lĩnh vực vẫn cho kết quả tư vấn phù hợp với NSD hơn khi xét trên nhu cầu từng lĩnh vực. Cụ thể, xét về đánh giá trên sách thì cả CRF và CRF cải tiến đều tốt hơn thuật toán tư vấn chỉ trên sách. Kết quả tương tự khi so sánh liên lĩnh vực với đơn lĩnh vực phim (Q2). Đồng thời biểu đồ thực nghiệm trên cũng chỉ ra thuật toán CRF cải tiến được đề xuất trong luận văn cũng nâng cao hiệu quả cho hệ thống tư vấn trên CSDL 100K của Amazon. Như vậy, theo cả hai độ đo RMSE và MAE thuật toán đề xuất đều cho kết quả khả quan (Q3).
Hình 5. 3. Kết quả thực nghiệm theo độ đo MAE.