Kết quả thử nghiệm trên tập dữ liệu inees

Một phần của tài liệu Khai phá dữ liệu tuần tự để dự đoán hành vi truy cập web tt (Trang 34 - 35)

10 Truy cập www.inees.org ngày 25/8/

4.5.2.5. Kết quả thử nghiệm trên tập dữ liệu inees

Kiểm định thời gian thực thi dự đoán, độ đo Accuracy sử dụng phương pháp kiểm định Paired T-Test với từng chuỗi dự đoán với độ tin cậy 99% trên tập dữ liệu inees. Kết quả thử nghiệm cho thấy thời gian giải pháp cải tiến chạy nhanh hơn gần 2 lần. Như vậy, giải pháp tích hợp phân tích chuỗi dữ liệu dự đoán vào CPT+ đã hiệu quả hơn về thời gian thực thi so với phương pháp dự đoán chỉ dùng CPT+ (không tích hợp phân tích chuỗi dự đoán). Các kết quả thực nghiệm cũng chỉ ra rằng dự đoán trên dữ liệu trên các tập dữ liệu click-stream cho thấy hiệu quả về thời gian hơn so với các tập dữ liệu được thu thập từ Web log.

4.6. Kết luận chương 4

Chương này đã trình bày đề xuất một giải pháp để nâng cao hiệu quả về thời gian thực thi dự đoán. Cụ thể là dự đoán các liên kết truy cập kế tiếp của các chuỗi tuần tự các liên kết truy cập tuần tự. Nghiên cứu sinh đã thử nghiệm giải pháp dự đoán chuỗi tuần tự cải tiến bằng cách tích hợp phương pháp phân tích chuỗi dự đoán với phương pháp CPT+: Bằng cách thức này, các chuỗi tuần tự dư thừa, không có ý nghĩa cho dự đoán bị loại bỏ, điều này cũng làm giảm kích cỡ không gian dự đoán của cơ sở dữ liệu tuần để dự đoán được hiệu quả hơn. Nghiên cứu sinh đã thử nghiệm trên 3 tập dữ liệu click-stream khác nhau, 2 tập dữ liệu thu thập từ Weblog và thu được các kết quả hiệu năng thời gian của các tập dữ liệu click-stream tốt hơn so với các tập dữ liệu Weblog khi dùng phương pháp phân tích chuỗi dự đoán. Bên cạnh đó, hai công trình liên quan đến luận án cũng đã được xuất bản [CT1, CT4].

Một phần của tài liệu Khai phá dữ liệu tuần tự để dự đoán hành vi truy cập web tt (Trang 34 - 35)