Kết quả thực nghiệm cho thấy thuật toán exponential cho kết quả tốt nhất nhưng sự khác biệt giữa các thuật toán là không lớn.
b. Thực nghiệm 9: Đánh giá độc lập với tập train và test khác nhau
Trong thực nghiệm này luận văn cũng đánh giá thuật toán để xây dựng mô hình hồi quy có trọng số địa lý theo tháng. Nhưng dữ liệu để train và test khác nhau. Hai
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 2 3 4 5 6 7 8 9 10 11 12 R2 gaussian exponential
phần ba dữ liệu là tập train và một phần ba dữ liệu còn lại là tập test. Dữ liệu được chia một cách ngẫy nhiên. Sử dụng các thông số thống kê (R2, RMSE, RE) để đánh giá. Trong thực nghiệm này thuật toán bisquare và tricube chỉ xây dựng được mô hình cho 1/12 tháng. Thuật toán boxcar xây dựng được mô hình cho 3/12 tháng. Thuật toán gaussian và exponential xây dựng được mô hình cho 9/12 tháng. Không thuật toán nào xây dựng được mô hình cho cả 12 tháng.
Bảng 26 thể hiện chỉ số tương quan R2 của các thuật toán xây dựng cho những tháng khác nhau. Giá trị NA là giá trị các tháng mô hình hồi quy không xây dựng được.
Tháng gaussian exponential bisquare tricube boxcar 1 0.800 0.808 NA NA NA 2 0.554 0.552 NA NA NA 3 NA NA NA NA NA 4 0.467 0.500 NA NA NA 5 0.694 0.701 NA NA NA 6 0.901 0.898 NA NA NA 7 0.334 0.321 NA NA NA 8 NA NA NA NA NA 9 0.807 0.806 NA NA 0.808 10 0.775 0.775 0.812 0.813 0.780 11 0.704 0.707 NA NA NA 12 NA NA NA NA NA
Bảng 24: Chỉ số R2của các thuật toán trong TN9
Qua cả 2 thực nghiệm 8 và thực nghiệm 9 ta thấy việc xây dựng mô hình cần một lượng dữ liệu nhất định. Các thuật toán yêu cầu lượng dữ liệu khác nhau.
4.3.2.2 Đánh giá và so sánh mô hình hồi quy tuyến tính và mô hình hồi quy địa lý quy địa lý
a. Thực nghiệm 10: Đánh giá trên tập train
Trong thực nghiệm nay mô hình hồi quy tuyến tính và mô hình hồi quy địa lý sử dụng thuật toán exponential sẽ được xây dựng theo tháng. Sử dụng toàn bộ dữ liệu
là tập train và đánh giá mô hình trên chính tập train. Sử dụng các thông số thống kê (R2, RMSE, RE) để đánh giá:
Hình 35 biểu diễn đồ thị chỉ số tương quan R2 giữa mô hình hồi quy tuyến tính và mô hình hồi quy địa lý. Đường màu xanh biểu diễn chỉ số tương quan R2 của mô hình hồi quy tuyến tính, đường màu cam của mô hình hồi quy địa lý. Có thể thấy mô hình hồi quy địa lý có kết quả tốt hơn trong tất cả các tháng.