Trong tiểu mục này, mô hình dự báo FTS-2NT được sử dụng để dự báo nhiệt độ trung bình hàng ngày với toàn bộ dữ liệu lịch sử gồm hai nhân tố về nhiệt độ trung bình và mật độ của mây từ ngày 1/ 06/ 1996 tới ngày 30/09/1996 đã được đưa ra trong Bảng 2.7. Trong đó, “mật độ của mây” được gọi là nhân tố thứ hai, “nhiệt
độ trrung bình” gọi là nhân tố chính (nhân tố dự báo).
Để xác minh tính hiệu quả của mô hình FTS-2NT dựa trên quan hệ mờ bậc cao, bốn mô hình dự báo trong các công trình [ 34, 40, 54, 86] được lựa chọn để so sánh dựa trên tiêu chí MAPE (1.10). Trong quá trình chạy mô hình, số lượng khoảng được thiết lập giống như các mô hình so sánh với 9 khoảng cho nhân tố chính và 7 khoảng cho nhân tố thứ hai. Kết quả so sánh trên từng tháng được thể hiện trong các Bảng 2.25 đến Bảng 2.28. Quan sát kết quả thu được trên từng bậc của mô hình khi dự báo nhiệt độ trung bình hàng ngày từ tháng 6 đến tháng 9 năm 1996 cho thấy mô hình FTS-2NT đưa ra sai số dự báo MAPE nhỏ hơn so với các mô hình so sánh trên các bảng tương ứng. Điều này có thể nhận định, mô hình FTS-2NT hiệu quả hơn so với một số mô hình hiện có dựa trên chuỗi thời gian mờ bậc cao khi áp dụng cho dự báo nhiệt độ hàng ngày từ tháng 6 đến tháng 9 năm 1996 tại Đài Bắc Đài Loan.
Bảng 2.25: So sánh sai số dự báo MAPE trong tháng 6 của mô hình đề xuất với các mô hình trước
Mô hình Bậc của quan hệ
Bậc 2 Bậc 3 Bậc 4 Bậc 5 Bậc 6 Bậc 7 Bậc 8 [86] 2.88% 3.16% 3.24% 3.33% 3.39% 3.53% 3.67% [54] 0.8% 0.76% 0.79% 0.76% 0.79% 0.79% 0.81% α=0.25 0.44% 0.42% 0.42% 0.42% 0.44% 0.40% 0.40% [34] 𝒜 =0.5 0.50% 0.45% 0.42% 0.38% 0.43% 0.39% 0.46% 𝒜 =0.9 0.46% 0.42% 0.44% 0.42% 0.41% 0.46% 0.39% [40] 0.36% 0.34% 0.32% 0.31% 0.31% 0.28% 0.29% FTS-2NT 0.27% 0.27% 0.26% 0.25% 0.25% 0.25% 0.26%
Bảng 2.26: So sánh sai số dự báo MAPE trong tháng 7 của mô hình đề xuất với các mô hình trước
Mô hình Bậc của quan hệ
Bậc 2 Bậc 3 Bậc 4 Bậc 5 Bậc 6 Bậc 7 Bậc 8
[86] 3.04% 3.76% 4.08% 4.17% 4.35% 4.38% 4.56% [54] 0.96% 0.96% 0.98% 0.97% 1.00% 0.98% 0.99% α=0.25 0.44% 0.42% 0.42% 0.44% 0.40% 0.40% 0.40% [34] 𝒜 =0.5 0.50% 0.42% 0.38% 0.43% 0.39% 0.46% 0.46%
𝒜 =0.9 0.46% 0.44% 0.42% 0.41% 0.46% 0.39% 0.39% [40] 0.34% 0.33% 0.33% 0.32% 0.32% 0.34% 0.33%
FTS-2NT 0.42% 0.16% 0.16% 0.17% 0.17% 0.17% 0.17%
Bảng 2.27: So sánh sai số dự báo MAPE trong tháng 8 của mô hình đề xuất với các mô hình trước
Mô hình Bậc của quan hệ
Bậc 2 Bậc 3 Bậc 4 Bậc 5 Bậc 6 Bậc 7 Bậc 8 [86] 2.75% 2.77% 3.30% 3.40% 3.18% 3.15% 3.19% [54] 1.07% 1.06% 1.08% 1.08% 1.09% 1.07% 1.07% α=0.25 0.44% 0.42% 0.42% 0.44% 0.40% 0.40% 0.40% [34] 𝒜 =0.5 0.50% 0.42% 0.38% 0.43% 0.39% 0.46% 0.46% 𝒜 =0.9 0.46% 0.44% 0.42% 0.41% 0.46% 0.39% 0.39% [40] 0.31% 0.34% 0.33% 0.33% 0.33% 0.34% 0.35% FTS-2NT 0.37% 0.31% 0.25% 0.25% 0.25% 0.24% 0.24%
Bảng 2.28: So sánh sai số dự báo MAPE trong tháng 9 của mô hình đề xuất với các mô hình trước.
Mô hình Bậc của quan hệ
Bậc 2 Bậc 3 Bậc 4 Bậc 5 Bậc 6 Bậc 7 Bậc 8 [86] 3.29% 3.10% 3.19% 3.22% 3.39% 3.38% 3.29% [54] 1.01% 0.90% 0.94% 0.96% 0.95% 0.95% 0.95% α=0.25 0.44% 0.42% 0.42% 0.44% 0.40% 0.40% 0.40% [34] 𝒜 =0.5 0.50% 0.42% 0.38% 0.43% 0.39% 0.46% 0.46% 𝒜 =0.9 0.46% 0.44% 0.42% 0.41% 0.46% 0.39% 0.39% [40] 0.54% 0.56% 0.54% 0.50% 0.51% 0.52% 0.41% FTS-2NT 0.44% 0.26% 0.25% 0.26% 0.26% 0.26% 0.25%
Dựa trên các kết quả đạt được từ các mô hình FTS-1NT và FTS-2NT, có thể thấy hai mô hình đề xuất đưa ra kết quả dự báo tốt hơn so với các mô hình nền tảng trước đây. Tuy nhiên ngoài việc sử dụng NQHM-PTTG và quy tắc giải mờ mới cũng như việc tăng cường thêm nhân tố để dự báo, thì hiệu quả dự báo của các mô hình FTS có thể được nâng cao hơn nữa bởi việc phân khoảng dữ liệu chuỗi thời gian. Các đánh giá và so sánh giữa các phương pháp phân khoảng cũng được trình bày trong Tiểu mục 2.4.4 sau đây.
2.4.4. Kết quả thực nghiệm trên mô hình FTS-1NT sử dụng hai phương pháp phân khoảng HA và K-means
Tiểu mục này trình bày các kết quả dự báo của mô hình chuỗi thời gian mờ đề xuất sử dụng hai phương pháp phân khoảng HA và K-means trên tập dữ liệu tuyển sinh của Đại học Alabama với toàn bộ dữ liệu lịch sử [8]. Kết quả thu được từ hai phương pháp phân khoảng này đồng thời được so sánh với một số phương pháp phân
khoảng khác trên cùng mô hình đề xuất và so sánh với các kết quả thu được từ các mô hình dự báo khác trên cùng tập mẫu.
2.4.4.1 So sánh đánh giá giữa hai phương pháp phân khoảng HA và K-means vớicác phương pháp phân khoảng khác trên cùng mô hình FTS-1NT các phương pháp phân khoảng khác trên cùng mô hình FTS-1NT
So sánh đánh giá các kết quả đạt được dựa trên 7 khoảng
Tính hiệu quả của mô hình dự báo đề xuất sử dụng hai phương pháp phân khoảng HA và K-means được so sánh với các phương pháp phân khoảng khác như: Phân khoảng theo lưới-Grid [8-10], phương pháp tối thiểu-Entropy [55], phương pháp mờ hình thang [55] (Trapezoid) và phân khoảng bởi Huarng [11]. Các phương pháp so sánh này được luận án thực hiện trên cùng mô hình được đề xuất FTS-1NT với số khoảng bằng 7. Kết quả so sánh giữa các phương pháp phân khoảng khác nhau dựa trên quan QHM bậc 1 và bậc cao được ghi ra trong Bảng 2.29 và Bảng 2.30. Một cách trực quan so sánh về sai số dự báo MSE giữa các phương pháp phân khoảng khác nhau dựa trên các bậc khác nhau cũng được biểu diễn trong Hình 2.13.
Bảng 2.29: Kết quả và sai số dự báo của mô hình FTS-1NT sử dụng các phương pháp phân khoảng khác nhau dựa trên QHM bậc 1 với 7 khoảng chia. Năm DL
thực
Kết quả dự báo
Grid Entropy Trapezoid Huarng HA K-means
1971 13055 --- --- --- --- --- --- 1972 13563 13500 13363.5 13574 13555 13514.84 13309 1973 13867 13500 13363.5 13574 13555 13514.84 13777 1991 19337 19500 19323.5 20128.5 19555 19170 18932 1992 18876 18833.3 19323.5 19254.83 18888.33 19170 18932 MSE 267436 356264 327879 250465 125929 76551
Bảng 2.30: Sai số dự báo MSE của mô hình FTS-1NT sử dụng các phương pháp phân khoảng khác nhau dựa trên QHM cao với 7 khoảng chia.
Bậc Grid Entropy Trapezoid Huarng HA K-means
2 158068.3 77224 115733.7 154505.3 74808.1 37067 3 93019.6 18055.8 52229.5 93532 13233.9 3887.2 4 35077 11004 5084.7 40673 2106.9 2483.6 5 21643.8 11586.6 4511.9 26593.2 2035.3 2627 6 13120 12164.4 4755.2 1102.6 1986.3 2763.3 7 15032.4 12955 5041.6 1162 2093.6 2947.4 8 14430.8 13880.3 5321 1242 2016 3042.5 Average -MSE 50056 22410 27525.37 45544.3 14040 7831.14
Hình 2.13: Đồ thị biểu diễn sai số dự báo trong Bảng 2.30 của mô hình FTS-1NT dựa trên các phương pháp phân khoảng khác nhau.
Quan sát Bảng 2.29 có thể thấy rằng hai phương pháp phân khoảng đề xuất dựa trên HA và K-means đưa ra sai số dự báo nhỏ hơn các phương pháp so sánh
trên cùng mô hình đề xuất. Như trên đã đề cập với phương pháp theo lưới Grid là chia tập nền thành các khoảng với độ dài bằng nhau. Cách phân khoảng này không phù hợp với dữ liệu phân bổ không đồng nhất, do đó thường được sử dụng để chia khoảng ban đầu trong các mô hình dự báo kết hợp. Phương pháp tối thiểu thành phần Entropy và mờ hình thang trong công trình [55] đã phần nào khắc phục được tính chủ quan trong việc xác định khoảng của phương pháp Grid [8-10], bằng cách chia tập nền thành các khoảng có độ dài khác nhau. Với cách này thì hàm độ thuộc của các tập mờ được biểu diễn bởi đồ thị bất đối xứng. Tuy nhiên trong phương pháp mờ hình thang Trapezoid
[55] chỉ phù hợp với người ra quyết định có kinh nghiệm. Thêm nữa, từ các giá trị
MSE và sai số dự báo trung bình trong Bảng 2.30 và Hình 2.13 cũng cho thấy hai
phương pháp phân khoảng K-means và HA vượt trội hơn so với các phương pháp phân khoảng khác trên tất cả các bậc (từ bậc 2 đến bậc 8). Đặc biệt đưa ra sai số dự báo nhỏ nhất dựa vào QHM bậc 4 đối với phân khoảng sử dụng K-means và bậc 6
với phân khoảng sử dụng HA trên cùng 7 khoảng chia.
So sánh đánh giá các kết quả đạt được dựa trên 14 khoảng
Kết quả dự báo của mô hình sử dụng hai phương pháp phân khoảng K-means và HA với cùng số khoảng chia bằng 14 được đưa ra ở Bảng 2.31. Minh hoạ trực quan hơn có thể quan sát giữa giá trị dự báo của mô hình FTS-1NT sử dụng hai
phương pháp phân khoảng với giá trị thực được thể hiện trên Hình 2.14. Từ hình này, nhận thấy đường cong của mô hình dự báo sử dụng cách phân khoảng K- means phản ánh xu thế tốt hơn so với cách chia khoảng sử dụng HA.
Bảng 2.31: Kết quả dự báo của mô hình FTS-1NT sử dụng phương pháp phân khoảng HA và K-means dựa trên QHM bậc 1 với 14 khoảng chia
Năm DL thực Kết quả dự báo
1971 13055 --- --- 1972 13563 13809.25 13871.5 1973 13867 13809.25 13871.5 1991 19337 19399.5 19332 1992 18876 19399.5 18998.67 MSE 76825.6 17528.57
Hình 2.14: Đường cong mô tả kết quả dự báo của mô hình FTS-1NT sử dụng phương pháp phân khoảng HA và K-means so với dữ liệu thực tế.
2.4.4.2 So sánh đánh giá mô hình FTS-1NT sử dụng phương pháp phân khoảng HA và K-means với các mô hình dự báo khác dựa trên QHM bậc 1.
So sánh đánh giá các kết quả đạt được dựa trên 7 khoảng
Kết quả dự báo thu được từ mô hình đề xuất trong cột 7 và cột 8 của Bảng 2.29 ở trên được so sánh với kết quả đạt được từ các công trình [8, 10, 19, 20, 55] dựa trên QHM bậc 1. Kết quả so sánh về sai số dự báo MSE giữa mô hình đề xuất
và các mô hình này trên cùng số khoảng chia bằng 7 được đưa ra trong Bảng 2.32. Bảng 2.32: So sánh sai số dự báo MSE giữa mô hình đề xuất với các mô hình khác
sử dụng 7 khoảng chia
Mô hình MSE
Song & Chissom [8] 423027 Chen [10] 407507.3 Mô hình [19] 194481 Mô hình [20] 150078.7 Cheng [55] MEPA_Entropy 446762
TFA_ Hình thang 261142 Mô hình đề xuất HA-FTS-1NT 125929
KM-FTS-1NT 76551
Kết quả trong Bảng 2.32, cho thấy mô hình đề xuất sử dụng hai phương pháp chia khoảng dựa trên HA và K-means đều đưa ra sai số MSE nhỏ hơn các mô hình
so sánh. Sở dĩ có được sai số dự báo nhỏ hơn các mô hình so sánh trên, ngoài sự khác biệt về phương pháp phân khoảng, mô hình đề xuất FTS-1NT còn cho kết
quả tốt bởi việc sử dụng NQHM-PTTG. Trong khi các mô hình so sánh như: mô hình [8, 10] sử dụng phương pháp chia khoảng theo lưới, mô hình [55] sử dụng tập mờ hình thang và hai mô hình [19, 20] áp dụng đại số gia tử để có được các khoảng với độ dài khác nhau. Kết quả này cho thấy mức độ ảnh hưởng của phương pháp chia khoảng và cách xây dựng NQHM trong mô hình dự báo được đề xuất là khá lớn.
So sánh đánh giá các kết quả đạt được dựa trên 14 khoảng
Thêm nữa, để chứng minh hiệu quả của mô hình dự báo đề xuất sử dụng phương pháp phân khoảng K-means (KM-FTS-1NT), sáu mô hình dự báo trong trong các công trình [15, 18, 21, 27, 45] được lựa chọn để so sánh. Kết quả so sánh về sai số MSE giữa các mô hình dự báo này được thể hiện trong Bảng 2.33.
Bảng 2.33: So sánh sai số dự báo giữa mô hình đề xuất sử dụng K-means với các mô hình khác dựa trên QHM bậc 1 với 14 khoảng chia
Mô hình [21] [15] [45] [27] [18] KM-FTS-1NT MSE 65689.7 35 32 4 31684 23710 22965 17528.57
Từ kết quả trong Bảng 2.33, cho thấy mô hình KM-FTS-1NT đạt sai số dự báo với giá trị MSE = 17528.57 nhỏ nhất trong số các mô hình được chọn để so sánh. Sự khác biệt chính giữa mô hình KM-FTS-1NT và các mô hình so sánh là cách thức nhóm quan hệ mờ và phương pháp phân khoảng. Hai mô hình [15, 45] sử dụng thuật toán di truyền để có được các khoảng chia, mô hình HPSO [18] dùng thuật toán PSO trong việc hiệu chỉnh độ dài khoảng, mô hình [21] sử dụng khái niệm hạt thông tin để có được các khoảng chia và mô hình [27] sử dụng thuật toán PSO để điều chỉnh độ dài khoảng và thực hiện dự báo dựa trên tỷ lệ của các khoảng. Trong khi mô hình đề xuất áp dụng thuật toán K-means để đạt được độ dài khoảng tốt nhất và sử dụng nhóm quan hệ mờ phụ thuộc thời gian để có được thông tin hữu ích hơn cho quá trình giải mờ đầu ra.
Xu hướng dự báo của mô hình KM-FTS-1NT và các mô hình được so sánh trong Bảng 2.33 được thể hiện trực quan trên Hình 2.15. Từ Hình 2.15, có thể thấy đường cong thể hiện giá trị dự báo của mô hình KM-FTS-1NT bám sát dữ liệu thực hơn so với các mô hình được so sánh.
Hình 2.15: Đường cong biểu diễn giữa giá trị dự báo của mô hình KM-FTS-1NT và các mô hình khác so với dữ liệu thực tế
2.4.4.3 So sánh đánh giá mô hình FTS-1NT sử dụng phương pháp phân khoảng HA và K-means với các mô hình dự báo khác dựa trên QHM bậc cao
Để xác minh hiệu quả dự báo của mô hình được đề xuất sử dụng hai phương pháp chia khoảng K-means và HA dựa trên QHM bậc cao, bốn mô hình chuỗi thời gian mờ có tên như C02 [48], CC06b [16], HPSO [18], AFPSO [33] được lựa chọn để so sánh về sai số dự báo MSE. Kết quả so sánh giữa mô hình được đề xuất và các mô hình bậc cao khác được thể hiện trực quan trên Hình 2.16.
Hình 2.16: So sánh sai số dự báo MSE giữa mô hình đề xuất sử dụng phân khoảng
K-means và HA với các mô hình khác dựa trên QHM bậc cao với 7 khoảng chia.
Quan sát hình 2.16 cho thấy, mô hình được đề xuất đưa ra sai số dự báo nhỏ hơn các mô hình được lựa chọn so sánh trên tất cả các bậc khác nhau. Đặc biệt, mô hình đề xuất đưa ra giá trị MSE =1968.3 nhỏ nhất trong số các mô hình so sánh dựa trên QHM bậc 6 khi sử dụng phương pháp phân khoảng HA và đạt giá trị MSE =2483.6 nhỏ nhất với phương pháp phân khoảng K-mean dựa trên QHM bậc 4.
Từ các đánh giá cụ thể trên cho thấy, hai phương pháp phân khoảng đề xuất không chỉ phù với các dữ liệu phân bổ không đồng nhất mà còn đưa ra sai số dự báo tốt hơn so với các phương pháp khác cũng như các mô hình trước đây.
2.5. Kết luận Chương 2
Chương này của luận án trình bày các nghiên cứu đề xuất các mô hình dự báo chuỗi thời gian mờ mới trên cơ sở nhóm quan hệ mờ phụ thuộc thời gian (NQHM- PTTG). Cụ thể:
- Đề xuất khái niệm NQHM-PTTG với mục đích ngăn việc đưa các tập mờ xuất hiện sau thời điểm t vào vế phải của nhóm quan hệ mờ, do đó, khắc phục được các nhược điểm của các công trình trước đây theo hướng tiếp cận quan hệ mờ và nhóm quan hệ mờ. Đóng góp này được công bố trong các công trình [P1, P2].
- Xây dựng mô hình dự báo chuỗi thời gian mờ một nhân tố và hai nhân tố dựa trên các đề xuất về NQHM-PTTG bậc nhất và bậc cao kết hợp với quy tắc giải mờ mới tính toán giá trị dự báo rõ (đầu ra). Kết quả dự báo của các mô hình dự báo được đề xuất được so sánh với kết quả dự báo của các mô hình dự báo nền tảng nhằm khẳng định tính hiệu quả của các mô hình được đề xuất. Đề xuất này được công bố trong công trình [P4, P6].