các phương pháp phân khoảng khác trên cùng mô hình FTS-1NT
So sánh đánh giá các kết quả đạt được dựa trên 7 khoảng
Tính hiệu quả của mô hình dự báo đề xuất sử dụng hai phương pháp phân khoảng HA và K-means được so sánh với các phương pháp phân khoảng khác như: Phân khoảng theo lưới-Grid [8-10], phương pháp tối thiểu-Entropy [55], phương pháp mờ hình thang [55] (Trapezoid) và phân khoảng bởi Huarng [11]. Các phương pháp so sánh này được luận án thực hiện trên cùng mô hình được đề xuất FTS-1NT với số khoảng bằng 7. Kết quả so sánh giữa các phương pháp phân khoảng khác nhau dựa trên quan QHM bậc 1 và bậc cao được ghi ra trong Bảng 2.29 và Bảng 2.30. Một cách trực quan so sánh về sai số dự báo MSE giữa các phương pháp phân khoảng khác nhau dựa trên các bậc khác nhau cũng được biểu diễn trong Hình 2.13.
Bảng 2.29: Kết quả và sai số dự báo của mô hình FTS-1NT sử dụng các phương pháp phân khoảng khác nhau dựa trên QHM bậc 1 với 7 khoảng chia.
Năm DL
thực
Kết quả dự báo
Grid Entropy Trapezoid Huarng HA K-means
1971 13055 --- --- --- --- --- --- 1972 13563 13500 13363.5 13574 13555 13514.84 13309 1973 13867 13500 13363.5 13574 13555 13514.84 13777 1991 19337 19500 19323.5 20128.5 19555 19170 18932 1992 18876 18833.3 19323.5 19254.83 18888.33 19170 18932 MSE 267436 356264 327879 250465 125929 76551
Bảng 2.30: Sai số dự báo MSE của mô hình FTS-1NT sử dụng các phương pháp phân khoảng khác nhau dựa trên QHM cao với 7 khoảng chia.
Bậc Grid Entropy Trapezoid Huarng HA K-means
2 158068.3 77224 115733.7 154505.3 74808.1 37067 3 93019.6 18055.8 52229.5 93532 13233.9 3887.2 4 35077 11004 5084.7 40673 2106.9 2483.6 5 21643.8 11586.6 4511.9 26593.2 2035.3 2627 6 13120 12164.4 4755.2 1102.6 1986.3 2763.3 7 15032.4 12955 5041.6 1162 2093.6 2947.4 8 14430.8 13880.3 5321 1242 2016 3042.5 Average -MSE 50056 22410 27525.37 45544.3 14040 7831.14
Hình 2.13: Đồ thị biểu diễn sai số dự báo trong Bảng 2.30 của mô hình FTS-1NT dựa trên các phương pháp phân khoảng khác nhau.
Quan sát Bảng 2.29 có thể thấy rằng hai phương pháp phân khoảng đề xuất dựa trên HA và K-means đưa ra sai số dự báo nhỏ hơn các phương pháp so sánh
trên cùng mô hình đề xuất. Như trên đã đề cập với phương pháp theo lưới Grid là chia tập nền thành các khoảng với độ dài bằng nhau. Cách phân khoảng này không phù hợp với dữ liệu phân bổ không đồng nhất, do đó thường được sử dụng để chia khoảng ban đầu trong các mô hình dự báo kết hợp. Phương pháp tối thiểu thành phần Entropy và mờ hình thang trong công trình [55] đã phần nào khắc phục được tính chủ quan trong việc xác định khoảng của phương pháp Grid [8-10], bằng cách chia tập nền thành các khoảng có độ dài khác nhau. Với cách này thì hàm độ thuộc của các tập mờ được biểu diễn bởi đồ thị bất đối xứng. Tuy nhiên trong phương pháp mờ hình thang Trapezoid
[55] chỉ phù hợp với người ra quyết định có kinh nghiệm. Thêm nữa, từ các giá trị
MSE và sai số dự báo trung bình trong Bảng 2.30 và Hình 2.13 cũng cho thấy hai
phương pháp phân khoảng K-means và HA vượt trội hơn so với các phương pháp phân khoảng khác trên tất cả các bậc (từ bậc 2 đến bậc 8). Đặc biệt đưa ra sai số dự báo nhỏ nhất dựa vào QHM bậc 4 đối với phân khoảng sử dụng K-means và bậc 6
với phân khoảng sử dụng HA trên cùng 7 khoảng chia.
So sánh đánh giá các kết quả đạt được dựa trên 14 khoảng
Kết quả dự báo của mô hình sử dụng hai phương pháp phân khoảng K-means và HA với cùng số khoảng chia bằng 14 được đưa ra ở Bảng 2.31. Minh hoạ trực quan hơn có thể quan sát giữa giá trị dự báo của mô hình FTS-1NT sử dụng hai
phương pháp phân khoảng với giá trị thực được thể hiện trên Hình 2.14. Từ hình này, nhận thấy đường cong của mô hình dự báo sử dụng cách phân khoảng K- means phản ánh xu thế tốt hơn so với cách chia khoảng sử dụng HA.
Bảng 2.31: Kết quả dự báo của mô hình FTS-1NT sử dụng phương pháp phân khoảng HA và K-means dựa trên QHM bậc 1 với 14 khoảng chia
Năm DL thực Kết quả dự báo
1971 13055 --- --- 1972 13563 13809.25 13871.5 1973 13867 13809.25 13871.5 1991 19337 19399.5 19332 1992 18876 19399.5 18998.67 MSE 76825.6 17528.57
Hình 2.14: Đường cong mô tả kết quả dự báo của mô hình FTS-1NT sử dụng phương pháp phân khoảng HA và K-means so với dữ liệu thực tế.
2.4.4.2So sánh đánh giá mô hình FTS-1NT sử dụng phương pháp phân khoảng HA và K-means với các mô hình dự báo khác dựa trên QHM bậc 1.
So sánh đánh giá các kết quả đạt được dựa trên 7 khoảng
Kết quả dự báo thu được từ mô hình đề xuất trong cột 7 và cột 8 của Bảng 2.29 ở trên được so sánh với kết quả đạt được từ các công trình [8, 10, 19, 20, 55] dựa trên QHM bậc 1. Kết quả so sánh về sai số dự báo MSE giữa mô hình đề xuất
và các mô hình này trên cùng số khoảng chia bằng 7 được đưa ra trong Bảng 2.32. Bảng 2.32: So sánh sai số dự báo MSE giữa mô hình đề xuất với các mô hình khác
sử dụng 7 khoảng chia
Mô hình MSE
Song & Chissom [8] 423027
Chen [10] 407507.3
Mô hình [19] 194481
Mô hình [20] 150078.7
Cheng [55] MEPA_Entropy 446762
TFA_ Hình thang 261142
Mô hình đề xuất HA-FTS-1NT 125929
KM-FTS-1NT 76551
Kết quả trong Bảng 2.32, cho thấy mô hình đề xuất sử dụng hai phương pháp chia khoảng dựa trên HA và K-means đều đưa ra sai số MSE nhỏ hơn các mô hình
so sánh. Sở dĩ có được sai số dự báo nhỏ hơn các mô hình so sánh trên, ngoài sự khác biệt về phương pháp phân khoảng, mô hình đề xuất FTS-1NT còn cho kết quả tốt bởi việc sử dụng NQHM-PTTG. Trong khi các mô hình so sánh như: mô hình [8, 10] sử dụng phương pháp chia khoảng theo lưới, mô hình [55] sử dụng tập mờ hình thang và hai mô hình [19, 20] áp dụng đại số gia tử để có được các khoảng với độ dài khác nhau. Kết quả này cho thấy mức độ ảnh hưởng của phương pháp chia khoảng và cách xây dựng NQHM trong mô hình dự báo được đề xuất là khá lớn. So sánh đánh giá các kết quả đạt được dựa trên 14 khoảng
Thêm nữa, để chứng minh hiệu quả của mô hình dự báo đề xuất sử dụng phương pháp phân khoảng K-means (KM-FTS-1NT), sáu mô hình dự báo trong trong các công trình [15, 18, 21, 27, 45] được lựa chọn để so sánh. Kết quả so sánh về sai số MSE giữa các mô hình dự báo này được thể hiện trong Bảng 2.33.
Bảng 2.33: So sánh sai số dự báo giữa mô hình đề xuất sử dụng K-means với các mô hình khác dựa trên QHM bậc 1 với 14 khoảng chia
Mô hình
[21] [15] [45] [27] [18] KM-FTS-1NT
MSE 65689.7 35324 31684 23710 22965 17528.57
Từ kết quả trong Bảng 2.33, cho thấy mô hình KM-FTS-1NT đạt sai số dự báo với giá trị MSE = 17528.57 nhỏ nhất trong số các mô hình được chọn để so sánh. Sự khác biệt chính giữa mô hình KM-FTS-1NT và các mô hình so sánh là cách thức nhóm quan hệ mờ và phương pháp phân khoảng. Hai mô hình [15, 45] sử dụng thuật toán di truyền để có được các khoảng chia, mô hình HPSO [18] dùng thuật toán PSO trong việc hiệu chỉnh độ dài khoảng, mô hình [21] sử dụng khái niệm hạt thông tin để có được các khoảng chia và mô hình [27] sử dụng thuật toán PSO để điều chỉnh độ dài khoảng và thực hiện dự báo dựa trên tỷ lệ của các khoảng. Trong khi mô hình đề xuất áp dụng thuật toán K-means để đạt được độ dài khoảng tốt nhất và sử dụng nhóm quan hệ mờ phụ thuộc thời gian để có được thông tin hữu ích hơn cho quá trình giải mờ đầu ra.
Xu hướng dự báo của mô hình KM-FTS-1NT và các mô hình được so sánh trong Bảng 2.33 được thể hiện trực quan trên Hình 2.15. Từ Hình 2.15, có thể thấy đường cong thể hiện giá trị dự báo của mô hình KM-FTS-1NT bám sát dữ liệu thực hơn so với các mô hình được so sánh.
Hình 2.15: Đường cong biểu diễn giữa giá trị dự báo của mô hình KM-FTS-1NT và các mô hình khác so với dữ liệu thực tế
2.4.4.3So sánh đánh giá mô hình FTS-1NT sử dụng phương pháp phân khoảng HA và K-means với các mô hình dự báo khác dựa trên QHM bậc cao
Để xác minh hiệu quả dự báo của mô hình được đề xuất sử dụng hai phương pháp chia khoảng K-means và HA dựa trên QHM bậc cao, bốn mô hình chuỗi thời gian mờ có tên như C02 [48], CC06b [16], HPSO [18], AFPSO [33] được lựa chọn để so sánh về sai số dự báo MSE. Kết quả so sánh giữa mô hình được đề xuất và các mô hình bậc cao khác được thể hiện trực quan trên Hình 2.16.
Hình 2.16: So sánh sai số dự báo MSE giữa mô hình đề xuất sử dụng phân khoảng
K-means và HA với các mô hình khác dựa trên QHM bậc cao với 7 khoảng chia.
Quan sát hình 2.16 cho thấy, mô hình được đề xuất đưa ra sai số dự báo nhỏ hơn các mô hình được lựa chọn so sánh trên tất cả các bậc khác nhau. Đặc biệt, mô hình đề xuất đưa ra giá trị MSE =1968.3 nhỏ nhất trong số các mô hình so sánh dựa trên QHM bậc 6 khi sử dụng phương pháp phân khoảng HA và đạt giá trị MSE =2483.6 nhỏ nhất với phương pháp phân khoảng K-mean dựa trên QHM bậc 4.
Từ các đánh giá cụ thể trên cho thấy, hai phương pháp phân khoảng đề xuất không chỉ phù với các dữ liệu phân bổ không đồng nhất mà còn đưa ra sai số dự báo tốt hơn so với các phương pháp khác cũng như các mô hình trước đây.
2.5. Kết luận Chương 2
Chương này của luận án trình bày các nghiên cứu đề xuất các mô hình dự báo chuỗi thời gian mờ mới trên cơ sở nhóm quan hệ mờ phụ thuộc thời gian (NQHM- PTTG). Cụ thể:
- Đề xuất khái niệm NQHM-PTTG với mục đích ngăn việc đưa các tập mờ xuất hiện sau thời điểm t vào vế phải của nhóm quan hệ mờ, do đó, khắc phục được các nhược điểm của các công trình trước đây theo hướng tiếp cận quan hệ mờ và nhóm quan hệ mờ. Đóng góp này được công bố trong các công trình [P1, P2].
- Xây dựng mô hình dự báo chuỗi thời gian mờ một nhân tố và hai nhân tố dựa trên các đề xuất về NQHM-PTTG bậc nhất và bậc cao kết hợp với quy tắc giải mờ mới tính toán giá trị dự báo rõ (đầu ra). Kết quả dự báo của các mô hình dự báo được đề xuất được so sánh với kết quả dự báo của các mô hình dự báo nền tảng nhằm khẳng định tính hiệu quả của các mô hình được đề xuất. Đề xuất này được công bố trong công trình [P4, P6].
- Đề xuất hai phương pháp phân khoảng mới dựa trên lý thuyết đại số gia tử và kỹ thuật phân cụm K-means. Bằng thực nghiệm trên tập dữ liệu tuyển sinh cho thấy hai phương pháp phân khoảng được đề xuất không những cho độ chính xác cao hơn mà còn linh hoạt và phù hợp với dữ liệu phân bổ không đồng nhất so với các kỹ thuật phân khoảng với độ dài bằng nhau. Các đóng góp này được công bố trong các công trình [P3, P5].
Chương này cũng trình bày các kết quả thực nghiệm và đánh giá so sánh được tiến hành đối với các mô hình dự báo chuỗi thời gian mờ bậc nhất, bậc cao và đa nhân tố được đề xuất để khẳng định tính hiệu quả của chúng. Ngoài ra, các kết quả thực nghiệm cũng khẳng định tính hiệu quả của các phương pháp phân khoảng được đề xuất đối với các dữ liệu chuỗi thời gian khác nhau. Với các kết quả dự báo của các mô hình được đề xuất tốt hơn so với các mô hình dự báo được đối sánh cho thấy những đóng góp về NQHM-PTTG và phương pháp phân khoảng là thiết thực và có giá trị trong luận án.
CHƯƠNG 3. NÂNG CAO HIỆU QUẢ CỦA MÔ HÌNH DỰ BÁO SỬ DỤNG CÁC KỸ THUẬT TÍNH TOÁN MỀM
Như phần Mở đầu và Chương 2 đã trình bày, độ dài khoảng phù hợp, nhóm quan hệ mờ và bậc của của mô hình cũng như quy tắc dự báo đầu ra được xem là các yếu tố ảnh hưởng đáng kể đến kết quả dự báo của mô hình FTS. Mặc dù các yếu tố này đã được đề cập trong các mô hình chuỗi thời gian mờ đơn lẻ, tuy nhiên chúng chưa được kết hợp một cách chặt chẽ để có được mô hình dự báo đủ mạnh nhằm đáp ứng nhu cầu dự báo trên các bài toán thực tế với độ chính xác cao. Với mục tiêu nâng cao kết quả của các mô hình dự báo đã đề cập trong Chương 2, chương này đề xuất các mô hình dự báo lai bằng việc kết hợp chuỗi thời gian mờ với các kỹ thuật tính toán mềm. Các nội dung cần trình bày bao gồm:
- Sử dụng kỹ thuật phân cụm mờ (Fuzzy C-Means – FCM) để phân tập chuỗi thời gian một nhân tố và hai nhân tố thành các cụm và hiệu chỉnh chúng thành các khoảng ban đầu trong tập nền.
- Cải tiến quy tắc giải mờ trong mô hình FTS-1NT và FTS-2NT ở Chương 2
để hiệu chỉnh các giá trị đầu ra trong giai đoạn giải mờ.
- Đề xuất kết hợp kỹ thuật FCM với thuật toán PSO trong việc xác định độ dài khoảng phù hợp của mô hình FTS- 1NT nhằm tăng độ chính xác dự báo - Cải tiến thuật toán PSO nhằm thực hiện việc tối ưu đồng thời độ dài khoảng
chia và bậc của quan hệ mờ trong mô hình dự báo chuỗi thời gian mờ bậc cao hai nhân tố (FTS-2NT).
- Chứng tỏ tính hiệu quả dự báo của các mô hình được đề xuất trên 3 tập tập dữ liệu kinh điển về tuyển sinh đại học thuộc trường đai học Alabama, số vụ tai nạn ô-tô tại Bỉ, nhiệt độ trung bình hàng ngày tại Đài Bắc Đài Loan và thị trường chứng khoán tại Đài Bắc, Đài Loan.
- Các kết quả của chương này được công bố trong các công trình [P6, P7]. 3.1. Các mô hình dự báo chuỗi thời gian mờ đề xuất
Mục này trình bày hai mô hình dự báo FTS cải tiến, được xem như là các mô hình nâng cao từ hai mô hình dự báo đã được đề xuất trong Chương 2. Các mô hình cải tiến được xây dựng bằng cách kết hợp giữa chuỗi thời gian mờ với các kỹ thuật tính toán mềm như phân cụm mờ FCM, tối ưu PSO cùng với các kỹ thuật giải mờ mới. Chi tiết của các mô hình cải tiến này được trình bày tương ứng trong các Mục 3.1.1 và Mục 3.1.2 dưới đây.
3.1.1. Mô hình chuỗi thời gian mờ một nhân tố (FTS-1NT) kết hợp giữa FCM và PSO
Tiểu mục này cải tiến mô hình dự báo FTS-1NT đã được đề cập trong Chương 2 của Luận án bằng việc kết hợp phân cụm mờ (FCM) với tối ưu bày đàn (PSO) nhằm nâng cao độ chính xác dự báo. Mô hình kết hợp này được đặt tên là
FTS1NT- CMPSO. Cấu trúc của mô hình FTS1NT-CMPSO được trình bày trong
Hình 3.1, bao gồm ba giai đoạn: giai đoạn đầu tiên là phân chia dữ liệu chuỗi thời gian thành các khoảng dựa trên thuật toán FCM; giai đoạn thứ hai là thiết lập và cải tiến mô hình FTS-1NT đã được trình bày trong Chương 2. Giai đoạn cuối cùng sử dụng PSO để hiệu chỉnh khoảng ban đầu đạt được từ FCM và chọn ra các khoảng với độ dài tối ưu. Để xử lý các giai đoạn này, tất cả dữ liệu về số lượng sinh viên nhập học của đại học Alabama [8] được sử dụng để minh họa cho quá trình dự báo. Ba giai đoạn của mô hình dự báo FTS1NT-CMPSO được trình bày thành các bước