Đánh giá hiệu quả của mô hình FTS hai nhân tố FTS2- 123docz.net

Tiểu mục này trình bày một số kết quả thực nghiệm thu được từ mô hình

FTS2NT-CMPSO trên hai tập dữ liệu khác nhau: dữ liệu về nhiệt độ trung bình hàng ngày tại Đài Bắc, Đài Loan trong Bảng 2.7 và thị trường chứng khoán Đài Loan

115

TAIFEX [54]. Các kết quả thu được từ mô hình FTS2NT-CMPSO được đưa ra để

đánh giá, so sánh với các mô hình dự báo khác. Ngoài ra, để khẳng định tính hiệu quả

của mô hình dựa trên quan hệ mờ bậc cao hai nhân tố, mô hình FTS2NT-CMPSO

cũng được xem xét để so sánh với mô hình một nhân tố FTS1NT-CMPSO đã được đề

cập trong Mục 3.1.1 trên cùng tập dữ liệu. Trước khi thực nghiệm mô hình dự báo được đề xuất, các tham số của mô hình sử dụng tối ưu PSO như: số lượng cá thể, số lần lặp tối đa, giới hạn vận tốc và vị trí của mỗi cá thể cần được thiết lập để đảm bảo các rằng buộc của hàm tối ưu cũng như miền giới hạn tìm kiếm trong PSO. Tùy thuộc vào mỗi tập dữ liệu thì các tham số này có thể được thiết lập với các giá trị khác nhau, như được chỉ ra trong các Bảng 3.24 và Bảng 3.25.

Bảng 3.24: Các tham số của mô hình FTS2NT-CMPSO được thiết lập cho dự báo nhiệt độ

Các tham số của mô hình

Số lượng cá thể trong quần thể: pn = Số lần lặp tối đa (số thế hệ): iter_max =

Phạm vi của bậc cần tối ưu m =

Trọng số quán tính ω (Giảm tuyến tính) Hệ số tự tin cậy và hệ số xã hội C1 = C2

Phạm vi vị trí của mỗi cá thể: X = Phạm vi vận tốc của mỗi cá thể: V =

Bảng 3.25: Các tham số của mô hình FTS2NT-CMPSO được thiết lập cho dự báo thị trường chứng khoán

Các tham số của mô hình

Số lượng cá thể trong quần thể: pn = Số lần lặp tối đa (số thế hệ): iter_max =

Phạm vi của bậc cần tối ưu m =

Trọng số quán tính ω (Giảm tuyến tính) Hệ số tự tin cậy và hệ số xã hội C1 = C2

Miền giới hạn vị trí của mỗi cá thể: X = Miền giới hạn vận tốc của mỗi cá thể: V = 3.2.2.1 Áp dụng dự báo trên tập dữ liệu nhiệt độ

Từ các tham số trong Bảng 3.24, thực hiện một số lần chạy mô hình FTS2NT-

CMPSO trên từng tháng của tập dữ liệu nhiệt độ hàng ngày. Kết quả của lần chạy tương ứng với khoảng tốt nhất cho tất cả các bậc của mô hình và chọn bậc có kết quả dự báo với sai số nhỏ nhất làm kết quả dự báo cuối cùng. Sau khi kết thúc của mỗi

lần chạy, mô hình FTS2NT-CMPSO sẽ hiển thị độ dài khoảng tối ưu và sai số dự báo của mỗi bậc (từ bậc 1 đến bậc 8). Trong phần thực nghiệm này, luận án sử dụng

hàm MAPE (1.10) làm tiêu chí đánh giá về sai số dự báo để tiện so sánh kết quả

thực nghiệm với các mô hình khác cùng sử dụng tiêu chí này.

Kết quả dự báo nhiệt độ hàng ngày từ tháng 6/1996 đến tháng 9/ 1996 của mô hình FTS2NT-CMPSO dựa trên bậc tốt nhất và độ dài khoảng tối ưu với 9 khoảng chia cho nhân tố chính “nhiệt độ trung bình” và 7 khoảng chia cho nhân tố thứ hai “mật độ của mây” được thể hiện trong Bảng 3.26. Thêm nữa sai số dự báo MAPE

khi thực hiện tối ưu các bậc của mô hình cũng được ghi lại trong Bảng 3.27. Bảng 3.26: Kết quả dự báo nhiệt độ trung bình hàng ngày tại Đài Bắc, Đài Loan

theo từng tháng từ ngày 01/06/1996 đến 30/09/1996. Ngày, Nhiệt Tháng (T) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

29 30 31

MAPE

Bảng 3.26 thể hiện kết quả dự báo trên từng tháng của tập dữ liệu nhiệt độ từ tháng 6 đến tháng 9 năm 1996. Quan sát bảng này cho thấy, các giá trị dự báo thu được trên từng tháng của tập dữ liệu nhiệt độ bám rất sát so với dữ liệu thực thế dựa trên các bậc tối ưu đạt được từ mô hình. Từ những kết quả này có thể nhận thấy việc kết hợp giữa kỹ thuật tối ưu PSO và phương pháp phân khoảng FCM trong mô hình chuỗi thời gian mờ hai nhân tố FTS2NT-CMPSO là phù hợp và đáng tin cậy.

Bảng 3.27: Sai số dự báo MAPE (%) trên từng bậc của mô hình FTS2NT-CMPSO

Tháng Bậc 1

T6 1.485

T7 1.64

T8 0.92

T9 1.302

Ngoài ra Bảng 3.27 cũng đưa ra độ chính xác trên từng bậc của mô hình và lựa chọn được bậc với độ chính xác tốt nhất khi sử dụng kỹ thuật tối ưu PSO. Điều này có thể thấy việc đề xuất cải tiến thuật toán sử dụng PSO để tối ưu đồng thời bậc của mô hình và độ dài khoảng là rất khả quan và hữu hiệu trong mô hình chuỗi thời mờ hai nhân tố. Mô tả trực quan hơn, có thể thấy đường cong biểu diễn giữa giá trị dự báo với giá trị thực tế trong tháng 6 như được minh họa trên Hình 3.9.

Hình 3.9: Đường cong biểu diễn giữa giá trị thực tế và giá trị dự báo nhiệt độ trung bình hàng ngày trong tháng 6, dựa trên mô hình FTS2NT-CMPSO bậc 7 Tiếp theo, để chứng tỏ tính ưu việt của mô hình FTS2NT-CMPSO dựa trên chuỗi thời gian mờ bậc cao hai nhân tố với số lượng khoảng chia bằng 9 cho nhân tố chính “nhiệt độ” và bằng 7 cho nhân tố thứ hai “mật độ của mây”, các mô hình trong các

118

bài báo [17, 34, 40, 54, 56, 57] được lựa chọn cho việc so sánh. Các kết quả về sai số dự báo MAPE trên từng tháng (từ tháng 6 đến tháng 9 năm 1996) giữa mô hình

FTS2NT-CMPSO với các mô hình so sánh dựa trên các bậc khác nhau (từ bậc 2 đến bậc 8) được đưa ra từ Bảng 3.28 đến Bảng 3.31 như sau:

Bảng 3.28: So sánh sai số dự báo MAPE (%) trong tháng 6 giữa mô hình FTS2NT-CMPSO và các mô hình khác dựa trên các bậc khác

nhau Mô hình [56] [54] α=0.25 [34] =0.5 =0.9 [40] [17] [57] FTS2NT-CMPSO

Bảng 3.29: So sánh sai số dự báo MAPE (%) trong tháng 7 giữa mô hình FTS2NT-CMPSO và các mô hình khác dựa trên các bậc khác

nhau Mô hình [56] [54] [34] [40] [17] [57] FTS2NT-CMPSO

Bảng 3.30: So sánh sai số dự báo MAPE (%) trong tháng 8 giữa mô hình FTS2NT-CMPSO và các mô hình khác dựa trên các bậc khác

nhau.

Mô hình

α=0.25 [34]

[40]

119

[17] [57]

FTS2NT-CMPSO

Bảng 3.31: So sánh sai số dự báo MAPE (%) trong tháng 9 giữa mô hình FTS2NT- CMPSO và các mô hình khác dựa trên các bậc khác nhau

Mô hình [56] [54] [34] [40] [17] [57] FTS2NT-CMPSO

Quan sát sai số dự báo MAPE trên từng bậc của các mô hình dự báo từ Bảng 3.28 đến Bảng 3.31, cho thấy mô hình dự báo FTS2NT-CMPSO đưa ra sai số nhỏ hơn so với các mô hình so sánh tương ứng với từng tháng trong tập dữ liệu nhiệt độ trung bình hàng ngày tại Đài Bắc, Đài Loan. Cụ thể mô hình FTS2NT-CMPSO đạt giá trị MAPE nhỏ hơn nhiều so với các mô hình dự báo so sánh trên tất cả các bậc của mô hình. Đặc biệt, đưa ra sai số dự báo tốt nhất tương ứng với từng tháng dựa trên các bậc tối ưu lần lượt là: kết quả dự báo tháng 6 đạt sai số với giá trị MAPE =

0.018% nhỏ nhất dựa trên bậc 7, tháng 7 đưa ra sai số MAPE = 0.018% nhỏ nhất ở bậc 4, tháng 8 đưa ra sai số MAPE = 0.027% nhỏ nhất ở bậc 3 và tháng 9 đạt giá trị

MAPE = 0.053% nhỏ nhất trong trường hợp bậc 5. Từ kết quả này cho thấy mô hình đề xuất FTS2NT-CMPSO ưu việt hơn một số mô hình trước đây trên tập dữ liệu nhiệt độ trung bình hàng ngày tại Đài Bắc, Đài Loan.

3.2.2.2 Áp dụng dự báo trên tập dữ liệu thị trường chứng khoán.

Trong tiểu mục này, mô hình dự báo FTS2NT-CMPSO được áp dụng để dự báo thị trường chứng khoán Đài Loan [54] từ ngày 8/3/1998 đến 9/30/1998 bao gồm hai nhân tố có các chỉ số tương ứng là TAIFEX và chỉ số TAIEX.

Để chứng tỏ tính hiệu quả dự báo của mô hình FTS2NT-CMPSO dựa trên chuỗi

thời gian bậc cao hai nhân tố, các mô hình có tên như: L06 [54], L08 [34], MPTSO [40], THPSO [35] và các mô hình trong [17, 56, 91] được lựa chọn để so sánh và đánh

giá về sai số dự báo MSE (1.8). Từ các tham số được lựa chọn trong Bảng 3.32, mô

hình FTS2NT-CMPSO được thử nghiệm với số khoảng là 16 cho cả

hai nhân tố và đưa ra kết quả dự báo với bậc có giá trị MSE nhỏ nhất.

Ngoài ra, khi thực hiện tối ưu bậc và độ dài khoảng một cách đồng thời, mô hình đề xuất cũng đưa ra thời gian tính toán và tốc độ hội tụ theo giá trị MAPE với số khoảng cố định bằng 16. Đồ thị biểu diễn tốc độ hội tụ theo giá trị MAPE với 150 lần lặp trên dữ liệu TAIFEX được minh họa trong Hình 3.10. Trong thử nghiệm này, mô hình hội tụ tới một giá trị MAPE thấp nhất có thể chấp nhận được là (MAPE =

0.23% hay MSE = 4.8) tại 90 lần lặp.

Kết quả và sai số dự báo tương ứng với bậc tối ưu của mô hình được đề xuất

FTS2NT-CMPSO và các mô hình so sánh được đưa ra trong Bảng 3.32.

Hình 3.10: Đồ thị thể hiện thời gian tính toán và tốc độ hội tụ của mô hình FTS2NT- CMPSO với 150 lần lặp

Bảng 3.32: So sánh kết quả và sai số dự báo MSE giữa mô hình FTS2NT-CMPSO với

các mô hình khác dựa trên QHM bậc cao với 16 khoảng chia cho mỗi nhân tố

Ngày tháng 8/3/1998 8/4/1998 8/5/1998 8/6/1998 8/7/1998 8/10/1998 8/11/1998 8/12/1998 8/13/1998 --- 9/29/1998 9/30/1998 10/01/1998 MSE

Từ kết quả trong Bảng 3.32 cho thấy, mô hình FTS2NT-CMPSO đưa ra giá trị dự báo trên từng ngày gần như sát với dữ thực tế và đạt sai số dự báo với giá trị (MSE = 4.8) nhỏ hơn nhiều so với các mô hình so sánh dựa trên QHM bậc 4.

Chi tiết đánh giá dựa trên ba điểm khác chính là cách NQHM, phương pháp phân khoảng tập nền và quy tắc giải mờ đầu ra. Kết quả tính toán cho thấy ưu thế của

mô hình FTS2NT-CMPSO được thể hiện trong việc sử dụng dụng nhóm quan hệ mờ

phụ thuộc thời gian, trong khi các mô hình còn lại đều sử dụng NQHM của Chen

[10].Với công việc phân khoảng tập nền, thì hai mô hình trong [17, 57] sử dụng

phân cụm tự động để tìm khoảng tối ưu, mô hình [91] sử dụng tìm kiếm Tuba với hệ thống suy diễn mờ để điều chỉnh độ dài khoảng chia tập nền. Còn lại các mô hình L06 [54], L08 [34], MTPSO [40], THPSO [35] và mô hình FTS2NT-CMPSO đều áp dụng thuật toán tối ưu để điều chỉnh khoảng ban đầu và tìm khoảng chia tối ưu trên mỗi tập nền của từng nhân tố, trong đó hai mô hình trước là sử dụng GA còn 3 mô hình còn lại sử dụng PSO.

Bên cạnh đó, để thấy được hiệu quả của việc mở rộng mô hình chuỗi thời gian mờ một nhân tố thành hai nhân tố, mô hình FTS2NT-CMPSO được so sánh với mô hình chuỗi thời gian mờ một nhân tố (FTS1NT-CMPSO) trên tập dữ liệu thị trường chứng khoán TAIFEX. Quan sát Bảng 3.32 cho thấy sai số dự báo của mô hình hai nhân tố FTS2NT-CMPSO với giá trị MSE = 4.8 nhỏ hơn so với mô hình một nhât tố FTS1NT-CMPSO đưa ra trong Bảng 3.21 với giá trị MSE = 5.1. Điều này cho thấy việc thêm nhân tố có mối quan hệ tiềm năng với nhân tố dự báo là khá quan trọng và có ảnh hưởng đáng kể đến kết quả dự báo của mô hình.

3.3. Kết luận Chương 3

Chương này trình bày một số phương pháp nâng cao độ chính xác của các mô hình dự báo được đề xuất ở Chương 2 bằng việc áp dụng các kỹ thuật tính toán mềm khác nhau như kỹ thuật phân cụm mờ FCM, tối ưu PSO. Cụ thể:

- Xây dựng mô hình dự báo mô hình chuỗi thời gian mờ một nhân tố mới (FTS1NT-CMPSO) trên cơ sở kết hợp kỹ thuật phân cụm mờ FCM và PSO với NQHM-PTTG bậc nhất và bậc cao được đề xuất ở Chương 2. Một kỹ thuật giải mờ mới cũng được đề xuất áp dụng để nâng cao độ chính xác dự báo (đầu ra) của mô hình FTS1NT-CMPSO. Nội dung này của luận án được công bố trong công trình [P7].

- Mở rộng mô hình FTS1NT-CMPSO thành mô hình hai nhân tố (FTS2NT- CMPSO). Để nâng cao độ chính xác của mô hình hai nhân tố mới FTS2NT- CMPSO và tận dụng sức mạnh của các kỹ thuật khác nhau, luận án đề xuất thuật toán tối ưu đồng thời độ dài khoảng chia và bậc của mô hình, đồng thời đưa ra được ước tính về thời gian tính toán và tốc độ hội tụ của thuật toán. Chương này cũng trình bày các kết quả thực nghiệm, so sánh và đánh giá kết quả đạt được của các đề xuất mới so với kết quả của các mô hình đã được công bố để chứng tỏ tính hiệu quả của các mô hình dự báo được đề xuất đối với nhiều bài toán dự báo khác nhau.

122

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

Với mục tiêu phát triển các mô hình dự báo chuỗi thời gian mờ mới hiệu quả theo hướng kết hợp NQHM-PTTG với các kỹ thuật tính toán mềm và giải mờ khác nhau, luận án đã hoàn thành mục tiêu đặt ra với một số kết quả chính như sau:

1) Đề xuất khái niệm NQHM-PTTG với mục đích ngăn việc đưa các tập mờ

xuất hiện sau thời điểm dự báo t vào vế phải của nhóm quan hệ mờ, do đó, khắc phục

được các nhược điểm của các công trình trước đây theo hướng tiếp cận quan hệ mờ và nhóm quan hệ mờ.

2) Xây dựng mô hình dự báo chuỗi thời gian mờ một nhân tố và hai nhân tố dựa trên các đề xuất về NQHM-PTTG bậc nhất và bậc cao kết hợp với quy tắc giải mờ mới tính toán giá trị dự báo rõ (đầu ra). Kết quả dự báo của các mô hình dự báo được đề xuất được so sánh với kết quả dự báo của các mô hình dự báo nền tảng nhằm khẳng định tính hiệu quả của các mô hình được đề xuất.

3) Đề xuất hai phương pháp phân khoảng mới dựa trên lý thuyết Đại số gia tử và kỹ thuật phân cụm K-means. Bằng thực nghiệm trên tập dữ liệu tuyển sinh cho thấy hai phương pháp phân khoảng được đề xuất không những cho độ chính xác cao hơn mà còn linh hoạt và phù hợp với dữ liệu phân bổ không đồng nhất so với các kỹ thuật phân khoảng với độ dài bằng nhau.

4) Xây dựng mô hình dự báo chuỗi thời gian mờ một nhân tố mới (FTS1NT- CMPSO) trên cơ sở kết hợp kỹ thuật phân cụm mờ FCM và PSO với NQHM-PTTG bậc nhất và bậc cao. Trong mô hình mới này, luận án đề xuất quy tắc giải mờ mới để hiệu chỉnh các giá trị dự báo đầu ra của mô hình FTS1NT-CMPSO.

5) Mở rộng mô hình FTS1NT-CMPSO thành mô hình hai nhân tố (FTS2NT- CMPSO). Trong mô hình hai nhân tố mới FTS2NT-CMPSO, luận án đề xuất thuật toán tối ưu đồng thời độ dài khoảng và bậc của mô hình, đưa ra được ước tính về thời gian tính toán và tốc độ hội tụ của thuật toán.

Dựa trên các kết quả thực nghiệm, đánh giá so sánh với các mô hình dự báo hiện có với các bài toán dự báo khác nhau, các mô hình dự báo được đề xuất đều tốt hơn so với hầu hết các mô hình được đối sánh. Điều này chứng tỏ rằng, các kết quả nghiên cứu của luận án có đóng góp quan trọng về mặt phương pháp luận cũng như ứng dụng trong việc phát triển các công cụ dự báo.

Đánh giá hiệu quả của mô hình FTS hai nhân tố FTS2NT-CMPSO

Một số khái niệm về tập mờ

Mô hình dự báo của Song và Chissom [8,9]