Sau khi đã thực hiện mơ hình ARIMA cụ thể và ước lượng các tham số của nó, ta tìm hiểu xem mơ hình lựa chọn có phù hợp với dữ liệu ở mức chấp nhận hay khơng bởi vì có thể một mơ hình ARIMA khác cũng phù hợp với dữ liệu. Một kiểm định đơn giản về mơ hình lựa chọn là xem các phần dư ước lượng từ mơ hình này có tính ngẫu nhiên thuần túy hay khơng (tức là có nhiễu trắng hay khơng)
Từ 10 mơ hình, lựa chọn ra 3 mơ hình tốt nhất.
STT MH R2 Adjusted
R2
AIC SBIC HQIC
1 ARIMA(1,1,1,) 0.2920 0.2839 0.6297 0.6834*** 0.6515 2 ARIMA (1,1,1)(2,1,3) 0.3260 0.3103 0.6006* 0.6903 0.6370* 3 ARIMA (1,1,1)(2,1,5) 0.3270 0.3113 0.5991** 0.6888* 0.6355** 4 ARIMA (1,1,1)(2,1,6) 0.3283 0.3127 0.5971*** 0.6868** 0.6335*** 5 ARIMA (1,1,1)(5,1,7) 0.3100 0.2937 0.6391 0.7299 0.6760 6 ARIMA (1,1,1)(5,1,8) 0.3221 0.3061 0.6214 0.7122 0.6582 7 ARIMA (1,1,1)(8,1,9) 0.3291* 0.3130* 0.6261 0.7180 0.6633 8 ARIMA (1,1,1)(8,1,11) 0.3262 0.3100 0.6303 0.7222 0.6676 9 ARIMA (1,1,1)(24,1,12) 0.3677** 0.3508** 0.6317 0.7299 0.6716 10 ARIMA (1,1,1)(24,1,20) 0.3720*** 0.3553*** 0.6247 0.7229 0.6646
Ba tiêu chuẩn cơ bản:
1. Mơ hình ARIMA (p,d,q) phải vượt qua tất cả các kiểm định 2. Adjusted R² cao
3. Các chuẩn thông tin thấp (AIC, SBIC, HQIC nhỏ)
Hệ số xác định R2 cho biết mức độ phù hợp của mơ hình nghiên cứu với ý nghĩa là các biến.Đồng thời cịn giải thich nhân tố phụ thuộc đó đạt bao nhiêu phần trăm trong quá trình nghiên cứu.
Hệ số hiệu chỉnh Adjusted R2 được nghiên cứu giúp khắc phục nhược điểm của r bình phương thơng thường.Hệ số này cho phép ta đo độ thích hợp khi ta thêm một tham số nữa. Qua đó giúp giảm sự phức tạp của mơ hình
Chỉ số Akaike Information Criterion (AIC) là một chỉ số ước lượng của out-of- mẫu lỗi dự đoán và chất lượng do đó tương đối của mơ hình thống kê cho một tập hợp dữ liệu.Đưa ra một tập hợp các mơ hình cho dữ liệu, AIC ước tính chất lượng của từng mơ hình,liên quan đến từng mơ hình khác.Do đó,AIC cung cấp một phương tiện để lựa chọn mơ hình.
Ngược lại với AIC, các tiêu chuẩn SIC( BIC) và HQ là các tiêu chuẩn tin cậy trong việc lựa chọn mơ hình.Chúng ta thực hiện điều chỉnh mạnh hơn so với AIC.McQuarrie và Tsai (1998,pp.36-43) còn gợi ý chi tiết khả năng bị over-fitted khi sử dụng các tiêu chuẩn thông tin trên.
KẾT LUẬN:
Vậy 3 mơ hình tối ưu là:
ARIMA (1,1,1)(2,1,6) ARIMA (1,1,1)(2,1,5) ARIMA (1,1,1)(2,1,3)
Giải thích lý do;
Mơ hình ARIMA (1,1,1)(2,1,6) có ba chỉ số AIC, SBIC, HQIC đo về chuẩn thơng tin của mơ hình là nhỏ nhất và tối ưu nhất so với các mơ hình khác như vậy thì độ biến động tin tức sẽ thấp nhất khiến cho việc dự báo ít rủi ro hơn.
Mơ hình ARIMA (1,1,1) (2,1,5) có ba chỉ số AIC, SBIC, HQIC đo về chuẩn thơng tin của mơ hình là nhỏ nhất và tối ưu hai so với các mơ hình khác như vậy thì độ biến động tin tức sẽ thấp nhất khiến cho việc dự báo ít rủi ro hơn.
Mơ hình ARIMA (1,1,1) (2,1,3) có hau chỉ số AIC , HQIC đo về chuẩn thông tin của mơ hình tối ưu thứ ba so với các mơ hình khác như vậy thì độ biến động tin tức sẽ thấp hơn so với các mơ hình cịn lại. Do đó mà việc dự báo ít rủi ro hơn.
Bước 8: Kiểm định tính dừng và nghịch đảo của mơ hình ARIMA(p,d,q).
Tính dừng của mơ hình AR là một thuộc tính thiết yếu đối với dự báo bằng mơ hình AR. Nếu mơ hình AR khơng dừng khơng thể dự báo giá trị của Yt dựa trên các giá trị trong quá khứ do các dữ liệu sai số trong quá khứ vẫn tác động mạnh đến giá trị hiện tại Yt.
Tính khả nghịch của mơ hình MA cũng là một yếu tố quan trọng đối với mơ hình ARIMA. Nếu mơ hình MA khơng nghịch đảo, phần dư (là thơng tin trong trường hợp dự báo giá chứng khoán) trong quá khứ vẫn sẽ tác động mạnh lên giá trị hiện tại của biến phụ thuộc Yt theo thời gian. Để MA khả nghịch thì nghịch đảo nghiệm đặc trưng của MA phải nằm trong vòng tròn đơn vị.
ARIMA(1,1,1)(2,1,6)
Inverse Roots of AR/MA Polynomial(s)
Specification: DCPI C AR(1) AR(2) MA(1) MA(6) Date: 06/08/21 Time: 10:33
Sample: 2000M01 2014M12 Included observations: 177
AR Root(s) Modulus Cycle
0.636071 ± 0.377864i 0.739843 11.72148
No root lies outside the unit circle. ARMA model is stationary.
MA Root(s) Modulus Cycle
0.851627 0.851627
0.422152 ± 0.452551i 0.618881 7.661132
-0.215908 ± 0.496710i 0.541607 3.171989
-0.524519 0.524519
No root lies outside the unit circle. ARMA model is invertible.
Trị tuyệt đối tổng tất cả hệ số hồi quy bé hơn 1 chứng tỏ rằng nghịch đảo nghiệm đặc trưng nằm trong vịng trịn đơn vị. Bên cạnh đó, tổng tất cả các nghiệm của MA có
giá trị tuyệt đối đều bé hơn 1 chứng tỏ rằng nghịch đảo nghiệm đặc trưng nằm trong vòng tròn đơn vị.
Vậy AR dừng và MA nghịch đảo. Mơ hình ARIMA(1,1,1)(2,1,6) là mơ hình tốt.
ARIMA(1,1,1)(2,1,5)
Inverse Roots of AR/MA Polynomial(s)
Specification: DCPI C AR(1) AR(2) MA(1) MA(5) Date: 06/08/21 Time: 10:37
Sample: 2000M01 2014M12 Included observations: 177
AR Root(s) Modulus Cycle
0.452470 ± 0.475327i 0.656250 7.756743
No root lies outside the unit circle. ARMA model is stationary.
MA Root(s) Modulus Cycle
0.756495 0.756495
0.274209 ± 0.634830i 0.691520 5.402283
-0.496238 ± 0.394674i 0.634050 2.544104
No root lies outside the unit circle. ARMA model is invertible.
Trị tuyệt đối tổng tất cả hệ số hồi quy bé hơn 1 chứng tỏ rằng nghịch đảo nghiệm đặc trưng nằm trong vịng trịn đơn vị. Bên cạnh đó, tổng tất cả các nghiệm của MA có giá trị tuyệt đối đều bé hơn 1 chứng tỏ rằng nghịch đảo nghiệm đặc trưng nằm trong vòng tròn đơn vị.
Vậy AR dừng và MA nghịch đảo. Mơ hình ARIMA(1,1,1)(2,1,5) là mơ hình tốt.
ARIMA(1,1,1)(2,1,3)
Inverse Roots of AR/MA Polynomial(s)
Specification: DCPI C AR(1) AR(2) MA(1) MA(3) Date: 06/08/21 Time: 10:37
Sample: 2000M01 2014M12 Included observations: 177
AR Root(s) Modulus Cycle
0.271559 0.271559
0.017834 0.017834
No root lies outside the unit circle. ARMA model is stationary.
MA Root(s) Modulus Cycle
-0.434562 ± 0.513243i 0.672505 2.763819
0.520366 0.520366
No root lies outside the unit circle. ARMA model is invertible.
Trị tuyệt đối tổng tất cả hệ số hồi quy bé hơn 1 chứng tỏ rằng nghịch đảo nghiệm đặc trưng nằm trong vịng trịn đơn vị. Bên cạnh đó, tổng tất cả các nghiệm của MA có giá trị tuyệt đối đều bé hơn 1 chứng tỏ rằng nghịch đảo nghiệm đặc trưng nằm trong vòng tròn đơn vị.
Vậy AR dừng và MA nghịch đảo. Mơ hình ARIMA(1,1,1)(2,1,3) là mơ hình tốt. Kết luận: Vậy có 3 mơ hình thỏa mãn AR dừng và MA nghịch đảo:
ARIMA (1,1,1)(2,1,6) ARIMA (1,1,1)(2,1,5) ARIMA (1,1,1)(2,1,3)
MH RMSE MAE MAPE
ARIMA (1,1,1)(2,1,6) 0.3884 0.2876 132.1167
ARIMA (1,1,1)(2,1,5) 0.3884 0.2881 131.1842
ARIMA (1,1,1)(2,1,3) 0.3869* 0.2860* 126.0367*
Bước 9: Lựa chọn mơ hình dựa trên tiêu chí độ chính xác của dự báo => chọn 1 mơ hình. Thực hiện tương tự với 2 mơ hình cịn lại.
Một trong số các lý do về tính phổ biến của phương pháp này là ở tính thành cơng trong mơ hình dự báo. Có rất nhiều mơ hình dự báo, nhưng ưu điểm của kỹ thuật này là dùng chính chuỗi thời gian này dự báo cho chính nó. Hay nói cách khác, nó đã mơ hình hóa gần như tất cả dao động của chuỗi thời gian ban đầu. Do đó, với những
chuỗi dữ liệu mang tính nhạy cảm như dự báo biến động giá dầu, giá vàng, giá chứng khốn.. Mơ hình ARIMA được xem là một mơ hình phù hợp
Ưu điểm của kỹ thuật này là dùng chính chuỗi thời gian này dự báo cho chính nó. Hay nói cách khác, nó đã mơ hình hóa gần như tất cả dao động của chuỗi thời gian ban đầu. Do đó, với những chuỗi dữ liệu mang tính nhạy cảm như dự báo biến động giá dầu, giá vàng, giá chứng khốn. Mơ hình ARIMA được xem là một mơ hình phù hợp
Giá trị sai số bình phương trung bình (RMSE – Root Mean Square Error): là sự khác biệt giữa các ước lượng và những gì được đánh giá. MSE là một hàm rủi ro, tương ứng với giá trị kỳ vọng của sự mất mát sai số bình phương hoặc mất mát bậc hai. Sự khác biệt xảy ra do ngẫu nhiên, hoặc vì các ước lượng khơng tính đến thơng tin có thể cho ra một ước tính chính xác hơn
Giá trị sai số tuyệt đối trung bình (MAE – Mean Absolute Error): AE đo lường mức độ trung bình của các lỗi trong một tập hợp các dự đốn, mà khơng xem xét hướng của chúng. Đó là trung bình trên mẫu thử nghiệm về sự khác biết tuyệt đối giữa dự đoán và lượng quan sát thực tế, trong đó tất cả các khác biệt với trọng số bằng nhau.
Giá trị tỷ lệ sai số tuyệt đối (MAPE - Mean Absolute Percent Error): là phần trăm sai số trung bình tuyệt đối. Lỗi phần trăm tuyệt đối trung bình (MAPE) là thước đo thống kê mức độ chính xác của một hệ thống dự báo. Nó đo độ chính xác này theo phần trăm và có thể được tính là sai số phần trăm tuyệt đối trung bình cho mỗi khoảng thời gian trừ đi các giá trị thực chia cho các giá trị thực. Lỗi phần trăm tuyệt đối trung bình (MAPE) là biện pháp phổ biến nhất được sử dụng để dự báo lỗi và hoạt động tốt nhất nếu khơng có cực trị đối với dữ liệu (khơng có số khơng).
Dựa trên các sai số của dự báo gồm MSE, MAE, MAPE ta đánh giá mơ hình
ARIMA(1,1,1)(2,1,3) có mức độ chính xác của dự báo là cao nhất vì chỉ số của tiêu chí MAE (sai số trung bình trong sự phù hợp), MAPE (sai số tương đối trung bình) là bé nhất. Và RMSE là căn bậc 2 của tiêu chí MSE nên hai tiêu chí về bản chất là một,
điều khác biệt là giá trị của tiêu chí RMSE bé hơn.Ở mơ hình ARIMA(1,1,1)(2,1,3) chỉ số tiêu chí MSE cũng là bé nhất.
Kết luận: Mơ hình phù hợp nhất là ARIMA(1,1,1)(2,1,3) vì có 3 chỉ tiêu nhỏ nhất trong 3 mơ hình.