L ỜI MỞ ĐẦU
3.4 Mô hình ARIMA
3.4.1 Tách yếu tốmùa vụkhỏi chuỗi:
Do chuỗi quan sát có yếu tố mùa vụ, chúng ta tiến hành tách yếu tố mùa vụ theo phương pháp Moving Average Methods và tách theo mô hình cộng tính (Dựa vào kết quả từ nhận dạng chuỗi số liệu).
Sau khi tách yếu tố mùa vụ, chúng ta thu được chuỗi hiệu chỉnh mùa vụ Prodsa và chỉ số thời vụ chung sfa.
Các bước tiếp theo để ước lượng được mô hình dự báo, chúng ta sẽ kiểm định và nghiên cứu theo chuỗi hiệu chỉnh mùa vụ Prodsa.
Để tiến hành dự báo bằng mô hình ARIMA, chuỗi nghiên cứu phải là 1 chuỗi dừng. Do đó để tiếp tục tiến hành các bước sau, chúng ta phải kiểm định tính dừng của chuỗi hiệu chỉnh. Ở đây chúng ta sẽ kiểm định tính dừng của chuỗi Prodsa bằng kiểm định Unit Root
Test.
Biến kiểm định p-value
Prodsa 0.0000
Từ kết quả của kiểm định Unit Root Test, giá trị p-value = 0.0000 < 0.1, 0.05, 0.01. Điều đó có nghĩa chuỗi Prodsa là chuỗi dừng ở cả 3 mức ý nghĩa 1%, 5%, 10%.
24
3.4.2 Tìm p, q bằng giản đồACF và PACF:
Ta bắt đầu tiến hành tìm các giá trị p, q để lập mô hình dự báo ARIMA. Để làm được điều này chúng ta sẽ tiến hành xây dựng mô hình Correlogram thu được kết quả như hình sau:
Hình 9 Kết quảmô hình Correlogram
Dựa theo kết quả biểu đồ tự tương quan riêng PACF, chúng ta sẽ lựa chọn các giá trị p là 1, 11 có ý nghĩa thống kê vì vượt qua đường biên. Tương tự kết quả biểu đồ tự tương quan ACF, chúng ta sẽ lựa chọn các giá trị q là 1, 2, 6, 11 có ý nghĩa thống kê.
3.4.3 Ước lượng mô hình:
Chúng ta sẽ sử dụng giá trị p, q lựa chọn ở trên để ước lượng mô hình phù hợp. Chúng ta sẽ sử dụng các chỉ tiêu Akaike, Schwaiz, Hannah-quinn để so sánh giữa các mô hình từ đó chọn ra mô hình phù hợp nhất.
Trong đó các chỉ tiêu cụ thể như sau:
Lựa chọn mô hình có chỉ số Akaike (AIC) càng nhỏ càng tốt Lựa chọn mô hình có chỉ số Schwaiz (SBC) càng nhỏ càng tốt Lựa chọn mô hình có chỉ số Hannah-quinn (HQ) càng nhỏ càng tốt Chúng ta có bảng kết quả ước lượng mô hình như sau:
Mô hình AIC SBC HQC
25
ls prodsa c ar(1) ar(11) ma(1) ma(2) ma(6) ma(11) ls prodsa c ar(1) ar(11) ma(2) ma(6) ma(11) Ls prodsa c ar(1) ar(11) ma(6) Ls prodsa c ar(1) ar(11)
Trong các kết quả thu được từ ước lượng mô hình chuỗi prodsa, chúng ta lựa chọn mô hình ước lượng: ls prodsa c ar(1) ar(11) vì có chỉ số SBC, HQC nhỏ nhất. Do đó mô hình ARIMA(1,11) là mô hình phù hợp nhất đối với bộ số liệu nghiên cứu. Bảng sau đây sẽ thể hiện kết quả hồi quy mô hình đã lựa chọn.
Tên biến
C AR(1) AR(11)
Bảng 7 Kết quảhồi quy mô hình ARIMA(1,11)
Từ kết quả hồi quy trên, chúng ta thấy tất cả độ trễ nghiên cứu trong mô hình đều có ý nghĩa thống kê. Trong đó p = 1 có giá trị p – value = 0.0003 < 0.1, 0.05, 0.001 và p = 11 có giá trị p-value = 0.0001 < 0.1, 0.05, 0.01. Điều đó đồng nghĩa độ trễ nghiên cứu có ý nghĩa thống kê ở cả 3 mức 1%, 5%, 10%.
3.4.4 Kiểm định nhiễu trắng:
Đầu tiên ta kiểm định vấn đề phương sai sai số thay đổi bằng lệnh Heteroskedasticity Tests.
Mô hình kiểm định p-value
Ls prodsa c ar(1) ar(11) 0.9174
26
Dựa theo kết quả trên, giá trị p-value của mô hình là 0.9174 lớn hơn mức ý nghĩa alpha 10%, 5%, 1%. Điều đó cho thấy mô hình ước lượng không gặp vấn đề phương sai sai số thay đổi.
Chúng ta tiếp tục kiểm định vấn đề tự tương quan mô hình bằng lệnh Serial Correlation LM Tests với Lags include = 7.
Mô hình kiểm định
Ls prodsa c ar(1) ar(11)
Từ kết quả trên, giá trị p-value = 0.7214 lớn hơn mức ý nghĩa alpha 10%, 5%, 1%. Điều đó chứng tỏ mô hình ước lượng đều không mắc vấn đề tự tương quan ở cả 3 mức ý nghĩa trong 7 độ trễ liên tiếp.
Cuối cùng chúng ta kiểm tra chuỗi phần dư của mô hình. Nếu chuỗi phần dư của mô hình là chuỗi dừng thì ta sẽ chấp nhận mô hình. Từ mô hình ước lượng ARIMA(1,11) chúng ta tạo chuỗi phần dư resid01. Sau đó chúng ta kiểm định tính dừng bằng Unit Root Test.
Biến kiểm định p-value
Resid01 0.0000
Từ kết quả trên chúng ta thấy được chuỗi phần dư của mô hình là 1 chuỗi dừng. Qua 3 kiểm định trên, mô hình đã đảm bảo điều kiện nhiễu trắng. Do đó mô hình này có thể được sử dụng để tiếp tục dự báo chuỗi quan sát.
3.4.5 Dựbáo ngoài mẫu:
Qua kết quả kiểm định ở phần trước, chúng ta đã chứng minh được mô hình ước lượng phù hợp để dự báo chuỗi quan sát. Chúng ta sẽ tiến hành dự báo ngoài mẫu chuỗi Prodsa bằng lệnh Forecast thu được chuỗi dự báo Prodsaf với kết quả như sau:
130
80
70 2013
Từ kết quả dự báo trên, chúng ta thấy chỉ số sai số phần trăm trung bình tuyệt đối MAPE = 8.084% < 10% cho thấy đây là một mô hình dự báo tốt.
Từ kết quả dự báo chuỗi hiệu chỉnh mùa vụ Prodsaf, chúng ta kết hợp với chỉ số thời vụ chung sfa để thu được chuỗi dự báo Prodff - chuỗi dự báo cho chuỗi nghiên cứu Prod ban đầu.
Chúng ta có kết quả dự báo 4 tháng cuối năm 2021 của sản lượng than đá Việt Nam như sau:
Thời gian
2021M09 2021M10 2021M11 2021M12
Chúng ta sẽ so sánh biểu đồ giá trị thực tế Prod và giá trị dự báo Prodff.
Chúng ta tiến hành kiểm tra sai số giữa 2 chuỗi prod thực tế và chuỗi Prodff dự báo, thu được kết quả như sau:
Tiêu chí RMSE MAPE
Kết quả 9.9312 8.2941% 130 120 110 100 90 80 70 60 2013 2014 2015 2016 2017 2018 2019 2020 2021 PROD PRODFF
Hình 10 Tương quan giữa chuỗi gốc và chuỗi dựbáo ARIMA
28
Nhìn chung, kết quả dự báo từ mô hình ARIMA(1,11) cũng tương đồng với xu hướng vận động của chuỗi giá trị thực tế. Mô hình ARIMA cũng đã dự đoán được các bước ngoặt, thời điểm sản lượng than đá tăng giảm trong chuỗi dữ liệu nghiên cứu. Đồng thời mô hình dự báo sản lượng Việt Nam tiếp tục giảm mạnh đến tháng 9 năm 2021, sau đó sẽ từ từ phục hồi tăng trưởng trong 3 tháng cuỗi năm.