c) Các mô hình dự báo theo dãy số thời gian
i) Dự báo với mô hình bình quân di động (MA)
Nhìn vào Hình 3.6 và Hình 3.7, ta thấy đồ thị hàm ACF có trễ 0 thì tự tương quan là 1 ngoài ra chỉ ở trễ 1 thì tự tương quan có ý nghĩa và nó phải mang giá trị âm. Ở các trễ còn lại thì tự tương quan gần như không có ý nghĩa. Trong đó, ở đồ thị PACF có dạng hàm giảm dần. Vì vậy, ta có thể tiên đoán có một MA(1).
ii) Dự báo với mô hình tự hồi qui (AR)
Nhìn vào Hình 3.6 và Hình 3.7, ta thấy ACF giảm dần nhanh và PACF
có giá trị cao ở trễ 1 và tắt dần sau trễ 1. Do đó ta có thể nhận ra mô hình cấp
p=1, hay có 1 mô hình AR(1).
iii) Dự báo với mô hình ARIMA bằng phương pháp Box-Jenkins:
Tương tự như trên, ta thấy ở đồ thị ACF có giá trị cao ở trễ 1, 2 và PACF có giá trị cao ở trễ 1. Ta tiên đoán được mô hình ARIMA cho chuỗi thời gian trên như sau: ARIMA(1,2,1), ARIMA(1,2,2). Để xem mô hình nào thích hợp hơn thì ta có thể sử dụng chỉ số AIC để kiểm định.
40
Bước 2: Ước lượng các tham số của mô hình
Dùng để tạo ra mô hình ARIMA phù hợp cho dữ liệu chuỗi thời gian. Tính chỉ số AIC cho từng mô hình trên.
Ta có bảng tổng hợp sau: Mô hình AIC ARIMA(g)(0,2,1)=MA(g)(1) 257.5764 ARIMA(g)(1,2,0)=AR(g)(1) 261.2673 ARIMA(g)(1,2,1) 258.8585 ARIMA(g)(1,2,2) 260.8484
So sánh AIC của các mô hình trên ta thấy mô hình ARIMA(0,2,1) có chỉ số AIC là nhỏ nhất. Vậy ta sử dụng mô hình này để dự báo.
Tiến hành ước lượng tham số cho mô hình ARIMA(0,2,1).
Bước 3: Kiểm định mô hình
Tạo ra kết quả chứa hình của residual (phần dư, thặng dư), tự tương quan của phần dư (ACF of Residual) và p-giá trị của thống kê Ljung-Box của 10 lag (trễ) đầu tiên.
Sta nda rdiz e d Re sidua ls
Time 1995 2000 2005 2010 -1.5 0.0 1.5 0 2 4 6 8 10 12 -0.5 0.5 Lag AC F ACF of Re sidua ls 2 4 6 8 10 0.0 0.4 0.8
p va lue s for Ljung-Box sta tistic
lag
p v
alue
Hình 3.8. Đồ thị các giá trị kiểm định cho mô hình ARIMA(0,2,1) của dữ liệu sản lượng lúa
Dựa vào đồ thị trên ta thấy, các giá trị của phần dư tập trung quanh giá trị 0, và với N=17 thì 1.96* 1 0.475
17
, nhìn trên đồ thị ta thấy ACF of Residuals nằm trong khoảng .
Bước 4: Dự báo
Khi một mô hình được nhận dạng và tham số của nó đã được ước lượng, ta dự đoán các giá trị tương lai cho chuỗi dữ liệu sản lượng lúa ở 9 năm kế tiếp (2012-2020) với hàm predict(). Ta có được giá trị dự đoán trong bảng sau:
41
Bảng 3.2. Bảng dự báo sản lượng lúa giai đoạn 2012-2020 bằng mô hình chuỗi thời gian
Năm Sản lượng lúa (nghìn tấn)
2012 43409.98 2013 44495.06 2014 45580.14 2015 46665.22 2016 47750.30 2017 48835.38 2018 49920.46 2019 51005.53 2020 52090.61 Time san luon glua .ts 1995 2000 2005 2010 2015 2020 25000 30000 35000 40000 45000 50000 55000