PHẦN 2 : DỰ BÁO DOANH THU CỦA VINAMILK
2.3 Dự báo bằng mơ hình ARIMA
a. Tổng quan về mơ hình
Mơ hình ARIMA bậc p, d, q là mơ hình với: AR(p) là mơ hình tự tương quan bậc p Y(d) là chuỗi dừng khi lấy sai phân bậc d MA(q) là mơ hình trung bình trượt bậc q có phương trình là:
Y(d) = c + Φ1Y(d)t-1 + … + ΦpY(d)t-p + θ1ut-1 + … + θqut-q + ut
b. Các bước tiến hành
Bước 1: Kiểm tra tính dừng của chuỗi cần dự báo
Đối với chuỗi thường: kiểm tra tính dừng của chuỗi gốc và tiến hành dự báo ARIMA với chuỗi gốc.
Đối với chuỗi có tính mùa vụ: tách yếu tố mùa vụ khỏi chuỗi gốc, sau đó kiểm tra tính dừng của chuỗi tách và tiến hành dự báo ARIMA với chuỗi tách.
Đối với chuỗi có tính xu thế: kiểm tra tính dừng của chuỗi gốc Yt= ^β1+β2^ t + et (với et là phần dư), sau đó kiểm tra tính dừng của chuỗi et và tiến hành dự báo ARIMA với
chuỗi et.
Bước 3: Kiểm tra các điều kiện giả định của mơ hình:
Mơ hình khả nghịch và ổn định (nghiệm đơn vị của các mơ hình hồi quy phụ < 1).
Nhiễu trắng (nhiễu không tự tương quan).
Chất lượng dự báo.
Bước 4: Dự báo ngoài mẫu
Đối với chuỗi có yếu tố mùa vụ: Nhân hoặc cộng chuỗi dự báo đã hiệu chỉnh với chỉ số mùa vụ để dự báo chuỗi gốc.
Đối với chuỗi có yếu tố xu thế: Tạo biến Yf = β^1 + β2^ t + ef là dự báo của chuỗi Yt.
c. Áp dụng
Bước 1: Kiểm tra tính mùa vụ và tách yếu tố mùa vụ nếu có
Trên cửa sổ Series: REV vào View/ Graph
Trên cửa sổ Graph Options chọn Seasonal Graph
0 2,000,000 4,000,000 6,000,000 8,000,000 10,000,000 12,000,000 14,000,000 Q1 Q2 Q3 Q4 Means by Season rev by Season
Các vạch đỏ trong hình là giá trị trung bình của từng mùa. Nếu các vạch này chênh nhau càng nhiều thì tính mùa vụ càng rõ ràng. Ở đây, ta thấy các vạch đỏ không chênh nhau nhiều, tuy nhiên vẫn có sự sai lệch chứng tỏ chuỗi giá trị sử dụng có yếu tố mùa vụ.
Ta sẽ tiến hành dự báo cho chuỗi rev bằng cách tách yếu tố mùa vụ.
Ta đã xác định được chuỗi thuộc dạng mơ hình nhân (như đã kết luận ở phần III). Tiến hành tách yếu tố mùa vụ (theo phần IV.2b) ta thu được chuỗi revsa.
Kiểm định tính dừng của chuỗi revsa Cặp giả thuyết: {H0: Chuỗi không dừng
H1: Chuỗi dừng
Trên cửa sổ Series: REVSA vào View/ Unit Root Tests/ Standard Unit Root Test
Ta có kết quả
Null Hypothesis: REVSA has a unit root Exogenous: Constant
Lag Length: 1 (Automatic - based on SIC, maxlag=10)
t-Statistic Prob.* Augmented Dickey-Fuller test statistic 1.105273 0.9970 Test critical values: 1% level -3.574446
5% level -2.923780 10% level -2.599925
Theo kết quả kiểm định ta thấy
P-value(Prob.) = 0,9970 > α = 0,05
Khơng có cơ sở bác bỏ H0 Chuỗi revsa khơng dừng
Vậy ta kiểm định tính dừng của chuỗi revsa sai phân bậc 1
Trên cửa sổ Series: REVSA vào lại View/ Unit Root Tests/ Standard Unit Root Test Trên cửa sổ Unit Root Test, phần Test for unit root in chọn 1st difference
Null Hypothesis: D(REVSA) has a unit root Exogenous: Constant
Lag Length: 0 (Automatic - based on SIC, maxlag=10)
t-Statistic Prob.* Augmented Dickey-Fuller test statistic -10.45589 0.0000 Test critical values: 1% level -3.574446
5% level -2.923780 10% level -2.599925
Theo kết quả kiểm định ta thấy:
P-value (Prob.) = 0,0000 < α = 0,05
Bác bỏ H0, chấp nhận H1 Chuỗi revsa dừng ở sai phân bậc 1.
Bước 2: Tìm độ trễ cho mơ hình AR và MA
Trên cửa sổ Series: REVSA vào View/ Correlogram
Trên cửa sổ Correlogram Specification chọn độ trễ phần Lags to include là 20
Date: 09/30/18 Time: 19:31 Sample: 2006Q1 2020Q4 Included observations: 49
Autocorrelation Partial Correlation AC PAC Q-Stat Prob 1 -0.408 -0.408 8.6576 0.003 2 0.241 0.090 11.751 0.003 3 -0.168 -0.050 13.278 0.004 4 0.361 0.317 20.504 0.000 5 -0.058 0.256 20.698 0.001 6 -0.054 -0.109 20.867 0.002 7 0.053 -0.018 21.033 0.004 8 -0.035 -0.143 21.109 0.007 9 0.158 0.054 22.671 0.007 10 -0.303 -0.193 28.544 0.001 11 0.147 -0.087 29.973 0.002 12 -0.128 -0.021 31.077 0.002 13 0.120 0.004 32.070 0.002 14 -0.224 -0.033 35.645 0.001 15 0.167 0.155 37.685 0.001 16 -0.121 0.001 38.799 0.001 17 0.169 0.164 41.026 0.001 18 -0.238 -0.138 45.587 0.000 19 0.151 -0.028 47.475 0.000 20 -0.134 -0.187 49.019 0.000
Ta chọn độ trễ là 1 cho AR, độ trễ 1 và 4 cho MA.
Bước 3: Ước lượng mơ hình và kiểm định khuyết tật
Ước lượng mơ hình
Trên cửa sổ Command gõ lệnh LS d(revsa) c ar(1) ma(1) ma(4) Ta có kết quả hồi quy như sau:
Dependent Variable: D(REVSA)
Method: ARMA Maximum Likelihood (BFGS) Date: 09/30/18 Time: 19:38
Sample: 2006Q2 2018Q2 Included observations: 49
Convergence achieved after 18 iterations
Coefficient covariance computed using outer product of gradients
Variable Coefficient Std. Error t-Statistic Prob. C 225291.1 42761.11 5.268598 0.0000 AR(1) -0.120328 0.212783 -0.565496 0.5746 MA(1) -0.335408 0.152258 -2.202889 0.0329 MA(4) 0.489154 0.097377 5.023316 0.0000 SIGMASQ 8.90E+10 1.83E+10 4.861800 0.0000 R-squared 0.330289 Mean dependent var 236917.9 Adjusted R-squared 0.269407 S.D. dependent var 368296.7 S.E. of regression 314800.7 Akaike info criterion 28.28525 Sum squared resid 4.36E+12 Schwarz criterion 28.47830 Log likelihood -687.9887 Hannan-Quinn criter. 28.35849 F-statistic 5.425005 Durbin-Watson stat 1.985770 Prob(F-statistic) 0.001221
Inverted AR Roots -.12
Inverted MA Roots .68-.58i .68+.58i -.52+.58i -.52-.58i
Module của các nghiệm đơn vị:
√¿ ¿ = 0,12 < 1
√0,682+ (-0,58)2 = √0,682+ 0,582 = 0,8937 < 1
√¿ ¿ = √¿ ¿ = 0,779 < 1
Ta thấy, các module đều nhỏ hơn 1 nên các nghiệm đơn vị đều nằm trong vịng trịn đơn vị. Mơ hình khả nghịch và ổn định.
Kiểm định nhiễu trắng
Trên cửa sổ ước lượng vào View/ Residual Diagnostics/ Correlogram – Q-statistics Trên cửa sổ Lag Specification chọn độ trễ 12
Date: 09/30/18 Time: 19:46 Sample: 2006Q1 2020Q4 Included observations: 49
Q-statistic probabilities adjusted for 3 ARMA terms
Autocorrelation Partial Correlation AC PAC Q-Stat Prob 1 0.001 0.001 0.0001 2 0.152 0.152 1.2211 3 0.038 0.038 1.2981 4 0.026 0.004 1.3368 0.248 5 -0.021 -0.033 1.3621 0.506 6 0.024 0.018 1.3952 0.707 7 -0.014 -0.007 1.4062 0.843 8 0.059 0.056 1.6182 0.899 9 0.078 0.083 1.9953 0.920 10 -0.294 -0.322 7.5331 0.376 11 -0.018 -0.049 7.5553 0.478 12 -0.153 -0.074 9.1383 0.425
P-value tại các độ trễ đều lớn hơn mức ý nghĩa α = 5% nên mơ hình khơng có tự tương quan của nhiễu.
Bước 4: Dự báo
Dự báo cho chuỗi hiệu chỉnh revsa
Trên cửa sổ ước lượng chọn Forecast.
Ta có kết quả sau: 7,000,000 7,500,000 8,000,000 8,500,000 9,000,000 9,500,000 10,000,000 10,500,000 11,000,000 IV I II III IV I II 2013 2014 2015 REVSAF ± 2 S.E. Forecast: REVSAF Actual: REVSA Forecast sample: 2013Q4 2015Q2 Included observations: 7
Root Mean Squared Error 354292.4 Mean Absolute Error 335304.8 Mean Abs. Percent Error 3.690889 Theil Inequality Coef. 0.020053 Bias Proportion 0.481008 Variance Proportion 0.158144 Covariance Proportion 0.360848 Theil U2 Coefficient 0.742035 Symmetric MAPE 3.745901
Nhìn vào kết quả dự báo trong mẫu ta thấy
Mean Abs. Percent Error = 3,690889 < 5
Tức là sai số dự báo < 5% Có thể sử dụng mơ hình này để dự báo ngồi mẫu. Mở lại cửa sổ Forecast. Trong phần Forecast sample chọn mẫu 2018Q3 2020Q4. Ta thu được chuỗi dự báo revsaf.
Dự báo cho chuỗi gốc
Ta lấy chuỗi revsaf nhân với chỉ số mùa vụ sr sẽ được chuỗi dự báo revfarima. Trên cửa sổ Command gõ lệnh genr revfarima=revsaf*sr
Trên cửa sổ Command gõ lệnh line revfarima rev thu được kết quả
0 2,000,000 4,000,000 6,000,000 8,000,000 10,000,000 12,000,000 14,000,000 16,000,000 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 REVFARIMA rev