Bài giảng Phân tích dữ liệu và dự báo: Chương 4 Các mô hình dự báo theo phương pháp box jenkins, cung cấp cho người đọc những kiến thức như: Tính dừng của chuỗi thời gian; Mô hình tự hồi quy AR; Mô hình trung bình động MA; Mô hình ARMA(p,q); Tịnh hóa dữ liệu; Mô hình ARIMA cho dữ liệu có tính mùa vụ; Các bước cơ bản của phương pháp ARIMA. Mời các... Đề tài Hoàn thiện công tác quản trị nhân sự tại Công ty TNHH Mộc Khải Tuyên được nghiên cứu nhằm giúp công ty TNHH Mộc Khải Tuyên làm rõ được thực trạng công tác quản trị nhân sự trong công ty như thế nào từ đó đề ra các giải pháp giúp công ty hoàn thiện công tác quản trị nhân sự tốt hơn trong thời gian tới.
CHƯƠNG CÁC MƠ HÌNH DỰ BÁO THEO PHƯƠNG PHÁP BOX-JENKINS DỰ BÁO THEO PHƯƠNG PHÁP BOX-JENKINS Goal Hiểu khái niệm tính dừng kiểm định tính dừng chuỗi thời gian Goal Hiểu rõ mơ hình: AR(p), MA(q), ARMA(p,q), ARIMA(p,d,q) Goal Nắm quy trình thực dự báo phương pháp Box-Jenkins DỰ BÁO THEO PHƯƠNG PHÁP BOX - JENKINS Tính dừng chuỗi thời gian Mơ hình tự hồi quy AR Mơ hình trung bình động MA Mơ hình ARMA(p,q) Tịnh hóa liệu Mơ hình ARIMA cho liệu có tính mùa vụ Các bước phương pháp ARIMA TÍNH DỪNG CỦA CHUỖI THỜI GIAN Một chuỗi thời gian dừng có đặc điểm sau đây: Dữ liệu dao động xung quanh giá trị trung bình cố định dài hạn Dữ liệu có giá trị phương sai xác định khơng thay đổi theo thời gian Dữ liệu có giản đồ tự tương quan với hệ số tự tương quan giảm dần độ trễ tăng lên TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) Theo ngơn ngữ thống kê, đặc điểm thể bởi: (𝑌𝑌𝑡𝑡 ) E(𝑌𝑌𝑡𝑡 ) số cho tất thời điểm t 𝐸𝐸 𝑌𝑌𝑡𝑡 = 𝜇𝜇, ∀𝑡𝑡 Var 𝑌𝑌𝑡𝑡 số cho tất thời điểm t 𝑉𝑉𝑉𝑉𝑉𝑉 𝑌𝑌𝑡𝑡 = 𝐸𝐸 𝑌𝑌𝑡𝑡 − 𝜇𝜇 = 𝜎𝜎 , ∀𝑡𝑡 Hiệp phương sai hai giai đoạn phụ thuộc vào khoảng cách hai giai đoạn 𝑐𝑐𝑐𝑐𝑐𝑐 𝑌𝑌𝑡𝑡 , 𝑌𝑌𝑡𝑡+𝑘𝑘 = 𝐸𝐸 (𝑌𝑌𝑡𝑡 − 𝜇𝜇)(𝑌𝑌𝑡𝑡+𝑘𝑘 − 𝜇𝜇) = 𝛾𝛾𝑘𝑘 , ∀𝑡𝑡 TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) YT Hình bên ví dụ minh họa cho chuỗi dừng với trunh bình -1 -2 -3 -4 50 100 150 200 250 300 350 400 450 500 TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) Hình bên ví dụ minh họa cho chuỗi khơng dừng trung bình thay đổi YT 5,200 4,800 4,400 4,000 3,600 3,200 2,800 72 74 76 78 80 82 84 86 88 90 TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) YT 3,000 Hình bên ví dụ minh họa cho chuỗi khơng dừng trung bình phương sai thay đổi 2,500 2,000 1,500 1,000 500 10 15 20 25 30 35 40 45 50 55 60 TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) Kiểm định tính dừng – Giản đồ tự tương quan Hệ số tự tương quan bậc 𝑘𝑘 xác định công thức � 𝑡𝑡−𝑘𝑘 − 𝑌𝑌) � ∑𝑛𝑛𝑡𝑡=𝑘𝑘+1(𝑌𝑌𝑡𝑡 − 𝑌𝑌)(𝑌𝑌 𝜌𝜌𝑘𝑘 = (1) 𝑛𝑛 ∑𝑡𝑡=1 𝑌𝑌𝑡𝑡 − 𝑌𝑌� Chia tử mẫu (1) cho 𝑛𝑛 ta có 𝑐𝑐𝑐𝑐𝑐𝑐(𝑌𝑌𝑡𝑡 , 𝑌𝑌𝑡𝑡−1 ) 𝜌𝜌𝑘𝑘 = 𝑣𝑣𝑣𝑣𝑣𝑣(𝑌𝑌𝑡𝑡 ) (2) Các phương trình (1) (2) gọi hàm tự tương quan, ký hiệu AFC TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) Kiểm định tính dừng – Giản đồ tự tương quan (tt) Thống kê t Cặp giả thuyết 𝐻𝐻0 : 𝜌𝜌𝑘𝑘 = (chuỗi dừng) 𝐻𝐻1 : 𝜌𝜌𝑘𝑘 ≠ Với 𝛼𝛼 xác định, ta xây dựng khoảng tin cậy cho 𝜌𝜌𝑘𝑘 , 𝑠𝑠𝑠𝑠(𝜌𝜌𝑘𝑘 ) = 1/ 𝑛𝑛 Nếu 𝜌𝜌𝑘𝑘 nằm ngồi khoảng tin cậy tìm ta bác bỏ giả thuyết 𝐻𝐻0 10 MƠ HÌNH ARIMA (tt) Quy trình bước Box - Jenkins: (tt) Ngồi ra, cần thực kiểm định vi phạm giả định hồi quy truyền thống mơ hình, bao gồm: • Kiểm định tự tương quan • Kiểm định phương sai sai số ngẫu nhiên thay đổi • Kiểm định thiếu biến/dạng hàm • Kiểm định sai số ngẫu nhiên có phân phối chuẩn Các kiểm định thực dễ dàng từ phần mềm Eviews 32 MƠ HÌNH ARIMA (tt) VÍ DỤ Sử dụng chuỗi liệu GDP quốc gia theo quý từ 1999Q1 đến 2020Q4 Ta thực bước Box – Jenkins để xây dựng mơ hình ARIMA phù hợp cho việc dự báo Ta sử dụng liệu từ 1999Q1 đến 2019Q4 để xây dựng mơ hình, liệu cịn lại để so sánh kết dự báo Bước 1: Kiểm tra tính dừng chuỗi GDP cho thấy GDP chuỗi không dừng Các giản đồ tương quan bảng kiểm định nghiệm đơn vị 33 MƠ HÌNH ARIMA (tt) Date: 11/23/21 Time: 10:53 Sample: 1999Q1 2020Q4 Included observations: 88 Autocorrelation Partial Correlation AC 10 0.969 0.935 0.901 0.866 0.830 0.791 0.752 0.713 0.675 0.638 PAC Q-Stat Prob 0.969 -0.058 -0.020 -0.045 -0.024 -0.062 -0.029 -0.024 0.009 -0.010 85.462 166.02 241.72 312.39 378.10 438.57 493.85 544.11 589.77 631.12 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 Hình bên giản đồ tương quan chuỗi gốc GDP 34 MƠ HÌNH ARIMA (tt) Kết KĐ tính dừng chuỗi gốc GDP KĐ nghiệm đơn vị Null Hypothesis: GDP has a unit root Exogenous: Constant, Linear Trend Lag Length: (Automatic - based on SIC, maxlag=10) Augmented Dickey-Fuller test statistic Test critical values: 1% level 5% level 10% level t-Statistic Prob.* -2.215287 -4.068290 -3.462912 -3.157836 0.4749 *MacKinnon (1996) one-sided p-values 35 MƠ HÌNH ARIMA (tt) Bước 2: Tạo biến sai phân bậc chuỗi GDP (dGDP) Kết kiểm định cho thấy dGDP chuỗi dừng Các giản đồ tương quan bảng kiểm định nghiệm đơn vị Bước 3: Xác định độ trễ 𝑝𝑝 𝑞𝑞 cho mơ hình ARMA với chuỗi dGDP Kết cho thấy độ trễ 𝑝𝑝 𝑞𝑞 1, 12 Như ta có mơ hình ARIMA(p,1,q), 𝑝𝑝 ∈ 1,8,12 , 𝑞𝑞 ∈ {1,8,12} 36 Autocorrelation Partial Correlation Date: 11/23/21 Time: 15:09 Sample: 1999Q1 2020Q4 Included observations: 87 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 0.316 0.186 0.049 0.051 -0.007 -0.019 -0.073 -0.289 -0.067 0.019 0.037 -0.239 -0.117 -0.204 -0.128 -0.035 -0.056 0.009 -0.045 0.066 0.084 0.039 -0.068 -0.032 AC 0.316 0.095 -0.038 0.033 -0.032 -0.020 -0.062 -0.280 0.128 0.100 -0.008 -0.311 0.011 -0.114 -0.051 -0.021 -0.019 0.122 -0.071 -0.126 0.089 -0.060 -0.121 -0.041 9.0136 12.165 12.389 12.631 12.636 12.672 13.188 21.380 21.820 21.855 21.991 27.892 29.314 33.712 35.474 35.610 35.956 35.965 36.195 36.694 37.519 37.696 38.259 38.384 0.003 0.002 0.006 0.013 0.027 0.049 0.068 0.006 0.009 0.016 0.024 0.006 0.006 0.002 0.002 0.003 0.005 0.007 0.010 0.013 0.015 0.020 0.024 0.032 PAC Q-Stat Prob MƠ HÌNH ARIMA (tt) Hình bên giản đồ tương quan chuỗi sai phân bậc chuỗi GDP (dGDP) 37 MƠ HÌNH ARIMA (tt) Kết KĐ tính dừng chuỗi dGDP KĐ nghiệm đơn vị Null Hypothesis: DGDP has a unit root Exogenous: Constant, Linear Trend Lag Length: (Automatic - based on SIC, maxlag=24) Augmented Dickey-Fuller test statistic Test critical values: 1% level 5% level 10% level t-Statistic Prob.* -6.588446 -4.068290 -3.462912 -3.157836 0.0000 *MacKinnon (1996) one-sided p-values 38 MƠ HÌNH ARIMA (tt) Bước 4: Thực ước lượng mơ hình bước Bước 5: Lựa chọn mơ hình tốt từ mơ hình thực bước Sử dụng tiêu chuẩn AIC, SBC, HQC so sánh mơ hình kết hợp kiểm định hệ số hồi quy khác không kiểm định mô hình truyền thống dạng hàm đúng, sai số ngẫu nhiên phân phối chuẩn, tự tương quan, phương sai thay đổi Kết cho thấy mơ hình với AR(1) MA(8) MA(12) phù hợp Kết ước lượng mô hình sau: 39 MƠ HÌNH ARIMA (tt) 40 MƠ HÌNH ARIMA (tt) Một số kiểm định mơ hình Heteroskedasticity Test: ARCH F-statistic Obs*R-squared 0.748934 3.073717 Prob F(4,74) Prob Chi-Square(4) 0.5619 0.5456 41 Autocorrelation Partial Correlation 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 -0.021 0.093 -0.016 -0.170 -0.031 -0.047 -0.041 -0.043 0.021 0.134 0.140 -0.056 0.044 -0.197 -0.132 -0.047 -0.096 0.044 -0.022 0.066 0.105 0.009 -0.035 -0.055 AC Date: 11/23/21 Time: 16:49 Sample: 1999Q1 2019Q4 Included observations: 83 Q-statistic probabilities adjusted for ARMA terms -0.021 0.093 -0.012 -0.181 -0.037 -0.014 -0.043 -0.073 0.014 0.140 0.134 -0.107 0.014 -0.140 -0.112 -0.043 -0.063 0.016 -0.046 0.007 0.057 -0.019 -0.078 -0.033 0.0368 0.7910 0.8127 3.3887 3.4772 3.6829 3.8409 4.0117 4.0522 5.7818 7.6928 8.0050 8.1960 12.167 13.964 14.200 15.190 15.398 15.453 15.944 17.198 17.207 17.351 17.718 0.066 0.176 0.298 0.428 0.548 0.670 0.565 0.464 0.534 0.610 0.351 0.303 0.360 0.365 0.423 0.492 0.528 0.510 0.576 0.630 0.667 PAC Q-Stat Prob MƠ HÌNH ARIMA (tt) 42 MƠ HÌNH ARIMA (tt) Kiểm định phần dư có phân phối chuẩn 20 Series: Residuals Sample 1999Q2 2019Q4 Observations 83 16 12 -80 -60 -40 -20 20 40 60 Mean Median Maximum Minimum Std Dev Skewness Kurtosis -0.674460 1.725865 85.08337 -87.08154 29.95960 -0.124600 3.458114 Jarque-Bera Probability 0.940562 0.624827 80 43 MƠ HÌNH ARIMA (tt) Bước 6: Thực dự báo cho thời kỳ 2020Q1 – 2020Q4 5,080 5,040 5,000 4,960 4,920 4,880 4,840 4,800 4,760 4,720 4,680 2020q1 2020q2 GDPF 2020q3 2020q4 Forecast: GDPF Actual: GDP Forecast sample: 2020Q1 2020Q4 Included observations: Root Mean Squared Error 10.65296 Mean Absolute Error 8.449882 Mean Abs Percent Error 0.174589 Theil Inequality Coefficient 0.001098 Bias Proportion 0.516430 Variance Proportion 0.122697 Covariance Proportion 0.360873 Theil U2 Coefficient 0.364815 Symmetric MAPE 0.174349 ± S.E 44 MƠ HÌNH ARIMA (tt) 4,880 Time 2020Q1 2020Q2 2020Q3 2020Q4 4,870 4,860 4,850 4,840 4,830 GDP GDPF 4824.0 4840.7 4862.7 4868.0 4842.6 4845.1 4861.1 4877.2 4,820 2020q1 2020q2 GDP 2020q3 2020q4 GDPF There cannot be an exact or perfect ARIMA model because it is more “of an art than of science” 45 KẾT THÚC CHƯƠNG