Đề bài: Hãy thu thập dữ liệu chuỗi thời gian về một chỉ tiêu kinh tế xã hội ( số quan sát >= 50 quan sát) thực tế của Việt Nam, từ đó áp dụng phương pháp ARIMASARIMA để dự báo cho 5 thời đoạn tương lai Lựa chọn đề tài: Dự bảo chỉ số giá của ngành MAY MẶC 5 tháng đầu năm 2021 bằng mô hình ARIMA thông qua việc sử dụng phần mềm Eviews 10 và SPSS 20 Quy trình dự báo bao gồm: Bước 1: Thu thập số liệu từ các nguồn Bước 2: Kiểm tra tính dừng của chuỗi thời gian bằng kiểm định ADF bằng việc sử dụng Eviews 10 Bước 3: Xác định bậc của p và q thông qua đồ thị ACF và PACF
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI!HỌC!KINH!TẾ!QUỐC!DÂN BÀI TẬP LỚN MÔN DỰ BÁO KINH TẾ - XÃ HỘI Đề bài:! Hãy thu thập liệu chuỗi thời gian tiêu kinh tế / xã hội (số quan sát >= 50 quan sát) thực tế Việt Nam, từ áp dụng phương pháp ARIMA/SARIMA để dự báo cho thời đoạn tương lai Giảng viên hướng dẫn PGS.TS Lê Huy Đức Lớp chuyên ngành Kinh tế phát triển 61A Lớp tín Dự báo kinh tế - xã hội (121)_01 Sinh viên thực Nguyễn Thị Quỳnh Anh Mã sinh viên 11190402 BÀI TẬP LỚN Học phần: Dự báo Kinh tế - Xã hội Học kỳ năm học 2020 – 2021 Đề bài: Hãy thu thập liệu chuỗi thời gian tiêu kinh tế / xã hội ( số quan sát >= 50 quan sát) thực tế Việt Nam, từ áp dụng phương pháp ARIMA/SARIMA để dự báo cho thời đoạn tương lai Lựa chọn đề tài: Dự bảo số giá ngành MAY MẶC tháng đầu năm 2021 mơ hình ARIMA thơng qua việc sử dụng phần mềm Eviews 10 SPSS 20 Quy trình dự báo bao gồm: Bước 1: Thu thập số liệu từ nguồn Bước 2: Kiểm tra tính dừng chuỗi thời gian kiểm định ADF việc sử dụng Eviews 10 Bước 3: Xác định bậc p q thông qua đồ thị ACF PACF Bước 4: Sử dụng SPSS 20 để chạy mơ hình ARIMA, tiến hành ước lượng, kiểm định dự báo cho mơ hình Bước 5: Lựa chọn mơ hình phù hợp thơng qua phương pháp cực tiểu sai số đưa kết dự báo Bước 1: Thu thập số liệu từ nguồn Nguồn thu thập số liệu số giá ngành May mặc giai đoạn 2016 – 2020: https://www.gso.gov.vn ( Tổng cục thống kê) Coi số giá tháng liền trước 100, ta có bảng số liệu số giá ngành May mặc giai đoạn 2016 – 2020 sau: Năm 2016 2017 2018 2019 2020 Tháng 100.37 100.24 100.34 100.39 100.33 Tháng 100.45 99.95 100.2 100.14 99.87 Tháng 99.83 99.88 99.83 99.83 99.85 Tháng 100.05 100.02 99.99 100.06 99.83 Tháng 100.02 100.05 100.08 100.12 99.99 Tháng 100.06 100.05 100.06 100.14 100 Tháng 100.04 100.04 100.12 100.1 100.06 Tháng 100.14 100.09 100.1 100.09 99.97 Tháng 100.14 100.05 100.11 100.09 100.1 Tháng 10 100.05 100.17 100.15 100.06 100.06 Tháng 11 100.24 100.15 100.26 100.12 100.14 Tháng 12 100.25 100.43 100.43 100.33 100.15 Bước 2: Kiểm định tính dừng chuỗi thời gian kiểm định ADF việc sử dụng Eviews 10 Để nhập số liệu, ta mở EVIEWS 10 chọn Creat a new Eview workfile Trong mục Workfile Structure type chọn Unstructured/Undated (dữ liệu chéo) Ở ô Observation ta điền số quan sát, trường hợp 60 quan sát bấm OK Trên bảng giao diện EVIEWS 10, ta chọn Quick/Empty Group nhập số liệu thu thập vào Đặt tên biến Y Tiến hành kiểm định tính dừng Y thông qua kiểm định ADF lệnh View/ Unit Root Test Bảng thực đơn sau xuất hiện: Trên bảng này, ta tích vào lựa chọn phù hợp Do chuỗi có hệ số chặn khơng có xu (có thể nhìn thấy qua việc vẽ đồ thị) nên cần tích vào Intercept Trong trường hợp này, để kiểm định tính dừng chuỗi ta chọn mục Level, sau tiến hành chạy kết ta thấy chuỗi không dừng, ta phải tiếp tục chọn mục 1st difference để kiểm định tính dừng chuỗi sai phân bậc 1, chuỗi sai phân bậc chưa dừng phải kiểm định tiếp chuỗi sai phân bậc cách chọn 2nd difference Nếu sau thực kiểm định hết đến chuỗi sai phân bậc mà chuỗi chưa dừng ta nên đổi số liệu khác để thực dự báo Tuy nhiên, ta nên vẽ đồ thị chuỗi sai phân để nhận dạng trước Chuỗi dừng giá trị tuyệt đối thống kê lớn giá trị tuyệt đối giá trị chuẩn theo mức ý nghĩa khác cho Bấm OK để thu kết kiểm định, ta kết hình Trong bảng kết quả, ta nhận thấy giá trị P-value = 0.0000 < 0.05 nên kết luận chuỗi thời gian chuỗi dừng Do mơ hình ARIMA ta xây dựng số giá ngành May mặc có d = Bước 3: Xác định bậc p q thông qua đồ thị ACF PACF Tại bảng giá trị Y (Series Y), ta chọn View/ Correlogram Chọn Level chuỗi số liệu ban đầu chuỗi dừng, chuỗi sai phân bậc bậc dừng ta chọn 1st difference 2nd difference Ta thu bảng kết sau: Để tìm bậc p q, so sánh PACF ACF với giá trị giới hạn ±1.96/√n để tìm bậc p q Ta có trường hợp này: ±1.96/√60 = ± 0.253034912 => Như vậy, quan sát có số liệu PACF nằm ngồi khoảng ( - 0.253034912 ; 0.253034912) giá trị p số liệu ACF vào ngồi khoảng giá trị q Nhìn đồ thị nhận với đường giới hạn kẻ nét đứt => Ta giá trị: q = 1, 11, 12, 23, 24, 36 p = 1, 2, 11 => Số mơ hình thiết lập thể bảng sau: q q=1 q=11 q=12 q=23 q=24 p=1 ARIMA(1,0,1) ARIMA(1,0,11) ARIMA(1,0,12) ARIMA(1,0,23) ARIMA(1,0,24) p=2 ARIMA(2,0,1) ARIMA(2,0,11) ARIMA(2,0,12) ARIMA(2,0,23) ARIMA(2,0,24) p=11 ARIMA(11,0,1) ARIMA(11,0,11) ARIMA(11,0,12) ARIMA(11,0,23) ARIMA(11,0,24) p=1 p=2 p=11 q=36 ARIMA(1,0,36) ARIMA(2,0,36) ARIMA(11,0,36) Bước 4: Sử dụng SPSS 20 để chạy mơ hình ARIMA, tiến hành ước lượng, kiểm định dự báo cho mơ hình Nhập lại số liệu vào SPSS đặt tên biến biến Y Tại Analyze, chọn Forecasting, chọn Creat Models Ta nhận kết sau: Đưa biến Y vào mục Dependent Variables Ở thẻ Variables, khung Method chọn ARIMA để thực dự báo Trong mục Criteria chọn giá trị p, d, q phần Nonseason (khơng có yếu tố 10 Trên đồ thị phần dư ACF PACF ta thấy toàn quan sát vượt nằm giới hạn nên phần dư nhiễu trắng Do đó, mơ hình phù hợp 37 13 ARIMA(1, 0, 24) Model Description Model Type Model ID Y Model_1 ARIMA(1,0,24) Model Fit Fit Statistic Mean Stationary R- SE Minimum Maximum Percentile 10 25 50 75 90 95 528 528 528 528 528 528 528 528 528 528 R-squared 528 528 528 528 528 528 528 528 528 528 RMSE 137 137 137 137 137 137 137 137 137 137 MAPE 071 071 071 071 071 071 071 071 071 071 MaxAPE 400 400 400 400 400 400 400 400 400 400 MAE 071 071 071 071 071 071 071 071 071 071 MaxAE 399 399 399 399 399 399 399 399 399 399 -2.202 squared Normalized BIC -2.202 -2.202 -2.202 -2.202 -2.202 -2.202 -2.202 -2.202 -2.202 Model Statistics Model Number of Model Fit Predictors statistics Stationary R- Ljung-Box Q(18) Number of Outliers Statistics DF Sig squared Y-Model_1 528 Forecast Model Y-Model_1 61 62 63 64 65 Forecast 100.16 100.06 100.14 100.07 100.22 UCL 100.37 100.29 100.38 100.33 100.47 LCL 99.94 99.83 99.90 99.82 99.96 38 Trên đồ thị phần dư ACF PACF ta thấy toàn quan sát vượt nằm giới hạn nên phần dư nhiễu trắng Do đó, mơ hình phù hợp 39 14 ARIMA(2, 0, 24) Model Description Model Type Model ID Y Model_1 ARIMA(2,0,24) Model Fit Fit Statistic Mean Stationary R- SE Minimum Maximum Percentile 10 25 50 75 90 95 527 527 527 527 527 527 527 527 527 527 R-squared 527 527 527 527 527 527 527 527 527 527 RMSE 139 139 139 139 139 139 139 139 139 139 MAPE 073 073 073 073 073 073 073 073 073 073 MaxAPE 398 398 398 398 398 398 398 398 398 398 MAE 073 073 073 073 073 073 073 073 073 073 MaxAE 398 398 398 398 398 398 398 398 398 398 -2.102 -2.102 squared Normalized BIC -2.102 -2.102 -2.102 -2.102 -2.102 -2.102 -2.102 -2.102 Model Statistics Model Number of Model Fit Predictors statistics Stationary R- Ljung-Box Q(18) Number of Outliers Statistics DF Sig squared Y-Model_1 527 Forecast Model Y-Model_1 61 62 63 64 65 Forecast 100.15 100.05 100.13 100.09 100.21 UCL 100.38 100.30 100.38 100.35 100.47 LCL 99.93 99.81 99.88 99.83 99.94 40 Trên đồ thị phần dư ACF PACF ta thấy toàn quan sát vượt nằm giới hạn nên phần dư nhiễu trắng Do đó, mơ hình phù hợp 41 15 ARIMA(11, 0, 24) Model Description Model Type Model ID Y Model_1 ARIMA(11,0,24) Model Fit Fit Statistic Mean Stationary R- SE Minimum Maximum Percentile 10 25 50 75 90 95 561 561 561 561 561 561 561 561 561 561 R-squared 561 561 561 561 561 561 561 561 561 561 RMSE 157 157 157 157 157 157 157 157 157 157 MAPE 066 066 066 066 066 066 066 066 066 066 MaxAPE 400 400 400 400 400 400 400 400 400 400 MAE 066 066 066 066 066 066 066 066 066 066 MaxAE 399 399 399 399 399 399 399 399 399 399 -1.244 squared Normalized BIC -1.244 -1.244 -1.244 -1.244 -1.244 -1.244 -1.244 -1.244 -1.244 Model Statistics Model Number of Model Fit Predictors statistics Stationary R- Ljung-Box Q(18) Number of Outliers Statistics DF Sig squared Y-Model_1 561 Forecast Model Y-Model_1 61 62 63 64 65 Forecast 100.17 99.97 100.03 100.03 100.14 UCL 100.42 100.25 100.32 100.32 100.44 LCL 99.92 99.70 99.74 99.73 99.85 42 Trên đồ thị phần dư ACF PACF ta thấy toàn quan sát vượt nằm giới hạn nên phần dư nhiễu trắng Do đó, mơ hình phù hợp 43 16 ARIMA(1, 0, 36) Model Description Model Type Model ID Y Model_1 ARIMA(1,0,36) Model Fit Fit Statistic Mean Stationary R- SE Minimum Maximum Percentile 10 25 50 75 90 95 571 571 571 571 571 571 571 571 571 571 R-squared 571 571 571 571 571 571 571 571 571 571 RMSE 162 162 162 162 162 162 162 162 162 162 MAPE 063 063 063 063 063 063 063 063 063 063 MaxAPE 388 388 388 388 388 388 388 388 388 388 MAE 063 063 063 063 063 063 063 063 063 063 MaxAE 388 388 388 388 388 388 388 388 388 388 -1.043 squared Normalized BIC -1.043 -1.043 -1.043 -1.043 -1.043 -1.043 -1.043 -1.043 -1.043 Model Statistics Model Number of Model Fit Predictors statistics Stationary R- Ljung-Box Q(18) Number of Outliers Statistics DF Sig squared Y-Model_1 571 Forecast Model Y-Model_1 61 62 63 Forecast 100.23 100.05 100.01 99.97 100.10 UCL 100.50 100.34 100.30 100.27 100.40 LCL 99.96 99.76 99.73 99.68 99.80 44 64 65 Trên đồ thị phần dư ACF PACF ta thấy toàn quan sát vượt nằm giới hạn nên phần dư nhiễu trắng Do đó, mơ hình phù hợp 45 17 ARIMA(2, 0, 36) Model Description Model Type Model ID Y Model_1 ARIMA(2,0,36) Model Fit Fit Statistic Mean Stationary R- SE Minimum Maximum Percentile 10 25 50 75 90 95 570 570 570 570 570 570 570 570 570 570 R-squared 570 570 570 570 570 570 570 570 570 570 RMSE 166 166 166 166 166 166 166 166 166 166 MAPE 063 063 063 063 063 063 063 063 063 063 MaxAPE 390 390 390 390 390 390 390 390 390 390 MAE 063 063 063 063 063 063 063 063 063 063 MaxAE 389 389 389 389 389 389 389 389 389 389 -.927 -.927 -.927 -.927 -.927 -.927 -.927 -.927 -.927 -.927 squared Normalized BIC Model Statistics Model Number of Model Fit Predictors statistics Stationary R- Ljung-Box Q(18) Number of Outliers Statistics DF Sig squared Y-Model_1 570 Forecast Model Y-Model_1 61 62 63 Forecast 100.20 100.04 100.02 99.96 100.10 UCL 100.48 100.33 100.32 100.26 100.40 LCL 99.93 99.74 99.73 99.66 99.79 46 64 65 Trên đồ thị phần dư ACF PACF ta thấy toàn quan sát vượt nằm giới hạn nên phần dư nhiễu trắng Do đó, mơ hình phù hợp 47 18 ARIMA(11, 0, 36) Model Description Model Type Model ID Y Model_1 ARIMA(11,0,36) Model Fit Fit Statistic Mean Stationary R- SE Minimum Maximum Percentile 10 25 50 75 90 95 579 579 579 579 579 579 579 579 579 579 R-squared 579 579 579 579 579 579 579 579 579 579 RMSE 218 218 218 218 218 218 218 218 218 218 MAPE 062 062 062 062 062 062 062 062 062 062 MaxAPE 430 430 430 430 430 430 430 430 430 430 MAE 062 062 062 062 062 062 062 062 062 062 MaxAE 429 429 429 429 429 429 429 429 429 429 226 226 226 226 226 226 226 226 226 226 squared Normalized BIC Model Statistics Model Number of Model Fit Predictors statistics Stationary R- Ljung-Box Q(18) Number of Outliers Statistics DF Sig squared Y-Model_1 579 Forecast Model Y-Model_1 61 62 63 64 65 Forecast 100.15 99.98 99.93 99.88 100.03 UCL 100.49 100.35 100.30 100.26 100.41 LCL 99.81 99.62 99.56 99.51 99.65 48 Trên đồ thị phần dư ACF PACF ta thấy toàn quan sát vượt nằm giới hạn nên phần dư nhiễu trắng Do đó, mơ hình phù hợp 49 Bước 5: Lựa chọn mơ hình phù hợp thơng qua phương pháp cực tiểu sai số đưa kết dự báo Mơ hình Kiểm định phần dư MSE ARIMA(1,0,1) Phần dư nhiễu trắng Phần dư nhiễu trắng Phần dư nhiễu trắng 0.138 BIC -3.763 0.135 -3.731 0.126 -3.255 Phần dư nhiễu trắng Phần dư nhiễu trắng Phần dư nhiễu trắng 0.129 -3.205 0.127 -3.175 0.133 -2.469 0.127 -3.175 0.127 -3.103 ARIMA(11,0,12) Phần dư nhiễu trắng Phần dư nhiễu trắng Phần dư nhiễu trắng ARIMA(1,0,23) Phần dư nhiễu trắng 0.136 -2.277 ARIMA(2,0,23) Phần dư nhiễu trắng 0.138 -2.185 ARIMA(11,0,23) Phần dư nhiễu trắng 0.157 -1.321 ARIMA(1,0,24) Phần dư nhiễu trắng ARIMA(2,0,24) Phần dư nhiễu trắng 0.139 -2.102 ARIMA(11,0,24) Phần dư nhiễu trắng 0.157 -1.244 ARIMA(1,0,36) Phần dư nhiễu trắng 0.162 -1.043 ARIMA(2,0,36) Phần dư nhiễu trắng 0.166 -0.927 ARIMA(11,0,36) Phần dư nhiễu trắng 0.218 0.226 ARIMA(2,0,1) ARIMA(11,0,1) ARIMA(1,0,11) ARIMA(2,0,11) ARIMA(11,0,11) ARIMA(1,0,12) ARIMA(2,0,12) 50 0.138 0.137 -2.316 -2.202 Trong mô hình bên trên, mơ hình có phần dư đồ thị ACF PACF nhiễu trắng mơ hình phù hợp cho cơng tác dự báo Tuy nhiên mơ hình ARIMA(11,0,1) có giá trị MSE nhỏ (xét theo phương pháp cực tiểu sai số) nên ta sử dụng kết dự báo mô hình => Kết dự báo tháng đầu năm 2021 ứng với giá trị quan sát thứ 61 đến 65 bảng Forecast sau: Model Y-Model_1 Forecast UCL LCL 61 100.10 100.32 99.88 62 99.98 100.22 99.74 63 99.89 100.14 99.65 64 99.95 100.20 99.70 65 100.00 100.25 99.75 Như vậy, sau tiến hành dự báo thông qua EVIEWS 10 SPSS 20, ta thu kết dự báo giá trị số giá ngành May mặc tháng đầu năm 2021 sau: Dự báo số giá ngành May mặc năm 2021 Tháng 100.10 Tháng 99.98 Tháng 99.89 Tháng 99.95 Tháng 100 51 ... phần: Dự báo Kinh tế - Xã hội Học kỳ năm học 2020 – 2021 Đề bài: Hãy thu thập liệu chuỗi thời gian tiêu kinh tế / xã hội ( số quan sát >= 50 quan sát) thực tế Việt Nam, từ áp dụng phương pháp ARIMA/SARIMA... Maximum Percentile 10 25 50 75 90 95 547 54 7 54 7 54 7 54 7 54 7 54 7 54 7 54 7 54 7 R-squared 54 7 54 7 54 7 54 7 54 7 54 7 54 7 54 7 54 7 54 7 RMSE 157 157 157 157 157 157 157 157 157 157 MAPE 068 068 068... Maximum Percentile 10 25 50 75 90 95 561 56 1 56 1 56 1 56 1 56 1 56 1 56 1 56 1 56 1 R-squared 56 1 56 1 56 1 56 1 56 1 56 1 56 1 56 1 56 1 56 1 RMSE 157 157 157 157 157 157 157 157 157 157 MAPE 066 066 066