Do đó, để nhìn nhận rõ được giá cả lương thực Việt Nam trong các giai đoạn tiếp theo thì công tác dự báo về chỉ số giá cả lương thực có vai trò vô cùng quan trọng.. Công tác trên có ý ng
Trang 1
TRƯỜNG ĐẠI HỌC KINH TE QUOC DAN KHOA KE HOACH VA PHAT TRIEN
BÀI TAP LON DU BAO KINH TE - XA HOT 1
DE TAI: HAY THU THAP SO LIEU CHUOI THOI GIAN VE
CHI SO GIA LUONG THUC CUA VIET NAM (THEO THANG)
TRONG GIAI DOAN 2010-2021 TU DO LUA CHON MO HINH
DU BAO PHU HGP DE DU BAO CAC THANG TRONG NAM 2022
Giảng viên hướng dẫn: PGS.TS Lê Huy Đức
Đỗ Mai Anh Giáp Thị Minh Huyền Pham Thi Thuy An Phan My Ha Dinh Tran Hiếu Thuận Lép hoc phan : Dự báo kinh té xa hoi 1(122) 02
HA NOI, THANG 10 NAM 2022
Trang 2
II QUY TRÌNH DỰ BẢO: LH n HH0 HH1 0H HH HH HH 6
1 Xác định vẫn đề dự bảo: à che ưàg 6
2 Thu thập thông tin dit HIỆN nh HH Hà nà Hà Hà hanh 6
3 Lựa chọn phương pháp dự ÙẢO ác ch nh Ha HH HH nhà hà 7
4, Kiểm tra tính dừng: Ăn HH se 7
5 Xác định bậc của q và p thong qua dé thi ACF va PACE .00.c0c0ccccccee Il
6 Chạy các mô hình ARIMA trên phần mêm SPSS 20 12
7 Lựa chọn mô hình và thực hiện dự Đả0: à.à cà SH He 20
Trang 3LỜI MỞ ĐẦU
Trong nhiều năm trở lại đây, chỉ số lương thực Việt Nam xảy ra nhiều biến đối Theo nhiều chuyên gia nhận định Việt Nam là một đất nước có nền nông nghiệp phát triên mạnh mẽ về sản lượng cũng như giá cả ở trong và ngoài nước Nghiêm trọng hơn, Xung đột Nga - Ukraine đang làm trầm trọng thêm lạm phát toàn cầu do giá lương thực và năng lượng tăng cao cùng với chuỗi cung ứng bị gián đoạn sau COVID-19 Các chuyên gia nhận định sự bất 6n này sẽ tạo ra “hiệu ứng gãy cổ” trong chuỗi cung ứng thực phẩm
Do đó, để nhìn nhận rõ được giá cả lương thực Việt Nam trong các giai đoạn tiếp theo thì công tác dự báo về chỉ số giá cả lương thực có vai trò vô cùng quan trọng Công tác trên có ý nghĩa đặc biệt quan trọng trong việc đưa ra chính xác về giá lương thực cũng như dự báo đúng đắn về chỉ số giá lương thực trong các tình huống cụ thê để phục vụ công tác quản lý một cách hiệu quả là một việc làm cần thiết Vì vậy nhóm 3 chúng em lựa chọn đề tài: “Hãy thu thập SỐ liệu chuỗi thời gian về chỉ số gi tiéu dung (CPI) cua Viét Nam (theo thang) trong giai đoạn 2012-2021, từ đó lựa chọn
mô hình dự báo phù hợp đề dự báo CPI các tháng trong năm 2022”
Trong quá trình nghiên cứu đề tài, do sự hạn chế về kinh nghiệm cũng như kiến
thức, nên chúng em khó tránh khỏi những thiểu sót về mặt nội dung Chúng em rất mong nhận được sự đánh giá và đóng góp từ thầy dé bai tap lớn này có thê hoàn thiện hơn nữa
Em xin chan thanh cam on !
Trang 4PHAN NOI DUNG
về cách thức và thời hạn đạt được các mục tiêu nhất định đã đề ra cho tương lai
© Dw bao ngan han:
La cac du bao cé tam xa du bao tir 1 dén 3 nam, lam can ctr cho viéc xây dựng và điều chỉnh các kế hoạch ngắn hạn (hàng năm) Trong quản lý kinh tế - xã hội, các dự báo
về nhu câu thị trường quốc tế và trong nước, biến động dân số và nguồn lao động, giá cả,
nhu cầu tiêu dùng xã hội, khả năng huy động vốn, tốc độ tăng trưởng kinh tế thuộc loại
dự báo này Sai số cho phép của dự báo ngắn hạn thường được khống chế ở mức độ nhỏ, yêu cầu độ tin cậy cao
© Chuỗi thời gian:
Là dãy các giá trị của một biến kinh tế-xã hội, được sắp xếp theo thứ tự thời gian
Chuỗi thời gian gồm 4 thành phần:
3
Trang 5mô hình sẽ có thêm thành phần bậc của sai phân d và mô hình được đặc tả bởi 3 tham số ARIMA(p, d, q)
Đề sử dụng mô hình ARIMA trong dự báo chuỗi thời gian, cần trải qua 4 bước như sau:
Bước 1 Nhận dạng mô hình
Để sử dụng mô hình ARIMA(p.đ.q) trong dự báo cần nhận dạng ba thành phần p,d
và q của mô hình Thành phần d của mô hình được nhận dạng thông qua kiêm định tính
dừng của chuỗi thời gian Nếu chuỗi thời gian dừng ở bậc 0 ta ký hiệu I(d=0),nêu sai
phân bậc l của chuỗi dừng ta ký hiệu I(d=1), nếu sai phân bậc 2 của chuỗi dừng ta ký
hiệu I(d=2), Để kiểm định tính dừng của chuỗi, chúng tôi sử dụng kiểm định nghiệm
don vi Dickey—Fuller cải biên (ADF) và kiểm định Phillips-Perron:
AY, = Bot Bit +7Y¥ 1+ TR, FIAY_, + © +
Kiểm định giả thuyết sử dụng thống kê student (ký hiệu t)
Sau khi kiêm định tính dừng, ta sẽ xác định bậc của quy trình tự hồi quy (AR) và
quy trình trung bình trượt (MA) thông qua biểu đồ tự tương quan (ACF) và biểu đồ tự tương quan riêng phần (PACF')
Quy trình tự hồi quy bậc p, ký hiệu AR(p), được định nghĩa:
(Yt- 8) =al(Yt-l — 8) + o2(Yt-2 — 8) + -+ap(Yt-p-d)t+ut (1)
Trong đó: Yt là chuỗi theo thời gian, 5 1a ky vong ctia chudi Yt , ut là nhiễu trắng (white noise) Quy trinh trung bình trượt bậc q, ký hiệu MA(q) được định nghĩa: Yt=u + B0utr BIut—I + B2ut—2 + - - - + Bqut—=q (2)
Bản chất của mô hình (1) là kết hợp tuyến tính giữa Yt và các nhiễu trắng Kết hợp
(1) và (2) ta có mô hình ARMA(p,q) như sau:
Yt=0+ al Yt-l+ o2Yt-2+ -+ apYt—p+ B0utr BIut—1+ B2ut—2+ - + Bqut-q
(3)
Trang 6Nhận dạng mô hình ARIMA(p,d,q) là tìm các giá trị thích hợp của p, d, q, với d là bậc sai phân của chuỗi thời gian được khảo sát, p là bậc tự hồi quy và q là bậc trung bình trượt
Việc xác định p và q sẽ phy thuéec vao cac dé thi PACF = f(t) va ACF = f(t)
Bước 2 Ước lượng các tham số và lựa chọn mô hình
Các tham số của mô hình sẽ được ước lượng bằng phần mềm Eview Quá trình lựa chọn mô hình là quá trình thực nghiệm và so sánh các tiêu chí R2 hiệu chính, AIC và Schwarz cho đến khi ta chọn được mô hình tốt nhất cho việc dự báo
Bước 3 Kiểm định mô hình
Để đảm bảo mô hình là phù hợp, sai số của mô hình phải là nhiễu trắng Ta có thê
sử dụng biểu đồ tự tương quan ACF hoặc kiểm định Breusch-Godfrey kiểm tra tính tự tương quan của sai số Đôi với phương sai sai số thay đổi, ta có thể sử dụng kiểm định White hoặc ARCH
Bên cạnh đó để đánh giá độ tin cậy của mô hình dự báo, nghiên cứu sử dụng chỉ số MAPE (Mean Absolute Percent Error) Theo Lewis (1983) thi MAPE lớn hơn hoặc bằng 50% thì dự báo không chính xác, 20% - 50% là hợp lệ, 10%-20% là dự báo tốt, đưới 10%
là dự báo hoàn hảo Chỉ số MAPE được định nghĩa như sau:
Trang 7Il Quy trinh dw bao:
1 Xác định vẫn đề dự báo:
- _ Đối tượng dự bảo: chỉ số giá lương thực của Việt Nam các tháng trong năm 2022
- Pham vi dw bao:
Phạm vi không gian: Phạm vi bao gồm cả nước
Phạm vi thời gian: Số liệu được thu nhập trong giai đoạn từ năm 2010 - 2021
2 Thu thập thông tin dữ liệu
Dữ liệu về chỉ số giá lương thực theo tháng trong giai đoạn 2010-2021 là dữ liệu
thứ cấp đã tổng hợp, xử lý từ kết quả của các nghiên cứu đã có Thu thập số liệu từ Tổng cục thông kê về chỉ số giá lương thực hàng tháng, giai đoạn 2010 - 2021 như sau: (coi chỉ
sô giá tháng liền trước là 100)
Trang 83 Lựa chọn phương pháp dự báo
Nhận thấy, số liệu về chỉ số giá lương thực theo tháng từ năm 2010 đến năm 2021
có hơn 144 quan sát và chỉ số giá năm trước có ảnh hưởng tới chỉ số giá năm sau Hơn
nữa, chuỗi dữ liệu về chỉ số giá lương thực là mẫu hình dữ liệu dừng hoặc có thé biến đối
về chuỗi dừng Trong tất cả các phương pháp dự báo, mô hình ARIMA rất phù hợp trong
việc dự báo những quan hệ tuyến tính giữa dữ liệu hiện tại và dữ liệu quá khứ với số
lượng quan sát tôi thiểu 50 và tầm xa dự báo ngắn hạn Vì vậy, việc sử dụng mô hình ARIMA dự báo chỉ số giá lương thực năm 2022 là thích hợp
4 Kiếm tra tính dừng:
Đề nhập số liệu, ta mở Eviews 4 ra Chọn Create a new Eview workfile Trong mục Workfile Range Frequency chon Monthly Ở ô Range điền ngày thống kê với Start Date (2010T1) va end date (2021 T12)
Workfile Range
Frequency
( Semi-annual © Daily [5 day weeks] - - OK
(~ Quarterly {" Daily [7 day weeks] _ |
@ Monthly (© Undated or irregular
|2010T1 |2021114
Trang 9
Sau đó chọn Quick/Empty group và nhập số liệu đã thu thập vào
View | Procs | Objects | Print | Name | Freeze | Transform | Edit+/- /-| insDel | Tr
Trang 10
~ Test for unit root in
Cách 2: Kiểm định tính dừng của Y thông qua kiểm định ADF bằng lệnh View/
Unit Root Test Để kiểm định tính dừng của chuỗi ban đầu, ta chọn mục Level
x Include in test equation
© Intercept
© Trend and intercept
© None Lagged differences:
E—
Lư | _ te |
Trang 11Bam OK để thu về kết quả kiểm định, ta được kết quả như hình bên dưới
Ỉ s| Print | Name | Freeze Sample |Genr| Sheet | Stats| Ident | Line | Bar | |
[ Augmented Dickey-Fuller Unit Root Test on Y
ADF Test Statistic -4 680064 1% Critical Value* -3.4783
5% Critical Value -2 8822 10% Critical Value -2.5777
*MacKinnon critical values for rejection of hypothesis of a unit root
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(Y)
Method: Least Squares
R-squared 0.205427 Mean dependent var 0.011871
Adjusted R-squared 0.175555 $_D dependent var 0.773537
S.E of regression 0.702363 Akaike info criterion 2.173473
Sum squared resid 65.61072 Schwarz criterion 2.300141
Log likelihood -145.0564 F-statistic 6.877083
Durbin-Watson stat 1.998292 Prob(F-statistic) 0.000010
Ta thay |ADF test statistic] > |Critical Value| nén chudi ban dau la chudi ding Do
đó mô hình ARIMA cần xây dựng có d=0
5 Xác định bậc của q và p thông qua do thi ACF va PACF
Bam vao biến Y chọn View/ Correlogram rồi chọn mục Level do chuỗi số liệu này là chuỗi dừng Bam OK ta duoc dé thi ACF va PACF như sau:
10
Trang 12View | Procs | Objects | Print | Name | Freeze | Sample | Genr| Sheet | Stats Ident | Line | Bar
Ta thấy = 0.163333333 Những quan sát nào có số liệu PACF nào nằm ngoài
khoảng từ -0 163333333 đến 0.163333333 thì đó là các giá trị của p và quan sát nào có số liệu ACF nào ngoài khoảng trên thì đó là các giá trị của q
Từ biểu đồ ACF và PACF ta có: q= l; 2 vàp = 1;9
Do đó ta thiết lập được các mô hình sau:
ARIMA(1,0,1); ARIMA(1,0,9); ARIMA@,0,1); ARIMA@,0,9)
6 Chạy các mô hình ARIMA trên phần mềm SPSS 20
Nhập số liệu về chỉ số giá lương thực vào SPSS Chọn muc Analyze / Forecast/ Creat Models Sau đó đưa biến chỉ số giá lương thực vào mục Dependent Variables
11
Trang 13Forecast Penod-
Start First case afler end of estimation period
End: Last case in active dataset
(ok } (Beste, (eae | Cancel) _ Hele)
G thé Variables, trong khung Method chon ARIMA để dự báo cho phương pháp nay Trong myc Criteria chon cac giá tri p, d, q ở phần Nonseason (không có yếu tổ mùa vu) da xac lap dé xem cac mé hinh dy bao Cur mỗi mô hình thì điền p, d, q tương ứng
do bam OK để chạy mô hình
vao roi bam Continue Sau
—ARIMA Ordars
‘Structure:
[ [ [ Seasonal [Autoreqraesiveip) 0 0
Trang 14Fit Statistic Mean SE Minimum | Maximum 5 10 25 50 75 90 95
Stationary R-squared 457 457 457 457 457 A8T 457 457 457 467
R-squarad 457 457 457 457 457 457 457 457 457 457 RMSE 809 809 809 809 809 809 809 809 809 809 MAPE 485 485 485 485 485 485 485 485 485 ,485 MaxAPE 4,589 4,589 4,589 4,589 4,589 4,589 4,589 4,589 4,589 4,589 MAE 490 490 490 490 490 490 490 490 490 490 MaxAE 4,865 4,865 4,865 4,865 4,865 4,865 4,865 4,865 4,865 4,865 Normalized BIC -320 -320 -320 -320 -320 -320 -,320 -,320 -320 -,320
Model Statistics
Model Fit
Statistics
Residual ACF Residual PACF
Trang 15
—rt UCL
Model Statistics Model Fit
statistics Ljung-Box Q(18) Number of Stationary R- Number of
Model Predictors squared Statistics OF Sig Outliers
VAR00002-Model_1 0 474 | 29.068 | 8 | — ,000 Ũ
Trang 16
T -05 a0 T
or each modal, forecastS s†art after the Ias† non-missing
100.49 100.41 10038 102.71 102.69 10268 98,26 9312 9810
predictors are available or at the enc date of the requested forecastperiod, whichever |s earlier
100.39 98.10 L_
in the range of the requested estimation period,
100.41
9812
100.37 102.86 98.07
Nd end atthe last perio
100.40 98.10 100.40
9810
15
Trang 17Model Statistics
Model Fit
Statistics Ljung-Box Q(18)
Model Predictors squared Statistics OF Sig Outliers
Trang 18
UCL 101.88 10242 102.54 10259 102.61 102.61 102.62 102.62 102,62 102.62 102.62 102.62 LCL 98.83 98.32 98.21 9817 88 15 9815 9815 98.15 98.15 88.15 98.15 98.15
For each model, forecasts start after fhe last non-missing in the range of the requested estimation period, and end at the last period for which non-missing values of all the predictors are available or atthe end date of the requested forecast period, whichever is earlier
Model! Statistics Model Fit statistics Ljung-Box Q(18) Number of Stationary R- Number of
Model Predictors squared Statistics OF Sig Outliers
VAR00002-Model_1 0 502 | 12825 | 7 | 076 0
Trang 19Residual PACF Residual ACF
Trang 207 Lựa chọn mô hình và thực hiện dự báo:
Từ kết quả ước lượng trên, ta có bảng so sánh như sau:
Trong các mô hình bên trên, có 3 mô hình phù hợp là ARIMA(I, 0, 1); ARIMA(I,
0, 9) va ARIMA(2, 0, 1) đều không phù hợp để thực hiện dự báo do có tat cả phần dư trên
đồ thị ACF và PACF đều không phải nhiều trắng Vì vậy mô hình ARIMAQ, 0, 1) là tốt nhất do có phần dư là nhiễu trắng, hệ số xác định hiệu chỉnh và giá trị MSE nhỏ nhất
- Kết quả dự báo chỉ số giá lương thực 12 tháng năm 2022 ứng với giá trị của các quan sat thir 145 dén 156 trén bang Forecast:
2
19
Trang 21
LCL 98.19 98.08 98.01 98.00 97.99 97.99
20