TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN-- --BÀI TẬP LỚN Môn: Dự báo kinh tế- xã hội Đề bài: Hãy vận dụng các phương pháp dự báo đã học, thu thập dữ liệu để dự báo một trong các chỉ tiêu sau đâ
Trang 1TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN
BÀI TẬP LỚN Môn: Dự báo kinh tế- xã hội
Đề bài: Hãy vận dụng các phương pháp dự báo đã học, thu thập dữ
liệu để dự báo một trong các chỉ tiêu sau đây ở Việt Nam: Chỉ số giá tiêu dùng; Số giờ nắng các tháng trong năm tại Hà Nội; Giá cổ phiếu chứng khoán của một Mã cổ phiếu niêm yết trên thị trường.
Sinh viên thực hiện: Chiang Kuan Wei
Mã sinh viên: 11237126
Lớp học phần: PTCC1126(124)_02
Giảng viên hướng dẫn: PGS.TS Lê Huy Đức
Trang 2Mục Lục
1 Mô tả nguồn dữ liệu
1.1 Yêu cầu về thu nhập dữ liệu
1.2 Nguồn thu thập dữ liệu
1.3 Phương pháp dự báo thu nhập
1.4 Quản lý dữ liệu cho dự báo
2 Lựa chọn mô hình và phương pháp cho dự báo
2.1 Một số khái niệm và mô hình ARIMA
2.1.1 Chuỗi dừng
2.1.2 Quá trình tự hồi quy AR
2.1.3 Quá trình trung bình trượt MA
2.1.4 Quá trình trung bình trượt và tự hồi quy ARMA
2.1.5 Quá trình trung bình trượt, tích hợp, tự hồi quy ARIMA
2.2 Phương pháp BOX JENKINS
2.2.1 Kiểm tra tính dừng
2.2.2 Nhận dạng mô hình
2.2.3 Ước lượng mô hình
2.2.4 Kiểm định mô hình
3 Sử dụng các phần mềm để ước lượng mô hình ARIMA
3.1 Nhân dạng mô hình ARIMA
3.1.1 Kiểm tra tính dừng
3.1.2 Bọn bậc AR(p) và bậc MA(q) tối ưu:
3.2 Chạy mô hình ARIMA nói trên có được trên phần mềm SPSS để ước lượng kiểm định và
dự báo
3.2.1 Ước lượng mô hình ARIMA và kiểm định mô hình
3.2.2 Đưa ra dự báo
TÀI LIỆU THAM KHẢO
Trang 3Lời mở đầu
Trong nền kinh tế hiện đại, việc đo lường và theo dõi sự biến động giá cả hàng hóa và dịch vụ là vô cùng quan trọng Một trong những chỉ số phổ biến và có ý nghĩa nhất để phản ánh sự thay đổi này chính là chỉ số giá tiêu CPI được coi là một chỉ báo kinh tế vĩ
mô quan trọng, cung cấp cái nhìn tổng quan về mức độ thay đổi giá cả mà người tiêu dùng phải đối mặt Sự biến động của CPI ảnh hưởng trực tiếp đến đời sống của người dân
và là cơ sở để đánh giá mức lạm phát trong nền kinh tế
Tại Việt Nam, chỉ số CPI không chỉ là công cụ quan trọng trong việc đo lường lạm phát
mà còn là yếu tố quan trọng giúp chính phủ điều chỉnh các chính sách tài khóa và tiền tệ Việc dự báo chính xác CPI có thể hỗ trợ cho các nhà quản lý kinh tế trong việc xây dựng các chính sách kinh tế phù hợp, từ đó đảm bảo ổn định giá cả và bảo vệ sức mua của đồng tiền Hơn thế nữa, CPI còn đóng vai trò quan trọng trong việc tính toán các yếu tố kinh tế khác như tiền lương, lợi tức trái phiếu, và các chương trình an sinh xã hội
Trong bối cảnh nền kinh tế Việt Nam đang phải đối mặt với nhiều biến động, từ tác động của thị trường quốc tế đến sự thay đổi trong cung cầu nội địa, việc dự báo CPI trở nên ngày càng cần thiết Những biến động về giá năng lượng, thực phẩm, và chi phí sản xuất
là những yếu tố chính ảnh hưởng mạnh mẽ đến chỉ số này Sự thay đổi của CPI không chỉ phản ánh tình hình kinh tế hiện tại mà còn giúp dự đoán xu hướng tương lai, từ đó hỗ trợ cho các doanh nghiệp và nhà đầu tư ra quyết định
Nghiên cứu này sẽ tập trung vào việc thu thập và phân tích dữ liệu CPI của Việt Nam qua các năm, áp dụng các phương pháp thống kê và mô hình dự báo chuỗi thời gian như Trung bình Di động (Moving Average), Hồi quy tuyến tính (Linear Regression), ARIMA
và Holt-Winters Các phương pháp này sẽ được so sánh về độ chính xác nhằm tìm ra mô hình phù hợp nhất cho việc dự báo CPI trong tương lai Thông qua nghiên cứu, chúng tôi mong muốn mang đến cái nhìn toàn diện về sự biến động của chỉ số giá tiêu dùng tại Việt Nam, từ đó cung cấp thông tin hữu ích cho việc hoạch định chính sách kinh tế và quản lý tài chính cá nhân
Nghiên cứu này không chỉ có ý nghĩa về mặt học thuật mà còn mang lại những ứng dụng thực tiễn quan trọng Kết quả dự báo sẽ cung cấp thông tin giá trị cho các nhà hoạch định chính sách, giúp họ đưa ra các biện pháp thích hợp nhằm kiểm soát lạm phát và duy trì sự
ổn định kinh tế Đồng thời, nghiên cứu cũng mang đến kiến thức hữu ích cho các doanh nghiệp và cá nhân trong việc xây dựng chiến lược tài chính, quản lý rủi ro trước sự biến động của giá cả thị trường
Với tất cả những lý do trên, đề tài "Dự báo chỉ số giá tiêu dùng (CPI) của Việt Nam" được lựa chọn để thực hiện với hy vọng đóng góp một phần nhỏ vào việc phân tích và dự báo kinh tế, giúp ích cho sự phát triển bền vững của nền kinh tế Việt Nam
1 Mô tả nguồn dữ liệu
Trang 41.1 Yêu cầu về thu thập dữ liệu
- Thu thập dữ liệu là quá trình lựa chọn và tập hợp các loại dữ liệu từ nhiều nguồn khác nhau nhằm đáp ứng yêu cầu thông tin phục vụ cho dự báo Đối với dự báo CPI, cơ sở
dữ liệu ban đầu cần phải đảm bảo các yêu cầu quan trọng:
- Tính đầy đủ: Dữ liệu phải đủ dài và chi tiết để phát hiện được xu hướng biến động của CPI Ngoài các chỉ số CPI định lượng, dữ liệu cũng cần bao gồm các yếu tố tác động như giá năng lượng, thực phẩm, tỷ giá hối đoái và các chính sách tiền tệ Dữ liệu phải được thu thập từ các nguồn đáng tin cậy và đảm bảo tính khách quan
- Tính chính xác: Các dữ liệu thu thập phải chính xác, phản ánh đúng mức thay đổi của giá cả và các yếu tố tác động đến CPI Điều này đặc biệt quan trọng khi sử dụng mô hình dự báo phức tạp như ARIMA hay hồi quy tuyến tính
- Tính phù hợp: Dữ liệu phải phù hợp với mục tiêu dự báo về nội dung, hình thức biểu hiện, đơn vị đo lường, và thời gian Chẳng hạn, dữ liệu về CPI phải được thu thập định kỳ hàng tháng hoặc hàng quý để đảm bảo phản ánh đúng sự biến động của chỉ số này trong từng giai đoạn
- Tính liên tục về thời gian: Dữ liệu được thu thập, tổng hợp và trình bày theo thời gian thường được sử dụng rộng rãi trong dự báo Trong thực tế, số liệu thu thập được theo thời gian là những chuỗi thời gian rất hữu ích đối với một lớp rộng lớn các phương pháp dự báo áp dụng trong kinh tế - xã hội và kinh doanh Theo yêu cầu này, các dữ liệu thu thập cần đảm bảo tính liên tục, có khoảng cách quan sát đều nhau và có độ dài phù hợp
1.2 Nguồn thu thập dữ liệu
- Dữ liệu sử dụng trong phân tích kinh tế - xã hội nói chung được thu thập từ rất
nhiều nguồn khác nhau Trong thực tế, nguồn dữ liệu sử dụng cho dự báo có nguồn xuất xứ khác nhau song có thể phân thành hai nguồn chính: nguồn dữ liệu sơ cấp
và nguồn dữ liệu thứ cấp Dữ liệu sơ cấp được thu thập trực tiếp khi thực hiện
nhiệm vụ dự báo thông qua quan sát, phỏng vấn, khảo sát, thí nghiệm cụ thể, hoặc kết quả điều tra khảo sát của các cơ quan chuyên môn Thông dụng hơn, dữ liệu sơ cấp còn được thu thập từ việc ghi chép sự biến động của một số chỉ tiêu thống kê một số biến cần nghiên cứu trong phạm vi doanh nghiệp theo thời gian xuất hiện Các phương pháp dự báo định tính và định lượng đều có thể sử dụng dữ liệu sơ cấp
để tiến hành các dự báo cho các đối tượng dự báo khác nhau Các phương pháp dự báo định lượng sử dụng dữ liệu sơ cấp dưới dạng số liệu để tiến hành dự báo về
trạng thái của đối tượng dự báo ví dụ khối lượng bán hàng hoặc khối lượng hàng
dự trữ.… Còn phương pháp dự báo định tính sử dụng nguồn dữ liệu sơ cấp xây
dựng các tiêu thức đánh giá mang tính dự báo, hoặc sử dụng dữ liệu sơ cấp cho
điều chỉnh ý kiến đánh giá dự báo
Trang 5Nghiên cứu của em sử dụng nguồn dữ liệu sơ cấp là dữ liệu về chỉ số tiêu thụ của Việt nam( theo tháng, nắm) trong giai đoạn 2019 – 2023 Tổng cục thống kê tiến hành là nơi cung cấp nguồn dữ liệu sơ cấp lớn ở Việt Nam đảm bảo đầy đủ các tiêu chí trong yêu cầu về dữ liệu khi phục vụ cho dự báo
Năm
/Tháng
Tháng
1
Tháng 2
Tháng 3
Tháng 4
Tháng 5
Tháng 6
Tháng 7
Tháng 8
Tháng 9
Tháng 10
Tháng 11
Tháng 12
2019 2.56% 2.64% 2.70% 2.93% 2.88% 2.64% 2.44% 2.26% 2.20% 2.24% 2.23% 2.79%
2020 6.43% 5.40% 4.87% 4.21% 2.40% 3.17% 3.39% 3.18% 3.00% 2.47% 1.48% 0.19%
2021 0.97% 0.70% 1.16% 2.70% 2.90% 2.41% 2.64% 2.82% 2.06% 1.77% 2.10% 1.81%
2022 1.94% 1.42% 2.41% 2.64% 2.86% 3.37% 3.14% 2.89% 3.32% 4.31% 4.37% 4.55%
2023 4.89% 4.31% 3.35% 3.84% 4.39% 4.17% 3.41% 3.25% 3.66% 3.59% 3.18% 3.16%
1.3 Phương pháp dự báo thu thập
- Các dữ liệu sơ cấp phục vụ dự báo được thu thập bằng nhiều phương pháp khác
nhau như quan sát, phỏng vấn, thảo luận nhóm và khảo sát ý kiến Trong đó tiến
hành phương pháp quan sát có thể quan sát và ghi chép một cách trực tiếp hoặc
thông qua việc nghiên cứu tài liệu sẵn có về chỉ số tiêu dùng của Việt Nam
trong giai đoạn 2019-2023 từ nguồn dữ liệu của Tổng cục thống kê
- Trong quá trình thu thập, có thấp nhiều nguyên nhân có thể gây sai số Do vậy xử lý
sơ bộ dữ liệu là khâu quan trọng nhằm hoàn thiện bộ dữ liệu trước khi sử dụng chúng vào xây dựng mô hình dự báo nhằm loại bỏ sai bố và đảm bảo các yêu cầu về tính
khách quan, tính phù hợp và tính đồng nhất về nội dung
1.4 Quản lý dữ liệu cho dự báo
- Phần lớn các phương pháp dự báo được tiến hành dựa trên những dữ liệu quá 23
khứ và hiện tại để dự báo trạng thái của đối tượng dự báo trong tương lai Sự sẵn
có của dữ liệu sẽ là cơ sở quan trọng lựa chọn phương pháp dự báo và có thể ảnh
hưởng tới kết quả dự báo
2 Lựa chọn mô hình và phương pháp cho dự báo
2.1 Một số khái niệm và mô hình ARIMA
2.1.1 Chuỗi dừng
- Trong thống kê, kinh tế lượng và toán tài chính, một chuỗi thời gian là một chuỗi các điểm dữ liệu, thường được đo ở lần liên tiếp cách nhau khoảng thời gian thống nhất
Dự báo chuỗi thời gian là sử dụng một mô hình dự báo các sự kiện tương lai dựa trên
sự kiện quá khứ được biết: để dự đoán điểm dữ liệu trước khi chúng được đo Một ví
dụ về dự báo chuỗi thời gian trong kinh tế lượng là dự đoán chỉ số giá (lạm phát) của một nền kinh tế dựa vào mô hình đáng tin cậy
- Định nghĩa: Chuỗi dừng gọi là dừng khi nó thỏa mãn các điều kiện sau đây:
Có trung bình không thay đổi theo thời gian: E(= với mọi t
Có phương sai không thay đổi theo thời gian: Var( với mọi t
Trang 6 Có hiệp phương sai chỉ phụ thuộc vào khoảng cách giữa các quan sát chứ không
o Có trung bình không thay đổi theo thời gian
o Có phương sai không thay đổi theo thời gian
o Có hiệp phương sai chỉ phụ thuộc vào khoảng cách giữa các quan sát chứ không phụ thuộc vào thời gian
- Kiểm định tính dừng
( Kiểm định tính dừng trên lược đồ tự quan )
+ Một trong các kiểm định đơn giản là kiểm định tính dừng dựa trên lược đồ tương quan
Hàm tự tương quan ACF:
- CỤ THỂ:
( Kiểm định nghiệm đơn vị )
- Xét mô hình:
+ Một mô hình được coi là đầy đủ nếu các phần dư là ngẫu nhiên
Nhiễu trắng: có E(Ut)=0 )
+ Kiểm định Dickey-fuller:
Trang 7Cả hai phương pháp đều cho ta kết quả giống nhau là chuỗi dừng Trong thực tế khi thực hiện ta có thể sử dụng một trong hai phương pháp hoặc cả hai phương pháp để xem xét một cách chính xác hơn
2.1.2 Quá trình tự hồi quy AR
- Quá trình trự hồi quy bậc p có dạng:
- Trong đó: ut là nhiễu trắng
2.1.3 Quá trình trung bình trượt MA
- Quá trình MA(q) là quá trình có dạng :
Trang 8- Mô hình:
- Trong đó ut là nhiễu trắng
2.1.4 Quá trình trung bình trượt và tự hồi quy ARMA
- Cơ chế sản sinh ra Y không chỉ có AR hoặc MA mà có thể kết hợp cả 2 yếu tố Khi
kết hợp cả 2 yếu tố ta có quá trình trung bình trượt và tự hồi quy:
- Dạng tổng quát:
- Khi đó dự báo:
Trang 92.1.5 Quá trình trung bình trượt, tích hợp, tự hồi quy ARIMA
- Chuỗi thời gian xuất phát có thể dừng hoặc không dừng Để là chuỗi dừng chúng ta cần lấy sai phân Chuỗi được gọi là đồng liên kết bậc d nếu chuỗi sai phân bậc d là chuỗi dừng Áp dụng mô hình ARIMA (p,q) cho ta quá trình trung bình trược, tích hợp, tự hồi quy ARIMA (p,d,q).
2.2 Phương pháp BOX JENKINS
- Phương pháp này sử dụng chuỗi thời gian trong quá khứ để dự báo cho tương lai Việc kết hợp mô hình ARIMA và phương pháp Box-Jenkins sẽ giúp xử lý vấn đề này Quá trình gồm 5 bước:
o Bước 1: Kiểm tra tính dừng
o Bước 2: Nhận dạng mô hình
o Bước 3: Ước lượng mô hình
o Bước 4: Kiểm định mô hình
o Bước 5: Sử dụng mô hình để dự báo
- Sơ đồ mô tả các bước thực hiện
Kiểm định xem liệu mô hình có đầy đủ không?
Sử dụng mô hình này
để
dự báo
Ước lượng tham số của mô hình thử nghiệm này
Nhận dạng một mô hình
thử nghiệm
Xây dựng một tập hợp
nhiều mô hình
KHÔNG
CÓ
Trang 102.2.1 Kiểm tra tính dừng
- Có 3 phương pháp:
o Vẽ đồ thị chuỗi thời gian, nhận xét qua hình dạng của đồ thị
o Thông qua hàm tự tương quan mẫu: SACF
TRONG ĐÓ:
- Nếu:
o SACF giảm nhanh và không có xu thế → chuỗi dừng
o SACF giảm chậm, có xu thế → chuỗi không dừng
Sử dụng phương pháp kiểm định nghiệm đơn vị ( Kiểm định
Dickey-Fuller).Trên Eview: View/Unit Root Test
Nếu: thì chuỗi là dừng và ngược lại
2.2.2 Nhận dạng mô hình
- Nếu SACF giảm về 0 theo cấp số nhân và SPACF mất đi, mô hình sẽ đòi hỏi thành phần AR
- Nếu SACF mất đi và SPACF giảm dần về 0, mô hình đòi hỏi thành phần trung bình trượt MA
- Nếu cả SACF và SPACF giảm dần về giá trị 0, cả hai thành phần AR và MA đều cần thiết
- Số các SACF và SPACF có ý nghĩa thống kê là bậc của MA và AR
Trang 11(p,d,0) Giảm dạng mũ hoặc hình sin rkk =0 với k>p
(0,d,q
)
rk = 0 với k>q Giảm dạng mũ hoặc hình sin
(1,d,1
)
r1≠0, Sau đó giảm dạng mũ hoặc giả
m hình sin
r11≠0, Sau đó giảm dạng mũ hoặc giảm
hình sin
(1,d,2
) r1, r2 ≠0, Sau đó giảm dạng mũ hoặc giảm hình sin r11≠0, Sau đó giảm dạng mũ hoặc giảm hình sin
(2,d,1
)
r1≠0, Sau đó giảm dạng mũ hoặc giả
m hình sin
r11, r22 ≠0, Sau đó giảm dạng mũ hoặc
giảm hình sin
(2,d,2
) r1, r2 ≠0, Sau đó giảm dạng mũ hoặc giảm hình sin r11, r22 ≠0, Sau đó giảm dạng mũ hoặc giảm hình sin
2.2.3 Ước lượng mô hình
- Sau khi định dạng mô hình ta biết bậc sai phân d của chuỗi xuất phát để thu được
chuỗi dừng Và ta cũng đã biết p,q Do đó ta dùng phương pháp bình phương nhỏ nhất
để ước lượng mô hình ARIMA này Sử dụng phần mềm EVIEWS, SPSS, STATA, chúng ta dễ dàng ước lượng mô hình này bằng phương pháp bình phương nhỏ nhất
2.2.4 Kiểm định mô hình
- Bằng cách nào ta biết mô hình đã lựa chọn phù hợp với thực tế Nếu như mô hình là thích hợp thì các yếu tố ngẫu nhiên là nhiễu trắng Do đó để xem mô hình có phù hợp hay không ta phải kiểm định phần dư Kết quả ước lượng từ mô hình ARIMA cho ta phần dư
- Dùng ADF để kiểm định xem phần dư có phải là nhiễu trắng hay không Các phần dư
tự tương quan nhỏ và dao động trong khoảng
- Lược đồ ACF và PACF các phần dư không bao gồm các giá trị khác 0 có ý nghĩa thống kê
- Kiểm định 1/2 dựa trên thống kê Q Ljung-Box được sử dụng để kiểm tra toàn diện tính đầy đủ của mô hình:
- Trong đó: rk(ut) = các HSTTQ phần dư tại độ trễ k; n = số lượng phần dư; k = độ
Trang 12trễ; m = số lượng biến trễ cần được kiểm định.
- Nếu giá trị Q lớn hơn giá trị tới hạn hoặc value của thống kê Q là nhỏ (cụ thể, p-value < 0.05), mô hình được xem như không phù hợp
3 Sử dụng mô hình ARIMA
3.1 Nhận dạng mô hình ARIMA
3.1.1 Kiểm tra tính dừng
(Sử dụng EVIEW 12 vẽ đồ thị biến CPI theo tháng từ 2019 – 2023)
Hình 1
Kiểm nghiệm đơn vị
Trang 13Có Mean = 2.857 Có hằng số
Hồi quy chuỗi gialuongthuc theo thời gian, nhập ls CPI c @trend trên thanh lệnh màn hình, kết quả như sau:
Hình 2
Ta thấy giá trị p – value = 0.442<0.05 => chuỗi CPI không có xu thế
- Kiểm định tính dừng
- Kiểm định cặp giả thuyết :
H0: =0: Chuỗi không dừng xu thế
H1: ≠0: Chuỗi là dừng xu thế
Sử dụng phần Unit root tests trong Eviews, ta được bảng sau
Trang 14Ta có thể thấy P – value = 0.000 < = 5%; nên ta bác bỏ giả thiết H0 => Chuỗi CPI là chuỗi dừng Do đó mô hình ARIMA mà ta xây dựng có d = 0
3.1.2 Chọn bậc AR(p) và bậc MA(q) tối ưu:
Từ chuỗi CPI đã dừng, chọn View => Correlogram để xem giản đồ tự
tương quan của chuỗi