Câu 2: Hãy thu thập dữ liệu về một hiện tượng kinh tế - xã hội theo thời gian Chuỗi không ít hơn 50 quan sát, có trích dẫn nguồn dữ liệu, từ đó áp dụng mô hình ARIMA để dự báo cho ít nh
Trang 1Câu 2: Hãy thu thập dữ liệu về một hiện tượng kinh tế - xã hội theo thời gian (Chuỗi không ít hơn 50 quan sát, có trích dẫn nguồn dữ liệu), từ đó áp dụng mô hình
ARIMA để dự báo cho ít nhất 5 quan sát trong tương lai
Bảng tốc độ tăng trưởng dân số đô thị Việt Nam (%/năm)
1968 4,633717953 1996 3,323977569
1969 4,823676052 1997 3,170995056
1970 4,709786714 1998 3,034744589
1971 2,977730867 1999 3,079498987
1972 2,883167349 2000 3,431744248
1973 2,808067685 2001 3,342092307
1974 2,763259352 2002 3,277059266
1975 2,733059703 2003 3,212619925
1976 2,709892070 2004 3,178017865
1977 2,685338537 2005 3,147253382
1978 2,683493486 2006 3,128304833
1979 2,712700363 2007 3,114679715
1980 2,611845077 2008 3,113668324
1981 2,603937451 2009 3,137466150
1982 2,642984151 2010 3,207515032
1983 2,660648362 2011 3,240144499
1984 2,656810870 2012 3,267870079
1985 2,636292701 2013 3,259347044
1986 2,610286892 2014 3,231327447
1987 2,571235999 2015 3,177314330
1988 2,542076087 2016 3,112603055
1989 2,887584290 2017 3,038908384
1995 3,492844559
1 Kiểm định tính dừng
Kiểm định tính dừng của Y thông qua kiểm định ADF
Trang 2Ta thu được kết quả sau:
Hình 1.2: Kết quả kiểm định ADF với Y
Kết quả cho Prob=0.0012<0.05, vậy chuỗi thời gian Y có tính dừng ngay ở bậc 0
2 Xác định bậc của p và q
Ta sử dụng View → Correlogram ta sẽ được đồ thị AC và PAC để xác định p và q như
Trang 3Hình 2.1: biểu đồ tự tương quan và tự tương quan riêng phần
Từ đồ thị ta xác định được p=1,2 và q=1,2,15,16,17,18 do đó ta thiết lập được các mô hình ARIMA sau: ARIMA(1,0,1), ARIMA(1,0,2), ARIMA(1,0,15), ARIMA(1,0,16), ARIMA(1,0,17), ARIMA(1,0,18), ARIMA(2,0,1), ARIMA(2,0,2), ARIMA(2,0,15), ARIMA(2,0,16), ARIMA(2,0,17), ARIMA(2,0,18)
3 Ước lượng mô hình
Kết quả ước lượng bằng phần mềm Eview như sau:
Trang 4Hình 3.2 Kết quả ước lượng cho mô hình ARIMA(1,0,2)
Trang 5Hình 3.3 Kết quả ước lượng cho mô hình ARIMA(1,0,15)
Hình 3.4 Kết quả ước lượng cho mô hình ARIMA(1,0,16)
Trang 6Hình 3.6 Kết quả ước lượng cho mô hình ARIMA(1,0,18)
Trang 7Hình 3.7 Kết quả ước lượng cho mô hình ARIMA(2,0,1)
Hình 3.8 Kết quả ước lượng cho mô hình ARIMA(2,0,2)
Trang 8Hình 3.10 Kết quả ước lượng cho mô hình ARIMA(2,0,16)
Trang 9Hình 3.11 Kết quả ước lượng cho mô hình ARIMA(2,0,17)
Hình 3.12 Kết quả ước lượng cho mô hình ARIMA(2,0,18)
Từ các kết quả ước lượng hồi quy trên ta thấy chỉ có mô hình ARIMA(2,0,1) là có ý nghĩa
thống kê → chọn làm mô hình dự báo
4 Dự báo
Trang 103.4
3.6
3.8
4.0
4.2
4.4
4.6
4.8
YF
Hình 4.1 Đồ thị dự báo mô hình ARIMA(2,0,1)
Có thể thấy theo xu hướng trên thì dự báo trong 5 năm tới tốc độ tăng trưởng dân số ở thành thị sẽ tăng với tốc độ xấp xỉ 3,29% một năm
Bảng kết quả dự báo tăng trưởng nhân số đô thị (%/năm)
Năm Y(%/năm) Năm Y(%/năm)
1999 3,079498987 2012 3,291399370
2000 3,431744248 2013 3,291241699
2001 3,342092307 2014 3,291119828
2002 3,277059266 2015 3,291007974
2003 3,212619925 2016 3,290921517
2004 3,178017865 2017 3,290842166
2010 3,291793414
Trang 11Hình 5.1 Kết quả kiểm định phần dư
Từ kết quả hình 5.1 cho thấy Prob=0.0000<0.05 điều này có nghĩa là phần dư của mô hình ARIMA(2,0,1) không có tự tương quan Và điều này có thể thấy rõ hơn trong từng hệ số tương quan của các phân dư trong kết quả trong hình 5.2 sau:
Hình 5.2 Biểu đồ tự tương quan phần dư của mô hình ARIMA(2,0,1)
• Đánh giá dự báo
✓ MAPE = 16,99799% là khá nhỏ nên dự báo là đáng tin cậy
✓ Do chuỗi thời gian là dài hạn nên khi sử dụng mô hình ARIMA dự báo thì độ chính xác chưa cao Thông thường, mô hình ARIMA chỉ dự báo một cách
chính xác cho các đối tượng biến động trong ngắn hạn
Trang 12Câu 3: Hãy thu thập dữ liệu về một biến CẦN GIẢI THÍCH và ít nhất 3 biến GIẢI THÍCH (Dãy dữ liệu không ít hơn 20 quan sát, có trích dẫn nguồn), từ đó áp dụng
Mô hình hồi quy bội để dự báo biến phụ thuộc (bao gồm dự báo điểm và dự báo khoảng) tại giá trị trung bình của các biến giải thích
Bài làm
Sự phụ thuộc của biến tăng trưởng giá trị sản xuất nông nghiệp vào biến tăng trưởng giá trị sản xuất của các biến trồng trọt, chăn nuôi và dịch vụ nông nghiệp
Bảng 1: tăng trưởng giá trị sản xuất nông nghiệp giai đoạn 1991- 2012 (%)
Năm nghiệp Nông trồng trọt Chăn
nuôi Dịch vụ
TB
4,831818 6,427273 3,190909
Trang 131 Xây dựng mô hình
1.1 Hàm hồi quy mẫu (dạng hàm): NN̂ = â + b̂ *TT + ĉ*CN + d̂*DV
Trong đó:
- Biến phụ thuộc: NN là tốc độ tăng trưởng sản xuất nông nghiệp
- Các biến độc lập:
✓ TT: Tốc độ tăng trưởng ngành trồng trọt
✓ CN: Tốc độ tăng trưởng ngành chăn nuôi
✓ DV: Tốc độ tăng trưởng ngành dịch vụ nông nghiệp
Kỳ vọng dấu và ý nghĩa các hệ số
- b̂ >0, cho biết trong điều kiện các yếu tố khác không đổi thì trồng trọt tăng trưởng
1% thì trung bình tăng trưởng giá trị sản xuất nông nghiệp là b̂ %
- ĉ >0, cho biết trong điều kiện các yếu tố khác không đổi thì chăn nuôi tăng trưởng 1% thì trung bình tăng trưởng giá trị sản xuất nông nghiệp là ĉ %
- d̂ >0, cho biết trong điều kiện các yếu tố khác không đổi thì dịch vụ nông nghiệp
tăng trưởng 1% thì trung bình tăng trưởng giá trị sản xuất nông nghiệp là d̂%
1.2 Ước lượng mô hình
Ta tiến hành ước lượng tham số cho mô hình này trên Eview bằng phương pháp OLS và thu được kết quả như bảng sau:
Trang 14Cũng từ bảng kết quả hồi quy trên ta có hàm hồi quy mẫu và cũng là hàm dự báo như sau:
𝐍𝐍̂ = 0,036629+ 0,790226*TT + 0,177234*CN + 0,027527*DV
Ý nghĩa các hệ số ước lượng:
b̂ = 0,790226 cho biết khi trồng trọt tăng 1% thì trung bình nông nghiệp tăng 0,790226%,
trong điều kiện các yếu tố khác không đổi
ĉ = 0,177234 cho biết khi chăn nuôi tăng 1% thì trung bình nông nghiệp tăng 0,177234%,
trong điều kiện các yếu tố khác không đổi
ĉ = 0,027527 cho biết khi dịch vụ nông nghiệp tăng 1% thì trung bình nông nghiệp tăng
0,027527%, trong điều kiện các yếu tố khác không đổi
1.3 Kiểm định các ước lượng và mô hình
Khi các tham số của mô hình được ước lượng, chúng cần được kiểm định xem có ý nghĩa về mặt thống kê hay không và mô hình có phù hợp với cho mục tiêu dự báo hay không, hay mức
độ ảnh hưởng của các biến độc lập tới biến phụ thuộc Phần này sẽ đề cập tới kiểm định t,
Trang 15Dựa vào kết quả hồi quy bảng ta được:
R2 = 0,999141, điều này cho biết các biến TT, CN, DV giải thích được 99,9141% sự thay đổi của biến NN Vậy mối quan hệ giữa các TT, CN, DV và NN trong mô hình là chặt chẽ gần như tuyệt đối
Kiểm định sự phù hợp của mô hình (kiểm định F)
Kiểm định sự phù hợp của mô hình hồi quy được tiến hành thông qua sử dụng kết quả kiểm định F-statistic = 6979,105 với giá trị p-value(F-statistic) = 0,000000 trong bảng 2 Kết quả này khẳng định mô hình sử dụng trong dự báo này là phù hợp
2 Tiến hành dự báo
Từ dữ liệu bảng 1 ta tính được giá trị trung bình của các biến độc lập lần lượt là:
TT̅̅̅̅ = 4,831818
CN ̅̅̅̅ = 6,427273
DV̅̅̅̅ = 3,190909
2.1 Kết quả dự báo điểm:
𝑵𝑵̂ = 0,036629+ 0,790226*4,831818 + 0,177234*6,427273 + 0,027527*3,190909 =
5,081818 (%)
Vậy tại các giá trị trung bình, trong năm 2013 tốc độ tăng trưởng sản xuất nông nghiệp dự
kiến sẽ tăng 5,081818 (%)
2.2 Dự báo khoảng:
- Khoảng tin cậy:
Hình 1: Đồ thị giá thị thực tế và giá trị dự báo
Trang 161.717* √0,054897
18 = 0,094822
(do các giá trị biến phụ thuộc đều lấy tại giá trị trung bình nên
u
q,
u u q q qu
detL
X X X X
= 0)
Vậy, kết quả dự báo khoảng: 5,081818 – 0,094822 < NN < 5,081818 + 0,094822
4,986996 < Y < 5,17664
3 Đánh giá dự báo
3.1 Các hệ số:
𝑏̂ = 𝟎, 𝟕𝟗𝟎𝟐𝟐𝟔 => Khi trồng trọt tăng 1% thì nông nghiệp tăng 0,790226% P-value = 0
< 0.05 nên hệ số này có ý nghĩa thống kê
𝑐̂ = 𝟎, 𝟏𝟕𝟕𝟐𝟑𝟒 => Khi chăn nuôi tăng trưởng 1% thì nông nghiệp tăng trưởng
0,177234% P-value = 0 < 0.05 nên hệ số này có ý nghĩa thống kê
𝑑̂ = 𝟎, 𝟎𝟐𝟕𝟓𝟐𝟕 => Khi dịch vụ nông nghiệp tăng trưởng 1% thì nông nghiệp tăng
trưởng 0,027527% P-value = 0.0011< 0.05 nên hệ số này có ý nghĩa thống kê
3.2 Mô hình hồi quy
Prob(F-statistic) = 0,000000 < 0.05 cho thấy đây là mô hình hồi quy tốt và đáng tin cậy
3.3 Sai số dự báo
Trang 173
4
5
6
7
8
9
92 94 96 98 00 02 04 06 08 10 12
NNF ± 2 S.E.
Forecast: NNF Actual: NN Forecast sample: 1991 2012 Included observations: 22 Root Mean Squared Error 0.049656 Mean Absolute Error 0.043564 Mean Abs Percent Error 0.979341 Theil Inequality Coefficient 0.004635 Bias Proportion 0.000000 Variance Proportion 0.000215 Covariance Proportion 0.999785 Theil U2 Coefficient 0.018907 Symmetric MAPE 0.981549
Hình 2: Đồ thị sai số dự dự báo
Từ đồ thị ta thấy:
- MAPE = 0,979341
- MSE = 0,049654
Các sai số trên cho thấy dự báo có tính chính xác rất cao