Bài thực hành kinh tế lượng.Vấn đề nghiên cứu: Diện tích rừng mất đi với mật độ dân số, diện tích đất canh tác và diện tích đồng cỏ chăn nuôi Vấn đề nghiên cứu: Diện tích rừng mất đi với mật độ dân số, diện tích đất canh tác và diện tích đồng cỏ chăn nuôi
Trang 1Vấn đề nghiên cứu :
Diện tích rừng mất đi với mật độ dân số, diện tích đất canh tác và diện tích đồng cỏ
chăn nuôi
I., Cơ sở lý thuyết.
Diện tích rừng mất đi phụ thuộc vào một số yếu tố sau đây:
+ Mật độ dân số: khi mật độ dân số càng cao thì xu hướng sẽ là mở rộng diện tích đất đai cho người dân có them không gian sống Điều đó có nghĩa là sẽ phải hy sinh một lượng diện tích rừng và làm diện tích rừng bị mất tăng lên
+ Diện tích đất dành cho trồng trọt: khi ngành trồng trọt phát triển mạnh, hay người dân cần nhiều đất hơn để trồng các loại cây lương thực, thực phẩm, công nghiệp,… họ sẽ phá rừng và tất nhiên diện tích rừng bị mất sẽ tăng lên
+ Diện tích đất dành cho chăn nuôi: tương tự như ảnh hưởng của diện tích đất dành cho trồng trọt, diện tích đất dành cho chăn nuôi cũng ảnh hưởng cùng chiều đến diện tích rừng bị mất đi Người dân tham gia sản xuất trong lĩnh vực chăn nuôi càng nhiều thì họ sẽ lấy đi của rừng nhiều đất hơn
II Xây dựng mô hình kinh tế lượng
Các biến sử dụng:
Forest_loss: diện tích rừng mất đi
Popdens: mật độ dân số
Cropch: sự thay đổi diện tích đất dành cho trồng trọt
Pasturech: sự thay đổi diện tích đất dành cho chăn nuôi
Ta có : PRF
E(Forest_loss i / Popdens, Cropch, Pasturech) = β1 +β2 Popdens+β3 Cropch
Trang 2Trong đó : Forest_lossi: là biến phụ thuộc
Popdens, Cropch, Pasturech: là biến độc lập
β1 : hệ số chặn
β2, β3, β4 : hệ số góc
Dự kiến dấu:
+ Mật độ dân số tăng làm diện tích rừng bị mất tăng => β2 mang dấu dương
+ Diện tích đất trồng trọt tăng làm diện tích rừng bị mất tăng => β3 mang dấu
dương
+ Diện tích đất chăn nuôi tăng làm diện tích rằng bị mất tăng => β4 mang dấu
dương
Trên cơ sở đó ta có mô hình hồi quy như sau:
SRM : Forest_loss i = b 1 + b 2 Popdens + b 3 Cropch +b 4 Pasturech + e i
Với e i là phần dư của mẫu
• Bảng số liệu về lượng giảm về rừng , mật độ dân số, diện tích canh tác và
diện tích đồng cỏ:
ob
Trang 317 1,1 256 3,4 0 52 2 503 3,7 6,2
+) với số liệu từ mẫu trên tiến hành ước lượng mô hình bằng phần mềm Gretl ta
được kết quả như bảng sau:
Model 1: OLS, using observations 1-70 Dependent variable: Forest_loss
Coefficient Std Error t-ratio p-value
const 0,565674 0,13271 4,2625 0,00007 ***
Popdens 0,00080774
3
0,00011355 8
7,1131 <0,00001 ***
-0,00397477
0,010214 -0,3891 0,69842 Pasturech 0,027966 0,0100031 2,7957 0,00677 ***
Trang 4Mean dependent var 1,138571 S.D dependent var 0,928189
Sum squared resid 30,00558 S.E of regression 0,674263
R-squared 0,495245 Adjusted R-squared 0,472302
F(3, 66) 21,58553 P-value(F) 7,45e-10
Log-likelihood -69,67678 Akaike criterion 147,3536
Schwarz criterion 156,3475 Hannan-Quinn 150,9261
Theo kết quả trên ta được hàm hồi quy miêu tả mối quan hệ giữa các biến kinh tế như sau:
-p-value(Popdens), p-value(Pasturech) < 0,01 => biến có ý nghĩa thống kê ở mức 1%
-p-value(Cropch)=0,6982 > 0,1 => biến Cropch không có ý nghĩa thống kê ở mức 10%
• Ý nghĩa của các hệ số ước lượng:
b1 = 0,536816 > cho t biết khi mật độ dân số và thay đổi của đồng cỏ không thay đổi thì tỷ lệ rừng bị mất là 0,536816
b2 = 0,000814567>0 cho biết khi các yếu tố khác không thay đổi, mật độ dân số tăng lên 1% thì tỷ lệ rừng bị mất là 0,000814567%
b4 =0,0269409 >0 cho biết khi các yếu tố khác không thay đổi, diện tích đất chăn nuôi tăng lên 1% thì tỷ lệ rừng mất đi là 0,0269409%
Theo lý thuyết thì khi dân số tăng và diện tích đất chăn nuôi tăng thì diện tích rừng giảm xống dó đó có thể kết luận các hệ số ước lượng phù hợp với lý thuyết
+) R2 = 0,495245 cho t biết 49, 5245% sự biến động của diện tích rừng được giải thích bởi mật độ dân số, diện tích canh tác và sự thay đổi của đồng cỏ
2. Kiểm định mô hình gốc:
2.1 1.Mô hình có hệ số của Cropch không có ý nghĩa thống kê
2.2 kiểm định sự phù hợp của hàm hồi quy:
Để kiểm định sự phù hợp của hàm hồi quy ta kiểm định cặp giả thiết sau:
H0 : R2 = 0
Trang 5H1 : R2 > 0
Tiêu chuẩn kiểm định:
P-value(F)=7,45e-10 < 0,01 => bác bỏ H0 => mô hình phù hợp
2.3 Mô hình có phân phối e i chuẩn do cỡ mẫu lớn.
Kiểm định Normality cho kết quả p-value=0 => phần dư của mô hình không có phân phối chuẩn Tuy nhiên vì mô hình có kích thước lớn (n=70) nên lỗi này
không ảnh hưởng nghiêm trọng tới mô hình do sự hội tụ về phân phối chuẩn khi kích thước mẫu đủ lớn
2.4 Đa cộng tuyến:
• Phát hiện đa cộng tuyến theo phương pháp hồi quy phụ
Hồi quy PL theo PC bằng phần mềm Gretl ta thu được kết quả sau:
Model 2: OLS, using observations 1-70 Dependent variable: Popdens
Trang 6Coefficient Std Error t-ratio p-value
const 702,673 114,084 6,1592 <0,00001 ***
Cropch -13,8884 10,8568 -1,2792 0,20523
Pasturech 11,0228 10,6771 1,0324 0,30561
Mean dependent var 639,4270 S.D dependent var 726,3400
Sum squared resid 35255298 S.E of regression 725,3954
R-squared 0,031509 Adjusted R-squared 0,002599
F(2, 67) 1,089908 P-value(F) 0,342134
Log-likelihood -558,8628 Akaike criterion 1123,726
Schwarz criterion 1130,471 Hannan-Quinn 1126,405
Ta có P-value(F)= 0,32134 <0,05 => không có hiện tượng đa cộng tuyến
• Có thể phát hiện đa cộng tuyến theo chạy mô hình tính VIF tư động, ta có :
Theo bảng số liệu trên ta có thể thấy rằng VIF(PL) và VIF(PC) <10 nên không có
đa cộng tuyến ở mô hình hồi quy ban đầu
2.5 Phương sai sai số thay đổi:
Trang 7Sử dụng kiểm định White và Breusch-Pagan test để kiểm tra có PSSS thay đổi trong mô hình hay không: ( với số liệu chéo)
Model 1: OLS, using observations 1-70 Dependent variable: Forest_loss
Coefficient Std Error t-ratio p-value
const 0,565674 0,13271 4,2625 0,00007 ***
Popdens 0,00080774
3
0,00011355 8
7,1131 <0,00001 ***
-0,00397477
0,010214 -0,3891 0,69842 Pasturech 0,027966 0,0100031 2,7957 0,00677 ***
Mean dependent var 1,138571 S.D dependent var 0,928189
Sum squared resid 30,00558 S.E of regression 0,674263
R-squared 0,495245 Adjusted R-squared 0,472302
F(3, 66) 21,58553 P-value(F) 7,45e-10
Log-likelihood -69,67678 Akaike criterion 147,3536
Schwarz criterion 156,3475 Hannan-Quinn 150,9261
Test for normality of residual
Null hypothesis: error is normally distributed
Test statistic: Chi-square(2) = 23,0444
with p-value = 9,90787e-006
White's test for heteroskedasticity (squares only)
Null hypothesis: heteroskedasticity not present
Test statistic: LM = 21,2084
with p-value = P(Chi-square(6) > 21,2084) = 0,00168293
White's test for heteroskedasticity
Null hypothesis: heteroskedasticity not present
Test statistic: LM = 30,5016
with p-value = P(Chi-square(9) > 30,5016) = 0,000360303
BreuschPagan test for heteroskedasticity
Null hypothesis: heteroskedasticity not present
Test statistic: LM = 72,5686
Trang 8with p-value = P(Chi-square(3) > 72,5686) = 1,20259e-015
-với White :
p-value = P(Chi-square(9) > 30,501581) = 0,000360303 <0.01 => có
PSSS thay đổi.
-với White's test (squares only)
p-value = P(Chi-square(6) > 21,20815) = 0,00168293 <0.01 => có PSSS thay đổi.
-với Breusch-Pagan test: :
p-value = P(Chi-square(3) > 72,568554) = 1,20259e-015<0,01 => có PSSS thay đổi.
2.6 Tự tương quan.
Đổi số liệu của mô hình về dạng chuỗi thời gian, hồi quy mô hình với sơ liệu đã đổi ta có
Model 6: OLS, using observations 1-70
Dependent variable: FL
Coefficient Std Error t-ratio p-value
const 0,536816 0,109359 4,9088 <0,00001 ***
Popdens 0,00081456
7
0,00011148 3
7,3066 <0,00001 ***
Pasturech 0,0269409 0,00958869 2,8097 0,00649 ***
Mean dependent var 1,138571 S.D dependent var 0,928189
Sum squared resid 30,07442 S.E of regression 0,669979
R-squared 0,494087 Adjusted R-squared 0,478985
F(2, 67) 32,71694 P-value(F) 1,22e-10
Log-likelihood -69,75699 Akaike criterion 145,5140
Schwarz criterion 152,2595 Hannan-Quinn 148,1934
rho -0,016856 Durbin-Watson 2,027822
Theo số liệu trong bảng ta thấy giá trị theo kiểm định Durbin-Watson: d=2,027822 Trong khi đó ta có : du= 1,672 dl=1,554 (với mức ý nghĩa 5%)
Trang 9d=2,027822 ∈ (du, 4-du) => với mức ý nghĩa 5% mô hình không có tự tương quan
3. Khắc phục mô hình có PSSS thay đổi :
phát hiện biến gây ra PSSS thay đổi :
Từ kết quả thu được từ những kiểm định trên ta có thể kết luận mô hình có hiện tượng PSSSTĐ Để có thể khắc phục lỗi này ta cần tìm hiểu xem biến nào gây ra lỗi Ta thực hiện lấy phần dư của mô hình gốc, bình phương lên sau đó vẽ đồ thị về mối quan hệ của nó với lần lượt 3 biến giải thích
Trang 11Từ 3 đồ thị trên ta có thể dễ dàng nhận thấy biến gây ra lỗi PSSSTĐ trong mô hình
là biến Popdens Bây giờ chúng ta sẽ có các phương án để khắc phục PSSS thay đổi do biến Popdens gây ra như sau :
1. Phương án một
• Giả định E(Ui2)=ƃ2Popdens2
Thực hiện hồi quy mô hình theo trọng số Popdens
Ta có
fl_pop=per_pop++cr_pop+pas_pop+v i
Trong đó fl_pop = , per_pop = , cr_pop =
pas_pop = , vi =
• Ta có mô hình hồi quy mới
Model 5: OLS, using observations 1-70 Dependent variable: fl_pop
const 0,0027765 0,000505563 5,4919 <0,00001 ***
per_pop 0,178267 0,0486095 3,6673 0,00049 ***
cr_pop -0,00468473 0,00311844 -1,5023 0,13780
pas_pop 0,00679658 0,0046246 1,4697 0,14641
Mean dependent var 0,006876 S.D dependent var 0,026756
Sum squared resid 0,000908 S.E of regression 0,003710
R-squared 0,981612 Adjusted R-squared 0,980776
F(3, 66) 1174,416 P-value(F) 3,49e-57
Log-likelihood 294,5083 Akaike criterion -581,0166
Schwarz criterion -572,0227 Hannan-Quinn -577,4441
rho -0,019315 Durbin-Watson 2,034742
White's test for heteroskedasticity
Null hypothesis: heteroskedasticity not present
Test statistic: LM = 57,2824
with p-value = P(Chi-square(9) > 57,2824) = 4,46176e-009
BreuschPagan test for heteroskedasticity
Null hypothesis: heteroskedasticity not present
Test statistic: LM = 10,9739
Trang 12with p-value = P(Chi-square(3) > 10,9739) = 0,0118679
• Kiểm định mô hình
1. Mô hình có hệ số của biến cr_pop và pas_pop không có ý nghĩa thống kê
2. hình có xảy ra đa cộng tuyến
Per_pop 212,251 Cr_pop 71,897 Pas_pop 160,191
Ta thấy VIF(Xi) >10 nên có đa cộng tuyến
3. Mô hình phù hợp do P-value(F)=3.49e-57 <0.05
4. Mô hình không có tự tương quan
2<DW=2.034742<4-Du=2.2792
5. Mô hình có PSSSTĐ
+ White’s test: Ta thấy p-value=0.000000<0.05 nên có xảy ra PSSSTĐ
+ BP test
Ta thấy p-value=0.0011868<0.05 nên có xảy ra PSSSTĐ
Vậy ta không nên dùng mô hình này
2. Phương án hai
• Giả định E(Ui2)=ƃ2 Popdens
Thực hiện hồi quy mô hình theo trọng số
Ta có
fl_sqrt_pop=per_sqrt_pop++cr_sqrt_pop+pas_sqrt_pop+vi
Trong đó fl_sqrt_pop = , per_sqrt_pop = ,
per_sqrt_pop = , pas_sqrt_pop = , vi =
• Ta có mô hình hồi quy mới
Model 7: OLS, using observations 1-70 Dependent variable: fl_sqrt_pop
per_sqrt_pop 0,263409 0,0507785 5,1874 <0,00001 ***
cr_sqrt_pop -0,00458343 0,00352437 -1,3005 0,19795
pas_sqrt_pop -0,00237464 0,00471866 -0,5032 0,61647
sqrt_pop 6,13233e-05 2,01104e-05 3,0493 0,00330 ***
Trang 13Mean dependent var 0,006876 S.D dependent var 0,026756
Sum squared resid 0,001160 S.E of regression 0,004192
R-squared 0,977992 Adjusted R-squared 0,976991
F(4, 66) 733,2118 P-value(F) 6,72e-54
Log-likelihood 285,9486 Akaike criterion -563,8971
Schwarz criterion -554,9032 Hannan-Quinn -560,3246
rho 0,088834 Durbin-Watson 1,815018
White's test for heteroskedasticity
Null hypothesis: heteroskedasticity not present
Test statistic: LM = 63,1116
with p-value = P(Chi-square(13) > 63,1116) = 1,44931e-008
White's test for heteroskedasticity (squares only)
Null hypothesis: heteroskedasticity not present
Test statistic: LM = 57,2535
with p-value = P(Chi-square(7) > 57,2535) = 5,32273e-010
• Kiểm định mô hình
1. Mô hình có hai hệ số của biến cr_sqrt_pop và pas_sqrt_pop không có
ý nghĩa thống kê
2. Không có hiện tượng đa cộng tuyến
Per_sqrt_pop 5,883 Sprt_pop 1,546 Cr_sqrt_pop 2,883 Pas_sqrt_pop 4,283
Ta thấy VIF(Xi) <10 nên không có đa cộng tuyến
3. Mô hình phù hợp do có p-value(F)=1.78e-16<0.05
4. Mô hình không có tự tương quan
Du=1.7208<DW=1.929324<2
5. Mô hình có PSSSTĐ
+White’s test
Ta thấy p-value=1,44931e-008<0.05 nên có xảy ra PSSSTĐ
+ White's test (squares only)
Ta thấy p-value=5,32273e-010 <0.05 nên có xảy ra PSSSTĐ
Vậy ta không nên chọn cách mô hình này
3. Phương án ba
• Giả định E(Ui2)=ƃ2 (E(Forest_loss))2
Trang 14Ta hồi quy mô hình theo trọng số ~(E(Forest_loss))2
Ta có
fl_FIT=per_FIT+Pop_FIT+cr_FIT+pas_FIT+
Trong đó fl_FIT = , per_FIT = ,
per_FIT = , pas_FIT = , vi =
• Ta có mô hình hồi quy mới
Model 8: OLS, using observations 1-70 Dependent variable: fl_FIT
per_FIT 0.517813 0.0753641 6.8708 <0.00001 ***
pop_FIT 0.000960863 0.000147392 6.5191 <0.00001 ***
cr_FIT -0.00634625 0.00537831 -1.1800 0.24225
Pas_FIT 0.0129025 0.00285919 4.5126 0.00003 ***
Mean dependent var 1.044786 S.D dependent var 0.837506
Sum squared resid 16.73410 S.E of regression 0.503535
R-squared 0.654238 Adjusted R-squared 0.638522
F(3, 66) 41.62758 P-value(F) 3.22e-15
Log-likelihood -49.23907 Akaike criterion 106.4781
Schwarz criterion 115.4721 Hannan-Quinn 110.0507
White's test for heteroskedasticity
Null hypothesis: heteroskedasticity not present
Test statistic: LM = 21.5765
with p-value = P(Chi-square(9) > 21.5765) = 0.0103226
BreuschPagan test for heteroskedasticity
Null hypothesis: heteroskedasticity not present
Test statistic: LM = 0.528361
with p-value = P(Chi-square(3) > 0.528361) = 0.912618
• Kiểm định mô hình
1. Mô hình có một hệ số của biến cr_FIT không có ý nghĩa thống kê
2. Mô hình phù hợp do có p-value(F)=3.22e-15<0.05
3. Mô hình xảy ra đa cộng tuyến
Trang 15Ta thấy hệ số tương quan giữa cr_FIT và per_FIT=0.8870>0.8
Ta hồi quy biến cr_FIT theo các biến độc lập còn lại
Ta thấy R-squared=1 tức là VIF tiến đến ∞
4. Mô hình không có tự tương quan
Du=1.7208<DW=1.898872<2
5. Mô hình qua được White’s test (squares only) và BP test nhưng không qua được White’s test
+ White’s test (squares only)
Trang 16Ta thấy p-value=0.172282 >0.05 => không có PSSS thay đổi
+ BP test
Ta thấy p-value=0.9122618 >0.05 => không có PSSS thay đổi + White’s test
Trang 17Ta thấy 0,05> p-value=0.010323 >0,01
Tuy nhiên mô hình mới này có nhược điểm là biến Cropch không có ý nghĩa thống
kê tại mứa 10% và R2 còn khá thấp Ta sẽ bỏ biến này và xem xét mô hình mới có tốt hơn không
Model 10: OLS, using observations 1-70 Dependent variable: Forest_loss3
per_FIT 0.465798 0.0613058 7.5979 <0.00001 ***
pop_FIT 0.000970617 0.000147591 6.5764 <0.00001 ***
Pas_FIT 0.0129523 0.00286724 4.5173 0.00003 ***
Mean dependent var 1.044786 S.D dependent var 0.837506
Sum squared resid 17.08713 S.E of regression 0.505007
R-squared 0.863093 Adjusted R-squared 0.859006
F(3, 67) 140.7943 P-value(F) 7.23e-29
Log-likelihood -49.96975 Akaike criterion 105.9395
Schwarz criterion 112.6850 Hannan-Quinn 108.6189
Trang 18Mô hình mới này tốt hơn mô hình khi chưa bỏ biến vì các biến giải thích đều có ý nghĩa thống kê tại mức 1% Hơn nữa cả giá trị R2 và R2 điều chỉnh đều có giá trị lớn hơn
R2 R2 điều chỉnh
Mô hình chưa bỏ biến
Cropch
0.654238 0.638522
Mô hình đã bỏ biến
Cropch
0.863093 0.859006
Ngoài ra các kiểm định khác cho thấy mô hình không có hiện tượng đa cộng tuyến cũng như tự tương quan => mô hình rất phù hợp
Vậy ta có thể lựa chọn mô hình này
4. Phương án bốn
• Ta sử dụng Robust standard errors cho mô hình hồi quy gốc
• Ta có mô hình hồi quy mới
Kết quả thu được không tốt hơn so với mô hinh ở mục D vì không những mô hình không khắc phục được PSSSTĐ mà vẫn còn biến không có ý nghĩa thống kê ở mức 10% và giá trị R2 quá thấp