Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 16 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
16
Dung lượng
378 KB
Nội dung
Bài 6: Những vấn đề xảy hồi qui Bỏ quên biến Đo lường sai lệch Đa cộng tuyến (Multi colinearity) Nhận định định mô hình Chệch liệu Phần ngẫu nhiên u không độc lập đồng (heteroscedasticity autocorrelation) Phần ngẫu nhiên không dừng(Non stationarity) Các biến hồi qui ngẫu nhiên Bài 6: Những vấn đề xảy hồi qui Bỏ quên biến Đo lường sai lệch Đa cộng tuyến Nhận định định mơ hình Chệch liệu 1 Bỏ qn biến Mơ hình thật Y = β1 X + β X + u Mơ hình sử dụng Y = β1 X + u * u* = β X + u → E [u *] = E [ β X + u ] = X E [ β ] + E [u ] = β2 X + ≠ → E[ β ] =β1 + ( X'1X1 ) −1 X'1X β ≠ β1 Sai lệch đo lường Mơ hình thật Mơ hình sử dụng Y = X *β +u X = X * +ε & E [u | X *] = Y = β X − βε + u Sai lệch đo lường ( X , − β ε + u ) − C o r r e la te d C ov(β X − β ε + u, X ) c o v (Y , X ) = β = v a r(X ) V a r(X ) v a r ( X ,X ) C o v (ε , X * + ε ) C o v (u , X ) = β − β + V a r(X ) v a r(X ) V a r(X ) C o v (ε , X * + ε ) = β − β ( b e c a u s e -C o v ( u , X ) = ) v a r(X ) v a r (ε ) cov( X *, ε ) = β 1 − − v v a r ( X ) a r ( X ) v a r (ε ) if c o v ( X * , ε ) = → β = β − v a r ( X ) Sai lệch đo lường v a r (ε ) → β = β 1 − v a r ( X ) V a r ( X ) = v a r(X * + ε )= v a r(X * )+ v a r(ε ) v a r (ε ) β = β 1 − v a r(X * )+ v a r(ε -Instruments variables -bootstrap var( X *) = β ) v a r(X * )+ v a r(ε ) Đa cộng tuyến Collinearity Y = X β +u & rank ( X ) = k C o llin e a r ity X : M a tr ix ( N × k ) & rank ( X ) < k → ( X ' X ) −1 ?? → β ?? Đa cộng tuyến hoàn hảo X = λ3 X + λ4 X + λ6 X Đa cộng tuyến khơng hồn hảo X = λ3 X + λ4 X − λ6 X + ε i Đa cộng tuyến Đa cộng tuyến hồn hảo β ?? Đa cộng tuyến khơng hồn hảo β∃ se( β ) ր, tβ ց Sai lầm loại 2: Không thể loại bỏ H0 ( không đúng) R2 cao thống kê t thấp Cả mơ hình có giá trị giải thích cao, nhiên biến số lại có giá trị giải thích 3 Đa cộng tuyến Goldprice = − 5.12 + 9.02Oilprice − 0.09Sp500index + 0.0007 JapanGDP − 0.014 UsaGDP t − 0.38 10.13 − 1.48 6.41 − 1.14 N = 51& R = 0.9262 Khi tương quan biến lớn 0.9 Đa cộng tuyến corr Goldprice Oilprice JapanGDP UsaGDP (obs=51) | Goldpr~e Oilprice JapanGDP UsaGDP -+ -Goldprice | 1.0000 Oilprice | 0.8845 1.0000 JapanGDP | 0.8240 0.6935 1.0000 UsaGDP | 0.7525 0.7662 0.9188 1.0000 Hồi qui biến độc lập biến độc lập lại xem R2 có cao hay khơng Đa cộng tuyến Vif: ( variance inflation factor ) VIFj = 1− Rj & VIFj > 10 → collinear Ví dụ ( Malinvaut-1969) Import = β1 + β Doppro + β 3Stock + β Consum+u N = 18 & R = 0.973 Import = −19 + 0.032Doppro + 0.41stock + 0.24Consum t − 4.78 0.17 1.29 0.85 Đa cộng tuyến Vif: ( variance inflation factor ) vif Variable | VIF 1/VIF -+ -doprod | 469.74 0.002129 consum | 469.37 0.002131 stock | 1.05 0.952492 -+ -Mean VIF | 313.39 X4 Y X3 Giải pháp Bỏ bớt biến vế phải Thêm liệu Chuyển đổi liệu: Lin- Log & sai phân cấp X2 Lỗi nhận định mơ hình Ramsey RESET : H0: Mơ hình định Kiểm định F : khác biệt mơ hình tuyến tính phi tuyến: So sánh R2 Qui trình: 1.OLS :→ R12 2.Y → Y , Y 3 3.OLS : Y , Y , Y → R22 4.F = 2 R − R ( )/m (1 − R22 ) / ( N − k − m ) Lỗi nhận định mơ hình Hedocnic Model: reg log(price) log(lot) bedrooms baths airco Source | SS df MS Number of obs = 546 -+ -F( 4, 541) = 177.41 Model | 42.790971 10.6977427 Prob > F = 0.0000 Residual | 32.6221992 541 060299814 R-squared = 0.5674 -+ -Adj R-squared = 0.5642 Total | 75.4131702 545 138372789 Root MSE = 24556 -lprice | Coef Std Err t P>|t| [95% Conf Interval] -+ -llot | 4004218 0278122 14.40 0.000 3457886 455055 bedrooms | 0776997 0154859 5.02 0.000 0472798 1081195 baths | 2158305 0229961 9.39 0.000 1706578 2610031 airco | 2116745 0237213 8.92 0.000 1650775 2582716 _cons | 7.093777 231547 30.64 0.000 6.638935 7.548618 ovtest Ramsey RESET test using powers of the fitted values of lprice Ho: model has no omitted variables F(3, 538) = 0.56 Prob > F = 0.6408 Lỗi nhận định mơ hình reg log(price) log(lot) bedrooms baths airco Source | SS df MS Number of obs = 546 -+ -F( 4, 541) = 177.41 Model | 42.790971 10.6977427 Prob > F = 0.0000 Residual | 32.6221992 541 060299814 R-squared = 0.5674 -+ -Adj R-squared = 0.5642 Total | 75.4131702 545 138372789 Root MSE = 24556 Linktest Source | SS df MS Number of obs = 546 -+ -F( 2, 543) = 356.40 Model | 42.8049623 21.4024812 Prob > F = 0.0000 Residual | 32.6082079 543 060051948 R-squared = 0.5676 -+ -Adj R-squared = 0.5660 Total | 75.4131702 545 138372789 Root MSE = 24505 -lprice | Coef Std Err t P>|t| [95% Conf Interval] -+ -_hat | -.1747656 2.433807 -0.07 0.943 -4.955595 4.606064 _hatsq | 0528108 1093971 0.48 0.629 -.1620827 2677042 _cons | 6.528758 13.53062 0.48 0.630 -20.05002 33.10753 Lỗi nhận định mơ hình Dự báo giá nhà: phòng ngủ, phòng tắm, 000 feet vng khơng điều hòa 094 + 0.400 * ln(5000) + 0.077 * + 0.216 *1 + 0.211 * = 11.028 exp (11.028) = 61, 574.30 dollars Canada Vấn đề chệch liệu Sen.Thomas Dewey (Rep) Pre Harry Truman (Dem) ...Bài 6: Những vấn đề xảy hồi qui Bỏ quên biến Đo lường sai lệch Đa cộng tuyến Nhận định định mơ hình Chệch liệu... variables -bootstrap var( X *) = β ) v a r(X * )+ v a r(ε ) Đa cộng tuyến Collinearity Y = X β +u & rank ( X ) = k C o llin e a r ity X : M a tr ix ( N × k ) & rank ( X ) < k →... 0.400 * ln(5000) + 0.077 * + 0.216 *1 + 0.211 * = 11.028 exp (11.028) = 61, 574.30 dollars Canada Vấn đề chệch liệu Sen.Thomas Dewey (Rep) Pre Harry Truman (Dem)