1. Trang chủ
  2. » Khoa Học Tự Nhiên

Những vấn đề xảy ra khi hồi quy

16 107 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 16
Dung lượng 378 KB

Nội dung

Bài 6: Những vấn đề xảy hồi qui Bỏ quên biến Đo lường sai lệch Đa cộng tuyến (Multi colinearity) Nhận định định mô hình Chệch liệu Phần ngẫu nhiên u không độc lập đồng (heteroscedasticity autocorrelation) Phần ngẫu nhiên không dừng(Non stationarity) Các biến hồi qui ngẫu nhiên Bài 6: Những vấn đề xảy hồi qui Bỏ quên biến Đo lường sai lệch Đa cộng tuyến Nhận định định mơ hình Chệch liệu 1 Bỏ qn biến Mơ hình thật Y = β1 X + β X + u Mơ hình sử dụng Y = β1 X + u * u* = β X + u → E [u *] = E [ β X + u ] = X E [ β ] + E [u ] = β2 X + ≠ → E[ β ] =β1 + ( X'1X1 ) −1 X'1X β ≠ β1 Sai lệch đo lường Mơ hình thật Mơ hình sử dụng Y = X *β +u X = X * +ε & E [u | X *] = Y = β X − βε + u Sai lệch đo lường ( X , − β ε + u ) − C o r r e la te d C ov(β X − β ε + u, X ) c o v (Y , X ) = β = v a r(X ) V a r(X ) v a r ( X ,X ) C o v (ε , X * + ε ) C o v (u , X ) = β − β + V a r(X ) v a r(X ) V a r(X ) C o v (ε , X * + ε ) = β − β ( b e c a u s e -C o v ( u , X ) = ) v a r(X )  v a r (ε ) cov( X *, ε )  = β 1 − −  v v a r ( X ) a r ( X )    v a r (ε )  if c o v ( X * , ε ) = → β = β  −  v a r ( X )   Sai lệch đo lường  v a r (ε )  → β = β 1 −  v a r ( X )   V a r ( X ) = v a r(X * + ε )= v a r(X * )+ v a r(ε )  v a r (ε ) β = β 1 − v a r(X * )+ v a r(ε  -Instruments variables -bootstrap   var( X *) = β   )  v a r(X * )+ v a r(ε  )  Đa cộng tuyến Collinearity Y = X β +u & rank ( X ) = k C o llin e a r ity X : M a tr ix ( N × k ) & rank ( X ) < k → ( X ' X ) −1 ?? → β ?? Đa cộng tuyến hoàn hảo X = λ3 X + λ4 X + λ6 X Đa cộng tuyến khơng hồn hảo X = λ3 X + λ4 X − λ6 X + ε i Đa cộng tuyến Đa cộng tuyến hồn hảo β ?? Đa cộng tuyến khơng hồn hảo β∃ se( β ) ր, tβ ց Sai lầm loại 2: Không thể loại bỏ H0 ( không đúng) R2 cao thống kê t thấp Cả mơ hình có giá trị giải thích cao, nhiên biến số lại có giá trị giải thích 3 Đa cộng tuyến Goldprice = − 5.12 + 9.02Oilprice − 0.09Sp500index + 0.0007 JapanGDP − 0.014 UsaGDP t − 0.38 10.13 − 1.48 6.41 − 1.14 N = 51& R = 0.9262 Khi tương quan biến lớn 0.9 Đa cộng tuyến corr Goldprice Oilprice JapanGDP UsaGDP (obs=51) | Goldpr~e Oilprice JapanGDP UsaGDP -+ -Goldprice | 1.0000 Oilprice | 0.8845 1.0000 JapanGDP | 0.8240 0.6935 1.0000 UsaGDP | 0.7525 0.7662 0.9188 1.0000 Hồi qui biến độc lập biến độc lập lại xem R2 có cao hay khơng Đa cộng tuyến Vif: ( variance inflation factor ) VIFj = 1− Rj & VIFj > 10 → collinear Ví dụ ( Malinvaut-1969) Import = β1 + β Doppro + β 3Stock + β Consum+u N = 18 & R = 0.973 Import = −19 + 0.032Doppro + 0.41stock + 0.24Consum t − 4.78 0.17 1.29 0.85 Đa cộng tuyến Vif: ( variance inflation factor ) vif Variable | VIF 1/VIF -+ -doprod | 469.74 0.002129 consum | 469.37 0.002131 stock | 1.05 0.952492 -+ -Mean VIF | 313.39 X4 Y X3 Giải pháp Bỏ bớt biến vế phải Thêm liệu Chuyển đổi liệu: Lin- Log & sai phân cấp X2 Lỗi nhận định mơ hình Ramsey RESET : H0: Mơ hình định Kiểm định F : khác biệt mơ hình tuyến tính phi tuyến: So sánh R2 Qui trình: 1.OLS :→ R12 2.Y → Y , Y 3 3.OLS : Y , Y , Y → R22 4.F = 2 R − R ( )/m (1 − R22 ) / ( N − k − m )    Lỗi nhận định mơ hình Hedocnic Model: reg log(price) log(lot) bedrooms baths airco Source | SS df MS Number of obs = 546 -+ -F( 4, 541) = 177.41 Model | 42.790971 10.6977427 Prob > F = 0.0000 Residual | 32.6221992 541 060299814 R-squared = 0.5674 -+ -Adj R-squared = 0.5642 Total | 75.4131702 545 138372789 Root MSE = 24556 -lprice | Coef Std Err t P>|t| [95% Conf Interval] -+ -llot | 4004218 0278122 14.40 0.000 3457886 455055 bedrooms | 0776997 0154859 5.02 0.000 0472798 1081195 baths | 2158305 0229961 9.39 0.000 1706578 2610031 airco | 2116745 0237213 8.92 0.000 1650775 2582716 _cons | 7.093777 231547 30.64 0.000 6.638935 7.548618 ovtest Ramsey RESET test using powers of the fitted values of lprice Ho: model has no omitted variables F(3, 538) = 0.56 Prob > F = 0.6408 Lỗi nhận định mơ hình reg log(price) log(lot) bedrooms baths airco Source | SS df MS Number of obs = 546 -+ -F( 4, 541) = 177.41 Model | 42.790971 10.6977427 Prob > F = 0.0000 Residual | 32.6221992 541 060299814 R-squared = 0.5674 -+ -Adj R-squared = 0.5642 Total | 75.4131702 545 138372789 Root MSE = 24556 Linktest Source | SS df MS Number of obs = 546 -+ -F( 2, 543) = 356.40 Model | 42.8049623 21.4024812 Prob > F = 0.0000 Residual | 32.6082079 543 060051948 R-squared = 0.5676 -+ -Adj R-squared = 0.5660 Total | 75.4131702 545 138372789 Root MSE = 24505 -lprice | Coef Std Err t P>|t| [95% Conf Interval] -+ -_hat | -.1747656 2.433807 -0.07 0.943 -4.955595 4.606064 _hatsq | 0528108 1093971 0.48 0.629 -.1620827 2677042 _cons | 6.528758 13.53062 0.48 0.630 -20.05002 33.10753 Lỗi nhận định mơ hình Dự báo giá nhà: phòng ngủ, phòng tắm, 000 feet vng khơng điều hòa 094 + 0.400 * ln(5000) + 0.077 * + 0.216 *1 + 0.211 * = 11.028 exp (11.028) = 61, 574.30 dollars Canada Vấn đề chệch liệu Sen.Thomas Dewey (Rep) Pre Harry Truman (Dem) ...Bài 6: Những vấn đề xảy hồi qui Bỏ quên biến Đo lường sai lệch Đa cộng tuyến Nhận định định mơ hình Chệch liệu... variables -bootstrap   var( X *) = β   )  v a r(X * )+ v a r(ε  )  Đa cộng tuyến Collinearity Y = X β +u & rank ( X ) = k C o llin e a r ity X : M a tr ix ( N × k ) & rank ( X ) < k →... 0.400 * ln(5000) + 0.077 * + 0.216 *1 + 0.211 * = 11.028 exp (11.028) = 61, 574.30 dollars Canada Vấn đề chệch liệu Sen.Thomas Dewey (Rep) Pre Harry Truman (Dem)

Ngày đăng: 05/01/2019, 08:25

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w