Bài giảng Kinh tế lượng - Chương 4: Đa cộng tuyến cung cấp cho người học các kiến thức: Bản chất của đa cộng tuyến, ước lượng trong trường hợp có đa cộng tuyến, hậu quả của đa cộng tuyến, phát hiện đa cộng tuyến, các biện pháp khắc phục.
Chương 4: Đa cộng tuyến Bản chất đa cộng tuyến Ước lượng trường hợp có đa cộng tuyến Hậu đa cộng tuyến Phát đa cộng tuyến Các biện pháp khắc phục 104 Bản chất đa cộng tuyến Đa cộng tuyến (Multicollinearity): Ragnar Frisch: Đa cộng tuyến có nghĩa tồn mối quan hệ tuyến tính “hồn hảo” xác số tất biến giải thích mơ hình hồi qui 105 Minh họa hình ảnh 106 Xét hàm hồi qui tuyến tính k biến độc lập: Yi = 1 + 2X2i + 3X3i + … + kXki + Ui Đa cộng tuyến hoàn hảo: Nếu tồn số i không đồng thời cho: 2X2i + 3X3i + …… + kXki = Có nghĩa tồn biến độc lập biểu diễn tuyến tính qua biến lại Đa cộng tuyến khơng hồn hảo: Nếu tồn số i không đồng thời cho: 2X2i + 3X3i + …… + kXki + V = 107 Ví dụ: X2 10 15 18 24 30 X3 50 75 90 120 150 X4 52 75 97 129 152 X3i = 5X2i, có cộng tuyến hồn hảo X2 X3 ; r23 = X2 X4 khơng có cộng tuyến hồn hảo, hai biến có tương quan chặt chẽ 108 Lưu ý: Giả định đa cộng tuyến liên quan đến mối quan hệ tuyến tính biến Xi, không đề cập đến mối quan hệ phi tuyến tính Xem xét mơ hình: Y = 1 + 2X + 3X2 + 4X3 + U Rõ ràng X2 X3 có mối quan hệ hàm số với X phi tuyến tính nên không vi phạm giả định đa cộng tuyến 109 Ước lượng tham số có đa cộng tuyến Xét mơ hình hồi qui biến dạng sau: Yi = 1 + 2 X2i + 3 X2i + Ui Var ( B2 ) Var ( B3 ) 2 2 2 x2i r23 x3i xi X i X , yi Yi Y r23 Nếu X2, X3 có quan hệ tuyến tính chặt chẽ r23 gần ±1 Do phương sai lớn 110 Hậu có đa cộng tuyến gần hoàn hảo: Ước lượng phương sai lớn Ước lượng tham số rộng i ( Bi t n k 1, / 2S Bi ) Kiểm định tham số có khuynh hướng chấp nhận Bi t S Bi Các ước lượng nhạy với thay đổi nhỏ liệu Dấu tham số sai Thêm vào bớt biến có đa cộng tuyến mơ hình thay đổi nhiều 111 Phát đa cộng tuyến Hệ số R2 lớn tỷ số t nhỏ Ví dụ: file Luong tieu thu xang regress ttxang maluc nang may lit Source SS df MS Model Residual 491.602177 141.640345 45 122.900544 3.14756322 Total 633.242522 49 12.9233168 ttxang Coef maluc nang may lit _cons -.0458493 -.0090899 2452276 1754044 26.2235 Std Err .0164784 0021871 5363098 8819955 2.319522 t -2.78 -4.16 0.46 0.20 11.31 Number of obs F( 4, 45) Prob > F R-squared Adj R-squared Root MSE P>|t| 0.008 0.000 0.650 0.843 0.000 = = = = = = 50 39.05 0.0000 0.7763 0.7564 1.7741 [95% Conf Interval] -.0790386 -.0134949 -.8349558 -1.601026 21.55174 -.01266 -.0046849 1.325411 1.951834 30.89526 112 Phát đa cộng tuyến Tương quan cặp biến giải thích cao pwcorr maluc nang may lit, sig maluc nang may maluc 1.0000 nang 0.7857 0.0000 1.0000 may 0.7517 0.0000 0.8023 0.0000 1.0000 lit 0.8176 0.0000 0.9008 0.0000 0.9415 0.0000 lit 1.0000 113 Phát đa cộng tuyến Sử dụng mơ hình hồi qui phụ: X j 1 X j 1 X j 1 j 1 X j 1 k X k Vi Với biến phụ thuộc Xj có hệ số tương quan lớn Nếu mơ hình có ý nghĩa ta nghi ngờ có tượng đa cộng tuyến regress lit maluc nang may Source SS df MS Model Residual 75.8529175 4.04614798 46 25.2843058 087959739 Total 79.8990655 49 1.63059317 lit Coef maluc nang may _cons 0048422 0015889 5005502 -2.303298 Std Err .0026606 0002807 050903 1871391 t 1.82 5.66 9.83 -12.31 Number of obs F( 3, 46) Prob > F R-squared Adj R-squared Root MSE P>|t| 0.075 0.000 0.000 0.000 = = = = = = 50 287.45 0.0000 0.9494 0.9461 29658 [95% Conf Interval] -.0005133 0010239 3980877 -2.67999 0101976 0021539 6030127 -1.926606 114 Phát đa cộng tuyến Sử dụng yếu tố phóng đại phương sai (VIF) VIF 1 R j Rj2 hệ số xác định hàm hồi qui phụ Nếu VIF lớn 10 nghi ngờ xảy tượng đa cộng tuyến vif Variable VIF 1/VIF lit may nang maluc 19.75 9.76 6.07 3.14 0.050641 0.102445 0.164798 0.318373 Mean VIF 9.68 115 Các biện pháp khắc phục Sử dụng thông tin tiên nghiệm: Ví dụ: hàm sản xuất Cobb-Douglas: ut Qt ALt K t e Qt sản lượng sản phẩm sản xuất thời kỳ t Lt lao động thời kỳ t; Kt vốn thời kỳ t; Ut sai số ngẫu nhiên Logarit vế ta được: ln Q ln A ln L ln K U Q* A* L* K * U 116 Sử dụng thông tin tiên nghiệm: Logarit vế ta được: ln Q ln A ln L ln K U Q* A* L* K * U Dựa vào thơng biết hàm sản xuất thu nhập theo qui mô không đổi: + = => = - Qt* Kt* A* ( L*t Kt* ) U t Yt* A* X t* U t 117 Các biện pháp khắc phục Thu thập thêm số liệu thu thập Hiện tượng đa cộng tuyến nhiều đặc tính mẫu, gia tăng kích thước mẫu làm giảm đa cộng tuyến Bỏ bớt biến xảy đa cộng tuyến: Thông thường ta bỏ biến gây đa cộng tuyến nhiều 118 Các biện pháp khắc phục regress ttxang maluc nang may Source SS df MS Model Residual 491.477691 141.764832 46 163.825897 3.08184417 Total 633.242522 49 12.9233168 ttxang Coef maluc nang may _cons -.0449999 -.0088112 3330264 25.81949 Std Err .0157484 0016614 3013056 1.107715 t -2.86 -5.30 1.11 23.31 Number of obs F( 3, 46) Prob > F R-squared Adj R-squared Root MSE P>|t| 0.006 0.000 0.275 0.000 = = = = = = 50 53.16 0.0000 0.7761 0.7615 1.7555 [95% Conf Interval] -.0766997 -.0121555 -.2734702 23.58978 -.0133001 -.0054669 939523 28.04921 vif Variable VIF 1/VIF nang may maluc 3.58 3.15 2.93 0.279601 0.317793 0.341298 Mean VIF 3.22 119 ... Residual 49 1.602177 141 . 640 345 45 122.900 544 3. 147 56322 Total 633. 242 522 49 12.9233168 ttxang Coef maluc nang may lit _cons -. 045 849 3 -. 0090899 245 2276 17 540 44 26.2235 Std Err .01 647 84 0021871... Model Residual 49 1 .47 7691 141 .7 648 32 46 163.825897 3.081 844 17 Total 633. 242 522 49 12.9233168 ttxang Coef maluc nang may _cons -. 044 9999 -. 0088112 33302 64 25.81 949 Std Err .015 748 4 00166 14 3013056... 39.05 0.0000 0.7763 0.75 64 1.7 741 [95% Conf Interval] -. 0790386 -. 01 349 49 -. 8 349 558 -1 .601026 21.551 74 -. 01266 -. 0 046 849 1.32 541 1 1.9518 34 30.89526 112 Phát đa cộng tuyến Tương quan cặp biến