Đa cộng tuyến là gì ?Ragnar Frisch: Đa cộng tuyến có nghĩa là sự tồn tại mối quan hệ tuyến tính “hoàn hảo” hoặc chính xác giữa một số hoặc tất cả các biến giải thích trong một mô hình hồi quy.Xét hàm hồi quy tuyến tính k1 biến độc lập:Yi = 1 + 2X2i + 3X3i + … + kXki + UiNếu tồn tại các số thực 2, 3, …… k sao cho:2X2i + 3X3i + …… + kXki = 0Với i ( i = 2, 3, k…) không đồng thời bằng không thì giữa các biến Xi (i = 2, 3, …k) xảy ra hiện tượng đa cộng tuyến hoàn hảo. Nói cách khác là xảy ra trường hợp một biến giải thích nào đó được biểu diễn dưới dạng một tổ hợp tuyến tính của các biến còn lại.
Trang 1Chương 2: ĐA CỘNG TUYẾN
Đa cộng tuyến cao
Đa cộng tuyến thấpKhông có đa cộng tuyến
Đa cộng tuyến vừa
Xét mô hình: Yi = 1 + 2X2i + 3X3i + … + kXki + Ui
Trang 3Xét hàm hồi quy tuyến tính k-1 biến độc lập:Yi = 1 + 2X2i + 3X3i + … + kXki + Ui
Nếu tồn tại các số thực 2, 3, …… k sao cho:2X2i + 3X3i + …… + kXki = 0
thì giữa các biến Xi (i = 2, 3, …k) xảy ra hiện
xảy ra trường hợp một biến giải thích nào đó được
2.1 TỔNG QUAN VỀ ĐA CỘNG TUYẾN
Trang 407/15/24 17:264
Nếu 2X2i + 3X3i + …… + kXki + vi = 0,
cộng tuyến không hoàn hảo giữa các biến giải thích Nói cách khác là một biến giải thích nào đó có tương quan với một số biến giải thích khác
2.1 TỔNG QUAN VỀ ĐA CỘNG TUYẾN
Trang 5Ví dụ
X3 ; r23 = 1
biến này có tương quan chặt chẽ.
X*
Trang 607/15/24 17:266
Lưu ý
Giả định về sự đa cộng tuyến liên quan đến mối quan hệ
quan hệ phi tuyến tính.
Xem xét mô hình:
Yi = 0 + 1Xi + 2Xi2 + 3Xi3 + ui,
Rõ ràng Xi2 và Xi3 có mối quan hệ hàm số với Xi nhưng phi tuyến tính nên không vi phạm giả định về đa cộng tuyến.
Trang 7Hậu quả của đa cộng tuyến
1.Phương sai và hiệp phương sai của các ước lượng OLS lớn
r23 là hệ số tương quan giữa X2 và X3.Khi r23 1, các giá trị trên
Trang 807/15/24 17:268
Hậu quả của đa cộng tuyến
khoảng tin cậy của 2 và 3 (với độ tin cậy 1 – ) là:2: t /2 se ( );
3: t /2 se ( );Trong đó:
232 ) 221
232 ) 321
Trang 9Hậu quả của đa cộng tuyến
3.Tỉ số t "không có ý nghĩa" Khi kiểm định giả thuyết H0: 2 = 0, chúng ta sử dụng tỷ số t
và so sánh giá trị ước lượng của t với giá trị tra bảng (tới hạn) của t
Trong trường hợp cộng tuyến cao thì sai số chuẩn sẽ rất lớn và do đó làm cho giá trị t sẽ nhỏ đi, kết quả là sẽ làm tăng chấp nhận giả thuyết H0
Trang 1007/15/24 17:2610
Hậu quả của đa cộng tuyến
4. R2 cao nhưng tỉ số t ít có ý nghĩa
Đa cộng tuyến cao: Một hoặc một số tham số tương quan (hệ số góc riêng) không có ý nghĩa về mặt thống kê Trong những trường hợp này, R2 lại rất cao (> 0,9) Kiểm định F thì có thể bác bỏ giả thuyết cho rằng 2 = 3 = … = k = 0
Trang 11Hậu quả của đa cộng tuyến
5. Các ước lượng OLS và sai số chuẩn của chúng trở nên rất nhạy với những thay đổi nhỏ trong dữ liệu
6. Dấu của các ước lượng của các hệ số hồi quy có thể sai.
7. Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay đổi về dấu hoặc thay đổi về độ lớn của các ước lượng
Trang 13Hệ số R2 lớn nhưng tỷ số t nhỏ
Đây là triệu chứng “kinh điển” của đa cộng tuyến,
i lại chấp nhận H0.
Trang 14Trong đó: X và Z là 2 biến giải thích nào đó trong mô hình
Trang 15Sử dụng mô hình hồi quy phụ
Hồi quy một biến giải thích X nào đó theo các biến còn lại
Tính R2 và F cho mỗi mô hình theo công thức:F =
Kiểm định giả thuyết H0: R2 = 0, tức giả thuyết biến X tương ứng không tương quan tuyến tính với các biến còn lại Nếu giả thuyết H0 được chấp nhận, thì không có cộng tuyến
R
Trang 1607/15/24 17:2616
Sử dụng nhân tố phóng đại phương sai (VIF)
Đối với hàm hồi quy có hai biến giải thích X2 và X3, VIF được định nghĩa như sau:
VIF =
Khi có đa cộng tuyến Khi r23 = 1 thì VIF tiến đến vô hạn Nếu không có cộng tuyến giữa X2 và X3 thì VIF bằng 1.
Kinh nghiệm: Nếu VIF của 1 biến vượt quá 10 (điều này xảy ra nếu Rj2 > 0,9) thì biến này được coi là có cộng tuyến cao
Trang 172.3 Các biện pháp khắc phục
1 Sử dụng thông tin tiên nghiệm:
Dựa vào kinh nghiệm khi làm việc với các mô hìnhVí dụ hàm sản xuất Cobb-Douglas:
Lt là lao động ở thời kỳ t; Kt là vốn ở thời kỳ t; Ut là sai số ngẫu nhiên
A, , là các tham số chúng ta cần ước lượng
Trang 1807/15/24 17:2618
Lấy Lôgarit tự nhiên:
lnQt = ln A + ln Lt + ln Kt + UtĐặt ẩn số ta được:
Giả sử K và L có tương quan rất cao, điều này dẫn đến phương sai của các ước lượng sẽ lớn Giả sử, từ một nguồn thông tin nào đó, ta biết được hàm sản xuất mà ta đang xét thuộc ngành có kỳ vọng sinh lợi không đổi theo quy mô, nghĩa là + = 1
Q* * * *
2.3 Các biện pháp khắc phục
Trang 19thay = 1 - , ta được:
Như vậy, thông tin tiên nghiệm đã giúp chúng ta giảm số biến độc lập của mô hình xuống chỉ còn một biến
**
Trang 2007/15/24 17:2620
2.3 Các biện pháp khắc phục
2 Loại trừ biến giải thích ra khỏi mô hình, định lại dạng mô hình:
Bước 1: Xem cặp biến giải thích nào có quan hệ chặt
hai biến; không có mặt một trong hai biến
có mặt biến đó là lớn hơn
Trang 212.3 Các biện pháp khắc phục
3 Thu thập thêm số liệu hoặc lấy mẫu mới4 Sử dụng sai phân cấp một
Ví dụ từ hàm hồi quy: yt = 1 + 1x1t + 2x2t + ut, ta suy ra yt-1 = 1 + 1x1,t-1 + 2x2,t-1 + ut-1,
Trừ hai vế cho nhau, ta được:
yt – yt – 1 = 1(x1,t – x1,t – 1) + 2(x2,t – x2,t – 1) + (ut – ut – 1) Hay:yt = 1 x1,t + 2 x2,t + et,
có nghĩa sai phân của chúng cũng như vậy.