I. Cơ sở lý thuyết
2. Các khuyết tật mô hình
2.3. Đa cộng tuyến
2.3.1 Bản chất
- Đa cộng tuyến hoàn hảo xảy ra khi giữa các biến độc lập có mối quan hệ chính xác theo dạng:
- Đa cộng tuyến không hoàn hảo xảy ra khi giữa các biến độc lập có mối quan hệ theo dạng:
λ2X2i+ λ3X3i+…+λkXki + Vi= 0 ∀ (∑λi2> 0) 2.2.3.2 Nguyên nhân
+ Do bản chất của các mối quan hệ giữa các biến độc lập + Mô hình dạng đa thức
+ Mẫu không mang tính đại diện 2.3.3 Hậu quả
- Nếu xảy ra đa cộng tuyến hoàn hảo: + β̂ jkhông xác định
+ Se(β̂ j) = +∞
- Nếu xảy ra đa cộng tuyến không hoàn hảo: + Se(β̂ j) rất lớn
+Khoảng tin cậy của β̂ jrộng + Tỷ số T= β̂ j
Se(β̂ j)mất ý nghĩa. + Dấu của β̂ jkhác so với thực tế
+ Kết quả ước lượng khá nhạy khi có sự thay đổi nhỏ trong mẫu 2.3.4. Phát hiện hiện tượng đa cộng tuyến
- Phương pháp R2 cao, chỉ số t thấp Hiện tượng đa cộng tuyến xảy ra khi: +R2 > 0.8
+ Tồn tại 1 |tj | < t∝
2 (n−k)
hoặc Pvalue > ∝
Kết luận: có xảy ra đa cộng tuyến. Ngược lại, nếu không thỏa mãn 1 trong hai điều kiện trên thì không xảy ra hiện tượng
- Phương pháp nhân tử phóng đại phương sai (VIF) VIF = 1−1R
i
- Phương pháp hồi quy phụ
+ Chọn một biến Xjđể hồi quy theo các biến giải thích còn lại để thu được R2 + BTKĐ: {H0:môhình không có đacộngtuyế n
H1:mô hìnhcó xảyra đacộngtuyế n {H0:R2j=0
H1:R2j>0 + TCKĐ: F = R2j/(k−2)
(1−R2j)/(n−k−1) Nếu H0đúng thì F ~ F(k−2;n−k+1)
+ Suy ra: Wα hoặc Pgiá trị. Dựa vào Wαhoặc P –giá trị để kiểm định giả thiết: Nếu P – giá trị < 𝛼 => Bác bỏH0, chấp nhận H1 và kết luận mô hình có đa cộng tuyến
Nếu P – giá trị > 𝛼 => Bác bỏ H1, có đa chấp nhận H0 và kết luận mô hình không cộng tuyến
- Phương pháp tương quan cặp giữa các biến giải thích cao rij= r (Xi,Xj) = ∑ t=1 n Xij. Xjt √∑ t=1 n X2jt.∑ t=1 n X2jt
Nếu |rij| ≥ 0,8 hệ số tương quan cặp cao
Suy ra: có cơ sở để khẳng định mô hình có đa cộng tuyến giữa Xi vàXj
2.3.5 Khắc phục đa cộng tuyến - Thu thập thêm số liệu mới:
+ Nếu có hiện tượng đa cộng tuyến thì có thể chọn lại mẫu. Phương án này có thể sử dụng chi phí cho việc lấy mẫu khác ở mức độ chấp nhận được
+ Đôi khi chỉ cần thu nhập thêm số liệu, tăng cỡ mẫu có thể làm giảm tính nghiêm trọng trong đa cộng tuyến.
- Bỏ biến:
+ Khi mô hình có hiện tượng đa cộng tuyến nghiêm trọng thì cách “đơn giản nhất” là bỏ biến ra khỏi mô hình
+ Có 2 cách để chọn biến loại khỏi mô hình: Loại khỏi mô hình biến có tỷ số t thấp nhất hoặc lần lượt bỏ từng biến, hồi quy mô hình và chọn mô hình có hệ số R2 cao nhất
- Sử dụng sai phân cấp 1:
Xét mô hình 3 biến với số liệu theo thời gian: Yt = β1 + β2X2t +β3X3t+¿Ut
Tại thời điểm (t-1) có mô hình: Yt−1 = β1 + β2X2t−1 +β3X3t−1+¿Ut−1
Trừ vế với vế của 2 mô hình trên khi đó ta có:
Yt - Yt−1= β2(X2t - X2t−1) + β3(X3t - X3t−1) + (Ut - Ut−1) => Yt¿
= β2X2¿t
+ β3X3¿t
+ Vt
Mô hình này là mô hình sai phân cấp 1. Thực tế cho thấy mô hình sai phân cấp 1 đã giảm được đáng kể mức độ đa cộng tuyến của mô hình gốc.