ĐA CỘNG TUYẾN CHƯƠNG VI 2 Khi lập mô hình hồi quy bội Có sự phụ thuộc tuyến tính cao giữa các biến giải thích gọi là đa cộng tuyến.. Bản chất của đa cộng tuyến... Ước lượng các tham số k
Trang 1ĐA CỘNG TUYẾN
CHƯƠNG VI
2
Khi lập mô hình hồi quy bội
Có sự phụ thuộc tuyến tính cao giữa các biến giải thích gọi là đa cộng tuyến
a Đa cộng tuyến hoàn hảo Tồn tại λ2, λ3,… λk không đồng thời bằng 0 sao cho :
λ2X2+ λ3X3+ …+ λkXk= 0
b Đa cộng tuyến không hoàn hảo
λ2X2+ λ3X3+ …+ λkXk+ vi= 0
ki k i
i
Y ˆ β ˆ β ˆ β ˆ β ˆ
3 3 2 2
=
6.1 Bản chất của đa cộng tuyến
Trang 2Nếu X2i= λX3i=> x2i= λx3i
=>
=> không xác định được
2 3 2
2 3
2 2
3 2 3
2 3 2 2
) (
ˆ
∑
∑ ∑
−
−
=
i i i
i
i i i i i
i i
x x x
x
x x x y x
x y
β
0
0 ˆ
2 3
2 3 2 2 3
2 3 2
3 3 3
2 3 3
−
−
=
∑
∑
∑ ∑
i i i
i
i i i i i
i i
x x x
x
x x x y x
x y
λ λ
λ λ
β
3
2, ˆ
ˆ β β
6.2 Ước lượng các tham số khi có đa
cộng tuyến
6
nhân quả hay có tương quan cao vì đồng phụ thuộc vào một điều kiện khác
* Một số nguyên nhân gây ra hiện tượng đa cộng tuyến
• Ước lượng các hệ số không hiệu quả do phương sai
của ước lượng lớn
• Khoảng tin cậy của các ước lượng rộng
• Tỷ số tikhông có ý nghĩa
• R2lớn nhưng t nhỏ
• Các ước lượng OLS và sai số chuẩn của chúng trở nên
rất nhạy với những thay đổi nhỏ của dữ liệu
• Dấu các ước lượng của các hệ số hồi quy có thể sai
• Thêm vào hay bớt đi các biến cộng tuyến với các biến
khác, mô hình sẽ thay đổi về dấu hoặc thay đổi về độ
lớn của các ước lượng
6.3 Hậu quả của đa cộng tuyến
6.4.2 Tương quan cặp giữa các biến giải thích cao
Trong đó X, Z là 2 biến giải thích trong mô hình
−
−
=
2
) (
) )(
(
Z Z X X
Z Z X X r
i i
i i
XZ
6.4 Cách phát hiện đa cộng tuyến
6.4.1 R2lớn nhưng tỷ số t nhỏ
Trang 3Mô hình hồi qui bội :
H0: R2= 0
• Nếu F > Fα(m-1,n-m): bác bỏ H0=> có đa cộng
tuyến
• Nếu F < Fα(m-1,n-m): chấp nhận H0=> không
có đa cộng tuyến
mi k i
X ˆ β ˆ β ˆ β ˆ
3 3 1
) 1 )(
1 (
) (
2
2
−
−
−
=
m R
m n R F
6.4.3 Sử dụng mô hình hồi quy phụ
10
Đối với hàm hồi quy 2 biến giải thích, VIF được định nghĩa như sau:
Đối với trường hợp tổng quát, có (k-1) biến giải thích thì:
R2
j: là giá trị R2trong hàm hồi quy của Xjtheo (k-1) biến giải thích còn lại
Thông thường khi VIF > 10, thì biến này được coi là có cộng tuyến cao
) 1 (
1
2 23
r
VIF
−
=
) 1 (
1
2
j
R
VIF
−
=
6.4.4 Sử dụng nhân tử phóng đại phương
sai (VIF – Variance Inflation Factor))
11
1) Dùng thông tin tiên nghiệm
Ví dụ khi hồi quy mô hình sản xuất Cobb-Douglas
Ln(Y i )=b 1 + b 2 ln(K i )+ b 3 ln(L i ) + u i
Có thể gặp hiện tượng đa cộng tuyến do K và L cùng
tăng theo quy mô sản xuất Nếu ta biết là hiệu suất
không đổi theo quy mô tức là b2+b3=1
Ln(Y i )=b 1 + b 2 ln(K i )+ (1-b 2 )ln(L i ) + u i
Ln(Y i ) – Ln(L i ) = b 1 + b 2 [ln(K i ) - ln(L i )] + u i
=> mất đa cộng tuyến (vì đây là mô hình hồi quy
đơn)
i
u i i
Y = β 3 β 2
6.5 Biện pháp khắc phục
12
• B1: Xem cặp biến giải thích nào có quan hệ chặt chẽ
• B2: Tính R2 đối với các hàm hồi quy: có mặt cả 2 biến; không có mặt một trong 2 biến
• B3: Loại biến mà giá trị R2tính được khi không có mặt biến đó là lớn hơn
• Phương pháp này chỉ áp dụng cho chuỗi thời gian)
Ví dụ 6.1 xem xét đa cộng tuyến trong mô hình từ số
liệu ở file “vi du 6.1 - da cong tuyen”
6.5 Biện pháp khắc phục (tt)