yˆ =β β
CHƯƠNG IV ĐA CỘNG TUYẾN
ĐA CỘNG TUYẾN
Các biến giải thích được xác định trong một mơ hình kinh tế lượng thường xuất phát từ lý thuyết hoặc những hiểu biết của chúng ta cũng như từ kinh nghiệm quá khứ. Dữ liệu về các biến này đặc biệt xuất phát từ những thực nghiệm khơng kiểm sốt và thường tương quan với nhau. Ví dụ, dân số và tổng sản phẩm quốc nội là hai chuỗi dữ liệu tương quan chặt lẫn nhau. Trong chương trước, chúng ta phát biểu là hệ số hồi qui đối với một biến cụ thể là số đo tác động riêng phần của biến này, nghĩa là tác động của nó khi tất cả các biến khác trong mơ hình được giữ ở những mức cố định và chỉ có giá trị của biến này thay đổi. Tuy nhiên, khi hai biến giải thích cùng tương quan chặt; chúng ta không thể chỉ đơn giản giữ một biến khơng đổi và thay đổi biến cịn lại vì khi biến sau thay đổi thì biến đầu thay đổi. Cũng vậy, thay đổi mơ hình bằng cách loại bỏ hoặc thêm vào một biến có thể làm thay đổi kết quả một cách nghiêm trọng, khiến cho việc diễn dịch các ước lượng sẽ khó khăn hơn. Đây chính là vấn đề đa cộng tuyến, vấn đề xuất
hiện khi các biến giải thích có các quan hệ gần như tuyến tính.
hiện khi các biến giải thích có các quan hệ gần như tuyến tính. gặp hiện tượng đa cộng tuyến.
Giả sử ta phải ước lượng hàm hồi qui Y gồm k biến giải thích X1,X2,.. , Xk: Yi= β1+ β2X2i+ β3X3i,... + βkXki + ui
Đa cộng tuyến xảy ra khi một biến giải thích được biểu diễn dưới dạng tổ hợp tuyến tính của các biến giải thích cịn lại đối với mọi điểm của tập số liệu. Hay có thể nói, nếu tồn tại các λi không đồng nhất bằng 0 làm cho:
λ2x2i + λ3x3i +...+ λkxki +νi = 0; Trong đó νi là nhiễu; E(νi)=0; Var(νi)=σ 2νi ≥0
Trường hợp này chúng ta có thể nói là có đa cộng tuyến
Nói chung hồi qui đa biến là có đa cộng tuyến, vấn đề là ở mức nào. Trường hợp Var(νi)= 0, => νi = 0 do E(νi)=0, khi đó ta có λ2x2i + λ3x3i +...+ λkxki = 0, trường hợp này được gọi là đa cộng tuyến hoàn hảo. Nhưng thực tế Var(νi)= 0 rất khó xảy ra, chỉ có khi số liệu quá ít hoặc đưa vào xi sai. Khi Var(νi)> 0, ta có đa cộng tuyến khơng hồn hảo, Var(νi) lớn thì đa cộng tuyến thấp.
Ví dụ: Giả sử chúng ta ước lượng hàm tiêu dùng. Y = tiêu dùng, X2 = thu nhập và X3 = của cải.