Trong mô hình phân tích hồi quy bội, ta giả thiết giữa các biến giải thích Xi của mô hình độc lập tuyến tính với nhau, tức là các hệ số hồi quy đối với một biến cụ thể là số đo tác động riêng phần của biến tương ứng khi tất cả các biến khác trong mô hình được giữ cố định. Tuy nhiên khi giả thiết đó bị vi phạm tức là các biến giải thích có tương quan thì chúng ta không thể tách biệt sự ảnh hưởng riêng biệt của một biến nào đó. Hiện tượng đó được gọi là hiện tượng đa cộng tuyến.
Khi mô hình bị mắc phải hiện tượng đa cộng tuyến, ước lượng các hệ số không hiệu quả do phương sai và đồng phương sai của các ước lượng OLS lớn. Mô hình có đa cộng tuyến có t-stat nhỏ và một số hệ số có thể có dấu trái với lý thuyết hay có giá trị không phù hợp. R2 và F có thể rất cao; giá trị ước lượng của các hệ số rất nhạy cảm đối với việc tăng hoặc bớt một quan sát hoặc loại bỏ bớt biến có ý nghĩa thấp; và việc phân tích tác động riêng phần của một biến là rất khó khăn.
Do khi mắc phải hiện tượng đa cộng tuyến thì phương sai và đồng phương sai của các ước lượng OLS lớn nên để phát hiện hiện tượng đa cộng tuyến, ta thực hiện kiểm định hệ số phóng đại phương sai VIF (Variance inflation factor), yếu tố này sẽ thể hiện tốc độ gia tăng của phương sai và đồng phương sai.
VIFj = ) 1 ( 1 2 j R (4.5)
Với R2j là giá trị R2 trong hàm hồi quy (phụ trợ) của Xj theo các biến hồi quy độc lập còn lại. Khi R2j tăng dần đến 1, đó là, vì sự cộng tuyến của Xj với các biến hồi quy độc lập khác tăng, VIF cũng tăng và trong giới hạn VIF có thể trở thành vô hạn. Giá trị VIF càng lớn thì biến Xj càng phức tạp hoặc càng cộng tuyến cao. Như một quy tắc kinh nghiệm của nhiều nghiên cứu, nếu VIF của một biến vượt quá 10 (điều này xảy ra nếu R2j vượt quá 0,9), biến này được nói là cộng tuyến cao (theo Damodar N. Gujarati).
Hình 4.7: Kiểm định nhân tố phóng đại phương sai VIF của các biến độc lập
Nguồn: Thực hiện trên phần mềm Stata/SE 11.1
Dựa trên kết quả kiểm định ở hình 4.8 ta nhận thấy cả ba biến độc lập R, D1, và
SV đều có hệ số phóng đại phương sai nhỏ hơn 10 nên ta có thể kết luận mô hình không có hiện tượng đa cộng tuyến.