Tác giả dùng phần mềm Eview 6.0 lập ma trận hệ số tương quan. Để phát hiện tượng đa cộng tuyến trong mô hình và sử dụng phương pháp hệ số tương quan Pearson (r) để biết mức độ tương quan giữa các biến:
r = 1 (hoặc gần 1) : tương quan dương -> tương quan rất mạnh r = 0 (hoặc gần 1) : không tương quan hay độc lập thống kê r = - 1(hoặc gần - 1) : tương quan âm -> tương quan rất mạnh
31
Theo kinh nghiệm nếu hệ số tương quan Pearson r ≥ |0,8| thì có hiện tượng đa cộng tuyến cao giữa các biến.
Do trong một số trường hợp đặc biệt, khi hệ số tương quan cặp giữa các biến giải thích thấp nhưng vẫn xảy ra hiện tượng đa cộng tuyến, nên tác giả sử dụng thêm một phương pháp thứ hai để xác định đa cộng tuyến đó là dùng nhân tố phóng đại phương sai VIF (Variance Inflation Factor) bằng công thức:
2 1 1 j phu j VIF R = − Trong đó: 2 phu j
R là giá trị hệ số xác định trong hàm hồi quy của biến giải thích thứ j theo (k-1) biến giải thích còn lại, nếu có cộng tuyến của Xj với các biến giải thích khác thì R2j sẽ gần bằng 1 và do đó VIFj sẽ lớn, giá trị VIFj càng lớn thì biến Xj càng cộng tuyến cao, theo quy tắc kinh nghiệm nếu VIFj≥ 5 (khi đó R2j> 0,8) thì xem như có đa cộng tuyến giữa Xj.
Cách khắc phục hiện tượng đa cộng tuyến: loại bỏ 1 biến trong cặp biến có hệ số tương quan cao bằng cách so sánh R2 trong mô hình gốc gồm đầy đủ các biến với R2 khi loại bỏ biến 1 và R2 khi loại bỏ biến 2 (giả sử hệ số tương quan giữa cặp biến 1 và 2 > 0,8). Nếu R2 khi loại bỏ biến 1 > R2 khi loại bỏ biến 2, theo quy tắc kinh nghiệm, tác giả loại bỏ biến 1 ra khỏi mô hình nghiên cứu.