CHƢƠNG 3 DỮ LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU
3.4. Phương pháp nghiên cứu
3.4.2.1. Kiểm định hiện tượng đa cộng tuyến
Hiện tượng đa cộng tuyến là hiện tượng mà một biến độc lập là một tổ hợp tuyến tính của các biến cịn lại, tức là có mối tương quan giữa các biến độc lập trong mơ hình. Nếu dữ liệu có hiện tượng đa cộng tuyến giữa các biến thì sẽ tạo nên hiện tượng hồi quy giả mạo, làm cho hệ số R2 của mơ hình cao nhưng mức ý nghĩa của mơ hình sẽ rất thấp và dấu của các ước lượng sẽ không đúng.
Vậy để tránh hiện tượng hồi quy giả mạo, tác giả sẽ tiến hành kiểm định xem giữa các biến có hiện tượng tượng đa cộng tuyến hay khơng? Nếu có hiện tượng đa cộng tuyến xảy ra, tác giả sẽ phải khắc phục để kết quả hồi quy đáng tin cậy hơn.
Cách phát hiện hiện tượng đa cộng tuyến:
Có nhiều phương pháp để phát hiện đa cộng tuyến giữa các biến độc lập với nhau, bài nghiên cứu này sẽ trình bày các phương pháp được sử dụng phổ biến trong những bài nghiên cứu khác.
Thứ nhất, có thể dùng ma trận hệ số tương quan để đánh giá mức tương quan giữa
các biến độc lập với nhau. Phương pháp này được hỗ trợ bằng các phầm mềm kinh tế lượng chẳng hạn như EVIEW, SPSS,…Các hệ số tương quan sẽ có giá trị từ 0 đến 1, hiện tượng đa cộng tuyến có thể xảy ra khi hệ số tương quan lớn hơn 0.8.
Thứ hai, một phương pháp khác được sử dụng để hỗ trợ cho kết quả của phương
pháp trên đó là sử dụng hệ số VIF. Hệ số VIF dùng để đo lường sự tương quan giữa các biến.
Trong đó: R2 được lấy từ kết quả của mơ hình hồi quy phụ giữa các biến độc lập. Hiện tượng đa cộng tuyến xảy ra khi hệ số VIF >= 10. Sau khi kiểm định, nếu có xảy ra hiện tượng đa cộng tuyến thì cần khắc phục để kết quả hồi quy đáng tin cậy.
Cách khắc phục hiện tượng đa cộng tuyến
Để khắc phục hiện tượng đa cộng tuyến trong mơ hình có thể thực hiện các phương pháp sau:
Thứ nhất, loại bớt biến có hệ số tương quan khá cao với các biến khác độc lập trong
mô hình. Tuy nhiên, có một số biến quan trọng trong mơ hình khơng thể dễ dàng loại bỏ.
Thứ hai, đổi dạng hàm thành dạng Log. Nếu dữ liệu của các biến có q nhiều giá
trị âm thì phương pháp này khơng thể sử dụng.
Thứ ba, có thể sai phân từng bậc cho mơ hình hồi quy. Nhưng nếu sử dụng sai phân
sẽ làm giảm số lượng mẫu quan sát, sai phân bậc càng cao làm cho dữ liệu càng bị hạn chế. Công thức sai phân bậc 1 như sau:
d(X1)=X1,2007 – X1,2008