PHẦN I : MỞ ĐẦU
5. Kết cấu đề tài
3.2. Áp dụng mô hình binary logistic để xếp hạng tín dụng khách hàng doanh
3.2.6. Kiểm tra đa cộng tuyến
Đối với mơ hình hồi quy có chức năng chính là dự báo như hồi quy Logistic thì hiện tượng ĐCT khơng phải là vấn đề nghiêm trọng vì R2 càng cao thì dự đốn càng chính xác.
Tuy nhiên, mục tiêu của phân tích này khơng chỉ là dự báo mà cịn phân tích sự ảnh hưởng của các chỉ tiêu biến độc lập đến biến phụ thuộc, do đó ĐCT nghiêm trọng có thể sẽ dẫn đến sai số của hàm ước lượng sẽ lớn. Nên cần kiểm tra hiện tượng ĐCT.
Đầu tiên, ta kiểm tra xem hệ số tương quan từng đôi giữa các biến hồi quy độc lập như thế nào. Nếu hệ số đó lớn hơn 0.8 thì ĐCT nghiêm trọng7.
Nhìn vào bảng 3.3, ta thấy hệ số tương quan của các biến tương đơi thấp, khơng có cặp biến nào có hệ số tương quan > 0.8. Như vậy khơng có cặp biến nào tương quan chặt chẽ với nhau. Tuy nhiên, trong trường hợp mơ hình có hơn 2 biến độc lập, khơng nhất thiết là các hệ số tương quan cao thì mới có sự đa cộng tuyến. Nói cách khác, tương quan bậc 0 cao là điều kiện đủ chứ không phải là điều kiện cần cho sự hiện diện của ĐCT, vì ĐCT có thể tồn tại ngay cả khi hệ số tương quan đơn hoặc hệ số tương quan bậc 0 tương đối thấp (<0.5)8.
6
Hoàng Trọng và Chu Nguyên Mộng Ngọc, Phân tích dữ liệu nghiên cứu với SPSS tập 2, Nhà xuất bản Hồng Đức,2008
7 Bài giảng Fullbright, Đa cộng tuyến.
8 Lawrence R. KLien, An introduction to Economics, ( Nhập môn kinh tế lượng), Prentice- Hall, Englewood cliffs, N.J., 1962, trang 101
45
Như vậy để chắc chắn, ta tiến hành hồi quy mơ hình phụ, theo đó mỗi biến độc lập lần lượt đóng vai trị biến phụ thuộc đơi với các biến con lại, sử dụng phương pháp bình phương nhỏ nhất (OLS).
Căn cứ vào lý thuyết hiện tương ĐCT xảy ra khi có ít nhất một R2
của mơ hình phụ lớn hơn R2 của mơ hình gốc ban đầu. Nhìn vào bảng 3.4, ta thấy khơng có R2 của biến độc lập nào lớn hơn R2 của mơ hình gốc ban đầu nên giữa các biến khơng có hiện tương đa cộng tuyến. Bên cạnh đó, hệ số ở một vài biến có trái dấu với giả thiết ( X2, X3, X8) và giá trị p-value (giá trị Sig) các biến lớn hơn mức ý nghĩa ∝=0.1. vì vậy có khả năng phải loại một vài biến ra khỏi mơ hình nhằm đảm bảo ý nghĩa thơng kê.
46
Bảng 3.4 : Hệ số R2 của từng mơ hình phụ
( nguồn tính tốn tác giả)
Bảng 3.3: Ma trận tương quan giữa các biến trong mơ hình ban đầu
y d1 d2 X1 X2 X3 X4 X5 X6 X7 X8 X9 x10 x11 y 1 d1 -0.47162 1 d2 -0.21437 0.332721 1 X1 -0.49046 0.19356 0.203533 1 X2 -0.30565 0.258641 0.326609 0.67576 1 X3 -0.32145 0.183639 0.168807 0.365621 0.288879 1 X4 0.459181 -0.23109 -0.32003 -0.25703 -0.23348 -0.39519 1 X5 0.449635 -0.25013 -0.29943 -0.48171 -0.28368 -0.2544 0.464994 1 X6 0.180683 -0.03772 -0.08127 -0.15954 -0.11007 -0.12267 0.171922 0.20409 1 X7 -0.00378 -0.06629 -0.10313 -0.07357 -0.12344 -0.06561 0.184315 0.070471 0.321848 1 X8 -0.05907 -0.04841 0.068814 0.005738 0.082934 0.436828 -0.15447 -0.04036 0.306077 -0.26016 1 X9 -0.38963 0.239573 0.099131 0.236299 0.146013 0.481069 -0.46262 -0.28683 -0.37875 -0.38277 0.391811 1 x10 -0.27003 0.210373 0.204093 0.312222 0.332677 0.399113 -0.2839 -0.20768 -0.15065 -0.20139 0.308132 0.66993 1 x11 -0.22192 0.06718 0.044122 0.04789 0.048334 0.351269 -0.40748 -0.13589 0.083376 0.032312 0.284442 0.325781 0.140699 1 Biến phụ thuộc D1 D2 X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 R- squared 0.270 0.277 0.605 0.558 0.489 0.466 0.408 0.547 0.339 0.602 0.747 0.554 0.309
47