3.1. Mô hình nghiên cứu
3.1.3. Xây dựng mô hình nghiên cứu
Mục đích của việc xây dựng và phân tích mô hình kinh tế lượng sử dụng hàm hồi quy Binary Logistic là nhằm nhận diện và đánh giá mức độ tác động của từng nhân tố ảnh hưởng. Các thông tin thu thập được từ kết quả điều tra khảo sát thực tế sẽ được phân tích bằng phần mềm SPSS.
Trước khi chính thức thực hiện hồi quy Binary Logistic, đề tài tiến hành một số kiểm định ban đầu như: phân tích tương quan để xem xét mối tương quan giữa các biến
với nhau, đặc biệt là kiểm định xem có mối tương quan giữa biến phụ thuộc và các biến độc lập trong mẫu quan sát, hiện tượng đa cộng tuyến để kiểm tra vi phạm các biến độc lập trong mô hình có phụ thuộc lẫn nhau hay không. Khi các kiểm định này thỏa, các kiểm định về mức độ phù hợp của mô hình và kiểm định thêm về tính nội sinh của mô hình với các giả thiết về hệ số hồi quy sẽ được tiếp tục tiến hành và phân tích. Cụ thể như sau:
Phân tích tương quan
Mục đích chạy tương quan Pearson nhằm kiểm tra mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc với các biến độc lập, vì điều kiện để hồi quy là trước nhất phải tương quan. Phân tích này dựa trên kết quả hệ số tương quan trong ma trận hệ số tương quan giữa các biến trong mô hình nghiên cứu.
Kiểm định hiện tượng đa cộng tuyến
Để dò tìm và phát hiện hiện tượng đa cộng tuyến, nghiên cứu sử dụng công cụ hệ số phóng đại phương sai (VIF - Variance Inflation Factor), quy tắc là khi VIF vượt quá 2 thì có hiện tượng đa cộng tuyến xuất hiện (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008).
Một biện pháp dò tìm khác cũng khá hiệu quả đó là xem xét các hệ số tương quan tuyến tính giữa các biến giải thích trong ma trận hệ số tương quan. Nếu tồn tại mối quan hệ tương quan mạnh giữa các biến độc lập với nhau (giá trị tương quan Pearson >0.4) thì mô hình có khả năng xảy ra hiện tượng đa cộng tuyến(Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008).
Nếu mô hình nghiên cứu có tồn tại hiện tượng đa cộng tuyến, đề tài sử dụng phương pháp loại bỏ bớt biến giải thích ra khỏi mô hình, cụ thể như sau:
Bước 1: Xem cặp biến giải thích nào có quan hệ chặt chẽ. Giả sử X2, X3…Xk là các biến độc lập, Y là biến phụ thuộc và X2, X3 có tương quan chặt chẽ với nhau.
Bước 2: Tính R2 đối với các hàm hồi quy: có mặt cả hai biến, không có mặt một trong hai biến.
Bước 3: Loại biến mà giá trị R2 tính được khi không có mặt biến đó là lớn hơn.
Kiểm định mức độ phù hợp của mô hình
Kiểm định độ phù hợp tổng quát: đối với kiểm định này, hồi quy Binary Logistic sử dụng kiểm định Chi-square để xem các biến số đưa vào mô hình thực sự có ý nghĩa trong việc giải thích cho biến phụ thuộc không. Kết luận được đánh giá dựa vào mức ý nghĩa quan sát mà SPSS đưa ra trong bảng Omnibus Tests of Model Coefficients. Nếu Sig nhỏ hơn mức ý nghĩa đưa ra thì có thể khẳng định tồn tại mối tương quan giữa các biến độc lập và biến phụ thuộc trong mô hình nghiên cứu.
Đo lường độ phù hợp của mô hình hồi quy Binary Logistic còn được dựa trên chỉ tiêu -2LL (viết tắt của -2 log likelihood), thước đo này càng nhỏ càng tốt vì -2LL càng nhỏ càng thể hiện độ phù hợp của mô hình cao. Giá trị nhỏ nhất của -2LL là 0 (tức là không có sai số), khi đó mô hình có độ phù hợp hoàn hảo.
Ngoài ra, chúng ta cùng có thể xác định được mô hình dự đoán tốt đến đâu qua bảng phân loại Clasification Table do SPSS đưa ra, bảng này sẽ so sánh số thực và số dự đoán cho từng biểu hiện và tính tỷ lệ đoán đúng sự kiện.
Kiểm định ý nghĩa của các hệ số
Trong hồi quy Binary Logistic, kiểm định Wald sẽ được sử dụng để kiểm định ý nghĩa thống kê của các hệ số hồi quy tổng thể.
Cách thức sử dụng mức ý nghĩa Sig cho kiểm định Wald cũng theo nguyên tắc thông thường: nếu Sig nhỏ hơn mức ý nghĩa đưa ra thì kết luận có ý nghĩa về mặt thống kê và ngược lại.
Để chạy mô hình Logit xây dựng mô hình nghiên cứu, học viên sử dụng phần mềm SPSS 16. Các bước xây dựng lần lượt như sau:
Bước 1: Chạy mô hình và xác định những biến quan trọng. Thông qua kết quả chạy mô hình học viên xác định những biến độc lập có ảnh hưởng đến khả năng trả nợ của khách hàng. Các tiêu chuẩn cần xem xét để đánh giá mức độ phù hợp của mô hình:
quát của mô hình với giả thiết H0: 1= 2 =…= k = 0, nếu Sig < thì giả thiết bị bác bỏ hay ta có thể kết luận mô hình phù hợp một cách tổng quát.
-Classification Table: bảng này cho ta kiểm tra độ chính xác trong việc dự báo của mô hình, tỷ lệ phần trăm dự đoán đúng càng cao cho thấy mô hình càng dự báo càng chính xác.
- Chỉ số - 2 Log likelihood (- 2 LL): chỉ số này đo lường mức độ phù hợp của mô hình tổng thể, chỉ số này càng nhỏ thể hiện độ phù hợp càng cao.
Bước 2: Dựa trên mức độ ý nghĩa của các biến và các tiêu chuẩn đo lường mức độ phù hợp của mô hình thực hiện loại dần các biến không có ý nghĩa giải thích cho mô hình. Kiểm tra lại mô hình sau khi loại bớt các biến với các tiêu chuẩn như ở bước 1.
Bước 3: Đề xuất mô hình phù hợp sau khi tìm ra mô hình tối ưu.