4.2.1 Thống kê mô tả
Thống kê mô tả giúp chúng ta nhìn thấy rõ các đặc tính, thấy được bản chất của các biến cần nghiên cứu. Đối với các biến định lượng, chúng ta cần chú ý đến mức độ trung bình, tối thiểu, tối đa và độ lệch chuẩn. Nếu là biến nhị phân (summury) thì chúng ta cần chú ý đến mức phần trăm (Phụ lục 1).
Bảng 4.5 cho thấy những khách hàng cá nhân có quan hệ tín dụng tại ngân hàng thường nằm trong độ tuổi (X1) từ 29 đến 59, và độ tuổi trung bình là hơn 43 tuổi. Thêm vào đó, số người phụ thuộc (X5) của họ trung bình là 2 người, thời gian cư trú tại địa phương (X6) trung bình là gần 43 năm, kinh nghiệm làm việc trong lĩnh vực hiện tại (X8) trung bình hơn 23 năm. Điều này là phù hợp vì ở độ tuổi này với thời gian cư trú cũng như thâm niên làm việc thì những khách hàng này thường sẽ có thu nhập ổn định và họ đảm bảo khả năng trả nợ cho ngân hàng.
Đối với thu nhập (X10) ta thấy, thấy những khách hàng cá nhân có quan hệ tín dụng tại Agribank Thủ Thừa thường có thu nhập trong khoảng từ 4,7 triệu đồng/tháng đến 45 triệu đồng/tháng. Mức thu nhập này là phù hợp tại địa phương vì ngoài thời
gian đi làm người dân tại địa phương còn tham gia kinh doanh riêng tại gia đình, nói cách khác với mức thu nhập này khách hàng đảm bảo khả năng trả nợ cho ngân hàng.
Bảng 4.5. Bảng mô tả các biến định lượng của được sử dụng trong nghiên cứu Tên Biến Số quan sát Trung bình Độ lệch chuẩn Tối thiểu Tối đa
X1 (năm) 200 43.51 8.46 29 59 X5 (người) 200 1.83 0,58 0 3 X6 (năm) 200 42.24 8.42 27 59 X8 (năm) 200 23.08 8.01 9 40 X9 (năm) 200 25.62 8.45 11 41 X10 (trđ/Tháng) 200 11.22 5.50 4,7 45 X11 (%/năm) 200 10.02 0.22 9,5 11 X12 (tháng) 200 48.38 11.42 36 60 X13 (trđ) 200 201.62 151.39 103 1,500
Nguồn: Kết quả phân tích từ phần mềm Stata 13.0
X1: Độ tuổi; X5: Người phụ thuộc; X6: Thời gian cư trú; X8: Kinh nghiệm trong lĩnh vực hiện tại; X9: Thời gian làm công việc hiện tại; X10: Thu nhập; X11: Lãi suất; X12: Kỳ hạn vay; X13: Quy mô khoản vay.
Bảng 4.5 cũng cho thấy mức lãi suất (X11) tại Agribank Thủ Thừa là phù hợp so với các ngân hàng khác trên cùng địa bàn như Ngân Hàng Xây Dựng Thủ Thừa, Ngân hàng Bưu Điện … Mức lãi suất tại ngân hàng linh hoạt cho từng đối tượng khách hàng, cao nhất là 11%/năm và thấp nhất là 9,5%/năm. Thêm vào đó, mức lãi suất này còn tùy thuộc vào kỳ hạn vay tại ngân hàng. Với mẫu dữ liệu nghiên cứu thì kỳ hạn vay trung bình của khách hàng là gần 49 tháng, cao nhất là 60 tháng (5 năm) và thấp nhất là 36 tháng (3 năm). Đối với quy mô khoản vay (X13), nhìn chung quy mô khoản vay của khách hàng tại ngân hàng thường nằm trong khoảng từ 103 triệu đồng đến 1,500 triệu đồng. Số tiền vay này là phù hợp vì đa số khách hàng thường vay nhằm mục đích sản xuất nông nghiệp và chăn nuôi, trồng cây ăn quả, còn có các khoản vay nhằm mục đích sản xuất kinh doanh thường quy mô sẽ lớn hơn (Phụ lục 1, Biến định lượng).
Bảng 4.6 cho thấy biến nhị phân giới tính (X2) có sự khác biệt giữa nam và nữ. Với mẫu dữ liệu là 200 khách hàng thì số lượng khách hàng là nam chiếm 80% tổng số khách hàng, trong đó khách hàng là nữ chỉ là 20%. Nói cách khác số lượng khách hàng là nam cao 4 lần so với khách hàng là nữ. Đa số khách hàng có quan hệ tín dụng tại
ngân hàng đều đã lập gia đình (X3) và sở hữu nhà ở (X4). Trong tổng số 200 khách hàng thì số người đã lập gia đình và sở hữu nhà ở chiếm tỷ lệ lần lượt là 87.5% (175/200 khách hàng) và 89.5% (179/200 khách hàng). Điều này là hoàn toàn phù hợp vì những người sở hữu nhà ở và đã lập gia đình thì họ thường đảm bảo khả năng trả nợ khi đáo hạn cũng như là tránh việc sử dụng sai mục đích số nợ vay.
Bảng 4.6. Bảng mô tả các biến định tính của được sử dụng trong nghiên cứu Tên biến Mã nhị phân Tần suất Phần trăm Dồn tích
X2 0 40 20 20 1 160 80 100 X3 0 25 12.50 12.50 1 175 87.50 100 X4 0 21 10.50 10.50 1 179 89.50 100 X7 0 175 87.50 87.50 1 25 12.50 100 X14 0 176 88 88 1 24 12 100
Nguồn: Kết quả phân tích từ phần mềm Stata 13.0
X2: Giới tính; X3: Tình trạng hôn nhân; X4: Tình trạng sở hữu nhà; X7: Lịch sử tín dụng; X14: Mục đích khoản vay.
Đối với biến lịch sử tín dụng (X7) ta thấy số lượng khách hàng đã từng phát sinh nợ quá hạn tại ngân hàng chỉ chiếm 12.5% (25/200 người), còn lại là chưa từng phát sinh nợ quá hạn tại ngân hàng. Tuy nhiên trong số 25 người phát sinh nợ quá hạn thì có nhiều khách hàng do nhà ở xa, giao thông không thuận tiện nên xảy ra, thu họach vụ mùa chưa kịp. Điều này cho thấy, hầu hết khách hàng đều có thiện chí trả nợ (87.5%, tương đương 175/200 người). Riêng đối với mục đích vay vốn (X14) ta thấy, hầu hết khách hàng vay nhằm mục đích sử dụng cho chăn nuôi (nuôi bò, nuôi heo, nuôi trâu,..) và sản xuất nông nghiệp (trồng lúa, ngô, cây ăn quả…) với tỷ lệ là 88% (176/200 khách hàng). Tuy nhiên, vẫn có một số khách hàng vay nhằm mục đích sản xuất kinh doanh, với tỷ lệ là 12% (24/200 khách hàng). Điều này là hoàn toàn phù hợp vì tại huyện Thủ Thừa đa số người dân vẫn làm nông nghiệp, nhưng do giáp khu vực Hồ Chí Minh và địa phương đang trên đà phát triển nên có một số hộ chuyển sang kinh doanh (Phụ lục 1, Biến định tính).
4.2.2 Kiểm định tương quan và đa cộng tuyến
Hệ số tương quan đo lường mức độ quan hệ tuyến tính giữa hai biến; chính xác hơn là quan hệ tuyến tính giữa hai biến, không phân biệt biến này phụ thuộc vào biến kia. Hệ số tương quan không có đơn vị, có thể tính từ giá trị mã hóa bằng phép biến đổi tuyến tính giữa hai biến. Hệ số tương quan luôn luôn biến động trong [-1, 1], nếu hệ số tương quan dương cho biết hai biến có biến động cùng chiều và âm thì ngược lại. Ở đây tác giả sử dụng phương pháp phân tích tương quan Pearson để xem xét sự tương quan tuyến tính giữa các biến độc lập và biến phụ thuộc cũng như xem xét sự tương quan giữa các biến độc lập với nhau, vì muốn phân tích hồi quy các biến trước hết phải có tương quan với nhau, và nếu đã “Hồi quy” thì “Tương quan” nhưng chưa hẳn
“Tương quan” thì đã “Hồi quy”.
Vấn đề đa cộng tuyến xảy ra khi các biến độc lập có tương quan tuyến tính mạnh với nhau. Nói cách khác hiện tượng đa cộng tuyến xảy ra khi có mối tương quan tuyến tính hiện hữu giữa các biến độc lập trong mô hình. Để xem xét mô hình có hiện tượng đa cộng tuyến hay không, các giá trị VIF (Variance Inflation Factor) được sử dụng. Về giá trị VIF, Hoàng Trọng & Chu Nguyễn Mộng Ngọc cho rằng quy tắc là khi VIF vượt quá 10, đó là dấu hiệu của đa cộng tuyến (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008).
Bảng 4.7 thể hiện ma trận tương quan giữa các biến độc lập và biến phụ thuộc
(Phụ lục 2). Bảng 4.7 thể hiện rằng tất cả các hệ số tương quan của các biến đều dưới 0.75 (lớn nhất là gần 0.59 được thể hiện thông qua sự tương quan giữa biến X1 và X6; X1 và X9; X6 và X9) và đây là dấu hiệu cho biết có hiện tượng đa cộng tuyến nhưng không đáng kể trong mô hình ước lượng (Neter & cộng sự, 1990). Ngược lại, hiện tượng đa cộng tuyến trở nên nghiêm trọng hơn nếu hệ số này lớn hơn 0.75.
Bên cạnh đó, Bảng 4.7 cũng trình bày chỉ số nhân tố phóng đại phương sai VIF và đây là chỉ số quan trọng trong việc nhận biết khả năng xuất hiện đa công tuyến trong mô hình (Phụ lục 2). Nếu chỉ số này lớn hơn 5, đó là dấu hiệu cho biết có hiện tượng đa cộng tuyến trong mô hình. Nếu chỉ số này gần bằng 10, đó là dấu hiệu cho biết có hiện tượng đa cộng tuyến nghiêm trọng (Gujarati, 2009). Chỉ số VIF lớn nhất trong Bảng 4.7 có giá trị cao nhất là 2.35 và nhỏ hơn 10, kết quả này cho thấy hiện tượng đa cộng tuyến là không đáng kể trong mô hình (Bảng 4.7).
Bảng 4.7. Ma trận tương quan giữa các biến độc lập trong nghiên cứu Biến quan sát X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 VIF X1 1.00 2.34 X2 -0.03 1.00 1.06 X3 0.39 0.00 1.00 1.59 X4 0.01 -0.04 -0.08 1.00 1.06 X5 0.34 0.01 0.49 -0.04 1.00 1.46 X6 0.59 -0.04 0.40 0.01 0.35 1.00 1.94 X7 0.05 -0.03 0.05 0.03 -0.02 0.06 1.00 2.35 X8 0.57 -0.03 0.39 0.01 0.36 0.57 0.04 1.00 1.14 X9 0.59 -0.03 0.39 0.01 0.35 0.59 0.06 0.57 1.00 2.77 X10 -0.10 -0.02 0.10 0.11 -0.00 -0.10 -0.07 -0.08 -0.11 1.00 1.37 X11 0.01 -0.14 -0.15 -0.02 -0.00 0.01 -0.03 0.01 0.01 -0.03 1.00 1.10 X12 -0.08 0.03 -0.04 0.05 0.02 -0.10 0.04 -0.10 -0.09 0.16 -0.07 1.00 1.11 X13 -0.03 -0.03 0.05 0.07 -0.06 -0.03 -0.07 -0.03 -0.03 0.44 -0.02 0.14 1.00 1.34 X14 0.02 0.10 0.09 -0.02 -0.00 0.02 -0.00 0.01 0.01 0.02 -0.05 0.05 0.18 1.00 1.08
Nguồn: Kết quả phân tích từ phần mềm Stata 13.0
X1: Độ tuổi; X2: Giới tính; X3: Tình trạng hôn nhân; X4: Tình trạng sở hữu nhà; X5: Người phụ thuộc; X6: Thời gian cư trú; X7: Lịch sử tín dụng; X8: Kinh nghiệm trong lĩnh vực hiện tại; X9: Thời gian làm công việc hiện tại; X10: Thu nhập; X11: Lãi suất;
X12: Kỳ hạn vay; X13: Quy mô khoản vay; X14: Mục đích khoản vay.
4.2.3 Kết quả phân tích hồi quy
Kết quả hồi quy Logistic được trình bài trong các bảng dưới đây. Trong các bảng dưới đây, tác giả lần lượt loại bỏ các biến không có ý nghĩa thống kê tức là loại bỏ các biến có hệ số p-value lớn nhất để có được mô hình từ 1 đến 2 và từ đó chọn được mô hình tối ưu trong việc đo lường khả năng trả nợ của khách hàng cá nhân tại Agribank Thủ Thừa (Phụ lục 3).
Bảng 4.8. Kết quả phân tích hồi quy Logistc theo mô hình 1
Logistic regression Number of obs = 200
LR chi2 (14) = 101.66 Prob > chi2 = 0.0000
Log likelihood = -9.6765 Pseudo R2 = 0.8401
Y Coef. Std. Err. Z P>|z| [95% Conf. Interval] X1 -10.64 4.68 -2.27 0.023** -19.82 -1.45 X2 0.61 2.02 0.30 0.763 -3.35 4.57 X3 6.06 5.43 1.12 0.264 -4.58 16.72 X4 -1.88 2.81 -0.67 0.503 -7.39 3.63 X5 -4.52 2.83 -1.60 0.110 -10.08 1.02 X6 3.43 1.55 2.21 0.027** 0.38 6.48 X7 -14.33 5.15 -2.78 0.005* -24.44 -4.22 X8 0.45 0.35 1.27 0.204 -0.24 1.15 X9 6.66 3.39 1.96 0.050** 0.004 13.32 X10 -0.33 0.17 -1.92 0.055*** -0.67 0.01 X11 9.59 4.43 2.16 0.031** 0.90 18.28 X12 0.05 0.09 0.62 0.536 -0.12 0.24 X13 0.01 0.01 1.28 0.199 -0.01 0.03 X14 -0.36 2.27 -0.16 0.873 -4.82 4.09 _CONS 52.05 61.05 0.85 0.394 -67.61 171.72
Ghi chú: *, **, *** có ý nghĩa thống kê lần lượt là 1%, 5% và 10%
Nguồn: Kết quả phân tích từ phần mềm stata 13.0
X1: Độ tuổi; X2: Giới tính; X3: Tình trạng hôn nhân; X4: Tình trạng sở hữu nhà; X5: Người phụ thuộc; X6: Thời gian cư trú; X7: Lịch sử tín dụng; X8: Kinh nghiệm trong lĩnh vực hiện tại; X9: Thời gian làm công việc hiện tại; X10: Thu nhập; X11: Lãi suất;
X12: Kỳ hạn vay; X13: Quy mô khoản vay; X14: Mục đích khoản vay.
Mô hình 1 được xây dựng dựa trên tất cả các biến trong mô hình. Kết quả hồi quy Logistic cho thấy 6 biến: Giới tính (X1); Thời gian cư trú (X6); Lịch sử tín dụng (X7); Thời gian làm công việc hiện tại (X9); Thu nhập (X10) và Lãi suất (X11) lần lượt có ý nghĩa thống kê lần lượt là 1%, 5% và 10%. Hệ số LR Chi2 (14) là 101.66; Prob>chi2 (P-value) là rất thấp chỉ 0.000 và hệ số Pseudo R2 trong mô hình là 0.8401 hay 84.01% (các biến độc lập giải thích được 84.01% biến phụ thuộc).
Bảng 4.9. Kết quả phân tích hồi quy Logistic theo mô hình 2
Logistic regression Number of obs = 200
LR chi2 (8) = 95.33 Prob > chi2 = 0.0000
Log likelihood = -11.7418 Pseudo R2 = 0.8059
Y Coef. Std. Err. Z P>|z| [95% Conf. Interval] X1 -8.03 3.17 -2.53 0.011** -14.24 -1.81 X5 -1.71 1.22 -1.40 0.162 -4.11 0.68 X6 2.66 1.06 2.51 0.012** 0.58 4.74 X7 -13.12 4.75 -2.76 0.006* -22.45 -3.79 X9 5.20 2.53 2.05 0.040** 0.23 10.17 X10 -0.30 0.16 -1.81 0.071*** -0.63 0.02 X11 -10.47 4.65 -2.25 0.024** 1.35 -19.59 X13 0.02 0.01 1.74 0.082*** -0.002 0.04 _CONS 10.98 34.63 0.32 0.751 -56.90 78.87
Ghi chú: *, **, *** có ý nghĩa thống kê lần lượt là 1%, 5% và 10%
Nguồn: Kết quả phân tích từ phần mềm stata 13.0
X1: Độ tuổi; X5: Người phụ thuộc; X6: Thời gian cư trú; X7: Lịch sử tín dụng; X9: Thời gian làm công việc hiện tại; X10: Thu nhập; X11: Lãi suất; và X13: Quy mô khoản vay.
Sau khi loại trừ các biến không có ý nghĩa thống kê (Pr>|z| lớn hơn 0.2): Giới tính (X2); Tình trạng hôn nhân (X3); Tình trạng sở hữu nhà (X4); Kinh nghiệm trong lĩnh vực hiện tại (X8); Kỳ hạn vay (X12) và Mục đích khoản vay (X14) thì Mô hình 2 được thiết lập. Nhìn vào Bảng 4.9, kết quả hồi quy cho thấy 7 biến: Giới tính (X1); Thời gian cư trú (X6); Lịch sử tín dụng (X7); Thời gian làm công việc hiện tại (X9); Thu nhập (X10); Lãi suất (X11) và Quy mô khoản vay (X13) lần lượt có ý nghĩa thống kê lần lượt là 1%, 5% và 10%. Hệ số LR Chi2 (8) của mô hình là 97.53; Prob>chi2 (P- value) là rất thấp (bằng 0.000) và hệ số Pseudo R2 trong mô hình là 0.8059 (biến độc lập giải thích 80.59% biến phụ thuộc).
Nhìn chung, tất cả các mô hình đều có hệ số LR Chi2 cao từ 80.59% đến 84.01% đồng thời với Prob>chi2 (P-value) rất thấp (bằng 0.000). Điều này cho thấy các mô hình là phù hợp trong việc đo lường khả năng trả nợ của khách hàng cá nhân tại Agribank Thủ Thừa. Bên cạnh đó, hệ số Pseudo R2
mức tối thiểu 0,2 theo yêu cầu của McFadden (1974), vì vậy cả 2 mô hình đều được sử dụng đo lường khả năng trả nợ của khách hàng cá nhân tại Agribank Thủ Thừa.
Bảng 4.10. Kết quả phân tích hồi quy Logistic và so sánh các mô hình
Các biến Dấu kì vọng Mô hình 1 (Tất cả các biến trông mô hình) Mô hình 2 (Từ mô hình 1, loại bỏ các biến có Pr>|z| lớn hơn 0.2) Y Coef Pr>|z| Coef Pr>|z| X1 - -10.64 0.023** -8.03 0.011** X2 + 0.61 0.763 X3 + 6.06 0.264 X4 - -1.88 0.503 X5 - -4.52 0.110 -1.71 0.162 X6 + 3.43 0.027** 2.66 0.012** X7 - -14.33 0.005* -13.12 0.006* X8 + 0.45 0.204 X9 + 6.66 0.050** 5.20 0.040** X10 - -0.33 0.055*** -0.30 0.071*** X11 - -9.59 0.031** -10.47 0.024** X12 + 0.05 0.536 X13 + 0.01 0.199 0.02 0.082*** X14 - -0.36 0.873 _CONS 52.05 0.394 10.98 0.751 LR chi 2 101.66 97.53 Prob>chi2 0.000 0.000 Pseudo R2 0.8401 0.8059
Ghi chú: *, **, *** có ý nghĩa thống kê lần lượt là 1%, 5% và 10%
Nguồn: Kết quả phân tích từ phần mềm stata 13.0
X1: Độ tuổi; X2: Giới tính; X3: Tình trạng hôn nhân; X4: Tình trạng sở hữu nhà; X5: Người phụ thuộc; X6: Thời gian cư trú; X7: Lịch sử tín dụng; X8: Kinh nghiệm trong lĩnh vực hiện tại; X9: Thời gian làm công việc hiện tại; X10: Thu nhập; X11: Lãi suất;
X12: Kỳ hạn vay; X13: Quy mô khoản vay; X14: Mục đích khoản vay.
Trong các mô hình trên, mô hình 2 được xem là tối ưu nhất trong việc đo lường khả năng trả nợ của khách hàng cá nhân tại Agribank Thủ Thừa vì nó ít biến và có số biến có ý nghĩa là nhiều nhất (ngoại trừ biến thu nhập) nên thuận tiện cho người sử
dụng mà vẫn đảm bảo Prob>chi2 rất thấp (bằng 0.000) và hệ số Pseudo R2
khá cao (0.8401). Phương trình hồi quy Logistic theo mô hình 2 được viết lại như sau:
Y = 10.98 – 8.03X1 + 2.66X6 – 13.12X7 + 5.20X9 – 0.03X10 - 10.47X11 + 0.02X13 +
Bên cạnh đó, để đánh giá khả năng chính xác của mô hình, tác giả tiến hành phân