5. Kết cấu của luận văn
2.6. Kết quả nghiên cứu và thảo luận
2.6.1 Phân tích tương quan
Phương pháp chung để đánh giá mối quan hệ tương quan cho các biến độc lập và biến phụ thuộc là ma trận tương quan, được trình bày ở bảng dưới đây:
54% 46% Phân bố khách hàng theo tình trạng nhà ở Nhà ở sở hữu Khác 86% 14% Phân bốkhách hàng theo tình trạng nghề nghiệp Có nghề nghiệp Không có nghề nghiệp
Bảng 2.4: Tương quan giữa các biến số có trong bộ dữ liệu nghiên cứu (*) Y X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X16 Y 1 0,05 -0 -0 0 -0 -0 0 -0 -0 0 0,06 -0 0 -0,1 0,01 -0 X1 0,05 1 -0,1 -0 -0 -0 -0 0,03 0,05 0 0 -0 0,02 -0,1 -0 -0 -0 X2 -0 -0,1 1 0,26 -0 0 0,32 0,16 0,05 0 0,01 0,03 0 0,15 0,04 0,01 0,02 X3 -0 -0 0,26 1 -0 0,01 0,11 0,06 -0 0 -0 0 0,01 0,06 0,04 -0 0,01 X4 0 -0 -0 -0 1 0,01 0,02 -0 0,01 0,01 -0 -0 0 0,02 0,03 -0 -0 X5 -0 -0 0 0,01 0,01 1 -0 0,01 0 0,43 -0 0,01 -0 0 0 0 0,01 X6 -0 -0 0,32 0,11 0,02 -0 1 0,09 0,04 -0 0 0,01 -0 0,1 0,04 -0 0 X7 0 0,03 0,16 0,06 -0 0,01 0,09 1 0,5 0 0 0,01 -0,1 0,08 0,02 -0 -0 X8 -0 0,05 0,05 -0 0,01 0 0,04 0,5 1 -0 -0 0 -0 0,06 0,03 0 -0 X9 -0 0 0 0 0,01 0,43 -0 0 -0 1 -0 0,01 0 -0 0 0 0,01 X10 0 0 0,01 -0 -0 -0 0 0 -0 -0 1 0 0,01 0 0,02 0 0 X11 0,06 -0 0,03 0 -0 0,01 0,01 0,01 0 0,01 0 1 0,03 0,1 0,03 0,27 -0,1 X12 -0 0,02 0 0,01 0 -0 -0 -0,1 -0 0 0,01 0,03 1 0,12 0,37 0,1 0,01 X13 0 -0,1 0,15 0,06 0,02 0 0,1 0,08 0,06 -0 0 0,1 0,12 1 0,29 -0 0,01 X14 -0,1 -0 0,04 0,04 0,03 0 0,04 0,02 0,03 0 0,02 0,03 0,37 0,29 1 -0 0,04 X15 0,01 -0 0,01 -0 -0 0 -0 -0 0 0 0 0,27 0,1 -0 -0 1 -0 X16 -0 -0 0,02 0,01 -0 0,01 0 -0 -0 0,01 0 -0,1 0,01 0,01 0,04 -0 1
Nguồn: Tác giả tự tổng hợp bằng Python (*) Chú thích: Xi là các tên giả tượng trưng cho các biến được quy định bảng 3.2
Bảng 4.1 cho thấy hệ số tương quan cao nhất là 0,5 (tương quan đồng biến) giữa biến Thu nhập (X7) và Chi phí cơ bản theo tháng (X8). Có rất nhiều cặp biến số không có tương quan (Hệ số tương quan=0). Kết quả ở bảng ma trận tương quan chỉ ra rằng giữa các biến độc lập trong mô hình vẫn tồn tại mối quan hệ tương quan với nhau. Theo Gujarati (2009) nếu hệ số này lớn hơn 0,8 thì có thể xảy ra hiện tượng đa cộng tuyến trong mô hình. Tuy nhiên, hệ số này trong mô hình vẫn nhỏ hơn 0,8, từ đó có thể kết luận có thể không xảy ra hiện tượng đa cộng tuyến trong mô hình. Tóm lại, có thể kết luận hiện tượng tự tương quan giữa các biến không quá cao, tất cả các biến độc lập này có thể đưa vào mô hình để giải thích cho biến phụ thuộc khả năng trả nợ. Tuy nhiên, để chắc chắn hơn, nghiên cứu tiếp tục kiểm định hiện tượng này bằng hệ số VIF.
Bảng 2.5: Kết quả kiểm định đa cộng tuyến bằng VIF 4 Features VIFFactor target 1.08 appsex 2.12 age 16.90 marital_status 3.78 number_reference 6.45 job 8.02 experience 1.75 income 6.57 basicexpences 5.26 type_residence 2.67 year_residence 1.98 outstanding_balance 1.12 avg_interest_rate 8.24 avg_tenor 5.59 number_closedloan 6.32 number_activeloan 1.27 year_relationship 3.35
Nguồn: Tác giả tự tổng hợp bằng Python
Theo tác giả Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008) để dò tìm và phát hiện hiện tượng đa cộng tuyến có thể dựa vào hệ số phóng đại phương sai VIF (Variance inflation factor), nếu VIF có giá trị lớn hơn 10 thì xảy ra hiện tượng đa cộng tuyến trong mô hình. Từ kết quả bảng 4.2 có thể thấy hệ số VIF của biến Tuổi, lớn hơn 10, do đó ta loại biến này ra khỏi mô hình để tránh hiện tượng đa cộng tuyến.
2.6.2 Phân tích mô hình hồi quy Binary Logistic
Tác giả thực hiện hồi quy Binary Logistic bằng ngôn ngữ lập trình Python, ta được kết quả hồi quy như sau:
Bảng 2.6: Kết quả hệ số hồi quy mô hình Binary Logistic 6 --- Coef. Std.Err. z P>|z| [0.025 0.975] appsex -0.2326 0.0688 3.3822 0.0007 0.0978 0.3674 marital_status 0.1832 0.0688 -2.5108 0.0120 -0.3262 -0.0402 number_reference 0.1486 0.0730 -4.2224 0.0000 -0.2176 -0.0796 job 0.4341 0.0352 -4.4164 0.0000 -0.6268 -0.2415 experience 0.0008 0.0983 -1.4257 0.1540 -0.0019 0.0003 income 0.0000 0.0000 -0.4232 0.6721 -0.0000 0.0000 basicexpenses 0.0000 0.0000 -3.4134 0.0006 -0.0000 -0.0000 type_residence 0.0206 0.0770 -0.2680 0.7887 -0.1716 0.1303 year_residence 0.4333 0.1820 -2.3807 0.0173 -0.7901 -0.0766 outstanding_balance - 0.0000 0.0000 5.4115 0.0000 0.0000 0.0000 avg_interest_rate 0.0024 0.0017 -1.3918 0.1640 -0.0057 0.0010 avg_tenor 0.0006 0.0038 -0.1525 0.8788 -0.0081 0.0069 number_closedloan 0.3516 0.0435 -8.0766 0.0000 -0.4369 -0.2662 number_activeloan 0.1067 0.0945 -1.1289 0.2589 -0.2918 0.0785 year_relationship 0.0428 0.0123 -3.4910 0.0005 -0.0668 -0.0188 ================================================================
Nguồn: Tác giả tự tổng hợp bằng Python
2.6.3 Kiểm định
2.6.3.1 Kiếm định hệ số hồi quy
Bảng trên cho thấy 9/15 biến độc lập có ý nghĩa về mặt thống kê, trong đó 7/15 biến có ý nghĩa về mặt thống kê với mức ý nghĩa 1%. Các biến có ý nghĩa với mức ý nghĩa 1% bao gồm: Giới tính, Số lượng người tham chiếu, Nghề nghiệp, Chi phí cơ bản, Tổng dư nợ, Số khoản vay đã đóng, Số năm quan hệ tín dụng với FE. Các biến này đều có P-value< 0.01. Hai biến có ý nghĩa với mức ý nghĩa 2% là Tình trạng hôn nhân, Số năm cư trú tại địa điểm hiện tại.
2.6.3.2. Kiếm định mức độ phù hợp của mô hình
Bên cạnh đó độ phù hợp của mô hình còn được thực hiện với kiểm định mức độ giải thích của mô hình.
Bảng 2.7: Bảng các thông số của mô hình Logistic 5
Results: Logit
=====================================================
Model: Logit Converged: 1.0000 Dependent Variable: target No. Iterations: 8.0000 Date: 2021-05-23 06:08 Pseudo R-squared: 0.7483
No. Observations: 13066 Log-Likelihood: -336.0 Df Model: 14 LL-Null: -335.7 Df Residuals: 13051 LLR p-value: 0.0514 =====================================================
Nguồn: Tác giả tự tổng hợp bằng Python
Giá trị LLR p-value cho thấy sự chắc chắn trong kết quả của dự báo. Đây được coi là phần trăm cơ hội mà phép hồi quy không thể tạo ra một mô hình có ý nghĩa. Ở đây, giá trị LLR p-value=0.0514, có nghĩa rằng kết quả hồi quy này không hợp lệ chỉ 5,1% trở xuống.
2.6.4 Kiểm định tính chính xác của mô hình nghiên cứu
Bảng 2.8: Kết quả dự báo của mô hình 6
Dự đoán Target Tỷ lệ dự báo đúng 1 0 Target 1 9771 2372 80.47% 0 708 215 23.29% Tỷ lệ trên tổng thể 76.43%
Nguồn: Tác giả tự tổng hợp bằng Python
Với mức cut-value=0.5, Bảng 4.7 cho thấy với 923 quan sát không trả nợ, mô hình dự đoán đúng 215 trường hợp với tỷ lệ dự đoán đúng là 23.3%. Với 9.771 quan sát trả nợ thì mô hình dự đoán đúng 9.771 trường hợp, chiếm tỷ lệ 80.5%. Tỷ lệ dự đoán đúng tính chung cho toàn bộ mẫu là 76,4%.
2.7. Thảo luận kết quả hồi quy
hình nghiên cứu có thể được viết lại như sau:
target = (-0.2326) appsex + 0.1832 marital_status + 0.1486 number_reference + 0.4341 job + 0.0008 experience + 0.000 income + 0.000 basicexpences + 0.0206 type_residence + 0.4333 year_residence + 0.0000 outstanding_balance + 0.0024 avg_interest_rate - 0.0006 avg_tenor +0.3516 number_closedloan+ 0.1067 number_activeloan + 0.0428 year_relationship + µ
Kết quả hồi quy Binary Logistic nhằm xác định những yếu tố ảnh hưởng đến khả năng trả nợ của khách hàng. Mẫu nghiên cứu bao gồm 15 biến đều có ý nghĩa về mặt thống kê với mức ý nghĩa dưới 2%. Từ các hệ số hồi quy ở mô hình nghiên cứu ta có thể diễn dịch ý nghĩa của các hệ số hồi quy như sau:
Các biến có hệ số hồi quy mang dấu âm bao gồm: Giới tính và Dư nợ tín dụng, điều này có nghĩa là trong điều kiện các yếu tố khác không đổi, khi các biến này tăng thêm 1 đơn vị thì khả năng trả nợ của khách hàng sẽ giảm xuống với một tỷ lệ nhất định.
Ngược lại, các biến như: Hôn nhân, Số người tham chiếu, Nghề nghiệp, Kinh nghiệm, Thu nhập, Chi phí cơ bản, Tình trạng nhà ở, Số năm kinh nghiệm, Lãi suất trung bình, Kỳ hạn trung bình, Số khoản vay đã đóng, Số khoản vay còn hiệu lực, Số năm quan hệ với FE Credit, có hệ số hồi quy mang dấu dương, có nghĩa là trong điều kiện các yếu tố khác không đổi, khi các biến này tăng 1 đơn vị thì khả năng trả nợ của khách hàng sẽ tăng lên với một tỷ lệ tương ứng. Qua kết quả trên có thể thấy các hệ số hồi quy có dấu đúng với dấu của kỳ vọng ban đầu.
Qua kết quả chạy mô hình Probit thì ta có thể thấy có 8 biến độc lập có ý nghĩa về mặt thống kê như sau:
Giới tính: có tương quan nghịch với khả năng trả nợ của khách hàng (tương
quan âm) ở mức ý nghĩa 0.1%, điều này cho thấy các khách hàng là nam giới thường có xu hướng nợ quá hạn cao hơn khách hàng là nữ giới, phù hợp với giả thuyết H1 mà học viên đưa ra. Điều này có thể lý giải bởi vì phụ nữ thường được cho là rất kỷ luật khi quản lý các khoản vay, do đó nữ giới có thể có khả năng trả nợ cao hơn. Điều này là hoàn toàn phù hợp với kết quả và lý luận của các nghiên cứu trước như của
Chapman (1990), Weber và Musshoff (2012) đã chứng minh lý thuyết nữ giới ít tạo ra rủi ro tín dụng hơn nam giới.
Tình trạng hôn nhân: quan hệ đồng biến với khả năng trả nợ của khách hàng
(tương quan dương) ở mức ý nghĩa 1.2%, điều này cho thấy với những khách hàng lập gia đình khả năng trả nợ của họ sẽ tốt hơn những người độc thân và phù hợp với giả thuyết H2 của học viên. Kết quả này xảy ra đúng với kỳ vọng ban đầu, phù hợp với điều kiện thực tế và đã được chứng minh qua các nghiên cứu của Afolabi (2010), Nwosu và cộng sự (2014), những khách hàng đã lập gia đình được cho là chín chắn và có sự ổn định hơn, ngoài ra, những người có gia đình thì năng suất lao động cũng sẽ tăng lên. Hơn nữa, đặc tính của sản phẩm cho vay tại FE Credit là hình thức cho vay tín chấp, đảm bảo hoàn toàn bằng sự uy tín của khách hàng, với những khách hàng đã có gia đình thì sẽ có mối liên hệ ràng buộc của họ với vợ, chồng, con cái, nên việc thu hồi nợ của Công ty Tài chính đối với các khách hàng đó cũng sẽ dễ dàng hơn những người độc thân.
Số người tham chiếu: quan hệ đồng biến với khả năng trả nợ của khách hàng
(tương quan dương) ở mức ý nghĩa ~0%, điều này cho thấy với những khách hàng có càng nhiều thông tin người tham chiếu thì độ tin cậy của họ càng cao, từ đó thông tin kê khai và mục đích sử dụng vốn của họ đáng tin hơn, và phần nào chứng tỏ khả năng trả nợ của họ càng tốt và phù hợp với giả thuyết H3 của học viên.
Nghề nghiệp: quan hệ đồng biến với khả năng trả nợ của khách hàng (tương
quan dương) ở mức ý nghĩa ~0%, điều này cho thấy với những khách hàng có việc làm thì có nguồn thu nhập ổn định hơn, từ đó giúp có khả năng trả nợ tốt hơn và phù hợp với giả thuyết H4 của học viên.
Kinh nghiệm làm việc: tương quan thuận chiều với khả năng trả nợ của khách
hàng nhưng không có ý nghĩa về mặt thống kê, điều này có thể giải thích rất nhiều sản phẩm cho vay tín chấp của FE CREDIT đối tượng khách hàng tính ổn định công việc không cao, thường xuyên thay đổi công việc hiện tại của bản thân, không có mối liên hệ cụ thể với khả năng trả nợ.
Thu nhập: Tương quan thuận chiều với khả năng trả nợ của khách hàng, tuy
kê. Điều đó cho thấy rằng với mẫu nghiên cứu năm 2019 của FE Credit, độ lớn của thu nhập của khách hàng gần như không có liên hệ gì với việc đánh giá khả năng trả nợ.
Chi phí cơ bản theo tháng: tương quan thuận chiều với khả năng trả nợ của
khách hàng nhưng không có ý nghĩa về mặt thống kê. Điều này cho thấy độ lớn chi phí cơ bản theo tháng gần như không có tác động tới việc đánh giá khả năng trả nợ.
Tình trạng nhà ở: tương quan thuận chiều với khả năng trả nợ của khách hàng
nhưng không có ý nghĩa về mặt thống kê, điều này có thể giải thích rất nhiều sản phẩm cho vay tín chấp của FE CREDIT đối tượng khách hàng có hoặc không có nhà ở chỉ là phân bố ngẫu nhiên và chưa thực sự liên quan đến khả năng trả nợ của khách hàng.
Số năm cư trú ở địa điểm hiện tại: tương quan thuận chiều với khả năng trả
nợ của khách hàng và có ý nghĩa về mặt thống kê ở mức ý nghĩa 1.7%, điều này có thể giải thích rằng khách hàng có nơi cư trú ổn định về mặt thời gian thì khả năng trả nợ của họ càng tốt, phù hợp với giả thuyết H10 của học viên.
Dư nợ tín dụng: Tuy có tương quan âm so với biến phụ thuộc và có ý nghĩa
thống kê, tuy nhiên độ lớn của hệ số hồi quy tương ứng lại ~0, cho thấy số dư tín dụng gần như không có tác động tới khả năng trả nợ của khách hàng.
Lãi suất trung bình: Tương quan dương với khả năng trả nợ, chứng tỏ lãi suất
càng cao thì khả năng trả nợ càng tốt, tuy nhiên không có ý nghĩa thống kê. Điều này chứng tỏ mối liên hệ giữa lãi suất trung bình và khả năng trả nợ chỉ là ngẫu nhiên.
Kỳ hạn trung bình: Tương quan dương với khả năng trả nợ, chứng tỏ kỳ hạn
trung bình càng cao thì khả năng trả nợ càng tốt, tuy nhiên không có ý nghĩa thống kê. Điều này chứng tỏ mối liên hệ giữa kỳ hạn trung bình và khả năng trả nợ chỉ là ngẫu nhiên.
Số khoản vay đã đóng: Tương quan dương với khả năng trả nợ. Điều này chứng
tỏ số khoản vay đã đóng càng cao, càng chứng tỏ quan hệ của khách hàng đó với FE Credit càng tốt, khách hàng vay nhiều và các khoản vay đều đã thanh toán hết, vì thế khả năng trả nợ càng cao. Điều này không bác bỏ giả thuyết H14 của tác giả
mức ý nghĩa thống kê không đạt. Do đó quan hệ của yếu tố số khoản vay còn hiệu lực và khả năng trả nợ của khách hàng hoàn toàn mang tính chất ngẫu nhiêu.
Số năm quan hệ với FE Credit: Tương quan dương với khả năng trả nợ và
thỏa mãn mức ý nghĩa 1%. Điều này có nghĩa là thời gian quan hệ tín dụng với FE Credit càng dài, càng làm tăng mức độ tin cậy và quen thuộc của khách hàng, vì thế khả năng trả nợ càng cao. Điều này phù hợp với giả thuyết H16 của tác giả.