CHƯƠNG 3 PHƯƠNG PHÁP NGHIÊN CỨU
3.3. Phân tích dữ liệu
3.3.2.1. Đánh giá hiện tượng đa cộng tuyến
Theo Nguyễn Quang Dong, Nguyễn Thị Minh (2013, tr 238), đa cộng tuyến là hiện tượng các biến độc lập có mối tương quan rất mạnh với nhau. Mơ hình hồi quy xảy ra hiện tượng đa cộng tuyến sẽ khiến nhiều chỉ số bị sai lệch, dẫn đến kết quả của việc phân tích định lượng khơng cịn mang lại nhiều ý nghĩa. Để xác định xem
nghiên cứu có hiện tượng đa cộng tuyến cao hay khơng, nghiên cứu này dựa vào giá trị của hệ số phóng đại phương sai VIF (Variance inflation factor) để đánh giá hiện tượng đa cộng tuyến giữa các biến.
Hệ số phóng đại phương sai VIF (Variance inflation factor) để xác định mối tương quan giữa các biến độc lập và mức độ của mối tương quan đó. Giá trị VIF bắt đầu từ 1 và khơng có giới hạn trên. Trong đó, nếu VIF lớn hơn 10 thì sẽ có hiện tượng đa cộng tuyến cao.
3.3.2.2. Kiểm định sự phù hợp của mô hình
Nghiên cứu dùng kiểm định Chi bình phương của các mơ hình để xác định sự phù hợp của mơ hình
+ Nếu sig < 0.05 thì hàm hồi quy phù hợp
+ Nếu sig > 0.05 thì hàm hồi quy khơng phù hợp
3.3.2.3. Đánh giá mức độ phù hợp của mô hình
Việc này được thực hiện qua so sánh sự khác biệt giá trị -2 Log-likelihood (- 2LL) giữa các mơ hình hồi quy, nếu mơ hình đề xuất có -2LL thấp hơn mơ hình ban đầu thì mơ hình hồi quy đó càng phù hợp (Hair và cộng sự, 2014). Trị số -2LL có giá trị nhỏ nhất là 0 và khơng có giá trị lớn nhất. Đồng thời so sánh hai trị số hệ số Cox & Snell R Square và hệ số Nagelkerke R Square này nếu càng lớn thì độ phù hợp mơ hình hồi quy nhị phân Binary Logistic càng cao.
3.3.2.4. Ý nghĩa thống kê của các biến độc lập
Căn cứ vào chỉ số sig tương ứng với mỗi biến để kiểm định các giả thuyết sau: Với giả thuyết:
+ H0: Hệ số hồi quy của biến đó bằng 0 + H1: Hệ số hồi quy của biến đó khác 0
Nếu sig < 0.05 thì bác bỏ giả thuyết H0, khi đó biến có ý nghĩa thống kê
Nếu sig > 0.05 thì chấp nhận giả thuyết H0, kho đó các biến khơng có ý nghĩa thống kê và sẽ loại khỏi mơ hình.
3.3.2.5. Mức độ dự báo của mơ hình
Trên cơ sở phân tích hồi quy các mơ hình, kết quả mức độ dự báo trung bình của các mơ hình sẽ phản ánh khả năng dự báo chính xác khả năng trả nợ của khách hàng là bao nhiêu phần trăm. Mơ hình có mức độ dự báo trung bình cao hơn thì sẽ có nhiều khả năng dự đốn đúng số khách hàng có khả năng trả nợ hơn, kết quả này sẽ là cơ sở để tác giả đề xuất các yếu tố của mơ hình chấm điểm tín dụng tại FE Credit.
Tóm tắt chương 3
Trên cơ sở các nội dung về cơ sở lý luận và tham khảo một số nghiên cứu có liên quan, tại Chương 3, tác giả đã trình bày các cơ sở để lựa chọn phương pháp nghiên cứu đồng thời đưa ra các giải thiết, quy mơ mẫu cũng như cách thức, quy trình thực hiện nghiên cứu. Kết quả nghiên cứu sẽ được thể hiện ở Chương 4.
CHƯƠNG 4. KẾT QUẢ NGHIÊN CỨU
Qua nội dung đã nêu ở Chương 3, Chương 4 sẽ trình bày kết quả cụ thể về việc nghiên cứu, đánh giá hồn thiện mơ hình chấm điểm tín dụng cá nhân phù hợp với tình hình hiện tại của FE Credit và bối cảnh dịch bệnh Covid-19 hiện nay.
4.1. Kết quả thống kê mô tả dữ liệu thu thập
4.1.1. Xử lý dữ liệu
Nghiên cứu sử dụng dữ liệu để thực hiện nghiên cứu gồm 859 mẫu quan sát, đây là những khách hàng đang có khoản vay của FE Credit từ năm 2019 đến 2021. Tuy nhiên do có 94 mẫu không đủ dữ liệu, nghiên cứu đã loại các mẫu này ra khỏi bộ dữ liệu, kết quả số lượng mẫu quan sát dùng để nghiên cứu chính thức còn 765 mẫu quan sát.
4.1.2. Thống kê mô tả dữ liệu
Thực hiện tính tốn theo các công thức nêu tại mục 3.2.1 thông qua phầm mềm SPSS, kết quả thống kê bảng mô tả dữ liệu như sau:
Bảng 4.1: Kết quả thống kê mô tả của nghiên cứu
Biến Số mẫu Giá trị trung bình Phương sai Độ lệch chuẩn Giá trị nhỏ nhất Giá trị lớn nhất Y 765 .80 .163 .403 0 1 X1 765 37.97 96.418 9.819 23 65 X2 765 .53 .249 .499 0 1 X3 765 .63 .233 .483 0 1 X4 765 .18 .145 .380 0 1 X5 765 1.34 .465 .682 0 4 X6 765 1.28 .379 .616 0 4 X7 765 15.82 1249.272 35.345 0 180 X8 765 4.50 35.619 5.968 0 30 X9 765 .15 .130 .360 0 1
X10 765 .03 .028 .167 0 1 X11 765 .35 .229 .479 0 1 X12 765 .85 .128 .358 0 1 X13 765 17.62 123.178 11.099 3 36 X14 765 .60 .240 .490 0 1 X15 765 19 triệu* 228 tỷ** 15 tỷ*** 2000000 70000000 X16 765 .10 .090 .299 0 1 Ghi chú * 19031393.14; ** 228590267283507; ***15119201939
Qua bảng thống kê mô tả dữ liệu của 765 khách hàng đang sử dụng tín dụng của FE Credit nêu trên, có thể thấy một số thơng tin cơ bản như sau:
- Về độ tuổi (X1), khách hàng có độ tuổi trung bình là 37,97 tuổi (tuổi nhỏ nhất là 23 tuổi, lớn nhất là 65 tuổi). Theo quy định của FE Credit thì các sản phẩm tín dụng của cơng ty được cung cấp cho các khách hàng trong độ tuổi từ 16 trở lên (từ 16 đến 18 tuổi phải có ý kiến của gia đình hoặc người giám hộ), dữ liệu thu thập có độ tuổi từ 23 đến 65 mặc dù chưa đầy đủ các độ tuổi theo tiêu chí về khách hàng của FE tuy nhiên với mức phân bố độ tuổi của dữ liệu, nghiên cứu mong muốn đáp ứng được yêu cầu phản ánh mức ảnh hưởng của độ tuổi tới khả năng trả nợ do đa số khách hàng của FE Credit sẽ nằm trong độ tuổi này.
- Về giá trị khoản vay (X15), giá trị khoản vay trung bình là khoảng 19 triệu (khoản vay nhỏ nhất là 2 triệu, lớn nhất là 70 triệu): Các sản phẩm tín dụng của FE có hạn mức tối đa là 70 triệu vì vậy với dữ liệu thu thập từ khách hàng có giá trị khoản vay từ 2 triệu đến 70 triệu nghiên cứu sẽ đánh giá được mức ảnh hưởng của giá trị khoản vay tới tới khả nợ của khách hàng.
4.2. Kết quả ước lượng mô hình hồi quy Binary Logistic
4.2.1. Hiện tượng đa cộng tuyến
Kết quả giá trị hệ số phóng đại phương sai VIF các mơ hình như sau:
Bảng 4.2: Kết quả chỉ số phóng đại phương sai của nghiên cứu
STT Biến Hệ số VIF mô hình 1 Hệ số VIF mô hình 2 Hệ số VIF mô hình 3 1 X1 1.277 1.323 1.206 2 X2 1.023 1.030 1.026 3 X3 1.235 1.254 1.249 4 X4 1.055 1.237 1.216 5 X5 2.618 2.691 6 X6 4.800 4.832 7 X7 3.234 3.264 1.040 8 X8 1.138 1.276 9 X9 1.016 1.022 1.012 10 X10 1.029 1.047 1.037 11 X11 1.084 1.046 12 X12 1.262 13 X13 3.048 2.245 14 X14 2.507 2.294 15 X15 1.680 16 X16 1.216 1.190
Qua kết quả về chỉ số VIF nêu trên có thể thấy giá trị VIF của các biến đều nhỏ hơn 10 vì vậy mơ hình đưa ra khơng có hiện tượng đa cộng tuyến cao tức là các biến khơng có mối quan hệ tuyến tính chặt với nhau vì vậy khơng cần phải loại bỏ biến nào ra khỏi mơ hình.
4.2.2. Sự phù hợp và mức độ phù hợp của các mô hình
Bảng 4.3: Kết quả hệ số hồi quy và mức ý nghĩa thống kê của các biến độc lập
STT Biến Giả thiết Mơ hình 1 Mơ hình 2 Mơ hình 3
𝜷 Sig. 𝜷 Sig. 𝜷 Sig.
1 X1 + .043 .001 .094 .000 .095 .000 2 X2 + .539 .012 1.145 .000 1.151 .000 3 X3 + .617 .009 1.007 .001 1.032 .001 4 X4 + -.074 .779 1.711 .000 1.736 .000 5 X5 - -.131 .576 .003 .993 6 X6 - -.138 .687 .168 .713 7 X7 - -.019 .000 -.028 .000 -.026 .000 8 X8 + .047 .042 .022 .426 9 X9 - -1.439 .000 -1.999 .000 -1.941 .000 10 X10 - -3.009 .000 -4.319 .000 -4.307 .000 11 X11 + 1.930 .000 1.936 .000 12 X12 + .032 .933 13 X13 - -.083 .000 -.094 .000 14 X14 - -1.293 .006 -1.383 .002 15 X15 + .000 .054 16 X16 - -2.822 .000 -2.913 .000 Constant .188 .733 .382 .647 .503 .440 Một số nhận xét:
- Mô hình 1: Đây làm mơ hình có các biến độc lập là các tiêu chí chấm điểm
tín dụng cá nhân hiện tại của FE Credit. Kết quả hồi quy cho thấy:
+ Các biến X4 (trình độ học vấn), X5 (chỉ số rủi ro của hợp đồng cùng
trong vòng 24 tháng) khơng có ý nghĩa thống kê do giá trị sig > 0.05; điều này có nghĩa là các biến này khơng có khả năng dự báo khả năng trả nợ của khách hàng.
+ Dấu của hệ số hồi quy các biến: Đa số các biến đều có tác động đúng với giả thuyết đã đưa ra, riêng hệ số hồi quy của biến X4 (trình độ học vấn) kết quả cho dấu (-) điều này trái với giả thiết tức là với dữ liệu phân tích thì khách hàng có trình độ học vấn cao hơn có khả năng trả nợ thấp hơn những khách hàng khác.
- Mơ hình 2: Đây là mơ hình mà nghiên cứu đề xuất đưa các biến từ X11 đến
X16 vào mơ hình với giả định các biến này có ảnh hưởng đến khả năng trả nợ của khách hàng.
Kết quả hồi quy cho thấy:
+ Các biến X5 (chỉ số rủi ro của hợp đồng cùng DSA_Code trong vòng 24
tháng và X6 (Chỉ số rủi ro của khách hàng cùng công ty trong vòng 24 tháng), X8 (số năm làm việc của khách hàng), X12 (khoản vay được mua bao hiểm), X15 (giá trị khoản vay) khơng có ý nghĩa thống kê do giá trị sig > 0.05, điều này có nghĩa là các biến này khơng có khả năng dự báo khả năng trả nợ của khách hàng.
+ Dấu của hệ số hồi quy các biến: Dấu của các biến X5 (chỉ số rủi ro của hợp đồng cùng DSA_Code trong vòng 24 tháng và X6 (Chỉ số rủi ro của khách hàng
cùng công ty trong vòng 24 tháng) trái với giả thiết. Tuy nhiên các biến này khơng có ý nghĩa thống kê tức là các biến này không ảnh hưởng hay tác động đến khả năng trả nợ của khách hàng.
- Mô hình 3: Trên cơ sở kiểm định mơ hình 2, nghiên cứu loại các biến X5,
X8, X12, X15 do khơng có ý nghĩa thống kê.
Kết quả hồi quy cho thấy:
+ Sau khi loại các biến khơng có ý nghĩa thống kê tại mơ hình 2 thì giá trị sig > 0.05 như vậy các biến được kiểm định tại mơ hình 3 đều có ý nghĩa thống kê.
+ Dấu của hệ số hồi quy thể hiện các biến độc lập tác động đến khả năng trả nợ của khách hàng phù hợp với giả thiết đưa ra.
4.2.3. Đánh giá độ phù hợp của 03 mô hình hồi quy
+ Mơ hình 1:
Bảng 4.4: Kết quả chỉ số chi bình phương và Sig của mơ hình 1
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 173.813 10 .000
Block 173.813 10 .000
Model 173.813 10 .000
+ Mơ hình 2:
Bảng 4.5: Kết quả chỉ số chi bình phương và Sig của mơ hình 2
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 384.917 16 .000
Block 384.917 16 .000
Model 384.917 16 .000
+ Mơ hình 3:
Bảng 4.6: Kết quả chỉ số chi bình phương và Sig của mơ hình 3
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 380.504 11 .000
Block 380.504 11 .000
Model 380.504 11 .000
Có thể thấy ở cả 3 mơ hình chỉ số sig kiểm định Chi-square tại hàng Model đều có giá trị bằng 0.000 < 0.05 do đó có thể kết luận mơ hình hồi quy tại 03 mơ hình là phù hợp.
4.2.4. Đánh giá mức độ phù hợp của các mô hình
Bảng 4.7: Kết quả đánh giá độ phù hợp của các mơ hình
Model Summary
Mơ hình -2 Log likelihood
(-2LL) Cox & Snell R Square Nagelkerke R Square
1 600.047a .203 .319
2 388.943a .395 .621
3 393.357a .392 .616
a. Estimation terminated at iteration number 5 because parameter estimates changed by less than .001.
- Giá trị -2LL: so sánh các giá trị -2LL của cả 3 mơ hình có thể thấy mơ hình 1 có chỉ số -2LL cao nhất tiếp đến là mơ hình 3 và mơ hình 2 có chỉ số -2LL thấp nhất. Như vậy mơ hình 1 có mức độ phù hợp thấp nhất, mơ hình 2 có mơ hình phù hợp cao nhất.
- Để tiếp tục so sánh mức độ phù hợp của mơ hình, nghiên cứu tiếp tục so sánh giá trị của chỉ số Cox & Snell R Square và Nagelkerke R Square, theo phân tích ở trên thì các chỉ số này càng cao thì mức độ phù hợp càng cao. Như vậy so sánh 02 chỉ số này thì mơ hình 2 vẫn phù hợp nhất và mơ hình 3 có mức độ phù hợp thấp nhất. Tuy nhiên các giá trị của 03 chỉ số nêu trên ở mơ hình 2, 3 có giá trị tương đương nhau tức là mơ hình 2, 3 có mức độ phù hợp tương đương nhau.
4.2.5. Mức độ dự báo của các mô hình
Qua đánh giá các giá trị nêu trên, có thể kết luận các mơ hình khơng có hiện tượng đa cộng tuyến, các biến có tác động hợp lý lên biến phụ thuộc đồng thời mơ hình có ý nghĩa thống kê. Để có thể đưa ra kết luận về mức độ phù hợp của mơ hình thì ở phần này nghiên cứu thực hiện so sánh mức độ dự báo của các mơ hình từ đó có thể kết luận về mơ hình chấm điểm tín dụng cá nhân phù hợp trong bối cảnh hiện nay.
- Mô hình 1:
Bảng 4.8: Kết quả đánh giá mức độ dự báo mơ hình 1
Classification Tablea Observed Predicted Y Percentage Correct khơng có khả năng có khả nang trả Step 1 Y khơng có khả năng 54 102 34.6 có khả nang trả 29 580 95.2 Overall Percentage 82.9
a. The cut value is .500
- Mô hình 2:
Bảng 4.9: Kết quả đánh giá mức độ dự báo mơ hình 2
Classification Tablea Observed Predicted Y Percentage Correct khơng có khả năng có khả nang trả Step 1 Y khơng có khả năng 100 56 64.1 có khả nang trả 27 582 95.6 Overall Percentage 89.2
a. The cut value is .500
- Mô hình 3:
Bảng 4.10: Kết quả đánh giá mức độ dự báo mơ hình 3
Classification Tablea Observed Predicted Y Percentage Correct khơng có khả năng có khả nang trả
Step 1 Y khơng có khả năng 98 58 62.8
có khả nang trả 26 583 95.7
Overall Percentage 89.0
a. The cut value is .500
Qua kết quả kiểm định mức độ dự báo chính xác của 03 mơ hình ta thấy trong 156 khách hàng khơng có khả năng trả nợ thì mơ hình 1 dự báo chính xác 54 khách hàng (đạt tỷ lệ 34,6 %), kết quả tương ứng với mơ hình 2 là 100 khách hàng (đạt tỷ lệ 64,1 %) và mơ hình 3 là 98 khách hàng (đạt tỷ lệ 62,8 %). Đối với dự báo khách hàng có khả năng trả nợ thì trong 609 khách hàng thì mơ hình 1 dự báo chính xác 580 khách hàng (đạt tỷ lệ 95,2 %) và kết quả tương ứng với mơ hình 2 là 582 khách hàng (đạt tỷ lệ 95,6 %) và mơ hình 3 là 583 khách hàng (đạt tỷ lệ 95,7 %).
Kết quả dự báo chính xác trung bình của các mơ hình: Căn cứ vào kết quả nêu trên về khả năng dự báo khách hàng có khả năng trả nợ của các mơ hình có thể thấy các mơ hình 1, 2, 3 đều phù hợp tuy nhiên mơ hình 1 (mơ hình ban đầu) có tỷ lệ dự báo trung bình thấp nhất 82.9 %, mơ hình 2, 3 có mức dự báo trung bình chính xác lần lượt là 89.2 % và 89 %.
Như vậy việc đề xuất bổ sung một số biến độc lập vào mơ hình ban đầu đã giúp cải thiện khả năng dự đoán khả năng trả nợ của khách hàng.
4.3. Đề xuất mô hình
Qua kết quả kiểm định mơ hình tại các mục nêu trên có thể thấy mơ hình 2 có mức độ dự báo trung bình khả năng trả nợ của khách hàng chính xác hơn 0.2 % tuy