Lemeshow Test
Mức ý nghĩa của kiểm định Chi-square là 0.000 < 0.05 nên ta kết luận có sự phù hợp cao giữa dữ liệu nghiên cứu và kết quả dự báo.
Bảng 3.4: Kiểm định sự phù hợp của mơ hình Model Summary
a. Estimation terminated at iteration number 8 because parameter estimates changed by less than .001.
Hệ số tương quan Cox& Snell R Square đạt 38.1%, trong khi đó hệ số tương quan Nagelkerde R Square đạt tới giá trị 65,1%, cho thấy rằng các biến độc lập giải thích được 65.1% sự biến thiên của biến phụ thuộc.
Giá trị của chỉ tiêu -2LL (viết tắt của -2 log likelihood) càng nhỏ thể hiện độ phù hợp càng cao, giá trị nhỏ nhất của -2LL là 0 (tức là khơng có sai số) khi đó mơ hình có một độ phù hợp hồn hảo. Dựa vào chỉ tiêu -2LL không cao lắm (-2LL = 235.004) thể hiện độ phù hợp khá tốt của mơ hình tổng thể. Tuy nhiên, khó xác định được -2LL bao nhiêu là nhỏ nên tác giả tiếp tục phân tích dựa vào xác suất dự báo chính xác từ kết quả phân tích Logistic trên phần mềm SPSS. Bảng 3.4 sẽ so sánh số trị số thực và trị số dự đoán cho từng biểu hiện và tính tỷ lệ dự đốn đúng sự kiện từ đó đưa ra được mức độ dự báo chính xác của mơ hình.
Step Chi-square df Sig.
1 2762.511 8 .000
Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square
Bảng 3.5: Ƣớc lƣợng mức độ dự báo chính xác của mơ hình Classification Tablea Observed Predicted No_xau.Y Percentage Correct 0 1 Step 1 No_xau.Y 0 1 Overall Percentage 483 12 97.6 24 70 74.5 93.9 a. The cut value is .500
Trong 495 trường hợp khơng phát sinh nợ xấu thì mơ hình dự đốn chính xác 483 trường hợp. 12 trường hợp được mơ hình dự báo khách hàng phát sinh nợ xấu trong khi thực tế là khách hàng không phát sinh nợ xấu. Vậy xác suất mơ hình dự đốn chính xác trường hợp khơng phát sinh nợ xấu là 97.6%. Trong 94 trường hợp khách hàng có nợ xấu mơ hình dự đốn chính xác 70 trường hợp và dự đốn chưa chính xác 24 trường hợp. Vậy tỷ lệ dự đốn chính xác là 74.5%. Sử dụng phép tính trung bình cộng tác giả kết luận mơ hình dự báo chính xác 93.9% xác suất khách hàng phát sinh nợ xấu TTDQT.
3.2.2 Mơ hình giới hạn
3.2.2.1Ƣớc lƣợng tham số của mơ hình
Theo Bảng 3.1, với mức ý nghĩa 5%, các biến X2, X3, X4, X5, X7, X8 có tương quan với xác suất nợ xấu TTDQT. Sử dụng các biến X2, X3, X4, X5, X7, X8 để dự báo xác suất nợ xấu TTDQT là phù hợp. Hệ số hồi qui của các biến X1, X6 có mức ý nghĩa lớn hơn 5%. Hay nói cách khác, với mức ý nghĩa 5%, các biến X1, X6 khơng có tương quan với xác suất nợ xấu TTDQT. Như vậy, các biến X1, X6 không nên sử dụng để dự báo xác suất nợ xấu TTDQT do không đảm bảo về mức ý nghĩa thống kê. Tác giả lập mơ hình giới hạn với các biến độc lập có mức ý nghĩa của hệ số hồi quy cao hơn 5%. Để lựa chọn mơ hình giới hạn phù hợp nhất, tác giả từng bước loại bỏ các biến mà hệ số hồi quy có mức ý nghĩa của hệ số hồi quy lớn hơn 5%. Bắt đầu thực hiện từ các biến mà hệ số hồi quy có mức ý nghĩa cao tới các biến thấp hơn theo thứ tự: X6 (Nhà ở). Sau khi loại biến X6, mức ý nghĩa của biến X1 vẫn cao hơn 5%, tác giả thực hiện loại bỏ biến X1. Việc loại bỏ các biến từng
[ ]
bước sẽ hạn chế việc loại bỏ nhầm các biến có mức ý nghĩa nhỏ hơn 5%. Trong nhiều trường hợp, sau khi loại bỏ biến độc lập thứ nhất X6 thì các biến cịn lại đều có mức ý nghĩa nhỏ hơn 5%. Mơ hình sau khi loại bỏ biến X6 và X1, mơ hình cịn lại gồm 6 biến độc lập là X2, X3, X4, X5, X7, X8. Kết quả phân tích hồi quy Logistics như sau.
Bảng 3.6: Phân tích mơ hình hồi quy Logistic giới hạn Variables in the Equation Equation
a. Variable(s) entered on step 1: Do_tuoi.X2, Trinh_do.X3, Hon_nhan.X4, Nguoi_phu_thuoc.X5, Thu_nhap.X7, Han_muc.X8.
3.2.2.2Kiểm định sự phù hợp của mơ hình
Bảng 3.7: Kiểm định giả thuyết về độ phù hợp Omnibus Tests of Model Coefficients Omnibus Tests of Model Coefficients
Chi-square Df Sig.
Step 1 Step 221.745 5 .000
Block 221.745 5 .000
Model 221.745 5 .000
B S.E. Wald df Sig. Exp(B)
Step 1a Do_tuoi.X2 Trinh_do.X3 Hon_nhan.X4 Nguoi_phu_thuoc.X5 Thu_nhap.X7 Han_muc.X8 Constant -.055 .019 8.216 1 .004 .946 -1.852 .275 45.238 1 .000 .157 -1.409 .361 15.239 1 .000 .244 1.492 .246 36.703 1 .000 4.444 -.428 .064 44.450 1 .000 .652 .033 .005 36.665 1 .000 1.034 5.076 .985 26.536 1 .000 160.076
Sử dụng kiểm định Chi-square, căn cứ vào mức ý nghĩa Sig < 0.05. Kết luận khơng có hiện tượng các hệ số hồi quy đồng thời bằng khơng. Như vậy, mơ hình có ý nghĩa thống kê hay nói cách khác mơ hình có độ phù hợp tổng qt cao.
Bảng 3.8: Kiểm định sự phù hợp của mơ hình Model Summary
a. Estimation terminated at iteration number 8 because parameter estimates changed by less than .001.
Phân tích mơ hình hồi quy giới hạn với 6 biến độc lập là: Độ tuổi, Trình độ học vấn, tình trạng hơn nhân, số người phụ thuộc, thu nhập, hạn mức TTDQT. Kết quả phân tích mơ hình hồi quy giới hạn cho thấy -2LL = 236.021 cao hơn so với - 2LL của mơ hình hồi quy tổng thể (236.021 > 235.004). Tuy nhiên, tỷ lệ chênh lệch là rất nhỏ.
Bảng 3.9: Kiểm định sự phù hợp giữa kết quả dự báo và dữ liệu Hosmer and Lemeshow Test Lemeshow Test
Mức ý nghĩa của kiểm định Chi-square là 0.000 < 0.05 nên ta kết luận có sự phù hợp cao giữa dữ liệu nghiên cứu và kết quả dự báo.
Bảng 3.10: Ƣớc lƣợng mức độ dự báo chính xác của mơ hình Classification Tablea
a. The cut value is .500
Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square
1 236.021a .380 .649
Step Chi-square df Sig.
1 2762.511 8 .000 Observed Predicted No_xau.Y Percentage Correct 0 1 Step 1 No_xau.Y 0 1 Overall Percentage 483 12 97.6 24 70 74.5 93.9
Dựa vào kết quả tại Bảng 3.8 ta kết luận mơ hình hồi quy giới hạn có thể dự báo chính xác 93.9% xác suất khách hàng phát sinh nợ xấu TTDQT. Tỷ lệ dự báo chính xác của mơ hình tổng thể và mơ hình giới hạn là bằng nhau.
3.2.3 Nhận xét và lựa chọn mơ hình tối ƣu
Nhận xét chung: Cả hai mơ hình đều có độ phù hợp tổng quát cao (Omnibus test of Model Coefficients có Sig. = 0.000). Kết quả dự báo của mơ hình phù hợp với dữ liệu nghiên cứu (Hosmer and Lemeshow Test có Sig. = 0.000).
3.2.3.1Căn cứ vào tiêu chuẩn định tính để lựa chọn mơ hình tối ƣu
Để lựa chọn mơ hình tối ưu tác giả sẽ căn cứ trên các tiêu chuẩn: Tiêu chuẩn đơn giản, tiêu chuẩn đầy đủ, tiêu chuẩn có ý nghĩa thực tế.
Tiêu chuẩn đơn giản: “Tiêu chuẩn đơn giản địi hỏi mơ hình có ít biến số
độc lập, vì nếu quá nhiều biến số thì vấn đề diễn dịch sẽ trở nên khó khăn, và có khi thiếu thực tế” (Nguyễn văn Tuấn, 2008, trang 233). Mơ hình hồi quy giới hạn bao gồm 6 biến độc lập và tất cả các biến đều có ý nghĩa thống kê. Trong khi đó, mơ hình tổng thể có 8 biến độc lập trong đó có 2 biến khơng có ý nghĩa thống kê. Căn cứ theo tiêu chuẩn đơn giản thì các mơ hình hồi quy giới hạn được đánh giá cao hơn vì có số lượng biến ít hơn và các hệ số hồi quy có mức ý nghĩa tốt hơn. Mơ hình giới hạn sẽ giúp ta diễn dịch dễ dàng hơn và có ý nghĩa thống kê chính xác hơn.
Tiêu chuẩn đầy đủ: “Tiêu chuẩn đầy đủ ở đây có nghĩa là mơ hình đó phải
mơ tả dữ liệu một cách thỏa đáng, tức phải tiên đoán gần (hay càng gần càng tốt) với giá trị thực tế quan sát của biến phụ thuộc Y. Nếu giá trị quan sát của Y là 10 và nếu có một mơ hình tiên đốn là 9 và một mơ hình tiên đốn là 6 thì mơ hình đầu phải được xem là đầy đủ hơn.” (Nguyễn văn Tuấn, 2008, trang 233).
Bảng 3.11: So sánh khả năng dự báo của hai mơ hình
Chỉ tiêu Mơ hình tổng thể Mơ hình giới hạn
-2LL 235.004 236.021
Tỷ lệ dự báo chính xác 93,9% 93,9%
Hệ số -2LL của mơ hình tổng thể thấp hơn so với mơ hình tổng thể nhưng sự khác biệt là không lớn (1.017 đơn vị) chứng tỏ mơ hình tổng thể có độ phù hợp cao hơn khơng đáng kể so với mơ hình giới hạn.
Tỷ lệ dự báo chính xác của hai mơ hình là bằng nhau trong khi mơ hình giới hạn khơng bao gồm các biến khơng có ý nghĩa. Vậy nếu căn cứ vào tiêu chuẩn đầy đủ thì mơ hình giới hạn được đánh giá cao hơn vì có mức độ dự báo chính xác cao và khơng bao gồm các biến khơng có ý nghĩa.
Giá trị của Nagelkerke R Square trong mơ hình tổng thể và mơ hình giới hạn lần lượt là 65.15%, 64.9%. Cả hai mơ hình đều cho thấy: Việc sử dụng các biến độc lập đưa vào mơ hình để giải thích sự biến thiên của biến phụ thuộc là khá cao. M c dù mơ hình tổng thể được đánh giá cao hơn nhưng mức độ chênh lệch là không đáng kể 0.25%.
Hai mơ hình có cùng mức độ dự báo chính xác nhưng độ phù hợp và khả năng giải thích sự biến thiên của mơ hình giới hạn có phần thấp hơn khơng đáng kể so với mơ hình tổng thể và tất cả các biến trong mơ hình giới hạn đều có ý nghĩa thơng kê. Như vậy, nhìn chung thì mơ hình giới hạn được đánh giá cao hơn.
Có ý nghĩa thực tế: “Có nghĩa là mơ hình đó phải được yểm trợ bằng lý thuyết hay có ý nghĩa thực tế, ý nghĩa lâm sàng (nếu là nghiên cứu lâm sàng), v.v... Có thể số điện thoại một cách nào đó có liên quan đến tỉ lệ gãy xương, nhưng tất nhiên một mơ hình như thế hồn tồn vơ nghĩa. Đây là một tiêu chuẩn quan trọng, bởi vì nếu một phân tích thống kê dẫn đến một mơ hình dù rất có ý nghĩa tốn học mà khơng có ý nghĩa thực tế thì mơ hình đó cũng chỉ là một trị chơi con số, khơng có giá trị khoa học thật sự.” (Nguyễn văn Tuấn, 2008, trang 233). Các lý thuyết nghiên cứu về ảnh hưởng giữa giới tính, tình trạng sở hữu nhà ở và hành vi thanh toán nợ thẻ quốc tế chưa có sự thống nhất trong kết quả nghiên cứu. Một số nghiên cứu cho rằng có sự tương quan giữa các biến giới tình, trình trạng sở hữu nhà ở và hành vi thanh toán nợ thẻ, trong khi một số nghiên cứu khác lại khơng đồng tình. Vì vậy, chưa thể căn cứ theo tiêu chuẩn có ý nghĩa thực tế để lựa chọn mơ hình tối ưu.
Căn cứ theo các tiêu chí lựa chọn mơ hình tối ưu. Tiêu chí đơn giản và đầy đủ ủng hộ việc sử dụng mơ hình giới hạn là mơ hình tối ưu. Tiêu chí có ý nghĩa thực
tế chưa thể kết luận mơ hình nào tốt hơn. Như vậy, 2/3 tiêu chuẩn ủng hộ việc chọn mơ hình giới hạn là mơ hình tối ưu.
3.2.3.2Căn cứ vào hệ số AIC để lựa chọn mơ hình tối ƣu
Một thước đo quan trọng và có ích để chúng ta quyết định một mơ hình đơn giản và đầy đủ là Akaike Information Criterion (AIC). Mơ hình tối ưu là mơ hình có hệ số AIC nhỏ nhất và các biến độc lập phải có ý nghĩa thống kê. R có một hàm gọi là step có thể giúp chúng ta đi tìm một mơ hình đơn giản và đầy đủ. Kết quả phân tích dữ liệu trên phần mềm R thu được hệ số AIC như sau.
[ ]
(2)
Phần mềm R báo cáo từng bước lựa chọn mơ hình tối ưu. Khởi đầu là mơ hình với 8 biến độc lập có hệ số AIC là 233.35, sau đó là 7 biến độc lập với AIC là 230.03. Cuối cùng là mơ hình tối ưu với 6 biến độc lập có hệ số AIC là 228.29. Căn cứ theo hệ số AIC thì mơ hình giới hạn được đánh giá là có khả năng dự báo tốt hơn vì có hệ số AIC thấp nhất.
Kết luận: Xét về tổng thể các yếu tố, mơ hình hồi quy giới hạn được đánh giá cao hơn. Như vậy, dựa trên cơ sở dữ liệu của mơ hình, căn cứ vào các tiêu chuẩn lựa chọn mơ hình và hệ số AIC. Tác giả đề xuất sử dụng mơ hình giới hạn để áp dụng trong dự báo xác suất nợ xấu TTDQT.
Mơ hình tối ưu:
3.3 Ý nghĩa của các hệ số hồi quy trong mơ hình tối ƣu
Để dễ dàng diễn dịch và phân tích ý nghĩa của hệ số hồi quy, cơng thức (1) có thể được viết lại như sau.
Dựa theo công thức (2) ta thấy rằng, khi các biến độc lập tăng thêm một đơn vị thì tỷ lệ giữa xác suất khách hàng phát sinh nợ xấu so với không phát sinh nợ xấu sẽ thay đổi tương ưng là . Ví dụ: Khi trình độ khách hàng cao thêm một bậc thì xác suất khách hàng phát sinh nợ xấu so với không phát sinh nợ xấu sẽ giảm tương ứng là:
= 0.157 lần
Phần mềm SPSS đã hỗ trợ việc tính tốn sự biến thiên về xác suất nợ xấu. Tại cột Exp(B) tại Bảng 3.6 là tỷ lệ thay đổi của xác suất phát sinh nợ xấu so với xác suất không phát sinh nợ xấu khi các biến phụ thuộc tăng thêm 1 đơn vị.
(3)
Độ tuổi (= -0.055): Trong khi các yếu tố khách không đổi, với mức ý nghĩa 5%, khi khách hàng tăng thêm một tuổi thì tỷ lệ xác suất nợ xấu so với tỷ lệ xác suất trả nợ đúng hạn giảm là 0.946 lần.
Trình độ học vấn (= -1.852): Trong điều kiện các yếu tố khác không đổi, với mức ý nghĩa 5% khi trình độ của chủ thẻ tăng thêm 1 đơn vị thì tỷ lệ xác suất nợ xấu của chủ thẻ so với xác suất trả nợ đúng hạn giảm 0.157 lần.
Trình trạng hơn nhân (= -1.409): Trong điều kiện các yếu tố khác không đổi, với mức ý nghĩa 5% khi chủ thẻ đã kết hơn thì tỷ lệ xác suất nợ xấu của chủ thẻ so với xác suất trả nợ đúng hạn giảm 0.244 lần.
Số người phụ thuộc (= 1.492): Trong điều kiện các yếu tố khác không đổi, với mức ý nghĩa 5% khi tăng thêm một người phụ thuộc thì tỷ lệ xác suất nợ xấu của chủ thẻ so với xác suất trả nợ đúng hạn tăng 4.444 lần.
Thu nhập (= -0.428): Trong điều kiện các yếu tố khác không đổi, với mức ý nghĩa 5% khi thu nhập của chủ thẻ tăng thêm một triệu đồng thì tỷ lệ xác suất nợ xấu của chủ thẻ so với xác suất trả nợ đúng hạn giảm 0.652 lần.
Hạn mức (= 0.033): Trong điều kiện các yếu tố khác không đổi, với mức ý nghĩa 5% khi hạn mức của chủ thẻ tăng thêm một triệu đồng thì tỷ lệ xác suất nợ xấu của chủ thẻ so với xác suất trả nợ đúng hạn tăng 1.034 lần.
Kết quả nghiên cứu phù hợp với cơ sở lý thuyết và kỳ vọng về dấu của hệ số hồi qui trong mơ hình.
3.4 Dự báo xác suất phát sinh nợ xấu
Để dự báo xác suất phát sinh nợ xấu thẻ tín dụng. Cơng thức (1) được viết lại như sau:
Dựa theo công thức (3) ta đưa ra được dự báo xác suất khách hàng phát sinh nợ xấu. Giả sử có một khách hàng có thơng tin như sau: Khách hàng 30 tuổi, trình độ đại học, đang sống cùng vợ/chồng, có 1 người phụ thuộc, thu nhập là 15 triệu
= 60%
đồng, mở thẻ tín dụng với hạn mức là 45 triệu đồng (Gấp ba lần lương) thì ta có xác suất phát sinh nợ xấu của khách hàng này là:
P = 60% ta kết luận xác suất khách hàng phát sinh nợ xấu là 60% > 50% nên ta kết luận khơng thể cấp tín dụng cho khách hàng với hạn mức 45 triệu đồng.