Theo phƣơng pháp hồi quy Logistic

IV. ĐỐI TƢỢNG VÀ PHẠM VI NGHIÊN CỨU

3.3.1 Theo phƣơng pháp hồi quy Logistic

a) Khảo sát các biến có ý nghĩa thống kê

Trƣớc khi ta tiến hành phƣơng pháp hồi quy Logistic ta xem xét mức độ tƣơng quan của các biến đƣợc đƣa vào mô hình. Nếu hệ số tƣơng quan cặp > 0.8 thì sẽ dẫn đến hiện tƣợng đa cộng tuyến nếu đƣa các biến này vào mô hình. Hệ số tƣơng quan cặp của các biến đƣợc cho bởi bảng sau:

Bảng 3.2. Hệ số tƣơng quan cặp của biến định lƣợng đƣa vào mô hình.

Bảng 3.2 cho ta thấy 2 biến Income và Saving có sự tƣơng quan chặt chẽ

với nhau (hệ số tƣơng quan bằng 0.931). Điều này cho thấy nếu cùng đƣa 2

biến này vào mô hình thì sẽ xảy ra hiện tƣợng đa cộng tuyến. Vì vậy, chúng ta tiến hành loại bỏ biến trƣớc khi dự báo.

Trƣờng hợp 1: Loại biến Income

Kết quả phân loại khi bỏ biến này đƣợc cho bởi bảng sau:

Correlati ons 1 .275** .529** .237** .279** -.046 .001 .000 .005 .001 .594 136 136 136 136 136 136 .275** 1 .264** .053 .018 .125 .001 .002 .538 .835 .148 136 136 136 136 136 136 .529** .264** 1 .049 -.005 -.059 .000 .002 .568 .952 .496 136 136 136 136 136 136 .237** .053 .049 1 .931** -.043 .005 .538 .568 .000 .618 136 136 136 136 136 136 .279** .018 -.005 .931** 1 -.059 .001 .835 .952 .000 .497 136 136 136 136 136 136 -.046 .125 -.059 -.043 -.059 1 .594 .148 .496 .618 .497 136 136 136 136 136 136 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Age Length_stay Work_tenure Income Sav ing Assets

Age Length_stay Work_tenure Income Sav ing Assets

Correlation is signif icant at the 0.01 lev el (2-t ailed). **.

Bảng 3.3. Bảng xác suất dự báo khi loại bỏ biến Income.

Trƣờng hợp 2: Loại biến Saving

Kết quả phân loại khi bỏ biến này đƣợc cho bởi bảng sau:

Bảng 3.4. Bảng xác suất dự báo khi loại bỏ biến Saving.

Nhận xét: Khi ta loại bỏ biến Income hay Saving thì xác suất dự đoán đúng

của cả mô hình đều bằng 88.2%. Vì vậy ta loại biến nào ra khỏi mô hình cũng được. Nhưng trên cơ sở thực tế thì khi ta đánh giá khách hàng ta cần quan tâm đến xác suất khách hàng đó không trả được nợ để tránh trường hợp nợ xấu cho ngân hàng mà khi ta loại bỏ biến Income ra khỏi mô hình xác suất dự đoán đúng khách hàng đó không trả nợ không cao hơn trường hợp loại bỏ biến Saving. Vì vậy, luận văn quyết định loại bỏ biến Income ra khỏi mô hình phân loại nên mô hình phân loại của ta chỉ còn 23 biến độc lập.

Tiến hành phân tích hồi quy Logistic trên phần mềm SPSS, ta có kết quả xử lý đƣợc cho bởi bảng tổng hợp sau:

Classificati on Tablea 13 11 54.2 5 107 95.5 88.2 Observ ed 0 1 Y Ov erall Percentage St ep 1 0 1 Y Percent age Correct Predicted

The cut v alue is . 500 a. Classificati on Tablea 14 10 58.3 6 106 94.6 88.2 Observ ed 0 1 Y Ov erall Percentage St ep 1 0 1 Y Percent age Correct Predicted

The cut v alue is . 500 a.

Bảng 3.5. Bảng phân tích hồi quy Logistic cho 23 biến.

Nhận xét: Bảng 3.5 cho ta thấy chỉ có 3 biến Renting (H), High_rank (K)

và DAB_ac (N) có ý nghĩa thống kê 5% khi đưa vào mô hình, các biến còn lại gồm Age (C), HE (D), Marrital (F), Homeown (G), Work_tenure (J), Medium_rank (L), DAB_relate (Q), Assets (T), Gov (U), Foreign (V), Finance_Comp (W) có dấu của hệ số đúng như giả thuyết nhưng không có ý nghĩa ở mức 5%. Điều này cho thấy các biến này không đóng vai trò quan trọng đối với khả năng trả nợ của khách hàng đang được khảo sát. Chính vì vậy những phương pháp phía sau luận văn cũng chỉ sử dụng các biến này để thực hiện bài toán phân loại.

b) Khảo sát khả năng phân loại đúng

Thực hiện phân tích trên phần mềm SPSS cho ta bảng tổng kết các trƣờng hợp nhƣ sau:

Bảng 3.6. Bảng tổng hợp tất cả các trƣờng hợp phân loại bằng phƣơng pháp Logistic.

Trƣờng

hợp Biến

Chi-

square -2Log likelihood sig

Khả năng phân loại đúng 1 biến H 3.275 123.477 0.070 82.4% K 1.351 125.401 0.245 82.4% N 19.015 107.737 0.000 82.4% 2 biến H và K 5.460 121.292 0.065 82.4% H và N 24.535 102.217 0.000 82.4% K và N 19.662 107.090 0.000 82.4% 3 biến H, K và N 25.911 100.841 0.000 82.4%

Var iables in th e Eq uatio n

-.251 1.004 .062 1 .803 .778 -1.474 1.034 2.031 1 .154 .229 -.025 .048 .279 1 .597 .975 1.512 .860 3.095 1 .079 4.537 .040 .331 .014 1 .905 1.040 -1.661 1.035 2.576 1 .109 .190 .448 .725 .381 1 .537 1.565 3.653 1.841 3.937 1 .047 38.601 -.001 .003 .229 1 .632 .999 .008 .007 1.336 1 .248 1.008 3.339 1.547 4.657 1 .031 28.178 2.658 1.402 3.594 1 .058 14.266 1.843 1.307 1.987 1 .159 6.313 2.482 1.137 4.766 1 .029 11.968 -1.132 1.197 .895 1 .344 .322 .580 1.364 .181 1 .671 1.785 .076 .635 .014 1 .905 1.079 -.036 .026 1.940 1 .164 .964 .009 .084 .012 1 .913 1.009 1.217 1.319 .851 1 .356 3.377 1.775 1.405 1.596 1 .206 5.903 .896 1.519 .348 1 .555 2.451 .716 1.111 .415 1 .520 2.046 -.121 2.578 .002 1 .963 .886 A B C D E F G H I J K L M N O P Q S T U V W X Constant St ep 1a

B S. E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: A, B, C, D, E, F , G, H, I, J, K, L, M, N, O, P, Q, S, T, U, V, W, X. a.

Nhận xét: Bảng 3.6 cho ta những kết luận cụ thể sau:

- Khả năng phân loại đúng của tất cả các trường hợp đều như nhau.

- Trường hợp sử dụng 1 biến H, K và 2 biến H và K có sig > 5% nên các mô hình xây dựng trong trường hợp này không có ý nghĩa thống kê. Các mô hình trong những trường hợp ngược lại đều có sig < 5% nên có ý nghĩa thống kê.

- Giá trị -2Log likelihood của trường hợp sử dụng 3 biến H, N và K nhỏ nhất và giá trị Chi-square lớn nhất do đó mô hình hồi quy Logistic với 3 biến được xem là phù hợp nhất.

Tiến hành phân tích cụ thể phƣơng pháp hồi quy Logistic cho trƣờng hợp 3 biến H, K và N bằng phần mềm SPSS ta có các bảng kết quả sau:

Bảng 3.7. Các bảng phân tích hồi quy Logistic cho 3 biến Renting (H), High_rank (K) và High_rank (N).

Bảng 3.7.a

Bảng 3.7.b

Bảng 3.7.c

Omnibus Tests of Model Coefficients

25.911 3 .000 25.911 3 .000 25.911 3 .000 St ep Block Model St ep 1 Chi-square df Sig. Model Summary 100.841a .173 .286 St ep 1 -2 Log likelihood

Cox & Snell R Square

Nagelkerke R Square

Estimation terminat ed at iteration number 6 because parameter est imat es changed by less than .001. a. Classificati on Tablea 0 24 .0 0 112 100.0 82.4 Observ ed 0 1 Y Ov erall Percentage St ep 1 0 1 Y Percent age Correct Predicted

The cut v alue is . 500 a.

Bảng 3.7.d

 Từ các bảng trên ta có các nhận xét sau:

Kiểm định Chi bình phƣơng cho giá trị quan sát 25,911: Mô hình có ít

nhất một biến độc lập tồn tại mối liên hệ tuyến tính với khả năng trả nợ của khách hàng với mức ý nghĩa 5%.

Với giá trị -2 Log likelihood =100,841 một lần nữa cho thấy có tồn tại mối tƣơng quan giữa biến độc lập và xác suất trả nợ của doanh nghiệp ở mức tƣơng đối có thể chấp nhận đƣợc.

Dựa vào chỉ số Classification Table cho thấy mức độ chính xác của toàn bộ mô hình là 82.4%. Trong đó, với 24 trƣờng hợp doanh nghiệp có nợ xấu mô hình đã dự đoán đúng 0 trƣờng hợp, vậy tỷ lệ đúng là 0%. Còn với 112 trƣờng hợp doanh nghiệp có nợ tốt, mô hình dự đoán sai 0 trƣờng hợp, tỷ lệ đúng là 100%.

Kiểm định Wald về ý nghĩa của các hệ số hồi quy tổng thể của các biến

Renting (H) và DAB_ac (N) có ý nghĩa ở mức 5% nên ta có thể bác bỏ giả thuyết H, có nghĩa là các hệ số hồi quy này có ý nghĩa và mô hình sử dụng tốt.

Với độ tin cậy 95%, khi các yếu tố khác không đổi biến Renting (H) có tƣơng quan tỷ lệ thuận với khả năng trả nợ của khách hàng với mức ý nghĩa 5%. Với Exp(B)= 8.223 khi Renting (H) gia tăng 01 đơn vị thì khả năng trả nợ của doanh nghiệp tăng lên 8.223 lần (*).

Giải thích (*)

Khi Renting (H) = Renting (H) trong điều kiện cố định các biến khác (High_rank (K), DAB_ac (N) bằng 0) khả năng trả nợ của khách hàng

( ( )) ( )

Khi Renting (H) = Renting (H)+1 (Renting (H) tăng thêm 1 đơn vị), khả năng trả nợ của doanh nghiệp

( ( )) ( ( ) )

Và tỉ số của hai xác suất trả nợ đƣợc thể hiện

( ( ) ) ( ( ))

( ( ) )

( )

Variables in the Equation

2.107 1.074 3.846 1 .050 8.223 .712 .631 1.275 1 .259 2.039 2.665 .769 12.001 1 .001 14.369 .455 .301 2.277 1 .131 1.576 H K N Constant St ep 1a

B S. E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: H, K, N. a.

đƣợc gọi là tỷ số OR (tỷ số khả dĩ), hay nói cách khác hệ số β trong mô hình chính là tỷ số khả dĩ OR.

Với hệ số β của Renting (H) là số dƣơng cho thấy mối liên hệ giữa xác suất trả nợ của khách hàng và Renting (H) là mối liên hệ thuận (khả năng trả nợ của khách hàng tăng khi Renting (H) tăng).

Vì vậy, với thì khi tăng Renting (H) lên 1 đơn vị thì khả năng trả nợ của khách hàng tăng lần.

Có thể giải thích, khách hàng thuê nhà thì lo làm việc để trả nợ hơn. Cũng theo chuyên gia đƣợc tƣ vấn đây là điều phù hợp với thực tiễn cuộc sống.

Với độ tin cậy 70%, khi các yếu tố khác không đổi, High_rank (K) có tƣơng quan tỷ lệ thuận với khả năng trả nợ của doanh nghiệp với mức ý nghĩa thống kê 30%. Với Exp(B)= 2,039 khi High_rank (K) tăng thêm 01 đơn vị thì khả năng trả nợ của khách hàng sẽ tăng lên 2.039 lần. Điều này nói lên rằng khách hàng là ngƣời lãnh đạo sẽ chú trọng việc trả nợ và thanh toán nợ vay. Theo ý kiến của chuyên gia đƣợc tham vấn rằng kết quả này phù hợp với giả thuyết.

Khi các yếu tố khác không đổi, DAB_ac (N) có tƣơng quan tỷ lệ thuận với khả năng trả nợ của khách hàng với mức ý nghĩa thống kê 1%. Có thể giải thích, khách hàng có hình thức chi lƣơng qua ngân hàng Đông Á thì sẽ có xu hƣớng trả nợ cao hơn những khách hàng có hình thức chi lƣơng qua ngân hàng khác. Với Exp(B)=14.369 khi DAB_ac (N) gia tăng 01 đơn vị lợi nhuận thì khả năng trả nợ của khách hàng doanh nghiệp tăng lên 14.369 lần. Điều này phù hợp giả thuyết và tâm lý con ngƣời.

Có một cách khác để đánh giá khả năng dự báo của mô hình thông qua biểu đồ phân phối xác suất, cụ thể qua đồ thị sau:

Hình 3.1:Kết quả kiểm định tính chính xác của mô hình 3 biến.

Theo đồ thị trên, trục hoành biểu diễn xác suất trả nợ của khác hàng nhận giá trị từ 0 (không trả đƣợc nợ) đến 1 (trả đƣợc nợ). Trục tung cho thấy tần số của các trƣờng hợp. Đồ thị có phân bố lý tƣởng nhất là xác suất doanh nghiệp không trả đƣợc nợ (hoặc trả đƣợc nợ) đƣợc tụ lại bên phải (hoặc trái) của trục hoành vì theo lý thuyết một mô hình có xác suất dự báo gần với 0 hoặc 1 sẽ cho kết quả dự báo tốt hơn trƣờng hợp xác suất tập trung xung quanh điểm phân cách 0.5. Từ 0.5 đến 0 là những trƣờng hợp doanh nghiệp không trả đƣợc nợ và ngƣợc lại từ 0.5 đến 1 là trả đƣợc nợ. Trong phạm vi đồ thị phía trên cho thấy những trƣờng hợp dự báo sai khi số 1 xuất hiện phía bên trái điểm phân cách (dự đoán không trả đƣợc nợ nhƣng cuối cùng trả đƣợc nợ) và ngƣợc lại khi số 0 xuất hiện phía bên phải điểm phân cách (dự đoán trả nợ nhƣng cuối cùng không trả đƣợc nợ. Kết quả nghiên cứu này, thành công của mô hình đƣợc thể hiện ở chỗ xác suất dự báo cho trƣờng hợp doanh nghiệp trả đƣợc nợ và doanh nghiệp không trả đƣợc nợ đều trên 80%.

Tóm lại: Mô hình trên có thể đƣợc sử dụng để đánh giá khả năng trả nợ của

doanh nghiệp ở mức độ khá, tuy nhiên 3 biến Renting (H), High_rank (K), DAB_ac (N) tác động nhiều nhất đến khả năng này.

PHÂN LOẠI BẰNG PHƢƠNG PHÁP FISHER

Trƣờng hợp nhiều hơn hai tổng thể