0
Tải bản đầy đủ (.pdf) (70 trang)

TỔNG QUAN VIỆC THỰC HIỆN

Một phần của tài liệu ĐÁNH GIÁ KHẢ NĂNG TRẢ NỢ VAY NGÂN HÀNG BẰNG MÔ HÌNH BÀI TOÁN PHÂN LOẠI (Trang 44 -44 )

IV. ĐỐI TƢỢNG VÀ PHẠM VI NGHIÊN CỨU

3.2 TỔNG QUAN VIỆC THỰC HIỆN

3.2.1 Số liệu

a) Nguồn số liệu

Để thực hiện đƣợc mô hình đánh giá khả năng trả nợ của các khách hàng tín dụng, luận văn đã sử dụng bộ số liệu từ luận văn “ Xây dựng mô hình xếp hạng tín dụng cá nhân của ngân hàng Đông Á”. Bộ số liệu sử dụng trong luận văn thực chất là thông tin về việc vay và trả nợ. Các thông tin về khách hàng đƣợc cung cấp bởi phòng tín dụng cá nhân ngân hàng Đông Á.

b) Cỡ mẫu

Trong phân tích, kết quả của phân tích đều bị ảnh hƣởng bởi cỡ mẫu. Cỡ mẫu quá nhỏ có thể dẫn đến những kết luận khó có thể chính xác. Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc, (2008)) cho rằng có tối thiểu 5 quan sát cho mỗi biến dự báo. Mẫu của nghiên cứu trong luận văn có 136 quan sát, với số biến là 24 nên đảm bảo cho các thống kê thực hiện.

c) Thời gian và phạm vi chọn mẫu

Mẫu đƣợc cung cấp bởi phòng tín dụng cá nhân của ngân hàng Đông Á trong thời gian từ tháng 9 năm 2008 đến tháng 2 năm 2010.

d) Chi tiết số liệu mẫu

Số liệu mẫu thực hiện phân tích đƣợc cho chi tiết trong phụ lục. Trong đó biến phụ thuộc có giá trị nhƣ sau:

{ ( )

Biến phụ thuộc đƣợc đánh giá theo 2 khả năng là khách hàng có khả năng trả nợ (nhận giá trị 1) và khách hàng không có khả năng trả nợ (nhận giá trị 0).

38

Bảng 3.1. Các biến độc lập đƣợc khảo sát.

STT Chỉ tiêu Thang đo thiết Giả Ký hiệu

1 Giới tính 1: Nam – 0: Nữ +/- Gender

2 Tuổi Tuổi - Age

3 Trình độ đại học (ĐH) 1: Từ ĐH trở lên – 0: Dƣới ĐH + HE

4 Số ngƣời phụ thuộc Ngƣời - Dependants

5 Khách hàng VIP 1: Có – 0: Không +/- VIP

6 Tình trạng hôn nhân 1: Có gia đình – 0: Độc thân - Marrital 7 Tình trạng cƣ trú Sở hữu nhà 1: Có – 0: Không + Homeown

Thuê nhà 1: Có – 0: Không - Renting

8 Thời gian cƣ trú Tháng + Length_stay

9 Thời gian làm việc Tháng + Work_tenure

10 Chức vụ công việc

Lãnh đạo 1: Có – 0: Không + High_rank Trƣởng bộ phận 1: Có – 0: Không + Medium_rank Nhân viên 1: Có – 0: Không - Officer

11 Hình thức chi lƣơng

Chi lƣơng qua ngân

hàng Đông Á 1: Có – 0: Không + DAB_acc Chi lƣơng qua ngân

hàng khác 1: Có – 0: Không + OtherB_acc 12 Lịch sử tín dụng 1: Có nợ - 0: Không có thông tin - Debt 13 Số dịch vụ khác khách hàng đang sử dụng Số dịch vụ + DAB_relate

14 Thu nhập hàng tháng Triệu đồng + Income

15 Tiết kiệm hàng tháng Triệu đồng + Saving

16 Giá trị tài sản đảm bảo Triệu đồng + Assets

17 Loại hình công ty

Công ty thuộc nhà

nƣớc 1: Có – 0: Không + Gov

Công ty vốn nƣớc

ngoài 1: Có – 0: Không + Foreign Công ty khối tài

chính 1: Có – 0: Không + Finance_Comp Doanh nghiệp Việt

Nam 1: Có – 0: Không - VN_Comp

3.2.2 Phƣơng pháp thực hiện

Với số liệu đã có, luận văn thực hiện phân tích xem các biến độc lập có tƣơng quan với nhau không để tránh trƣờng hợp đa cộng tuyến. Sau khi loại bỏ bớt biến để không còn đa cộng tuyến, luận văn xây dựng mô hình Logistic, lựa chọn các biến có ý nghĩa thống kê. Với các biến đã lựa chọn tiến hành đánh giá khả năng trả nợ của khách hàng theo 3 phƣơng pháp: Fisher, Logistic và Bayes. Với mỗi phƣơng pháp, luận văn tiến hành đánh giá tính hợp lý giữa biến phụ thuộc với tất cả các biến độc lập để lựa chọn mô hình phù hợp nhất. Cuối cùng sẽ cho những nhận xét về các phƣơng pháp đã thực hiện để lựa chọn đƣợc phƣơng pháp phù hợp nhất.

39

3.2.3 Vấn đề tính toán

Trong phƣơng pháp Fisher và hồi quy Logistic, luận văn sử dụng phần mềm SPSS với các lệnh cụ thể đƣợc chỉ ra trong mục 2.2.3 và mục 2.4.5.

Trong phƣơng pháp Bayes, từ số liệu rời rạc luận văn sử dụng chƣơng trình 1.1 và chƣơng trình 1.2 để ƣớc lƣợng hàm mật độ xác suất, chƣơng trình 2.1 để phân loại phần tử mới và chƣơng trình 2.2 và chƣơng trình 2.3

để tính sai số Bayes.

3.3 KẾT QUẢ THỰC HIỆN

3.3.1 Theo phƣơng pháp hồi quy Logistic a) Khảo sát các biến có ý nghĩa thống kê a) Khảo sát các biến có ý nghĩa thống kê

Trƣớc khi ta tiến hành phƣơng pháp hồi quy Logistic ta xem xét mức độ tƣơng quan của các biến đƣợc đƣa vào mô hình. Nếu hệ số tƣơng quan cặp > 0.8 thì sẽ dẫn đến hiện tƣợng đa cộng tuyến nếu đƣa các biến này vào mô hình. Hệ số tƣơng quan cặp của các biến đƣợc cho bởi bảng sau:

Bảng 3.2. Hệ số tƣơng quan cặp của biến định lƣợng đƣa vào mô hình.

Bảng 3.2 cho ta thấy 2 biến Income và Saving có sự tƣơng quan chặt chẽ

với nhau (hệ số tƣơng quan bằng 0.931). Điều này cho thấy nếu cùng đƣa 2

biến này vào mô hình thì sẽ xảy ra hiện tƣợng đa cộng tuyến. Vì vậy, chúng ta tiến hành loại bỏ biến trƣớc khi dự báo.

Trƣờng hợp 1: Loại biến Income

Kết quả phân loại khi bỏ biến này đƣợc cho bởi bảng sau:

Correlati ons 1 .275** .529** .237** .279** -.046 .001 .000 .005 .001 .594 136 136 136 136 136 136 .275** 1 .264** .053 .018 .125 .001 .002 .538 .835 .148 136 136 136 136 136 136 .529** .264** 1 .049 -.005 -.059 .000 .002 .568 .952 .496 136 136 136 136 136 136 .237** .053 .049 1 .931** -.043 .005 .538 .568 .000 .618 136 136 136 136 136 136 .279** .018 -.005 .931** 1 -.059 .001 .835 .952 .000 .497 136 136 136 136 136 136 -.046 .125 -.059 -.043 -.059 1 .594 .148 .496 .618 .497 136 136 136 136 136 136 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Age Length_stay Work_tenure Income Sav ing Assets

Age Length_stay Work_tenure Income Sav ing Assets

Correlation is signif icant at the 0.01 lev el (2-t ailed). **.

40

Bảng 3.3. Bảng xác suất dự báo khi loại bỏ biến Income.

Trƣờng hợp 2: Loại biến Saving

Kết quả phân loại khi bỏ biến này đƣợc cho bởi bảng sau:

Bảng 3.4. Bảng xác suất dự báo khi loại bỏ biến Saving.

Nhận xét: Khi ta loại bỏ biến Income hay Saving thì xác suất dự đoán đúng

của cả mô hình đều bằng 88.2%. Vì vậy ta loại biến nào ra khỏi mô hình cũng được. Nhưng trên cơ sở thực tế thì khi ta đánh giá khách hàng ta cần quan tâm đến xác suất khách hàng đó không trả được nợ để tránh trường hợp nợ xấu cho ngân hàng mà khi ta loại bỏ biến Income ra khỏi mô hình xác suất dự đoán đúng khách hàng đó không trả nợ không cao hơn trường hợp loại bỏ biến Saving. Vì vậy, luận văn quyết định loại bỏ biến Income ra khỏi mô hình phân loại nên mô hình phân loại của ta chỉ còn 23 biến độc lập.

Tiến hành phân tích hồi quy Logistic trên phần mềm SPSS, ta có kết quả xử lý đƣợc cho bởi bảng tổng hợp sau:

Classificati on Tablea 13 11 54.2 5 107 95.5 88.2 Observ ed 0 1 Y Ov erall Percentage St ep 1 0 1 Y Percent age Correct Predicted

The cut v alue is . 500 a. Classificati on Tablea 14 10 58.3 6 106 94.6 88.2 Observ ed 0 1 Y Ov erall Percentage St ep 1 0 1 Y Percent age Correct Predicted

The cut v alue is . 500 a.

41

Bảng 3.5. Bảng phân tích hồi quy Logistic cho 23 biến.

Nhận xét: Bảng 3.5 cho ta thấy chỉ có 3 biến Renting (H), High_rank (K)

và DAB_ac (N) có ý nghĩa thống kê 5% khi đưa vào mô hình, các biến còn lại gồm Age (C), HE (D), Marrital (F), Homeown (G), Work_tenure (J), Medium_rank (L), DAB_relate (Q), Assets (T), Gov (U), Foreign (V), Finance_Comp (W) có dấu của hệ số đúng như giả thuyết nhưng không có ý nghĩa ở mức 5%. Điều này cho thấy các biến này không đóng vai trò quan trọng đối với khả năng trả nợ của khách hàng đang được khảo sát. Chính vì vậy những phương pháp phía sau luận văn cũng chỉ sử dụng các biến này để thực hiện bài toán phân loại.

b) Khảo sát khả năng phân loại đúng

Thực hiện phân tích trên phần mềm SPSS cho ta bảng tổng kết các trƣờng hợp nhƣ sau:

Bảng 3.6. Bảng tổng hợp tất cả các trƣờng hợp phân loại bằng phƣơng pháp Logistic.

Trƣờng

hợp Biến

Chi-

square -2Log likelihood sig

Khả năng phân loại đúng 1 biến H 3.275 123.477 0.070 82.4% K 1.351 125.401 0.245 82.4% N 19.015 107.737 0.000 82.4% 2 biến H và K 5.460 121.292 0.065 82.4% H và N 24.535 102.217 0.000 82.4% K và N 19.662 107.090 0.000 82.4% 3 biến H, K và N 25.911 100.841 0.000 82.4%

Var iables in th e Eq uatio n

-.251 1.004 .062 1 .803 .778 -1.474 1.034 2.031 1 .154 .229 -.025 .048 .279 1 .597 .975 1.512 .860 3.095 1 .079 4.537 .040 .331 .014 1 .905 1.040 -1.661 1.035 2.576 1 .109 .190 .448 .725 .381 1 .537 1.565 3.653 1.841 3.937 1 .047 38.601 -.001 .003 .229 1 .632 .999 .008 .007 1.336 1 .248 1.008 3.339 1.547 4.657 1 .031 28.178 2.658 1.402 3.594 1 .058 14.266 1.843 1.307 1.987 1 .159 6.313 2.482 1.137 4.766 1 .029 11.968 -1.132 1.197 .895 1 .344 .322 .580 1.364 .181 1 .671 1.785 .076 .635 .014 1 .905 1.079 -.036 .026 1.940 1 .164 .964 .009 .084 .012 1 .913 1.009 1.217 1.319 .851 1 .356 3.377 1.775 1.405 1.596 1 .206 5.903 .896 1.519 .348 1 .555 2.451 .716 1.111 .415 1 .520 2.046 -.121 2.578 .002 1 .963 .886 A B C D E F G H I J K L M N O P Q S T U V W X Constant St ep 1a

B S. E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: A, B, C, D, E, F , G, H, I, J, K, L, M, N, O, P, Q, S, T, U, V, W, X. a.

42

Nhận xét: Bảng 3.6 cho ta những kết luận cụ thể sau:

- Khả năng phân loại đúng của tất cả các trường hợp đều như nhau.

- Trường hợp sử dụng 1 biến H, K và 2 biến H và K có sig > 5% nên các mô hình xây dựng trong trường hợp này không có ý nghĩa thống kê. Các mô hình trong những trường hợp ngược lại đều có sig < 5% nên có ý nghĩa thống kê.

- Giá trị -2Log likelihood của trường hợp sử dụng 3 biến H, N và K nhỏ nhất và giá trị Chi-square lớn nhất do đó mô hình hồi quy Logistic với 3 biến được xem là phù hợp nhất.

Tiến hành phân tích cụ thể phƣơng pháp hồi quy Logistic cho trƣờng hợp 3 biến H, K và N bằng phần mềm SPSS ta có các bảng kết quả sau:

Bảng 3.7. Các bảng phân tích hồi quy Logistic cho 3 biến Renting (H), High_rank (K) và High_rank (N).

Bảng 3.7.a

Bảng 3.7.b

Bảng 3.7.c

Omnibus Tests of Model Coefficients

25.911 3 .000 25.911 3 .000 25.911 3 .000 St ep Block Model St ep 1 Chi-square df Sig. Model Summary 100.841a .173 .286 St ep 1 -2 Log likelihood

Cox & Snell R Square

Nagelkerke R Square

Estimation terminat ed at iteration number 6 because parameter est imat es changed by less than .001. a. Classificati on Tablea 0 24 .0 0 112 100.0 82.4 Observ ed 0 1 Y Ov erall Percentage St ep 1 0 1 Y Percent age Correct Predicted

The cut v alue is . 500 a.

43

Bảng 3.7.d

 Từ các bảng trên ta có các nhận xét sau:

Kiểm định Chi bình phƣơng cho giá trị quan sát 25,911: Mô hình có ít

nhất một biến độc lập tồn tại mối liên hệ tuyến tính với khả năng trả nợ của khách hàng với mức ý nghĩa 5%.

Với giá trị -2 Log likelihood =100,841 một lần nữa cho thấy có tồn tại mối tƣơng quan giữa biến độc lập và xác suất trả nợ của doanh nghiệp ở mức tƣơng đối có thể chấp nhận đƣợc.

Dựa vào chỉ số Classification Table cho thấy mức độ chính xác của toàn bộ mô hình là 82.4%. Trong đó, với 24 trƣờng hợp doanh nghiệp có nợ xấu mô hình đã dự đoán đúng 0 trƣờng hợp, vậy tỷ lệ đúng là 0%. Còn với 112 trƣờng hợp doanh nghiệp có nợ tốt, mô hình dự đoán sai 0 trƣờng hợp, tỷ lệ đúng là 100%.

Kiểm định Wald về ý nghĩa của các hệ số hồi quy tổng thể của các biến

Renting (H) và DAB_ac (N) có ý nghĩa ở mức 5% nên ta có thể bác bỏ giả thuyết H, có nghĩa là các hệ số hồi quy này có ý nghĩa và mô hình sử dụng tốt.

Với độ tin cậy 95%, khi các yếu tố khác không đổi biến Renting (H) có tƣơng quan tỷ lệ thuận với khả năng trả nợ của khách hàng với mức ý nghĩa 5%. Với Exp(B)= 8.223 khi Renting (H) gia tăng 01 đơn vị thì khả năng trả nợ của doanh nghiệp tăng lên 8.223 lần (*).

Giải thích (*)

Khi Renting (H) = Renting (H) trong điều kiện cố định các biến khác (High_rank (K), DAB_ac (N) bằng 0) khả năng trả nợ của khách hàng

( ( )) ( )

Khi Renting (H) = Renting (H)+1 (Renting (H) tăng thêm 1 đơn vị), khả năng trả nợ của doanh nghiệp

( ( )) ( ( ) )

Và tỉ số của hai xác suất trả nợ đƣợc thể hiện

( ( ) ) ( ( ))

( ( ) )

( )

Variables in the Equation

2.107 1.074 3.846 1 .050 8.223 .712 .631 1.275 1 .259 2.039 2.665 .769 12.001 1 .001 14.369 .455 .301 2.277 1 .131 1.576 H K N Constant St ep 1a

B S. E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: H, K, N. a.

44

đƣợc gọi là tỷ số OR (tỷ số khả dĩ), hay nói cách khác hệ số β trong mô hình chính là tỷ số khả dĩ OR.

Với hệ số β của Renting (H) là số dƣơng cho thấy mối liên hệ giữa xác suất trả nợ của khách hàng và Renting (H) là mối liên hệ thuận (khả năng trả nợ của khách hàng tăng khi Renting (H) tăng).

Vì vậy, với thì khi tăng Renting (H) lên 1 đơn vị thì khả năng trả nợ của khách hàng tăng lần.

Có thể giải thích, khách hàng thuê nhà thì lo làm việc để trả nợ hơn. Cũng theo chuyên gia đƣợc tƣ vấn đây là điều phù hợp với thực tiễn cuộc sống.

Với độ tin cậy 70%, khi các yếu tố khác không đổi, High_rank (K) có tƣơng quan tỷ lệ thuận với khả năng trả nợ của doanh nghiệp với mức ý nghĩa thống kê 30%. Với Exp(B)= 2,039 khi High_rank (K) tăng thêm 01 đơn vị thì khả năng trả nợ của khách hàng sẽ tăng lên 2.039 lần. Điều này nói lên rằng khách hàng là ngƣời lãnh đạo sẽ chú trọng việc trả nợ và thanh toán nợ vay. Theo ý kiến của chuyên gia đƣợc tham vấn rằng kết quả này phù hợp với giả thuyết.

Khi các yếu tố khác không đổi, DAB_ac (N) có tƣơng quan tỷ lệ thuận với khả năng trả nợ của khách hàng với mức ý nghĩa thống kê 1%. Có thể giải thích, khách hàng có hình thức chi lƣơng qua ngân hàng Đông Á thì sẽ có xu hƣớng trả nợ cao hơn những khách hàng có hình thức chi lƣơng qua ngân hàng khác. Với Exp(B)=14.369 khi DAB_ac (N) gia tăng 01 đơn vị lợi nhuận thì khả năng trả nợ của khách hàng doanh nghiệp tăng lên 14.369 lần. Điều này phù hợp giả thuyết và tâm lý con ngƣời.

Có một cách khác để đánh giá khả năng dự báo của mô hình thông qua biểu đồ phân phối xác suất, cụ thể qua đồ thị sau:

45

Hình 3.1:Kết quả kiểm định tính chính xác của mô hình 3 biến.

Theo đồ thị trên, trục hoành biểu diễn xác suất trả nợ của khác hàng nhận giá trị từ 0 (không trả đƣợc nợ) đến 1 (trả đƣợc nợ). Trục tung cho thấy tần số của các trƣờng hợp. Đồ thị có phân bố lý tƣởng nhất là xác suất doanh nghiệp không trả đƣợc nợ (hoặc trả đƣợc nợ) đƣợc tụ lại bên phải (hoặc trái) của trục hoành vì theo lý thuyết một mô hình có xác suất dự báo gần với 0 hoặc 1 sẽ cho kết quả dự báo tốt hơn trƣờng hợp xác suất tập trung xung quanh điểm phân cách 0.5. Từ 0.5 đến 0 là những trƣờng hợp doanh nghiệp không trả đƣợc nợ và ngƣợc lại từ 0.5 đến 1 là trả đƣợc nợ. Trong phạm vi đồ thị phía trên cho thấy những trƣờng hợp dự báo sai khi số 1 xuất hiện phía bên trái điểm phân cách (dự đoán không trả đƣợc nợ nhƣng cuối cùng trả đƣợc nợ) và ngƣợc lại khi số 0 xuất hiện phía bên phải điểm phân cách (dự đoán trả nợ nhƣng cuối cùng không trả đƣợc nợ. Kết quả nghiên cứu này, thành công của mô hình

Một phần của tài liệu ĐÁNH GIÁ KHẢ NĂNG TRẢ NỢ VAY NGÂN HÀNG BẰNG MÔ HÌNH BÀI TOÁN PHÂN LOẠI (Trang 44 -44 )

×