CHƯƠNG 2. MÔ HÌNH HỒI QUY LOGISTIC TRONG ĐÁNH GIÁ XẾP HẠNG TÍN DỤNG KHÁCH HÀNG
2.1 Giới thiệu mô hình hồi quy logistic
2.1.1 Xác suất không trả được nợ
Xác suất không trả được nợ hay xác suất vỡ nợ, tiếng Anh là Probability Of Default viết tắt là PD, là khả năng người đi vay không thực hiện trả nợ (gốc, lãi) theo lịch trình, cam kết đã định trước. Khi bên cho vay ước tính PD của một doanh nghiệp cao thì bên cho vay sẽ ấn định mức lãi suất cho vay cao hơn như là khoản bồi thường cho việc chấp nhận rủi ro cao hơn đó. PD là tham số đầu tiên quan trọng khi nghiên cứu về rủi ro tín dụng theo tiêu chuẩn Basel.
Theo Basel II, xác suất vỡ nợ được định nghĩa như sau: “Xác suất vỡ nợ được xem là một chỉ báo rủi ro tín dụng, nó cho thấy khả năng xảy ra việc một khách hàng không thể thực hiện nghĩa vụ tài chính theo cam kết ban đầu” [22].
Một khách hàng được Basel định nghĩa không có khả năng trả được nợ như sau [22] :
Ngân hàng cho rằng khách hàng vay có nhiều khả năng không thanh toán được đầy đủ nghĩa vụ tín dụng của mình cho ngân hàng, ngân hàng có thể xử lý tài sản bảo đảm (nếu có) mà không cần truy đòi khách hàng.
Cách xác định có thể dựa vào:
o Có dấu hiệu phá sản;
o Vốn lưu động ròng bị âm;
o Giá trị thị trường của doanh nghiệp < Nợ phải trả…
- Khách hàng có khoản vay lớn đã quá hạn trả nợ 90 ngày mà chưa thanh toán [34]:
o Các khoản thấu chi sẽ được coi là quá hạn khi khách hàng sử dụng vượt quá hạn mức cho phép hoặc khi khoản tiền hiện đang thấu chi lớn hơn mức giới hạn được cấp.
o Đối với một số loại tài sản như khoản vay của các đơn vị công có thể sẽ do cơ quan giám sát xác định là vỡ nợ sau khi quá hạn 180 ngày thay vì 90 ngày.
Với định nghĩa về vỡ nợ của Basel II, toàn thế giới đã có thể áp dụng một định nghĩa thống nhất và mang tính khách quan hơn.
17 Bài toán xác định PD thuộc lớp bài toán phân loại. Hiện nay có nhiều kỹ thuật/mô hình phân loại, trong đó phổ biến và dễ sử dụng là mô hình hồi quy logistic. Trong nghiên cứu của luận văn này, tác giả sử dụng mô hình hồi quy logistic trong việc xác định xác suất vỡ nợ (PD) của khách hàng. Trên cơ sở xác suất vỡ nợ tìm được sẽ đối chiếu sang bảng thang hạng chuẩn để chuyển kết quả sang các ký hiệu xếp hạng tín dụng tương ứng của khách hàng.
Dưới đây luận văn trình bày về mô hình hồi quy logistic trong bài toán phân loại khách hàng vỡ nợ hay không vỡ nợ.
2.1.2 Mô hình hồi quy logistic trong phân loại khách hàng
Trong các mô hình hồi quy tuyến tính, biến độc lập và biến phụ thuộc có thể nhận giá trị trên tập số thực. Nhưng trong thực tế, có một số tình huống hồi quy, biến phụ thuộc chỉ nhận hai kết quả có thể xảy ra, ví dụ huyết áp cao hay huyết áp thấp, bệnh nhân bị ung thư hay không bị ung thư, khách hàng có khả năng trả nợ hay không có khả năng trả nợ,…Trong các trường hợp như vậy, kết quả có thể được mã hóa thành giá trị 0 hoặc 1 và chúng ta muốn dự đoán kết quả hoặc xác suất của kết quả trên cơ sở một hoặc nhiều biến độc lập.
Trong trường hợp này biến phụ thuộc là biến phân loại có hai giá trị (biến nhị phân) và hồi quy logistic là một phương pháp sử dụng mô hình toán học để mô tả mối quan hệ của một số biến độc lập với biến phụ thuộc nhị phân.
Gọi p là xác suất biến cố A xảy ra với giá trị các biến độc lập x1, x2,…,xn. p có giá trị trong khoảng từ 0 đến 1. Khi đó xác suất p(x) được xác định theo công thức [27][34]:
( ) [ | ]
( ) Trong đó:
+ : là hệ số chặn của phương trình
+ x1, x2,..,xn: các biến độc lập của mô hình : là hệ số các biến độc lập + n: Số biến độc lập
Gọi odds là xác suất biến cố xảy ra chia cho biến cố không xảy ra:
Odds=p/(1-p). Nói logit(p) chính là nói log(odds) [13].
18 Xét thấy p chỉ nhận giá trị trong khoảng từ 0 đến 1 nhưng tổ hợp tuyến tính của các biến độc lập có thể nhận giá trị bất kỳ trên tập số thực (từ -∞ đến +∞) . Ta thấy có mối liên hệ chặt chẽ giữa logit(p) và các biến độc lập xi dưới dạng tuyến tính. Nói cách khác, tuyến tính hóa (2.1) ta có [30]:
( ) ( ) Khi đó mô hình hồi quy logistic là một hàm số tuyến tính.
Mối liên hệ giữa: X, p và logit(p) được thể hiện qua hình 2.1 [19]
Hình 2.1: Mối liên hệ giữa X, p và logit(p) Nhận xét:
o p biến thiên từ 0 đến 1 thì y=logit(p) biến thiên từ -∞ đến +∞
o y là hàm tuyến tính của X nhưng xác suất p không là hàm tuyến tính của X o α là giá trị của logit(p) khi X=0.
Trong công thức (2.1), nếu xi là các biến số tài chính độc lập của khách hàng có quan hệ tín dụng hoặc có nhu cầu vay vốn với ngân hàng, Y là biến phụ thuộc thể hiện khách hàng vỡ nợ hoặc không. Khi đó ta quy ước như sau [34][42]:
+ Y=1 nếu khách hàng vỡ nợ (default)
+ Y=0 nếu khách hàng không vỡ nợ (non-default)
Khi đó công thức (2.1) trở thành mô hình hồi quy logistic tính xác suất vỡ nợ của khách hàng.
2.1.3 Xác định tham số mô hình hồi quy logistic
Các hệ số hồi quy được ước lượng bằng phương pháp hợp lý cực đại MLE (maximum likelihood estimator) [13]
0 1
p
X
-4
logit(p)
-2 0 2 4 8
X
19 { ∑ ∑ ( [ ( ̂ ∑ ̂ )])
∑ ∑ ( [ ( ̂ ∑ ̂ )]) ( ) Trong đó:
+ Yi là biến phụ thuộc nhận giá trị 0 hoặc 1 + xi là biến độc lập
+ n là số lượng quan sát
+ ̂ ̂
Giải hệ phương trình (2.3) ta tìm được các hệ số α, β. Đây chính là hệ số của mô hình.
Sau khi tìm được hệ số của phương trình hồi qui, ta tính được xác suất xảy ra của p có biến quan sát x=(x1, x2,…,xn)
( ̂ ∑ ̂ )
( ̂ ∑ ̂ ) ( ) Khi kết quả tính toán p> t thì kết luận A có xảy ra, ngược lại, p <=t thì kết luận A không xảy ra. t gọi là hệ số cắt (cutpoint), tùy theo từng bài toán mà t có thể khác nhau [47]. Mặc định trong các phần mềm xử lý dữ liệu thống kê đều lấy t=0.5.