MỤC LỤC
XHTD là sự đánh giá rủi ro tín dụng của ngân hàng với KH vay vốn (có thé là cá nhân, doanh nghiệp,..) từ các báo cáo về thông tin của họ; dự đoán khả năng trả nợ của khách hàng và dự báo ngầm về khả năng không trả được nợ của họ. Bên cạnh đó, hiện nay các NHTM đã áp dụng các ứng dụng chuyên tiền thay vì phải trực tiếp đến ngân hàng thì KH có thé giao dịch qua internet banking, hay ngân hàng hợp tác với một số ứng dụng khác để tạo ra các ví điện tử được KH khá ưa. Tiến hành XHTD bằng phương pháp này chủ yếu dựa vào những kinh nghiệm đã được đúc kết từ nhiều năm của các chuyên gia, qua đó chúng ta có thé tìm ra bản chất của mối quan hệ giữa khả năng trả nợ của khách hàng và các yếu tố tác động tới nó.
Nếu phương pháp chuyên gia phụ thuộc chủ yếu vào đánh giá chủ quan từ phía các chuyên gia thì những mô hình thống kê lại dùng các kiểm định dé chấp nhận hay bác bỏ các giả thuyết được đưa ra liên quan đến tiêu chuan khả năng trả nợ của khách hàng. Khi các giả thuyết được kiểm định qua các phương pháp thống kê thì sựa lựa chọn và xác định các tham số cho những yếu tố ảnh hưởng đến khả năng trả nợ của khách hàng cá nhân được tiến hành một cách khách quan từ những thông tin đã được thu thập từ thực tế trước đó. Chính vi vậy, hiện nay, các NHTM dan chuyên sang tiếp cận phương pháp thống kê- sử dụng định lượng thay vì định tính như trước đây; đặc biệt là sử dụng hồi quy Logit để phân tích và dự báo khả năng không trả được nợ của KH.
Chúng ta có thê tuyến tính hóa hàm Logistic hồi quy, nó sẽ dé dàng dé giải thích tại sao biến độc lập này thay đổi thì biến phụ thuộc cũng sẽ gián tiếp thay đối theo. Cỏc bước thực hiện cú thộ được lý giải dựa trên những cơ sở lý thuyết đã có, khác với một số mô hình Machine Learning khác cần chỉnh sửa những tham số dé chọn ra mô hình tốt nhất mà không có cơ sở hay phương pháp cụ thê nảo. Hau hết dữ liệu liên quan đến lĩnh vực tài chính đều có “missing values”; đặc biệt trong dữ liệu về thông tin, lich sử tin dung,..cla khách hàng tai NHTM đều có chưa các giá trị trên.
Tuy nhiên, việc bỏ này có thể sẽ gây ra van đề mất rất nhiều quan sát trong bộ dữ liệu; ví dụ: mỗi một biến có “missing values” ở những quan sát khác nhau, nếu chúng ta loại bỏ hết thì bộ. Thứ ba, ta có thê đưa hết “missing values” vào mô hình băng cách gộp chúng lại thành 1 nhóm đối với từng biến, sau đó sẽ dùng WOE của chúng là đầu vào thay. Các NHTM thường áp dụng phương pháp biến đổi thứ ba để xử lý “missing values” vì các phương pháp 1,2,4 đều giả định các “missing value” không có giá trị gi- không thé thu thập được những thông tin hữu ich cho việc kinh doanh từ các giá trị đó.
Thứ hai, khi sử dụng biến chưa xử lý thì trong một số trường hợp xu thế của biến độc lập có thể không quan hệ đơn điệu với biến mục tiêu: chữ U, A,..Do đó, phương pháp biến đổi WOE sẽ đảm bảo mối quan hệ đơn điệu (đồng biến/ nghịch biến) với biến mục tiêu. Giả sử như biến tuổi và biến số tiền dư trong tài khoản tiết kiệm của khách hàng có sự chênh lệch đơn vị khá lớn, thường chúng ta sẽ dùng hàm log đối với các biến có đơn vị lớn đề cân bằng với các biến khác và WOE cũng giúp chúng ta giải quyết van dé này với hiệu quả tương tự. Dé ước lượng các hệ số trong mô hình này, ta không thé dùng phương pháp OLS vì khi thay giá trị phân loại thực tế (0,1) vào mô hình (*) thì về trái có thé không xác định.
Trong trường hợp một biến độc lập không thỏa mãn theo những tiêu chuẩn về mặt thống kê nhưng biến đó có ảnh hưởng lớn tới biến phụ thuộc thì chúng ta van cần cân nhắc dé giữ lại. Hồi quy theo Stepwise là phương pháp dé xây dựng một mô hình bằng cách lặp đi lặp lại từng bước hồi quy Logit để chọn ra các biến độc lập có sức ảnh hưởng nhất định cho mô hình. * Mô hình hoàn hảo: Biéu dién qua đường gồm 2 phân khúc riêng biệt bao gồm phân khúc phân biệt được hoàn toàn các quan sát Bad đầu tiên và phân khúc sau đó phân biệt được các quan sát Good.
Trong đó có cách biến đổi WOE với các ưu nhược điểm và lợi ích của việc dùng nó trong xử lý biến, sau đó lựa chọn biến dé đưa vào mô hình cuối cùng bằng chỉ số IV, ma trận tương quan, hồi quy Logistic theo phương pháp Stepwise,..Sau khi chọn được các biến và hồi quy dé ra được một mô hình dự báo xác suất không trả được nợ của KH thì chúng ta cần đánh giá mô hình qua một số chỉ số: Gini, PSI,.
Đó là lý do cần sử dụng các phương pháp phân tích thống kê dữ liệu để xây dựng một mô hình dự báo xác suất không trả được nợ của KHCN từ những thông tin KH cung cấp. Mẫu gồm 89,592 khách hàng với các nhóm biến liên quan đến sản phẩm tín dụng của khách hàng, nhóm biến về giao dịch phi tín dụng, nhóm biến liên quan đến số dư tài khoản. Lúc này ngân hàng cần phải xây dựng một mô hình dự báo xác suất không trả được nợ của KHCN dựa trên những thông tin của KH trong phạm vi ngân hàng có thé thu thập dé đưa ra bang XHTD.
Sau đó, ta đưa 21 biến trên vào hồi quy Logit và loại các biến có P-value lớn hơn 0.05 kết hợp với xét ma trận tương quan giữa các biến: với cặp biến có tương quan lớn hơn 0.5 (do mô hình có các khách hàng thuộc nhóm A-score) thì ta loại biến có Gini nhỏ hơn. Khi biến này có giá trị tăng dần thì có thé hiểu họ đang có nhiều tiền và khả năng không tra được nợ giảm dẫn đến WOE tăng và xu thế kì vọng đi lên. Khi giá trị của biến tăng dan thì có thé hiểu họ đang có nhiều tiền và khả năng không trả được nợ giảm dẫn đến WOE tăng và xu thế kì vọng đi lên.
Khi giá trị của biến tăng đồng nghĩa với việc họ ngày càng rút nhiều tiền, tài chính không ổn định dẫn đến khả năng không trả được nợ tăng và xu thế kì vọng đi xuống. Khi biến này có giá trị càng tăng nhẹ lúc đầu thì có thể do họ sử dụng dé thanh toán bình thường hoặc trả tiền mua hàng trên một số ứng dụng mua hang online nên xu thé kì vọng đi lên. Khi giá tri của biến nay tăng dần có thé hiểu là họ hay có nhiều tiền ra/ vào trong tài khoản dé giao dịch, khả năng tài chính ôn định dẫn đến khả năng không trả được nợ giảm va xu thế kì vọng đi lên.
Tuy nhiên, sau đó số lần sử dụng thẻ tin dụng của KH càng nhiều có thé hiểu là khả năng tài chính của KH đó có van dé dẫn đến khả năng không trả được nợ tăng, xu thé kì vọng lại đi xuống. Sau khi xây dựng ra được một bảng XHTD dựa trên xác suất dự đoán ra được từ mô hình thì ta đánh giá mô hình dựa trên Gini và PSI để xem xét độ phân biệt. Mô hình được kiêm tra với tập Test thì có Gini = 46.52%, có sự giảm mạnh so với tập Train, tuy nhiên nó vẫn trên 40% nên ta thay khả năng phân biệt của mô hình vẫn có thé chấp nhận được.
Ngân hàng hiện đang cung cấp 4 sản phẩm chính cho KHCN và do tính chất của KH khi sử dụng các sản phầm này tương đối khác nhau nên ngân hàng đang muốn triển khai xây dựng một mô hình để dự báo xác suất không. Bên cạnh đó, chương 3 cũng đưa ra một mô hình dự báo xác suất với các hệ số ước lượng phù hợp với kì vọng của ngân hàng và có ý nghĩa thống kê (P-value <0.05). Tu đó, ta xây dựng được một bảng XHTD dựa trên xác suất dự báo dé cung cấp những thông tin cần thiết giúp cho ngân hàng quyết định cho nhóm KH nao vay hay từ chối.