Giải pháp ứng dụng phương pháp hồi quy mô hình Logistic đánh giá rủi ro tín dụng khách hàng doanh nghiệp tại ngân hàng Techcombank

MỤC LỤC

LỜI MỞ ĐẦU

Theo đó, trước bối cảnh kinh tế thị trường han chưa minh bach hoàn toàn, van còn nhiều DN cé tình che giấu tình hình sức khỏe tài chính khi nộp hồ sơ vay vốn, Ngân hàng đặc biệt cần chú trọng đến chất lượng cấp tín dụng, giải quyết triệt dé nợ xấu dé không làm ảnh hưởng đến hiệu quả hoạt động kinh doanh. Xếp hạng tín dụng KHDN là một trong những biện pháp phổ biến tại các Ngân hàng trong đánh giá RRTD, bằng việc thiết kế thẻ điểm để XHTD DN với mục đích ngăn ngừa, hạn chế đến mức thấp nhất rủi ro có thé xảy ra, giảm thiểu các thiệt hại phát sinh từ hoạt động cấp tín dụng và tăng lợi nhuận cho Ngân hàng, dần nâng cao uy tín và lợi thế trong cạnh tranh.

CƠ SỞ LÝ LUẬN VA TONG QUAN NGHIÊN CỨU

Hiện nay, có rất nhiều phương pháp hiện đại hơn được ứng dụng trong xây dựng mô hình trong các bài toán dự báo nói chung và bài toán dự báo xác suất vỡ nợ nói riêng, có thé kê đến như hồi quy Logistic, Rừng ngẫu nhiên (Random Forest), Cây quyết định (Decision Tree),..đều được chứng minh là có khả năng. dự báo xác suât vỡ nợ của KHDN nhanh chóng và độ chính xác cao. Chuyên dé tốt nghiệp chuyên ngành Toán Tài chính. Hainz, 2010; Psillaki và các tác giả, 2010) đã sử dụng phương pháp hồi quy mô hình Logistic và Cây quyết định dé xây dựng mô hình dự báo xác suất vỡ nợ của các DN. Dựa trên những nghiên cứu trên cho thấy do đặc điểm của mỗi phạm vi nghiên cứu và thời điểm nghiên cứu khác nhau, mối quan hệ giữa RRTD với các yêu tố liên quan đến tiềm lực tài chính của người di vay được xác định cũng không hoàn toàn giống nhau, nhưng nhìn chung các nghiên cứu đều tập trung phân tích nhóm yếu tố có tác động đến xác suất vỡ nợ của DN dựa trên phương pháp hồi quy Logistic do tính ưu việt và dé giải thích, từ đó đánh giá RRTD của hồ sơ cho vay.

KET LUẬN CHƯƠNG 1

Do bản chất mỗi DN là khác nhau nên đánh giá hiệu quả kinh doanh của mỗi DN cũng sẽ khác, các biến được cho là có khả năng phản ánh được rủi ro vỡ nợ của DN cần được linh hoạt đưa vào mô hình, với mục tiêu tìm ra mô hình phù hợp dựa trên căn cứ thuyết phục mang tính khách quan giúp giảm thiêu đáng ké.

PHƯƠNG PHÁP NGHIÊN CỨU

Đối với bài toán đánh giá điểm tín dụng, xác suất của một sự kiện có diễn ra P(Y = 1|X = x) được biểu diễn dưới dạng biến nhị phân tức là biến phụ thuộc Y sẽ có 2 kết quả trả về được gán nhãn 0 và 1 được ước tính bởi mô hình Logistic. Trước khi đưa vào chạy hồi quy mô hình Logistic, phép biến đổi được sử dụng hỗ trợ trong trong lựa chọn các biến độc lập theo đó, các đặc trưng được biến đôi về định dạng WOE và lựa chọn dựa trên chỉ tiêu IV nhằm đảm bảo phân loại được quan sát tốt và quan sát xấu. > Phương pháp hồi quy tiến (Forward Selection): bắt đầu từ mô hình không có biến nào, chọn lần lượt các biến tốt nhất để đưa vào mô hình dựa trên sức mạnh dự báo, sau đó lần lượt thêm các biến khác vào, xây dựng mô hình với kết hợp tốt nhất của 2, 3, 4,..cho dé khi không các biến đưa vào không tác động đến mô hình (đánh giá dựa trên p — values) hoặc hiệu quả mô hình không được cải thiện nữa thì dừng lại (hệ số xác định R2 hoặc hệ số Gini của mô hình).

Ma trận hệ số tương quan giúp dé dàng quan sát mức độ tương quan của các biến độc lập trước khi đưa vào hồi quy, nhằm đảm bảo rằng mô hình không xảy ra hiện tượng đa cộng tuyến (các biến giải thích sử dụng trong hàm hồi quy có tương quan chặt chẽ với nhau). Trong trường hợp hai biến độc lập có tương quan cao với nhau rất dé xảy ra đa cộng tuyến gây ảnh hưởng đến khả năng giải thích của các hệ số hồi quy, điều này vi phạm giả thuyết của mô hình hồi quy tuyến tính cô điển “Các biến độc lập không có quan hệ tuyến tính với nhau”.

Hình 2.1.2: Hoi quy Logistic
Hình 2.1.2: Hoi quy Logistic

TECHCOMBANK VA THE DIEM PHAN LOẠI HO SƠ KHACH HANG

Nợ quá han

Chuyên dé tốt nghiệp chuyên ngành Toán Tài chính. Lién quan dén ty 1é. dư nợ nội bang. Lién quan dén kha. 18 năng thanh khoản của Ngày Acc turn1. DN : Liên quan đến khả. Nhóm Liên quan đến nợ. chính Liên quan đên chi phí hoạt động quản lý và. sản xuất kinh doanh ;. Liên quan đến lợi. Chuyên dé tốt nghiệp chuyên ngành Toán Tài chính. Trong đó, 2 biến đen_inƒo3 và Typ_loan1 là biến rời rac, còn lại là biến. Biến phụ thuộc là biến nhị phân được gan nhãn 0/1. Thống kê mô tả dữ liệu. Bảng thống kê dưới đây đưa ra cái nhìn tông quan về bộ dữ liệu bang việc. ) của một sô biên độc lập. Đối với dit liệu còn lại được coi là tập In-time (Tập trong thời gian) được chia 70% cho tập Train gồm 35417 quan sát và 30% cho tập Validation gồm 15179 quan sát, tỷ lệ hồ sơ xấu ở tập Train (tập huấn luyện) và tập Validation (Tập kiểm chứng trong quá trình huấn luyện) đảm bảo đồng nhất về phân phối. Với mục đích hạn chế sự khác biệt về tính chất giữa hai tập, ngoài tỷ lệ hồ sơ xấu thì các thông đại diện quan trọng của KH (thời điểm quan sát, phân khúc KH) cũng cần được đồng nhất trong phân phối, cho thấy nếu KH trong cùng phân khúc và được quan sát ở cùng thời điểm thì 2 tập dữ liệu sẽ có tính tương đồng nhất định.

Áp dụng phép biến đổi WOE trong xử lý các đặc điểm đầu vào và tính toán chỉ tiêu IV kết hợp với hệ số Gini của biến trong việc đánh giá sức mạnh dự báo đề tạo danh sách biến đầu vào cho mô hình. Do đây là bài toán dự báo xác suất vỡ nợ trong 12 tháng tiếp theo cho KHDN mới chờ phê duyệt cấp tín dụng, đang có quan hệ phi tín dụng hoặc đã có quan hệ tín dụng với Ngân hàng nên ngưỡng hệ số tương quan được lựa chọn là Corr = 0.7 và kết hợp với hệ số Gini của từng biến.

Bảng 3.1.1.1: Mô tả các biến độc lập
Bảng 3.1.1.1: Mô tả các biến độc lập

KET LUẬN CHƯƠNG 3

Việc đưa ra thẻ điểm không làm thay đôi kết quả của mô hình mà giúp đơn giản hóa việc đánh giá hồ sơ KH, dé dàng kiểm tra và theo doi do các nhóm KH có thé được so sánh được với nhau dựa trên xác suất vỡ nợ của KH đã được quy.

LOI KET LUẬN —- KHUYEN NGHỊ

- Giả sử, các nhà quản trị có chức năng ra quyết định đưa ra chính sách lựa chọn điểm cắt tỷ lệ KH xấu là 10%, tức là Ngân hàng chỉ cho vay đối với KH thuộc nhóm có tỷ lệ số hồ sơ xấu dưới 10% tương ứng với nhóm KH có mức điểm lớn hơn 10.511 điểm sẽ bị từ chối cho vay và ngược lại. Ví dụ với nhóm KHDN có rủi ro thấp sẽ được chấp nhận cấp tín dụng mà không cần TSĐB (100% là tín chấp) còn nhóm KHDN ở hạng tín nhiệm thấp sẽ bị yêu cầu bổ sung 100% TSĐB, tăng lãi suất cho vay, tăng phí bảo hiểm khoản, thậm chí là từ chối cấp tín dụng nếu hồ sơ. - Mô hình ước lượng dựa trên phương pháp hồi quy Logistic đơn giản, dễ thực hiện và có đầy đủ thông tin về các nhóm biến nghiên cứu, riêng các biến nhóm Tín dung và Phi tín dụng chiếm phan lớn trong danh sách biến nên có thé nhanh chóng phản ánh được nếu DN gặp van dé khó khăn;.

- Kết quả xác suất dự báo được từ mô hình là cơ sở đề trực tiếp xếp hang tín dụng KHDN, từ đó tạo cơ hội cho các DN tiếp cận được nguồn vốn vay dù gặp trở ngại về yêu cầu đáp ứng đủ TSĐB hay thiếu dữ liệu về lịch sử tín dụng do thẻ điểm có thể xây dựng dựa trên thông tin của KHDN từ nhiều nguồn khác nhau. Biến Typ_loan1 là biến có xu thé WOE dang chữ U, có thé dẫn đến kết qua mô hình bị quá khớp và ảnh hưởng đến sự mức độ 6n định của mô hình, nên cần bóc tách dữ liệu của biến, phân tích sự phù hợp về lý thuyết kinh tế của đường xu thế WOE của biến sau khi chia nhỏ các khoảng giá trị;.

PHU LUC 2: GINI TREN TAP TRAIN

_R trén tap ho sơ n F „ l Tố Gini xác suât ae R hô so tot tích lũy tích lũy sát tích lũy.