Một bài toán đặt ra trong NHTM là khi KHCN nộp hồ sơ vay vốn tại ngân hàngthì làm sao để dự đoán được khả năng trả nợ của KH giúp bộ phận có liên quan đưa racác chính sách cho vay phù hợ
Trang 1TRUONG DAI HỌC KINH TE QUOC DAN
KHOA TOAN KINH TE
Dé tai:
UNG DUNG MO HINH LOGISTIC TRONG XEP HANG TIN
DUNG DANH GIA RUI RO TIN DUNG KHACH HANG CA NHAN
TAI NGAN HANG TMCP KY THUONG VIET NAM
Sinh viên thực hiện: Nguyễn Khánh Ly
HÀ NỘI - 08/2022
Trang 2Dé tai:
UNG DUNG MO HINH LOGISTIC TRONG XEP HANG TIN
DUNG DANH GIA RUI RO TIN DUNG KHACH HANG CA NHAN
TAI NGAN HANG TMCP KY THUONG VIET NAM
Giang viên hướng dan: Hoang Đức Mạnh Sinh viên thực hiện : Nguyễn Khánh Ly
Ngành : Toán Kinh tế
Lớp : Toán Kinh tế 61
Hà Nội, 08/2022
Trang 3Chuyên đề thực tập chuyên ngành Toán Tài chính
LỜI CAM ĐOAN
Tôi xin cam đoan đây là nghiên cứu được thực hiện bởi riêng tôi Bộ dữ liệu
được sử dụng trong xây dựng mô hình, kết quả được đưa ra trong trong bài chuyên
dé dưới đây là trung thực và chưa từng được tác giả nào công bố trong bat kì nghiên
cứu khác.
Hà Nội, ngày 25 tháng 11 năm 2022
Sinh viên thực hiện
Nguyễn Khánh Ly
Trang 4Chuyên dé thực tập chuyên ngành Toán Tài chính
11193221 — Nguyễn Khánh Ly
Trang 5Chuyên dé thực tập chuyên ngành Toán Tài chính
MỤC LỤC
LỜI CAM ĐOAN
LỜI CẢM ƠN
DANH MỤC TỪ VIET TAT
DANH MỤC BANG BIEU
DANH MỤC HÌNH VE
MỞ ĐẦU %9 E141 EE77140 EE72130 E972141 EAr2idpeorrrdetie 1CHƯƠNG 1: CO SỞ LÝ LUẬN VE XÉP HẠNG TÍN DỤNG TẠI NGÂN HANG
VA TONG QUAN NGHIÊN CỨUU -2°-es°©©EE+esEEEExAdeetrvxerorrrdeeree 3
1.1 Tống quan về xếp hang tín dung cc.cccccssssssessescesssssseseescsssssseeseessesssssseseessessesseess 3
i50 3
1.1.3 Đối tượng ¿5c 5c TEExỀE1211211211211 1111111111111 11 1111 111gr 41.1.4 Tầm quan trọng của xếp hạng tín dụng cá nhân -. 2- ¿5552 41.2 Các yếu tố ảnh hưởng đến xếp hạng tín dụng của khách hang cá nhân 6
1.2.1 Thông tin cá nhân - ¿<< E111 SE HT HH HH HH 6 I2 šÈ 09v 6n Ầ 7
1.2.3 Hanh vi sử dụng tin dụng của các nhân - + Sc + s+xseseerrssreerres 7
1.2.4 Các thông tin liên quan đến viễn thông - 2-2 2s x+£++£+2£szE+zxzez 71.3 Các phương pháp xếp hạng tín dụng s-s- s-s<ssessesss=ssssessezsersssse 8
1.3.1 Phương pháp chuyÊn Ø1a - - s13 13112339111 11911 11 1 ng ng ngư 8
1.3.2 Phương pháp thống kê -2- 22 +¿©2++E+2EE+2EE+EEEEEEESEEvSEEerEeerkrsrkerrxee 9
1.4 Tổng quan về các nghiên cứu sử dụng hồi quy Logistic dé đánh giá rủi ro tin
dụng của khách hàng << << 9 9 9 0.0 0 00004 06000400009 800096 10
KET LUẬN CHƯNG -. <2 2s ©ssEss£SsEEseEseEssetserserserssrtsrrszrssrssese 12
CHƯƠNG 2: QUY TRÌNH NGHIÊN CỨU TRONG XÉP HẠNG TÍN DỤNG TẠI e8: 13
2.1 Mô hình Logistic 0 5G (G5 9 9 99.59 9.9 9 00.00 :900800809 6804050 13
QLD su 13
11193221 — Nguyễn Khánh Ly
Trang 6Chuyên dé thực tập chuyên ngành Toán Tài chính
2.1.2 Ưu điểm, nhược điểm -c-: 22vcctttErrrrrttrttirrrrttirrrrririrrriirrrre 14
2.2 Các phương pháp xử lý biến và ước lượng hệ số trong mô hình 15
2.2.1 XU ly vì i0) 15
2.2.2 Cách biến đồi dữ liệu 55cc tt tre l6
2.2.3 Phương pháp ước lượng hợp lý cực đại c- «cc«csscssessssssee 18
2.3 Các chỉ tiêu lựa chọn biến cho mô hình -2- 2s ssssessesssessessess 18
2.4.1 Ly thuyét kinh 0n“ 2 182.4.2 Chỉ số Information Value c c.sccsscescsssessessessessesseessessessesseessessesseesessesseesees 19
2.4.3 Ma y0) i50 n 19
2.4.4 Hồi quy Logistic theo Stepwise c.ccccsessesssessessessessessessessssssessessessseeseesees 192.4.5 Hồi quy Logistic và dựa vào trị số P-value ccscccssecsseessesssessseestesseesseessees 202.4 Các tiêu chí để đánh giá m6 hình - - << 5° 5< se se sessessessesseseesessesse 21
3.2 Xây dựng mô hình xếp hạng tín dụng khách hàng cá nhân - 25
3.2.1 Dit LGU Str QUIN 25
3.2.2 Tông quan các bước xây dung mô hình xếp hạng tin dung tại ngân hang 263.2.3 Ap dụng vào dit liệu thực tế và phân tích kết quả - 5 5-5226
KET LUẬN CHƯNG 3 s- << se se EssESsEEsEESEssExserserseresesserserssrsssse 40
CHUONG 4: KET LUẬN VÀ KHUYEN NGHỊ, -5- 5° ss©ssccsecssesses 41
ca 6h 6 414.1 Khuyến nghị s-s-s- << s©s£s£ se s£SsESsESsESsEs4 E9 5e sEE3E25E243503505958752s25E 42
PHU LUC
TAI LIEU THAM KHAO
11193221 — Nguyễn Khanh Ly
Trang 7Chuyên dé thực tập chuyên ngành Toán Tài chính
DANH MỤC TỪ VIET TAT
NHTW Ngân hàng Trung ương
NHTM Ngân hang thương mai
XHTD Xép hang tin dung
KHCN Khách hàng cá nhân KHDN Khách hàng doanh nghiệp
Trang 8Chuyên dé thực tập chuyên ngành Toán Tài chính
Bảng 2.2: Các ngưỡng đề xét sự ôn định của mô hình -¿- ¿©2522 22Bang 3.1: Thống kê mô tả một số biến 2-2 2 2 +E+E+EE+EE£EE+E£E£ErEeExerxrreee 28Bang 3.2: Các biến còn lại sau khi hồi quy theo Stepwise - ¿52c sccxsccee 29Bang 3.3: Các nhóm giá trị của biến “non lending bal_25” -:- 55+: 30Bảng 3.4: Các nhóm giá tri của biến “non _lending bal 19” -5- 3lBang 3.5: Các nhóm giá trị của biến “non _lending bal 30” - 32Bảng 3.6: Các nhóm giá trị của biến “trans channel_withdraw_9” 33Hình 3.4: Xu thé của biến “trans_channel_withdraw_9” cccccccssssssssssssesesescscscsceseeesesene 33Bang 3.7: Các nhóm giá trị của biến “pcb_produet _ 1 Í” s z+sz+s+zs+zs+zs+ceez 34Bang 3.8: Các nhóm giá trị của biến “trans channel 33” - sec: 35Bảng 3.9: Các nhóm giá trị của biến “peb_ produet_ 12” -z-sz+-sz5-sze- 36
Bảng 3.10: Kết quả hồi quy LogisfiC 2-22-5255 2S22SE‡EE‡EE2E2EEEEEEEEEEEErEkrrkerrrres 37
Bảng 3.11: Bảng XHTD với KHCN dựa trên xác suất được dự báo từ mô hình 37
Bang 3.12: Gini của mô hình trên 3 tập Train — Validation — Tesf - + 38 Bang 3.13: PSI giữa Train — Validation và Train — 'Ï€Sf . 5+5 << s++sesssess 39
DANH MỤC HÌNH VE
11193221 — Nguyễn Khánh Ly
Trang 9Chuyên dé thực tập chuyên ngành Toán Tài chính
Hình 2.1: Biểu diễn Gini của mô hình -225c+cccvvcrrtrEktrrrrtrttrrrrrtrirrrrrrieg 21
Hình 3.1: Xu thế của biến “non lending bal 25” -22©52+c+£x+cserserssreee 30
Hình 3.2: Xu thế của biến “non lending bal 19” -252+52+s+£E+£sererssreee 31Hình 3.3: Xu thế của biến “non lending bal 30” - 2©52+5+secse£ersseeez 32Hình 3.5: Xu thế của biến “peb_produet _ Ï 1”” ¿ ¿-s+2++2x++zx++zxezxeerxezrxzrxees 34Hình 3.6: Xu thé của biến “trans_channel,_ 33”” - ¿+ + s+k+E+Et+E+E+EEE+EvErtzxerereree 35Hình 3.7: Xu thé của biến “peb_produet_ Í2”” ¿ s¿s2++2x++cx+2x+tzx+erxzrxerxecree 36Hình 3.8: Hình biểu diễn Gini trên tập Train - 2-2552 2+£E+EE+EEtEEzEeerxerxeres 39Hình 3.9: Hình biểu diễn Gini trên tập Validation 2- 2-52 2+c2+EczEecxerxerxereee 38Hình 3.10: Hình biểu diễn Gini trên tập Test ¿- ¿5c 5 SsSE+EE2E£2E££Ee£EeExerxerxee 38
11193221 — Nguyễn Khánh Ly
Trang 10Chuyên đề thực tập chuyên ngành Toán Tài chính
MỞ ĐẦU
a Lí do chọn đề tài
Hiện nay, hệ thống ngân hàng từ NHTW đến các NHTM là một mắt xích vô cùngquan trọng trong sự phát triển nền kinh tế của mỗi quốc gia, việc thiếu sót gây sai lệchtrong quản trị rủi ro sẽ gây ra hậu quả nghiêm trọng và tác động tiêu cực đến hoạt độngcủa các ngân hàng Đây có thé là một phần nguyên ngân gay ra sự suy giảm nền kinh tế
của quôc ø1a.
Trong các NHTM hiện nay, tín dụng là loại tài sản chiếm ty trọng lớn nhất (chiếmkhoảng 50%-70% tổng tài sản), phản ánh hoạt động đặc trưng của ngân hàng Tín dung
luôn được đánh giá là một trong những hoạt động phức tạp của ngân hàng Chính vì vậy,
rủi ro từ hoạt động tín dụng là rất lớn và đến từ nhiều nguyên nhân khác nhau; chủ yếu
là do KH không có khả năng trả nợ hoặc trả nợ quá hạn (quá thời gian quy định tại mỗi
ngân hàng/tô chức tin dụng) Và nếu tốn thất xảy ra sẽ làm giảm mức lợi nhuận dự tính
và có thé dan đến một khoản lỗ lớn hoặc nghiêm trọng hơn là phá sản cho ngân hàng
Một bài toán đặt ra trong NHTM là khi KHCN nộp hồ sơ vay vốn tại ngân hàngthì làm sao để dự đoán được khả năng trả nợ của KH giúp bộ phận có liên quan đưa racác chính sách cho vay phù hợp với từng nhóm KH Hầu hết các NHTM giải quyết bàitoán này bằng cách tạo ra một bảng XHTD với KHCN từ việc xây dựng mô hình dựatrên các thông tin có thể thu thập được của KH và đưa ra một ngưỡng nào đó tùy thuộcvào chiến lược của ngân hàng mà hạn chế các khoản vay không thể trả hoặc trả quá hạn
của KH.
b Đối tượng và phạm vi nghiên cứu
e Đối tượng nghiên cứu: hệ thống XHTD của KHCN vay vốn tại Techcombank
e Phạm vi nghiên cứu: một mẫu 89,592 quan sát thuộc danh mục KHCN tại
Techcombank từ 2014 đến 2019
Trang 11Chuyên dé thực tập chuyên ngành Toán Tài chính
d Phương pháp nghiên cứu: Bài chuyên đề áp dụng phương pháp phân tích định lượng,
các thống kê mô tả và mô hình Logistic để phân tích dữ liệu
Trang 12Chuyên dé thực tập chuyên ngành Toán Tài chính
CHƯƠNG 1
CƠ SỞ LÝ LUẬN VỀ XÉP HẠNG TÍN DỤNG TẠI NGÂN
HÀNG VÀ TỎNG QUAN NGHIÊN CỨU
Chương 1 đề cập đến các vấn đề liên quan đến XHTD trong ngân hàng Chúng ta
sẽ tìm hiểu XHTD là gì, đối tượng trong XHTD, các phương pháp xây dựng mô hìnhXHTD và mục đích cũng như tầm quan trọng của XHTD đối với cả NHTM và KHCN.Bên cạnh đó, chương này cũng nêu ra một số nghiên cứu trước đây về sử dụng hồi quyLogistic để xây dựng mô hình dự báo xác suất không trả được nợ của KH
1.1 Tổng quan về xếp hạng tín dụng
1.1.1 Khái niệm
Ngày nay, dự báo rủi ro tài chính ngày càng phát triển mạnh mẽ tại các doanhnghiệp Rui ro tài chính gan liền với các bài toán về quan lý danh mục đầu tư, định giáquyền chon, và các công cụ tài chính khác XHTD cũng là một trong các hoạt động vềquản lý rủi ro tài chính, đặc biệt là được ứng dụng nhiều trong các NHTM
XHTD là sự đánh giá rủi ro tín dụng của ngân hàng với KH vay vốn (có thé là cánhân, doanh nghiệp, ) từ các báo cáo về thông tin của họ; dự đoán khả năng trả nợ củakhách hàng và dự báo ngầm về khả năng không trả được nợ của họ Từ kết quả của bảngXHTD, các tổ chức tin dụng có thé ra quyết định trong việc chấp nhận hay từ chối cho
Trang 13Chuyên dé thực tập chuyên ngành Toán Tài chính
KH đó dé tiến hành phân tích và xây dựng mô hình dự báo khả năng trả nợ của họ Từ
đó xây dựng một bảng XHTD của những KH đó dé ngân hàng có thé đưa ra được quyết
định cho vay đối với họ
1.1.3 Đối tượng
XHTD ca | +) Hinh thức xếp hạng được áp dụng đối với các KHCN tham gia
nhân vào hoạt động tín dụng của các ngân hàng thương mại.
+) XHTD cá nhân dựa trên việc phân tích các thông tin, đặc điểm
của mỗi cá nhân (tuổi tác, trình độ học vấn, lịch sử tín dung, )
XHTD | +) Hình thức xếp hạng được áp dụng đối với các KHDN
doanh
nghiệp +) Việc XHTD doanh nghiệp dựa trên các báo cáo các cáo tài chính,
báo các kinh doanh, của doanh nghiệp.
XHTD quôc | +) Hình thức xếp hạng dùng đề đánh giá mức độ tín nhiệm của mỗi
gia quốc gia Quốc gia được đánh giá càng cao thì dòng vốn đầu tư nước
ngoài sẽ càng lớn.
+) Việc XHTD dựa trên các chỉ số phát triển chung như: chỉ số phát
triên của các ngành, toc độ tăng trưởng của quôc gia,
XHTD các | +) Hình thức xếp hạng được áp dụng chủ yếu đối với các loại trái
công cụ tài | phiếu: trái phiếu công ty, trái phiếu chính phủ,
chính , ,
+) Việc XHTD dựa trên một sô tiêu chí: lãi suât, mệnh giá, kì han,
1.1.4 Tâm quan trọng của xếp hạng tín dụng cá nhân
1.1.4.1 Đối với các ngân hàng thương mại
XHTD cá nhân của NHTM nhằm cung cấp một bảng XHTD của KHCN tại ngânhang dựa trên mô hình dự đoán khả năng không trả được nợ của KHCN dé quyết định
cho vay mà phù hợp với khâu vi rủ ro của ngân hàng Do đó, đê hiêu được tâm quan
Trang 14Chuyên dé thực tập chuyên ngành Toán Tài chính
trọng của XHTD thì chúng ta cần sơ lược về RRTD và thiệt hại mà nó gây ra cho mỗi
NHTM.
RRTD là khả năng không chi trả được no/ trả nợ quá thời han được quy định của
KH vay vốn tại các NHTM/ các tổ chức tín dụng Rủi ro xảy ra khi KH vay vốn nhưng
họ dùng sai mục đích gây thua lỗ hoặc năng lực tài chính của KH đi vay ở mức thấp dẫnđến họ không có khả năng trả nợ hay trả nợ quá hạn so với mức quy định của mỗi
NHTM.
Bên cạnh đó, các NHTM ra đời dé giải quyết các van dé liên quan đến nhu cầuluân chuyền vốn, phát triển sản xuất kinh doanh hay tiêu dùng của các doanh nghiệp, cá
nhân, NHTM là một trung gian tài chính, là doanh nghiệp kinh doanh hàng hóa đặc
biệt: đó là tiền tệ; NHTM sẽ huy động tiền từ thị trường sau đó cho các tô chức, cá nhânvay với lãi suất cao hơn lãi suất huy động để sinh lợi nhuận Nếu trong trường hợpNHTM không huy động đủ vốn dé đáp ứng nhu cầu của nền kinh tế hay huy động được
đủ vốn nhưng số lượng KH muốn vay bị hạn chế, thì ngân hàng sẽ hoạt động không hiệuquả và dẫn đến rủi ro mang tính chủ quan của NHTM
RRTD xảy ra gây ảnh hưởng lớn tới hoạt động kinh doanh của NHTM Khi NHTM
huy động vốn từ các nguồn trong nền kinh tế và họ phải trả một khoản tiền định kì, tuynhiên, nễu NHTM không có thị trường dé cho vay thì họ sẽ không có lợi nhuận từ việc
đó dé có khoản tiền trả cho nguồn mà NHTM huy động vốn Điều đó dẫn đến sự mat uytín của ngân hàng đối với đối tượng gửi tiền, khiến ho 6 ạt muốn rút tiền và gây khókhăn cho NHTM Vì vậy, NHTM phải thường xuyên thu số tiền đã giải ngân để đảmbảo khả năng hoàn trả vốn cho người gửi tiền và thu được lợi nhuận Từ đó, chúng tathấy răng XHTD là vô cùng quan trọng đối với hoạt động kinh doanh của NHTM:
+) Hạn chế RRTD và một số rủi ro khác
+) Hỗ trợ ra quyết định trong việc cấp tín dụng cho KH: xác định mức lãi suất, hạn mức
tín dụng, đối với KH đi vay
Trang 15Chuyên dé thực tập chuyên ngành Toán Tài chính
+) Giám sát và đánh giá KH khi khoản tín dụng còn đang dư nợ Thứ hạng của KH sẽ
giúp NHTM dự báo được chất lượng tín dụng và có biện pháp đối phó kịp thời
+) Ngân hàng có thể dựa vào vốn đã cho vay nhưng không thu hồi được từ những dữliệu trong quá khứ dé ước lượng mức vốn không thu hồi được trong thời gian tới dé tríchlập dự phòng tốn that tin dụng
1.1.4.2 Đối với khách hàng cá nhân
XHTD là cơ sở dé chia nhóm KH theo mức độ rủi ro dé có những chính sách phù
hợp với từng nhóm:
-Nhóm có rủi ro thấp: cho vay với chế độ ưu đãi
-Nhóm có rủi ro trung bình: cho vay với điều kiện bình thường
-Nhóm có rủi ro cao: có thể không cho vay hoặc cho vay với lãi suất cao
Vi vậy, hầu hết KHCN đều có thé sử dụng sản phẩm tin dụng của NHTM tùy vào
mức độ rủi ro của mình mà NHTM sẽ đặt những chính sách với từng nhóm KH tùy
thuộc vào chiên lược đặt ra.
1.2 Cac yếu tố ảnh hưởng đến xếp hạng tín dụng của khách hang cá nhân
1.2.1 Thông tin cá nhân
Mỗi cá nhân đều có những thông tin, hoàn cảnh sống riêng của bản thân để phânbiệt với những người xung quanh Những đặc điểm đó đều có những ảnh hưởng nhất
định tới cuộc sống của họ Chính vì vậy, khi tiễn hành XHTD với KHCN, NHTM thường
xem xét một sô đặc diém sau:
-Thông tin cơ bản về bản thân: độ tuổi, giới tính, tình trạng hôn nhân, trình độ học
vân,
-Thông tin về điều kiện sống: quy mô hộ gia đình, số thành viên đi làm trong giađình, nghề nghiệp, tài sản sở hữu,
Trang 16Chuyên dé thực tập chuyên ngành Toán Tài chính
1.2.2 Tài chính cá nhân
Phân tích thông tin tài chính và các mối quan hệ liên quan đến tài chính của mỗiKHCN là yếu tố quan trọng nhất khi tiến hành XHTD Nó là cơ sở chính để NHTM dựđoán được khả năng trả nợ của KHCN và đưa ra các mức xếp hạng phù hợp với từng cánhân đi vay Một số yếu t6 đưa vào phân tích:
-Giá tri tài sản đảm bảo
-Tiết kiệm-Tổng giá trị tài sản nợ
-Số lần vay mới
1.2.3 Hành vi sử dụng tín dụng của các nhân
Ngoài những yếu tố đã được nêu ở trên, NHTM cũng dựa vào hành vi sử dụng tin
dụng của KHCN để tiến hành XHTD Những yếu tổ này giúp cho NHTM có cái nhìn
tong quan về cách thức và nhu cầu của từng KHCN khi sử dụng tin dụng cũng như uytín trong việc trả nợ của họ với ngân hàng Từ đó, NHTM có thé đưa ra những hạn mứctín dụng phù hợp, có những cách thức thu hồi nợ tín dụng hoặc ngưng cấp tín dụng choKHCN dựa trên thói quen chỉ tiêu của KHCN dé giảm bớt rủi ro cho ngân hàng Một sốyếu tô cần phân tích:
-Thói quen chi tiêu hàng ngày -Ủy tín trong giao dịch
-Lịch sử vay và trả nợ
-Tổng dư nợ-Số lượng thẻ tín dụng hiện có/ số lần dùng thẻ/ mục đích dùng thẻ
Trang 17Chuyên dé thực tập chuyên ngành Toán Tài chính
1.2.4 Các thông tin liên quan đến viễn thông
Đối với nhóm di liệu liên quan đến thông tin viễn thông của khách hàng, cácNHTM cần có sự hợp tác với các công ty viễn thông để mua được những thông tin liênquan của khách hàng Một số thông tin có thê đưa vào phân tích:
-Lịch sử nạp tiền qua điện thoại
-Lịch sử trả tiền trong việc sử dụng mạng viễn thông: Wifi, 3G/4G,
-Lịch sử trả tiền điện, nước, qua internet
Bên cạnh đó, hiện nay các NHTM đã áp dụng các ứng dụng chuyền tiền thay vì
phải trực tiếp đến ngân hàng thì KH có thể giao dịch qua internet banking, hay ngân
hàng hợp tác với một số ứng dụng khác dé tạo ra các ví điện tử được KH khá ưa chuộng:Zalopay, Shopeepay, Bởi chúng dé dang sử dung và nhanh chóng giúp tiết kiệm thờigian Những thông tin giao dịch của KH qua các ứng dụng trên đều sẽ phần nào ảnhhưởng tới khả năng trả nợ của KH vì nó thể hiện được khả năng tài chính của KH đó
1.3 Cac phương pháp xếp hang tin dụng
1.3.1 Phương pháp chuyên gia
Phương pháp chuyên gia là phương pháp thu thập và xử lý các đánh giá dự báo
bằng cách hỏi ý kiến của các chuyên gia giỏi hoạt động trong một lĩnh vực khoa học nào
đó liên quan Những chuyên gia giỏi là những người hiểu rõ những van đề tồn tai trong
một lĩnh vực hoạt động của họ Họ luôn hướng tới tương lai để giải quyết các vấn đề
dựa trên sự hiểu biết, kinh nghiệm và linh cảm nghề nghiệp của bản thân họ tích lũy
trong nhiêu năm.
Tiến hành XHTD bằng phương pháp này chủ yếu dựa vào những kinh nghiệm đã
được đúc kết từ nhiều năm của các chuyên gia, qua đó chúng ta có thể tìm ra bản chất
của môi quan hệ giữa khả năng trả nợ của khách hàng và các yêu tô tác động tới nó.
Trang 18Chuyên dé thực tập chuyên ngành Toán Tài chính
Chất lượng của việc sử dụng phương pháp chuyên gia dé XHTD phụ thuộc vào kinh
nghiệm chủ quan của các chuyên gia tín dụng chính xác đến mức độ nào.
1.3.2 Phương pháp thông kê
Đây là một trong những phương pháp nghiên cứu chính xác, là một quá trình bao
gồm điều tra thống kê, khái quát hóa thông tin, phân tích và dự báo Phương pháp này
cũng được gọi là quá trình mô hình hóa toán học các vấn đề cần phân tích tùy thuộc vào
mục tiêu nghiên cứu Phương pháp này giúp ta có khả năng được tiếp cận nhiều hơn vớicác phương pháp phân tích thống kê, các mô hình dự báo, cũng như việc sử dụng phầnmềm phân tích trong quá trình nghiên cứu Một số mô hình được sử dụng trong XHTD:
Mô hình tuyến tính, mô hình Logistic, mô hình cây quyết định, XGboost,
Nếu phương pháp chuyên gia phụ thuộc chủ yếu vào đánh giá chủ quan từ phíacác chuyên gia thì những mô hình thống kê lại dùng các kiểm định dé chấp nhận haybác bỏ các giả thuyết được đưa ra liên quan đến tiêu chuẩn kha năng trả nợ của kháchhàng Khi các giả thuyết được kiểm định qua các phương pháp thống kê thì sự lựa chọn
và xác định các tham số cho những yếu tố ảnh hưởng đến khả năng trả nợ của kháchhàng cá nhân được tiền hành một cách khách quan từ những thông tin đã được thu thập
từ thực tế trước đó Tuy nhiên, muốn có một mô hình phù hợp thì bộ dữ liệu đưa vào
phải đủ lớn.
Bên cạnh đó, ta cũng có thể áp dụng việc kết hợp hai hay nhiều mô hình trongphương pháp thống kê dé đưa ra một mô hình tốt nhất Chúng ta có thé kê đến một số
nghiên cứu trước đây của Peter và cộng sự (2015), Radall (2017) đã tiến hành kết hợp
mô hình cây quyết định và mô hình mạng noron nhân tạo ANN Sự kết hop này được
đánh giá là hiệu quả khi hai mô hình có chung khả năng là xử lý bộ dữ liệu lớn Mô hình
cây quyết định với ưu điểm là khả năng giải thích biến rõ ràng giúp cải thiện khả nănggiải thích của mô hình XHTD khi kết hợp với ANN
Trang 19Chuyên dé thực tập chuyên ngành Toán Tài chính
1.4 Tổng quan về các nghiên cứu sử dụng hồi quy Logistic dé đánh giá rủi ro tín
dụng của khách hàng
Trước đây, dé tiến hành XHTD đánh giá mức độ tín nhiệm của KHCN, các NHTM
thường sử dụng phương pháp chuyên gia: dựa trên các thông tin, dữ liệu thu thập được
trên thị trường, các chuyên gia tiến hành đánh giá rủi ro tin dụng của KH Và từ kết quả
đánh giá đó, NHTM sẽ quyết định cấp hay không cấp các khoản tín dụng
Tuy nhiên, phương pháp này có hạn chế là phụ thuộc vào tính chủ quan của chuyên
gia đánh giá Chính vì vậy, hiện nay, các NHTM dan chuyên sang tiếp cận phương pháp
thống kê- sử dụng định lượng thay vì định tính như trước đây; đặc biệt là sử dụng hồiquy Logit để phân tích và dự báo khả năng không trả được nợ của KH Ngày nay, cónhiều nhà nghiên cứu đã tìm hiểu chuyên sâu về việc sử dụng hồi quy Logistic trong
XHTD:
Nam Tac gia Kết qua nghiên cứu
2006 | Vương Quân Áp dụng phương pháp thống kê dé xây dựng mô hình
Hoàng và định mức tín nhiệm Tác giả đưa ra 16 biến vào mô hình
cộng sự để tiến hành hồi quy Logistic nhưng sau đó tác giả đã
loại 2 biến do chúng không có khả năng giải thích trong
mô hình Các biến: mức thu nhập hàng tháng, chênh lệch
thu nhập va chi tiêu, gia tri tài sản khách hàng có tác
động cùng chiều với biến phụ thuộc; các biến còn lại:
tuổi tác, trình độ hoc van, loại hình công việc, tình trạnghôn nhân, nơi cư trú, thời gian cư trú, SỐ người phụ
thuộc, phương tiện đi lại, phương tiện thông tin, giá trị các khoản nợ, quan hệ với Techcombank thì có ảnh
hưởng ngược chiều tới biến phụ thuộc
2007 | Maria Nghiên cứu này nói về việc áp dụng mô hình hồi quy
Aparecida Binary Logistic, Neutral network va mô hình Genetic
Gouvéa va | Algorithm dé phân tích rủi ro
10
Trang 20Chuyên dé thực tập chuyên ngành Toán Tài chính
Eric Bacconi
Gongalves
Bài nghiên cứu này tac gia đã su dung dữ liệu từ một
ngân hàng tại Brazil và mô hình dùng hồi quy Logisticcho ra kết quả tốt nhất nên Maria Aparecida Gouvéa
đã dùng mô hình đó là mô hình xếp hạng tín dụng phục
vụ cho nghiên cứu Maria Aparecida Gouvéa va Eric
Bacconi Goncalves đã đưa 18 nhóm biến độc lập vào
mô hình và phân tích tác động: giới tính, tình trạng hôn
nhân, lương, thời gian làm việc hiện tại, Và cuối
cùng, các biến có ảnh hưởng tích cực tới biến phụ
thuộc là các biến thuộc nhóm biến liên quan đến số
lượng các khoản nợ và tông dư nợ.
2010 Eliana Costa
e Silva va cong su
Nghiên cứu nay áp dụng hôi quy Logistic dé đánh giá
rủi ro không trả được nợ của KH.
Trong bài nghiên cứu, tác giả đã sử dụng dữ liệu từ
một ngân hang tại Bồ Dao Nha từ thang 1 năm 2008đến thang 12 năm 2009 gồm 13 biến độc lập: Số tiềnvay trong hợp đồng, lãi suất cho vay, kì hạn, tuổi của
KH, số tiền KH phải trả mỗi tháng, số năm mà KH đãvay tại ngân hàng, số thẻ tín dụng của KH, giới tính,tình trạng hôn nhân, lương, thuế IRS, sản pham tindụng khác, lương va mô hình cuối cùng gồm có 6biến tốt nhất Trong đó, biến lãi suất, kì hạn, tuổi có
tác động cùng chiều với biến phụ thuộc; còn số thẻ tín
dụng của KH, lương, thuế IRS của KH có ảnh hưởngngược chiều tới biến phụ thuộc
11
Trang 21Chuyên dé thực tập chuyên ngành Toán Tài chính
KET LUẬN CHƯƠNG 1
Chương 1 đã đưa cho chúng ta một cái nhìn tổng quan về XHTD tại các NHTM.Chúng ta hiểu được thé nào là XHTD, tại sao phải XHTD hay XHTD hướng tới những
đối tượng nào Chương I cũng đưa ra được tầm quan trọng của XHTD với cả NHTM
và KHCN: với NHTM thì nó giúp NHTM đưa ra quyết định cho vay đối với một nhómKHCN nào thì phù hợp với chiến lược của ngân hàng: nó giúp KHCN được hưởng
những chế độ ưu đãi phù hợp Các phương pháp XHTD cũng được nêu ra cụ thể: phương
pháp chuyên gia dựa vào ý kiến chủ quan của các chuyên gia giỏi trong lĩnh vực đó,
phương pháp thống kê áp dụng các phân tích thống kê đữ liệu để xây dựng mô hình dự
báo, phương pháp kết hợp sử dụng cả hai phương pháp trên Bên cạnh đó, chương nàycũng đưa ra được một số nghiên cứu liên quan đến chủ đề dùng hồi quy Logistic để đánh
giá RRTD.
12
Trang 22Chuyên dé thực tập chuyên ngành Toán Tài chính
CHƯƠNG 2
QUY TRÌNH NGHIÊN CỨU XÉP HẠNG TÍN DỤNG TẠI
NGÂN HÀNG
Chương 2 tập trung vào giới thiệu các phương pháp được sử dụng trong xây dựng
mô hình XHTD tại ngân hàng Chúng ta sẽ tìm hiểu về mô hình Logistic và lí do chọnLogistic trong bài toán XHTD này Ngoài ra, chương này cũng đưa ra một số phương
pháp xử lý biên, chọn lọc biên cùng với một sô tiêu chí đê đánh giá mô hình.
2.1 Mô hình Logistic
2.1.1 Khải niệm
Hau hết NHTM ưu tiên sử dụng mô hình Logistic trong xây dựng mô hình dự báo
xác suất không trả được nợ của KH thay vì sử dụng phương pháp chuyên gia hay kết
hợp các mô hình trong phương pháp thống kê Nguyên nhân chính là bài toán cụ thểđược đặt ra tại ngân hàng: dự báo xác suất không trả được nợ của KH nên các NHTMcần đưa ra những lời giải thích hợp lý khi từ chối/ chấp nhận một khoản vay nào đó từkhách hàng Những giải thích khi dựa trên những phân tích từ mô hình sẽ thuyết phụchơn khi sử dụng phương pháp thu thập ý kiến chủ quan từ chuyên gia; còn việc sử dụng
cách kết hợp các mô hình trong phương pháp thống kê thì khá phức tạp và không cần
thiết trong bài toán này
Mô hình Logistic là một mô hình thống kê mà mô hình hóa xác suất của một sự
kiện đang diễn ra băng cách đặt in) la su két hop tuyén tính của một hoặc nhiều
biến độc lập Ham Logistic là một hàm được dùng phổ biến vì nó dé hiểu về mặt toán
học:
1
1+e-XB
P= VỚI XB = Bo + BX, a
Tuy nhiên, ham Logistic lại phi tuyến với cả các tham số và các biến độc lập nên
ta sẽ khó giải thích khi hồi quy, vì vậy, ta sẽ biến đổi nó về dang tuyến tính:
13
Trang 23Chuyên dé thực tập chuyên ngành Toán Tài chính
In (2) = In(odds) = By + BX, + ĐạX;¿ ++ voip € (0;1)
Như vậy, ta biến déi từ ham Logistic về hàm có dạng tuyến tính sẽ dé hồi quy vàđưa ra lời giải thích về ảnh hưởng của biến độc lập tới biến phụ thuộc
2.1.2 Uu điểm, nhược điểm
Một số ưu điểm của hồi quy Logistic trong xây dựng mô hình XHTD tại NHTM:
Thứ nhất, hồi quy Logistic dé đưa ra lời giải thích về sự tác động của biến giải
thích lên biến phụ thuộc Chúng ta có thé tuyến tính hóa hàm Logistic hồi quy, nó sẽ dé
dàng dé giải thích tại sao biến độc lập này thay đổi thì biến phụ thuộc cũng sẽ gián tiếpthay đổi theo Một số mô hình Machine Learning khác có khả năng dự báo tốt hơn nhưng
nó có chứa những tham số mà chúng ta khó có thê đưa ra được những sự lý giải thích
hợp với thực tế
Thứ hai, cách thực hiện hồi quy Logistic cũng dễ thực hiện vì đây là một quy trình
với các phép biến đổi và giải thích rõ ràng Các bước thực hiện có thể được lý giải dựatrên những cơ sở lý thuyết đã có, khác với một số mô hình Machine Learning khác cầnchỉnh sửa những tham số dé chọn ra mô hình tốt nhất mà không có cơ sở hay phương
pháp cụ thé nao.
Bên cạnh những ưu điểm trên, hồi quy Logit cũng có những nhược điểm cần phải
khắc phục:
Thứ nhất, hồi quy Logistic không dự báo được kết quả liên tục Nó chỉ có thể được
dùng dé đưa ra những dự báo với những mô hình có biến phụ thuộc là biến phân loại
Thứ hai, hồi quy Logistic có thé không đưa ra được kết qua dự báo chính xác vớimẫu có kích thước nhỏ Nếu kích thước mẫu nhỏ thì mô hình được tạo ra từ hồi quy
Logistic dựa trên số quan sát nhỏ hơn Điều đó sẽ có thê dẫn đến “overfitting”- một lỗi
mô hình hóa xảy ra khi mô hình quá khớp với một bộ dữ liệu hạn chế.
14
Trang 24Chuyên dé thực tập chuyên ngành Toán Tài chính
2.2 Các phương pháp xử lý biến và ước lượng hệ số trong mô hình
2.2.1 Xử lý “missing values”
Hau hết dữ liệu liên quan đến lĩnh vực tài chính đều có “missing values”; đặc biệttrong đữ liệu về thông tin, lịch sử tín dụng, của khách hàng tại NHTM đều có chưacác giá trị trên Nó xảy ra với nhiều nguyên nhân khách nhau: do khách hàng khôngđiền/ không biết điền như thế nào, do khách hàng làm thẻ tín dụng nhưng không sử
dụng, Và chúng ta có bôn cách đê xử lý các “missing value” trong bộ đữ liệu:
Thứ nhất, loại bỏ tất cả các quan sát có chứa “missing values” Tuy nhiên, việc bỏnày có thé sẽ gây ra van dé mắt rất nhiều quan sát trong bộ dữ liệu; ví dụ: mỗi một biến
có “missing values” ở những quan sát khác nhau, nếu chúng ta loại bỏ hết thì bộ đữ liệu
sẽ mat nhiều quan sát Chúng ta chỉ nên loại bỏ “missing values” nếu chúng chiếm nhỏ
hơn 5% tông số quan sát trong bộ dữ liệu.
Thứ hai, loại bỏ hêt các biên có “missing values” ra khỏi mô hình Trong trường
hợp này, ta nên loại biên nêu biên đó có chứa trên 50% quan sát là “missing value” hoặc
các biến đó vẫn sẽ có khả năng thiếu đữ liệu trong tương lai.
Thứ ba, ta có thể đưa hết “missing values” vào mô hình bằng cách gộp chúng lạithành 1 nhóm đối với từng biến, sau đó sẽ dùng WOE của chúng là đầu vào thay vì đưa
dtr liệu thô vào.
Thứ tư, chúng ta có thé thay thé “missing values” bằng giá trị trung bình, mean
của biến đó Tuy nhiên, điều này có thê ảnh hưởng đến xu thế của các biến độc lập với
biên mục tiêu.
Các NHTM thường áp dụng phương pháp biến đổi thứ ba dé xử lý “missing values”
vì các phương pháp 1,2,4 đều giả định các “missing value” không có giá trị gì- không
thê thu thập được những thông tin hữu ích cho việc kinh doanh từ các giá trị đó Tuy
nhiên, điêu đó chưa chắc đã hoàn toàn đúng, những giá tri đó có thê là một phân của xu
15
Trang 25Chuyên dé thực tập chuyên ngành Toán Tài chính
hướng, được liên kêt với các giá trị khác trong biên đó đê tạo nên một xu hướng đúng
với thực tế
2.2.2 Cách biến đổi dữ liệu
Dé hiểu rõ hơn về cách biến đổi WOE, chúng ta có thé tìm hiểu về ý nghĩa, cách
tính toán và những ưu - nhược điêm của nó:
WOE là một trong những kĩ thuật tao biến và lựa chọn biến thường được xử dụng
trong xây dựng mô hình XHTD Phương pháp biến đổi này sẽ đánh giá sức mạnh dựbáo dựa trên điểm số đánh giá về sức mạnh dự báo nợ xấu Tiêu chuẩn đánh giá sẽ dựatrên chỉ số IV- được tính toán thông qua WOE Cách biến đổi WOE có các kĩ thuật xử
lý khác nhau đôi với biên liên tục và biên phân loại:
Đối với biến liên tục: WOE sẽ chia các quan sát trong biến thành các nhóm giá trị
Số lượng nhóm và số quan sát mỗi nhóm phụ thuộc vào xu thế và phải được lý giải đúngvới thực tế Sau đó, áp dụng công thức và tính WOE rồi đưa vào mô hình thay giá trị
thô của biên đó.
Doi với biên rời rạc: WOE có thê can nhac moi một giá tri rời rac là một nhóm hoặc có thê gộp nhiêu giá tri roi rac có sô lượng quan sat ít vào một nhóm Bên cạnh đó,
trường hop “missing values” cũng có thé được coi là một nhóm riêng biệt nêu sô lượng của nó là đáng kê hoặc nhóm vào các nhóm khác nêu nó là thiêu sô Sau đó thì tính toán
WOE và thay vào mô hình như làm với biến liên tục
(1)
Distr 7
Công thức: WOE = Ln = Bad
e Good: những quan sát ma KH có khả nang trả được nợ P(Y=0)-hồ sơ Good
e Distr Good: tỷ lệ giữa tổng Good trong một nhóm và tông Good của cả biến
WOE dùng dé đo lường sự khác biệt giữa phân phối của Good và phân phối của
Bad trên từng nhóm gia trị Giá tri WOE tại một nhóm nao đó càng lớn thì chứng tỏ
16
Trang 26Chuyên dé thực tập chuyên ngành Toán Tài chính
nhóm đó có số lượng Good càng cao Như đã trình bày ở trên, cách biến đổi WOE có
rat nhiêu ưu điêm trong vân dé xử lý biên trước khi đưa vào mô hình cuôi cùng:
Thứ nhất, cách biên d6i WOE giúp loại bỏ ảnh hưởng của các giá trị ngoại lai vìchúng sẽ được gộp vào nhóm giá trị gần đó Khi đó, các giá trị ngoại lai sẽ không cònkhác biệt so với các những quan sát khác thuộc cùng nhóm vì tất cả các quan sát trongnhóm đó cùng được gán giá trị bằng trọng số WOE Bên cạnh đó, cách biến đổi này
cũng giúp chúng ta giải quyết van đề với “missing values” bằng cách thay thé giá trị của
WOE tương ứng vào cho cua “missing values”.
Thứ hai, khi sử dung biến chưa xử ly thì trong một số trường hợp xu thé của biếnđộc lập có thé không quan hệ đơn điệu với biến mục tiêu: chữ U, A, Do đó, phương
pháp biến đổi WOE sé đảm bảo mối quan hệ đơn điệu (đồng biến/ nghịch biến) với biến
mục tiêu Cách biến đổi này giúp ta chia nhỏ các biến liên tục thành các nhóm mà giátrị của nó đơn điệu với bién mục tiêu Do đó, các hệ số trong hồi quy Logistic sẽ giải
thích được đúng mối quan hệ giữa các biến độc lập và biến phụ thuộc.
Thứ ba, WOE giúp chúng ta giải quyết được các vấn đề về mâu thuẫn đơn vị giữa
các biến độc lập trong mô hình Giả sử như biến tuổi và biến số tiền dư trong tài khoản
tiết kiệm của khách hàng có sự chênh lệch đơn vị khá lớn, thường chúng ta sẽ dùng hàmlog đối với các biến có đơn vị lớn để cân bằng với các biến khác và WOE cũng giúpchúng ta giải quyết van dé này với hiệu quả tương tự
Thứ tư, WOE có thé thay cho việc chúng ta dùng biến giả với các biến định tính.Việc sử dụng biến giả có nhược điểm là nó giả định sự khác biệt giữa một nhóm biến
phân loại này với nhóm biến phân loại tiếp theo là như nhau Điều này sẽ ảnh hưởngđến kết quả phân tích từ mô hình
Tuy nhiên, cách biến đổi WOE cũng có một vài nhược điểm như sau:
Thứ nhất, khi dùng WOE thì chúng ta rất khó để biết nên chia bao nhiêu nhómtrong một biến là phù hợp Hiện nay có một số công cụ có cách chia tự động nhưng để
17
Trang 27Chuyên dé thực tập chuyên ngành Toán Tài chính
phù hợp với xu thế theo lý thuyết kinh tế thì chúng ta vẫn phải kết hợp với việc chia
nhóm thủ công.
Thứ hai, do WOE luôn đơn điệu với biên mục tiêu nên giữa các biên độc lập sẽ
xuất hiện tương quan và gây hiện tượng đa cộng tuyến trong mô hình hồi quy
2.2.3 Phương pháp ước lượng hợp lý cực đại
Ta có mô hình Logistic sau khi đưa về dạng tuyến tính như sau:
In (2) = In(odds) = Bo + BiXin + BoXig ++ + BuXix C®)
Dé ước lượng các hệ số trong mô hình này, ta không thé dùng phương pháp OLS
vì khi thay giá trị phân loại thực tế (0,1) vào mô hình (*) thì về trái có thể không xácđịnh Ví dụ, xác suất KH không tra được nợ p=1 và xác suất KH trả được nợ p=0, khi
đó về trái của mô hình sẽ là In(1/0) không xác định
Bên cạnh đó, phương pháp OLS giả định phần dư tuân theo phân phối chuẩn màphan dư 1u = p; — p, và p theo phân phối Logistic Do đó, chúng ta cần dùng một
phương pháp khác dé ước lượng- phương pháp ước lượng hợp lý cực dai
Hop lý cực đại là phương pháp thống kê dùng để ước lượng giá trị tham số củamột mô hình xác suất dựa trên những đữ liệu quan sát được Phương pháp này ước lượngcác tham số nói trên bởi những giá trị làm cực đại hóa hàm hợp lý
2.3 Các chỉ tiêu lựa chọn biến cho mô hình
2.4.1 Ly thuyết kinh tế
Do mô hình được xây dựng từ bộ dữ liệu thực tế tại Techcombank nên lý thuyếtkinh tế là một trong những tiêu chí cần thiết trong lựa chọn biến cho mô hình Các biến
được chọn cần phải phù hợp với lý thuyết kinh tế tài chính Trong trường hợp một biến
độc lập không thỏa mãn theo những tiêu chuẩn về mặt thống kê nhưng biến đó có ảnhhưởng lớn tới biến phụ thuộc thì chúng ta vẫn cần cân nhắc đề giữ lại
18
Trang 28Chuyên đề thực tập chuyên ngành Toán Tài chính
2.4.2 Chỉ số Information Value
Information Value (IV) là một trong những chỉ số tốt nhất trong việc lựa chọnbiến cho một mô hình dự báo Nó giúp đo lường sức mạnh của từng biến trong mô hình
và đưa ra một xếp hạng cơ bản thể hiện mức độ mạnh / yếu của các biến đầu vào
IV được tính toán dựa trên WOE:
IV =}?_:(Distr Good; — Distr Bad,) x WOE; (2)
IV Sức mạnh của bién
<0.02 Không có sự ảnh hưởng
0.02—0.1 Ảnh hưởng yêu0.1—0.3 Ảnh hưởng trung bình
0.3 —0.5 Anh hưởng mạnh
>0.5 Anh hưởng rất lớn, cần xem xét
Bang 2.1: Các khoảng IV để xét sức mạnh ảnh hưởng của các biến
2.4.3 Ma trận tương quan
Ma trận tương quan thê hiện mức độ tương quan giữa các biến độc lập trong mô
hình, từ đó, ta có thể quan sát được tất cả các cặp biến có tương quan cao Nếu ta giữcác biến có tương quan cao với nhau trong mô hình thi dé xảy ra hiện tượng đa cộng
tuyến, do đó ta nên cân nhắc loại bỏ 1 trong 2 biến trong cặp tương quan cao
2.4.4 Hồi quy Logistic theo Stepwise
Hồi quy theo Stepwise là phương pháp dé xây dựng một mô hình bang cách lặp đilặp lại từng bước hồi quy Logit để chọn ra các biến độc lập có sức ảnh hưởng nhất địnhcho mô hình Phương pháp này là sự kết hợp của phương pháp Forward Selection và
phương pháp Backward Elimination.
19