Chuyên dé tốt nghiệp chuyên ngành Toán tài chínhLỜI CAM KÉT Tôi xin cam đoan bài luận văn: “Ứng dụng mô hình hồi quy Logistic đánh giá khả năng khách hàng trả trước hạn khoản vay mua nhà
Trang 1TRUONG DAI HỌC KINH TE QUOC DAN
KHOA TOAN KINH TE
CHUYEN DE TOT NGHIỆP — TOÁN KINH TẾ
DE TAI: UNG DUNG MO HINH HOI QUY LOGISTIC
ĐÁNH GIA KHẢ NANG KHACH HANG TRA TRƯỚC HAN KHOAN VAY MUA NHA TAI NGAN HANG TECHCOMBANK
Sinh viên : Dinh Thi Quynh Trang MSV: 11195210
Lop: Toan kinh té 61 GVHD: TS Pham Thi Héng Tham
Ha Noi - 2022
Trang 2TRƯỜNG ĐẠI HỌC KINH TE QUOC DAN
KHOA TOÁN KINH TE
ĐÈ TÀI: UNG DUNG MÔ HÌNH HOI QUY LOGISTIC
ĐÁNH GIÁ KHẢ NĂNG KHÁCH HÀNG TRẢ TRƯỚC HẠN KHOẢN VAY MUA NHÀ TẠI NGÂN HÀNG TECHCOMBANK
Sinh viên : Dinh Thị Quỳnh Trang
MSV: 11195210
Ha Noi - 2022
Trang 3Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
LỜI CAM KÉT
Tôi xin cam đoan bài luận văn: “Ứng dụng mô hình hồi quy Logistic đánh giá
khả năng khách hàng trả trước hạn khoản vay mua nhà tại ngân hàng Techcombank”
là do tôi thực hiện và tôi xin chịu trách nhiệm hoàn toàn về tính trung thực của nội
dung trong bải.
Tác giả
Định Thị Quỳnh Trang
Trang 4Chuyên dé tốt nghiệp chuyên ngành Toán tải chính
Em xin cảm ơn đến các anh chị phòng Phân tích rủi ro và mô hình của ngân
hàng Thuong mại cổ phần Kỹ Thương Việt Nam — Techcombank, đã cung cấp dữliệu, cũng như hỗ trợ em thực tập và hoàn thành Chuyên đề tốt nghiệp
Em xin gửi lời cảm ơn và sự tri ân sâu sắc đối với các thầy, cô giáo khoa Toán
Kinh tế, Trường Đại Học Kinh tế Quốc dân đã tận tình truyền đạt kiến thức trong suốt
thời gian em học tập tại đây Vốn kiến thức được tiếp thu trong quá trình học khôngchỉ là nền tảng cho quá trình nghiên cứu mà còn là hành trang vững chắc để em bước
vào đời.
Em cũng vô cùng cảm ơn sự quan tâm, ủng hộ và giúp đỡ từ gia đình và bạn
bè Đó chính là nguồn động viên tinh thần rất lớn dé em theo đuổi và hoàn thành
Chuyên đề tốt nghiệp này.
Cuối cùng, trong phạm vi giới hạn về thời gian và trình độ, nên Chuyên đề chắcchắn không thể tránh khỏi sai sót và hạn chế Em rất mong nhận được những ý kiến,đóng góp của các thầy cô, anh chị dé bài viết của em được hoàn thiện hon! Em xin
chân thành cảm ơn!
11195210 — Dinh Thị Quynh Trang 4
Trang 5Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
MỞ ĐẦU 2-5221 21 221221121122121121121121111121111211112111111212121 011 re 11CHUONG 1: CƠ SỞ LÝ LUẬN VA TONG QUAN NGHIÊN CỨU 14
1.1 CƠ SỞ LÝ LUẬN -2-22 22222221 221122122122127121121 21 cccrke 14
1.1.1 Hoạt động cho vay tại ngân hàng - 5c s+S ssskseiererrsee 14
1.1.2 Hoạt động vay va cho vay mua nhà ¿55+ +22 ++++s++vxseessss 16 1.1.3 Hành vi trả trước hạn khoản Vay - 5-5 + + ++ssvxseeseereeersee 17
1.2 TONG QUAN NGHIÊN CỨU - 52-5 ềEềEEEEEEEEEEEEEEkEEkerkerkerver 19
1.2.1 Tổng quan các mô hình đánh giá khả năng trả trước hạn cho những
[3100:0120 A0077 5 19
1.2.2 Những yếu tố ảnh hưởng đến khả năng trả trước của khách hang 21KET LUAN 09:i0I9) c1 .Ố 24
CHƯƠNG 2: PHƯƠNG PHÁP NGHIÊN CỨU 2- 22 ©5z+222+£xz+zzzzzse2 25
2.1 XỬ LÍ VÀ LỰA CHỌN BIÊN ©22- 2S 2222221222122 22212212Ecee 25
2.1.1 _ Cách thức xử lí biến :©22:22+c22x22ECSEEEEkrSrkrsrkrrrree 252.1.2 Cac tiêu chí lựa chọn biến cho mô hình -2- 2 s+s+zszE+E+zszzzzsz 272.2 MÔ HÌNH HOI QUY LOGISTIC - 2-52 s+S£E£EE2EEEEEeEEeExerxerxered 29
2.2.1 Mô hình hồi quy LogistiC 2- 5: ©52+2x+2E2EEt£E2EEerxrzrxerxerrxee 29
2.2.2 Cac tiêu chí đánh giá mô hình 5 +25 + *+vsvsserserrrrsreree 30
2.3 THẺ DIEM VA VAI TRÒ CUA THE ĐIỀM 2-©-2+cxc>szzce¿ 35
Trang 6Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
KET LUẬN CHUONG 2 -i- St E321 2EEE12111571215711151115E2E111711711151EE SE EEree 37
CHƯƠNG 3: SỬ DỤNG MÔ HÌNH HỎI QUY LOGISTIC ĐỀ ĐÁNH GIÁ KHẢNĂNG KHÁCH HÀNG TRẢ TRƯỚC HẠN KHOẢN VAY MUA NHÀ TẠONGAN HÀNG TECHCOMBANK - - 2k St E121 1112111111111 E111 px 38
3.1 THỰC TRẠNG CHO VAY MUA NHÀ VÀ HANH VI TRA TRƯỚC HANCUA KHÁCH HANG TẠI TECHCOMBANK 2 + set+E+£E£EeEvrxerxez 39
3.1.1 _ Thực trạng cho vay mua nhà tại Techcombank - - + 39
3.1.2 _ Thực trạng hành vi trả trước hạn khoản vay mua nhà của khách hang tại TechcombaniK - - ¿+ - 2 E222 1112311112531 11 53 112931 11183111 031111 1n vn ng re Al
3.2 DU LIEU NGHIÊN CỨU 2: ©5¿+2+2E2E+£EE2EEEEE2EESExrrkrerkrrei 42
3.2.1 _ Tổng quan dữ liệu -©5-+5++E22ES2E2E2EE2122121121121121 21 xe 42
3.2.2 Chia tập dit liệu -222.222222112211221122122121 ca 46
3.3 KET QUÁ NGHIÊN CỨU -¿- St SE EEEEEEEE E111 xe.46
3.3.1 _ Phân tích đơn biến ¿ :- ++22+22E2E2EEEEESEEEEEEErerkrrrrrrkee 463.3.2 _ Phân tích đa biến 22c 2222k 2E 2212212212212 473.3.3 Đánh giá mô hình cuối cùng ©2¿+22+£2+E++EzE+zEzEzzezrezreee 53KET LUAN CHUONG3 1 57KET LUẬN VÀ KHUYEN NGHI 0 cccsscsssessssssssssesssecssesssecssecssecssscssecssesssecesessseceses 58TAI LIEU THAM KHẢO ¿- 5c St StEEEEEE‡EEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEkrrtkervee 62
PHU LỤC - 2:22:22 2212EE222122212212212111211211211211211211211 21211 re 64
Trang 7Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
CÁC THUẬT NGỮ
Tiếng Anh Tiếng Việt
Random Forest Rừng ngẫu nhiên
Decision Tree Cay quyét dinh
Accuaracy Độ chính xác
Confusion matrix Ma trận nhầm lẫn
Good Tốt
Bad Xấu
Train Tập huấn luyện
Validation Tập kiểm chứng trong quá trình huấn luyện
Test Tập kiểm chứng sau quá trình huấn luyện
Intime Trong thời gian
Outime Ngoai thoi gian
Forward Hồi quy tiến
Backward Hồi quy lùi
Stepwise Hồi quy từng bước
Trend Xu thế
Logical Trend Đường biểu diễn mối quan hệ biến đầu vào và WOE
Business sense Khia canh kinh doanh
CAC TU VIET TAT
SVM Support Vector Machines
(Máy Vector hỗ trợ)GDA Gaussian Discriminant Analysis
11195210 — Dinh Thị Quynh Trang 7
Trang 8Chuyên dé tốt nghiệp chuyên ngành Toán tải chính
(Phân tích phân biệt Gauss) ANN Artificial Neural Networks
(Mang lưới than kinh nhân tạo)
WOE Weight of evidence
(Trong số dau hiệu)
(Quan sát dự đoán là tốt nhưng thực tế là xấu)
ROC Receiver operating characteristic
(Đường cong đặc trưng hoạt động của bộ thu nhận)
AUC Area Under the ROC Curve
(Diện tích dưới đường cong ROC) PSI Population Stability Index
(Chi số ôn định tổng thé)
CSI Characteristic Stability Index
(Chi số ôn định của biến)
Trang 9Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
DANH MỤC BANG
Bảng 2.1 Ma trận nhằm lẫn E1 1222222111111 1111 2155551111 vày 31Bang 3.1 Bang mô ta biến độc lập - L-c c2 1122222211111 525111111555 xk2 42Bang 3.2 Thống kê mô tả một số biến - 7 2222222222 22+* s2 45Bang 3.3 Thống kê ty lệ Missing ở một số biến -c ¿<2 222cc 552 46Bang 3.4 Kết quả hồi quy mô hình cuối cùng -. - 2c >sss2 53Bảng 3.5 Thống kê mô ta của xác suất dự báo cc ecseeeseeeeeeeeeeeeees 54
Bảng 3.6 Kết qua đánh giá mô hình ở 3 tap 000000.0cccccccec eee eeseeeeseeeeeeeeeeeees 54
Bang 3.7 Chỉ số PSI của mô hình - - + c2 2221111212112 cez 56
Trang 10Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
DANH MỤC HÌNH
Hình 2.1 Đồ thị biểu diễn đường cong ROC 2 +2 2c c2 *s+>>232
Hình 2.2 Đồ thị biểu diễn Gini - cece cece cece 1 1111122222221 sex32
Hình 3.1 Biểu đồ Box-plot biến tuổi - -¿- c2 1122221111122 E111 s2245Hình 3.2 Xu thế WOE biến “TRANS_1” 2 1122221111122 re 48Hình 3.3 Xu thế WOE biến ‘TRANS _9° 22011111222 1xx 48Hình 3.4 Xu thế WOE biến 'PRODUCT_Š” - c2 222252222221 sssey 49
Hình 3.5 Xu thế WOE biến “OS_7' 2211111111112 1111151 a 49
Hình 3.6 Xu thế WOE biến “SEC_OS_2) c 7221111122221 eg 50Hình 3.7 Xu thế WOE biến ‘DEMO 3' 2c 2222211111222 xy 51Hình 3.8 Xu thé WOE biến ‘BAL CA 6' c2 2211112222 xy 51Hình 3.9 Xu thế WOE biến ‘LOAN 37 00 cccccccccceseeeeeceeeeeeeeessueeeeeeeeeess 52Hình 3.10 CSI của 8 biến cuối cùng ở tập Train - Validation - 55Hình 3.11 CSI của 8 biến cuối cùng ở tập Train — Test -: 56
11195210 — Dinh Thị Quynh Trang 10
Trang 11Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
lam giảm lợi nhuận của các hợp đồng, đặc biệt là khi lãi suất thị trường hiện tại thấp
hơn lãi suất hợp đồng
Bên cạnh đó, một danh mục thế chấp như các khoản vay mua nhà phải đượctái cấp vốn Khi thời hạn tài trợ không khớp với thời hạn thế chấp, rủi ro thanh khoản
có thể xảy ra Việc ước tính không chính xác về các khoản trả trước dẫn đến rủi rothiếu hoặc thừa tài trợ Hơn nữa, ngân hàng luôn cần phải cân đối giữa mức lãi suất,
kì hạn cho vay và các chi phí hoạt động cũng như lãi suất, kì hạn phải trả cho nguồnvốn mà ngân hàng đã dùng đề huy động Việc khách hàng trả trước sẽ ảnh hưởng đếnviệc giải ngân đối với khoản vay của các khách hàng khác và kế hoạch hoạt động của
tô chức, tạo ra sự phức tạp trong các chiến lược tái cấp vốn
Tại Techcombank, dé tạo thuận lợi hơn cho khách hàng đến với sản phẩm củamình cũng như kích cầu mua nhà cho doanh nghiệp, ngân hàng thường ký thỏa thuậnhợp tác hỗ trợ khách hàng vay tiền mua nhà ở một số dự án bất động sản Do đó, đốivới các khoản vay mua nhà tại Techcombank, trong khoảng thời gian 6 — 24 tháng kế
từ lúc vay, khách hàng có thê sẽ không cần trả cả gốc lẫn lãi Khoảng thời gian nàyđược gọi là thời gian ân hạn Sau khi kết thúc khoảng thời gian trên, khách hàng bắtđầu phải trả lãi, do đó khách hàng sẽ trả trước rất nhiều
Vậy nên, việc đánh giá khả năng khách hàng vay mua nhà trả trước hạn là điềucần thiết để ngân hàng có những chiến lược phù hợp phòng ngừa các rủi ro trên, bùđắp chi phí trả lãi huy động vốn cũng như đảm bảo sự 6n định cho quá trình hoạt độngcủa ngân hàng Nhiều thuật toán như Rừng ngẫu nhiên (Random Forest), Mạng thầnkinh nhân tạo (ANN) đã dựa trên thông tin lịch sử tín dụng, nhân khẩu học, đặcđiểm khoản vay để dự đoán hành vi thanh toán sớm hơn dự kiến của khách hàng.Trong đó, mô hình hồi quy logistic được sử dụng rộng rãi và được chứng minh là cókhả năng dự báo tốt và dễ giải thích Đó là những ly do dé sinh viên lựa chọn đề tài:
11195210 — Dinh Thị Quynh Trang 11
Trang 12Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
“Ứng dụng mô hình hồi quy logistic đánh giá khả năng khách hàng trả trước hạnkhoản vay mua nhà tại ngân hàng Techcombank” làm chuyên đề tốt nghiệp
2 MỤC TIỂU NGHIÊN CỨU
2.1 Mục tiêu chung:
Mục tiêu nghiên cứu chung của Chuyên đề là sử dụng mô hình hồi quy Logistic
đề đánh giá khả năng khách hàng trả trước hạn cho khoản vay mua nhà tại Ngân hàngThương mại cô phần Kỹ Thương Việt Nam - Techcombank, từ đó thiết kế thẻ điểmcho khách hàng và đưa ra một số kiến nghị trong chiến lược phòng ngừa rủi ro khi
khách hàng trả trước hạn của Ngân hàng.
2.2 Mục tiêu cụ thể:
Dé thực hiện được mục tiêu chung ở trên, Chuyên đê có các mục tiêu cu thê theo các câu hỏi nghiên cứu sau đây:
(i) Mô hình hồi quy Logistic có phù hợp dé đánh giá kha năng khách hang
trả trước hạn khoản vay mua nhà tại Techcombank hay không?
(ii) — Có thể xây dựng được thẻ điểm phân loại khách hang từ mô hình trên,
để từ đó có những chính sách cho nhóm khách hàng mục tiêu hay
không?
3 Đối tượng nghiên cứu và phạm vi nghiên cứu
- Đối tượng nghiên cứu: mô hình hồi quy Logistic dự đoán hành vi trả trước hạn
khoản vay mua nhà của khách hàng.
- Phạm vi nghiên cứu: những khách hàng có khoản vay mua nhà tại ngân hàng
Techcombank trong giai đoạn thang 6/2020 đến tháng 9/2021
4 Phương pháp nghiên cứu
- Phương pháp nghiên cứu: Định lượng
- Mô hình/ Thuật toán: Logistic
Trang 13Chuyên dé tốt nghiệp chuyên ngành Toán tải chính
Chương 1: Cơ sở lý luận và tông quan nghiên cứu
Chương 2: Phương pháp nghiên cứu
Chương 3: Sử dụng mô hình Logistic dé đánh giá khả năng khách hang trả trước
hạn khoản vay mua nhà tại Techcombank.
11195210 — Dinh Thị Quynh Trang 13
Trang 14Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
CHƯƠNG 1
CƠ SỞ LÝ LUẬN VA TONG QUAN NGHIÊN CỨU
Mục tiêu của Chương 1 là trình bay cơ sở lý luận và tổng quan về van đề nghiêncứu dé làm tiền đề nghiên cứu Cụ thé, phần 1.1 trình bày cơ sở lý luận về hoạt độngcho vay thế chấp, cho vay mua nhà và hành vi trả trước hạn của khách hàng, cùng cácvan đề liên quan dé thay được sự cần thiết của dé tài Phan 1.2 tổng quan các mô hình
dự đoán và những yếu tố ảnh hưởng đến khả năng trả trước của khách hàng vay, dựa
trên các nghiên cứu từ trước đến nay, dé từ đó lựa chọn mô hình nghiên cứu phù hợp
với dữ liệu tại ngân hàng Techcombank.
1.1 CƠSỞ LÝ LUẬN
1.1.1 Hoạt động cho vay tại ngần hàng
Theo quy định tại Khoản 1, Điều 2, Thông tư 39/2016/TT-NHNN của Ngân
hàng nhà nước quy định về hoạt động cho vay của tổ chức tín dụng đối với khách
hàng thì: “Cho vay là hình thức cấp tín dụng, theo đó tổ chức tín dụng giao hoặc cam
kết giao cho khách hàng một khoản tiền để sử dụng vào mục đích xác định trong mộtthời gian nhất định theo thỏa thuận với nguyên tắc có hoàn trả cả gốc và lãi”
Ngân hàng là các trung gian tài chính cung cấp các khoản vay cho một loạt cáchoạt động kinh tế Họ chỉ giữ một tỷ lệ nhỏ tiền gửi như một khoản dự trữ dé trả chonhững người gửi tiền đến ngân hàng để rút tiền vào bất kỳ ngày nào nhất định Phầnlớn khoản tiền gửi ngân hang dé cho vay Ngoài ra, dé tài trợ cho hoạt động cho vay,ngân hàng còn huy động vốn từ vốn tự có, vốn vay thị trường trong và ngoài nước,vốn ủy thác tài trợ phát triển
Hoạt động cho vay bị ảnh hưởng bởi nhu cầu và nguồn cung bat động sản, sựcạnh tranh giữa những người cho vay, điều kiện lãi suất, điều kiện kinh tế chung, khảnăng cung cấp vốn Dé đảm bảo an toàn và hiệu quả, hoạt động cho vay phải đượcthực hiện theo những nguyên tắc nhất định Thứ nhất, khách hàng phải hoàn trả nợ
gốc và lãi đúng thời hạn đã thoả thuận trong hợp đồng Thứ hai, khách hàng vay phải cam kết sử dụng khoản vay đúng mục đích đã thoả thuận Thứ ba, ngân hàng cho vay
dựa trên phương án có hiệu quả, mục đích hợp pháp và có khả năng hoàn trả nợ Ngân
hàng sẽ xem xét thu nhập, điểm tín dụng, mức nợ của người vay trước khi quyếtđịnh cho họ vay và cũng có thể tính lãi suất cao hơn đối với những người vay rủi ro
11195210 — Dinh Thị Quynh Trang 14
Trang 15Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
Hiện nay, hoạt động cho vay ở ngân hàng được phân loại theo nhiều phươngthức khác nhau Đối với mỗi loại khoản vay thì ngân hàng cung cấp với các mức lãisuất khác nhau Cu thé:
+ Căn cứ vào thời hạn vay, các khoản vay được chia thành: cho vay ngắn hạn,
cho vay trung hạn và cho vay dài hạn
+ Căn cứ vào mục đích sử dụng vốn vay: Cho vay tiêu dùng, cho vay kinh
doanh
+ Căn cứ vào tính chất bảo đảm của khoản vay: Cho vay có tài sản đảm bảo,
cho vay không có tài sản đảm bảo
+ Căn cứ vào phương thức cho vay: Cho vay từng lần, cho vay theo hạn mứctin dụng, cho vay thấu chi, cho vay trả góp, cho vay hợp vốn
e Vai trò của hoạt động cho vay
- Vai trò đối với ngân hàng:
Hoạt động cho vay là hoạt động mang lại lợi nhuận chủ yếu cho ngân hàng.Các ngân hàng tính lãi suất cho các khoản vay cao hơn so với lãi suất mà họ cung cấpcho các khoản tiền gửi Sự khác biệt giữa lãi được tính từ người đi vay và lãi được trảcho những người gửi tiền là nguồn thu nhập chính của họ
Bên cạnh đó, ngoài khoản thu từ lãi, ngân hàng còn có các khoản thu phí dịch
vụ như: dịch vụ thanh toán, dịch vụ tư vấn,
- Vai trò đối với khách hàng:
Với nhiều ưu điểm như an toàn, thuận tiện, dễ tiếp cận , hoạt động cho vaycủa ngân hàng đáp ứng kịp thời về nhu cầu vốn đa dạng của khách hàng: giúp các nhà
đầu tư nắm bắt được những cơ hội kinh doanh; doanh nghiệp có vốn dé mở rộng san
xuất; các cá nhân có khả năng tài chính để trang trải các khoản chỉ tiêu nâng cao chất
lượng cuộc sống.
- Vai trò đối với nên kinh tế
Ngân hàng làm trung gian với hoạt động cho vay sẽ giúp luân chuyền vốn giữacác chủ thê trong nền kinh tế: giữa những người có tiền dư thừa (người gửi tiền) vànhững người đang cần tiền (người đi vay)
11195210 — Dinh Thị Quynh Trang 15
Trang 16Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
Hơn nữa, hoạt động cho vay sẽ giúp các doanh nghiệp có vốn mở rộng sảnxuất, cá nhân có tiền nâng cao chất lượng cuộc sống, từ đó tăng tính hiệu quả trong
sử dụng vốn, góp phần mở rộng sản xuất, thúc đây đổi mới công nghệ, thu hút đầutu dé phát triển kinh tế
1.1.2 Hoạt động vay và cho vay mua nhà
Từ xưa đến nay, người dân Việt Nam luôn quan niệm rằng “an cư lạc nghiệp”,
nên luôn có mong muốn có một ngôi nhà sạch đẹp, ấm cúng Nhưng với chỉ tiêu ngàycàng đắt đỏ; song song với quá trình đô thị hoá dién ra nhanh, dân số đông thì nhu cầu
về nhà ở càng cao, do đó việc tích góp và mua được một ngôi nhà ưng ý khá khó khăn.
Chính vì thế, hoạt động vay mua nhà được coi là giải pháp tối ưu, giúp người dân cóthê mua nhà trong thời gian sớm nhất mà không phải chờ đến khi tích góp đủ số tiền
Nhờ đó, người dân có thé yên tâm làm việc, cải thiện đời sống với ngôi nhà mình mơước Ngoài ra, đối với nhiều người, đầu cơ còn là mua đi bán lại kiếm lời
Vay thé chấp là hình thức vay vốn phổ biến nhất cho các khoản vay mua nhà.Khách hàng sẽ được xem xét xét duyệt hồ sơ cho vay dựa trên tài sản đảm bảo, thunhập, điểm tín dụng, Với hình thức này, số tiền cho vay tối đa lên đến 100% giá trịcủa căn nhà cần mua và thời hạn vay từ 10 - 30 năm với mức lãi suất không quá cao.Người vay cần phải thế chấp tài sản đảm bảo như xe hơi, đất đai hoặc chính ngôinhà mình đang vay mua dé có thé được vay vốn Tài sản vẫn thuộc sở hữu của người
đi vay, ngân hàng chỉ giữ giấy tờ gốc chứng nhận sở hữu tài sản Tuy nhiên, tuy nhiênnếu không có khả năng trả nợ cho ngân hàng, ngân hàng có thể bán tài sản nhằm giảm
bớt tôn thất và bù đắp khoản vay.
Trong khi đó, đối với các ngân hàng, thị trường cho vay mua nhà là phân đoạnthị trường được đánh giá là tiềm năng, đặc biệt khi càng ngày càng nhiều các khu đôthị, dự án nha ở liền kề được triển khai xây dựng, và thu nhập cũng như nhu cầu của
người dân ngày một tăng cao Cho vay mua nhà chiếm tỉ trọng lớn trong cho vay tiêu
dùng với quy mô khá lớn và mức lãi suất cao, là nguồn thu rất lớn của ngân hàng Bên
cạnh đó, hoạt động cho vay mua nha còn giúp ngân hang đa dạng hoá danh mục sản
phẩm, góp phan phân tán rủi ro, thu hút khách hàng nhiều hơn Đồng thời ngân hàng
cũng phát triển được nhiều sản phẩm liên kết như cho vay mua 6 tô hay nội thất saukhi đã vay mua nhà.
11195210 — Dinh Thị Quynh Trang 16
Trang 17Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
Bên cạnh đó, hoạt động cho vay mua nhà còn có ý nghĩa hết sức quan trọngđối với nền kinh tế nói chung và thị trường bất động sản nói riêng bởi sự tham gia vàothị trường của các ngân hàng đã tạo được những đòn bây quan trọng, kích thích nềnsản xuất phát triển, thúc đây hoạt động kinh doanh bất động sản cũng như thúc đâyquá trình đô thị hoá đất nước
Tuy nhiên, theo dự thảo sửa đổi thông tư 39/2016/TT-NHNN, Ngân hàng Nha nước bổ sung quy định nhằm quản lý chặt chẽ hơn đối với các loại hình cho vay:
“kiểm soát cho vay dé đầu tư kinh doanh chứng khoán; cho vay mua, kinh doanh bat động sản; cho vay cho các dự án đầu tư theo hình thức đối tác công tư; cho vay các nhu cầu vốn phục vụ đời sống có giá trị lớn theo đánh giá của tổ chức tín dụng” Tuy
nhiên, trong bối cảnh hạn mức (room) tín dụng ở các ngân hàng thương mại đang cạnkiệt, lãi suất tăng thì không chỉ khách vay mua bat động san dé đầu cơ gặp khó, ma
trên thực tế, người dan mua nhà ở cũng khó dé tiếp cận vốn tin dụng Theo quan sát,
ở một số ngân hàng, lãi suất vay mua nhà đang ở mức cao, giải ngân lâu hơn và không
còn những gói ưu đãi.
1.1.3 Hành vi trả trước hạn khoản vay
Khi đi vay, khách hàng có thê lựa chọn 2 hình thức trả quen thuộc nhất là trảtheo niên kim và tra theo du nợ từng phan Khi trả theo niên kim, người vay sẽ trả một
số tiền gốc và lãi cộng lại là bằng nhau ở hang ky, cho đến khi hoàn trả tổng số tiềngốc của khoản vay Số tiền niên kim là cố định, nhưng thành phần của nó thay đồi.Trong thời gian đầu, phần lớn số tiền này được tạo thành từ tiền lãi và chỉ một phầnnhỏ dành đề trả nợ gốc Số tiền gốc còn lại càng cao thì số tiền lãi càng cao Vì vậy,theo thời gian, phần lãi nhỏ dan, dé tổng số tiền phải trả không đổi thì phần trả nợ gốcphải tăng lên Trong khi với khoản vay trả dư nợ từng phần, hàng tháng, người đi vay
sẽ trả lãi và cố định một phần của nợ sốc, lãi tháng sau được tính dựa trên số tiền gốc
còn lại.
Trả trước hạn khoản vay là việc khách hàng muốn trả nhiều hơn số tiền tại mộtthời điểm sớm hơn so với thời hạn được ghi trên hợp đồng tín dụng của mình và ngânhàng Người vay có thể chọn trả một số tiền lớn hơn số tiền trả góp hàng tháng hoặctoàn bộ khoản vay trước khi kết thúc thời hạn vay Ở đây chúng ta xét đến nhữngkhách hàng tất toán toàn bộ khoản vay trước hạn
11195210 — Dinh Thị Quynh Trang 17
Trang 18Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
Trả trước khoản vay có thể giúp khách hàng giảm bớt gánh nặng tài chính khitrả các khoản vay và tiết kiệm chỉ phí trả lãi Tuy nhiên, đối với ngân hàng, việc trảtrước được coi là rủi ro tài chính Bởi khi cho vay vốn, thì bản thân ngân hàng đượchưởng lợi từ chính số tiền cho khách hàng vay với một lãi suất nhất định Các khoảntrả trước sẽ làm giảm lợi nhuận của các hợp đồng thế chấp, đặc biệt khi cho rằngkhách hàng có nhiều khả năng trả trước khi lãi suất thị trường hiện tại thấp hơn lãi
suất hợp đồng trên hợp đồng thế chấp Bên cạnh đó, trả trước có thể khiến ngân hàng
gặp rủi ro thanh khoản Một danh mục thế chấp phải được tái cấp vốn Do vậy, rủi rothanh khoản xảy ra khi thời han tài trợ không khớp với thời hạn cam có Việc ước tínhkhông chính xác về các khoản trả trước dẫn đến rủi ro thiếu hoặc thừa tai trợ
Cụ thể như nếu khách hàng vay tiền từ ngân hàng với thời hạn § năm Tuy
nhiên, đến năm thứ 2 người vay lại muốn trả hết tiền vay trước cho ngân hàng Thực
tế, ngân hàng luôn cần phải cân đối giữa mức lãi suất, kì hạn cho vay và lãi suất, kì
hạn phải trả cho nguồn vốn mà ngân hàng đã huy động, cũng như các chỉ phí hoạt
động khác Điều dé hiểu là người đi vay luôn muốn trả nợ càng nhanh càng tốt nhưngngược lại, ngân hàng bị day vào thé bị động do điều khiển dòng tiền mà khách trả nợquá sớm Việc khách hàng trả trước sẽ ảnh hưởng đến việc giải ngân đối với khoảnvay của các khách hàng khác và kế hoạch hoạt động của tô chức, tạo ra sự phức tạptrong các chiến lược tái cấp vốn Kéo theo đó, nguồn lãi suất mà ngân hàng có thé
thu được trong thời hạn § năm cũng bị ảnh hưởng.
Hon thé, đối với các khoản vay thé chấp, việc khách hang trả trước có thé gây
ra rủi ro lãi suất Bởi vì các khoản vay thế chấp thường được thanh toán sớm đề chịukhoản thanh toán lãi suất thấp hơn thông qua việc tái cấp vốn rẻ hơn Khoản tài trợmới có thé rẻ hon do tín dụng của người đi vay đã được cải thiện hoặc do lãi suất thịtrường đã giảm Trong khi đó, các khoản thế chấp có lãi suất có định thường được bảohiểm trước sự thay đổi của lãi suất bằng cách sử dụng giao dịch hoán đối lãi suất,trong đó ngân hàng nhận lãi suất thả nỗi và tra lãi suất có định Do đó, việc trả trước
có thé khiến ngân hàng phải trả một tỷ lệ cô định, cao hơn lãi suất nhận được từ khoảnthế chấp mới
Vì vậy, ngân hàng sẽ thu phí khi khách hàng trả trước hạn các khoản vay dé bùđắp lại những rủi ro trên Phí trả trước sẽ khác nhau giữa các ngân hàng và cũng phụthuộc vào thời hạn hoàn thành của khoản vay cá nhân Thông thường, các ngân hàng
11195210 — Dinh Thị Quynh Trang 18
Trang 19Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
tính mức phí này dao động từ 1-5% trên tổng giá trị tiền trả trước hạn của người vay.Khách hàng có thể sẽ không phải nộp phí phạt trước hạn sau khi hoàn thành khoảnvay trong một số năm nhất định
1.2 TONG QUAN NGHIÊN CỨU
1.2.1 Tổng quan các mô hình đánh giá kha năng trả trước han cho những
khoản vay ngần hàng
Cho tới nay, dé đánh giá khả năng khách hàng vay mua nhà trả trước hạn, cácnghiên cứu hiện có đã áp dụng hai cách tiếp cận chính: cách tiếp cận trả trước tối ưu
và quy tắc trả trước ngoại sinh Cách tiếp cận thứ nhất bao gồm các mô hình trả trước
theo lý thuyết tùy chọn (option-theoretic prepayment model) chỉ tính đến các khíacạnh tài chính (chi bao gồm các yếu tố liên quan đến biến động lãi suất, chi phí giaodịch ) Cách tiếp cận thứ hai bao gồm các mô hình trả trước ngoại sinh (exogenousprepayment models) dựa trên thông tin liên quan đến cả tài chính và phi tài chính,nhằm mục đích giải thích mối quan hệ giữa khả năng trả trước được quan sát và mộttập hợp các biến độc lập thông qua phân tích thống kê và khai thác dữ liệu
1.2.1.1 Mô hình trả trước theo lý thuyết tuỳ chọn
Các mô hình này coi việc trả trước xảy ra như một hệ qua của hành vi hoàn
toàn hợp lý từ người đi vay, một tùy chọn được cho là được thực hiện một cách tối
ưu; nên còn có tên gọi khác là mô hình trả trước tôi ưu.
Nhiều tùy chọn trả trước là một tùy chọn “phản ánh sự chênh lệch giữa giá trịcủa các khoản nợ chưa hoàn trả theo lãi suất tại thời điểm trả trước cho thời hạn cònlại của khoản vay, trừ đi số tiền còn lại của khoản vay” Những người đi vay hợp lýchỉ nên thực hiện tùy chọn trả trước nếu khoản chênh lệch nêu trên là dương, vì nếukhông, tùy chọn này là vô nghĩa vì gửi tiền vào tài khoản tiết kiệm sẽ thích hợp hơn
là trả trước các khoản vay thế chấp Hay nói cách khác, người đi vay sẽ chỉ trả trước
theo các mô hình này khi nó có lợi về mặt kinh tế cho họ và đặc biệt khi lãi suất thị
trường thấp hơn lãi suất trả trên tài sản thế chấp của họ Sử dụng cách tiếp cận này,các nguyên nhân chính dẫn đến hành vi trả trước chỉ gồm giá trị nhà và lãi suất
(Gerardi và cộng sự, 2013; Chamboko và Bravo, 2020).
Tuy nhiên, không phải lúc nào mọi người cũng hành động hợp lý về mặt kinh
tê Các nghiên cứu đã chỉ ra răng các mô hình trả trước dựa trên các biên sô tải chính
11195210 — Dinh Thị Quynh Trang 19
Trang 20Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
thuần túy sẽ đánh giá thấp hơn hoặc ước tính quá mức các khoản trả trước trong cáctrường hợp cụ thé Tức là, có thé quan sát thay một thành phần ngẫu nhiên đáng kéliên quan đến hành vi không chắc chắn Bên cạnh đó, việc sử dụng các mô hình trảtrước theo lý thuyết tuỳ chọn không thể giải thích được đầy đủ hành vi trả trước nói
chung.
1.2.1.2 Mô hình trả trước ngoại sinh
Các mô hình này dựa trên phân tích dữ liệu liên quan đến cả tài chính và phi
tài chính Mô hình trả trước ngoại sinh khắc phục được những thiếu sót của mô hình
trả trước theo lý thuyết tuỳ chọn là không thê giải thích hành vi và người đi vay khôngtrả trước khi nó là tối ưu, vì người tiêu dùng có động cơ phi tài chính khác để trả trước
(Charlier và van Bussel, 2003; Jacobs và cộng sự, 2005; LaCour-Little, 2008; Saito,
2018) Có nhiều lý do tại sao người đi vay quyết định trả trước khoản vay thế chấp
của họ Một bộ dữ liệu với thông tin các khoản vay thế chấp, khách hàng và thậm chí
đến các yêu tố kinh tế vĩ mô là cần thiết dé bắt đầu một mô hình như vậy
Dựa trên những thông tin này, đã có nhiều mô hình học máy, học sâu được sửdụng dé dự đoán hành vi trả trước của khách hàng như Logistic, Random Forest,Neural Networks, và đều được chứng minh là có kha năng dự bao và phân loại tốt
Trong một nghiên cứu của Sara Zahi và BouJemâa Achcab (2020), mô hình
Logistic đã được sử dụng dé dự đoán các khoản vay mua 6 tô trả trước Kết quả đánhgiá mô hình đã đạt được độ chính xác 85% Kiểm định Hosmer — Lemeshow so sánhmức độ khớp giữa giá trị dự đoán và giá trị quan sát được cũng cho thấy mô hình cókhả năng dự báo tốt
Một nghiên cứu khác của Chong Guo, John Boccio, Cameron (2018) đã tiến
hành nghiên cứu sâu rộng va toan diện nhất về chủ đề đang thảo luận Họ đã so sánh
hiệu suất của Hồi quy Logistic, Support Vector Machines (SVM), Neural Network và
Gaussian Discriminant Analysis (GDA) Kết qua thu được từ nghiên cứu cho thấy
GDA được đánh giá cao nhất, tiếp đến là Logistic Đối với mô hình Logistic, sau khi
áp dụng kĩ thuật L2 regularization, mô hình đạt độ chính xác lên đến 99,92% và cóthê dự đoán "No Prepayment" với accuracy là 100%
Trong khi đó, Amar (2020) đã sử dụng mang Nơ-ron dé phân tích hành vi trảtrước của những người đi vay thế chấp ở Mỹ từ năm 2000 đến năm 2018 Hai khía
11195210 — Dinh Thị Quynh Trang 20
Trang 21Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
cạnh khác nhau được xem xét: khía cạnh thứ nhất xác định liệu một khoản thế chấp
có trả trước hay không, khía cạnh thứ hai đánh giá mức độ của khoản trả trước (dự
đoán tỷ lệ trả trước) Cả hai mô hình mạng Nơ-ron đa lớp mà Amar phát triển, môhình hồi quy và phương pháp tiếp cận mô hình hai yếu tố, đều cho kết quả tốt Việcước tính tỷ lệ thanh toán trước là chính xác và điều này có triển vọng Nghiên cứucũng nhắn mạnh các mô hình cần được dao tạo lại thường xuyên khi có dữ liệu mới
cũng như để có thé đào tạo tốt các mô hình mạng nơ-ron, cần phải có một lượng lớn
dữ liệu.
Trong nghiên cứu của tác giả Joana Lopes, dựa trên các phương pháp tiếp cận
máy học là Random Forest va Artificial Neural Networks (ANN), hai mô hình được thực hiện: một mô hình xem xét khả năng tra trước toàn bộ, va một mô hình trả trước
từng phần Cả hai thuật toán đều cho kết quả khả quan, có khả năng dự báo và phânbiệt tốt, trong đó Random Forest hoạt động tốt hơn ANN trong cả 2 mô hình mục tiêu
Mô hình Random Forest trả trước toàn bộ đạt được AUC là 0,86 trong tập dữ liệu đào
tạo và 0,83 trong tập dữ liệu thử nghiệm; trong khi với mục tiêu trả trước từng phần,AUC lần lượt là 0,93 trong tập Train và 0,90 trong tập Test
Các mô hình như Random Forest, SVM, Neural Network cho kết quả với độchính xác cao, tuy nhiên lại có cấu trúc khá phức tap và khó dé giải thích Trong khi
đó, mô hình hồi quy Logistic lại có thé dé dang biến đổi về dạng tuyến tính nên dễgiải thích ảnh hưởng của biến độc lập lên mục tiêu, cũng như dễ hiểu và quy trìnhthực hiện rõ ràng Vậy nên, Chuyên đề đã lựa chọn mô hình Logistic dé đánh gia kha
năng khách hang trả trước hạn khoản vay mua nhà.
1.2.2 Những yếu tố ảnh hưởng đến khả năng trả trước của khách hàng
Theo Amar (2020), Lopes (2022), đối với một mô hình dự báo khả năng trả
trước của khách hang vay mua nhà, các biến giải thích có thé liên quan đến:
+ Đặc điểm khoản vay: số tiền vay, thời hạn vay, số tiền phải trả hàng tháng,lãi suất, tình trạng sở hữu nhà / hạng mục đối với yêu cầu vay, giá trị tài sản đảm
bao;
+ Các đặc điểm cá nhân của khách hàng: tuổi, giới tinh, tinh trạng hôn nhân,
số lượng người phụ thuộc, trình độ học van, thu nhập hàng tháng, nghề nghiép/ tình
trạng công việc, mức độ tín nhiệm
11195210 — Dinh Thị Quynh Trang 21
Trang 22Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
+ Lịch sử tín dụng của khách hàng: số lượng và số tiền của các khoản tín dụng
mở, số dư trung bình trong tài khoản séc, dư nợ cho vay, khoản nợ không trả được
+ Kha năng tài chính của khách hàng: tổng tai sản, tổng thu nhập, chi phí hàng
tháng của hộ gia đình, tỷ lệ nợ trên thu nhap ;
+ Các biến số kinh tế vĩ mô: giá nhà/ diễn biến của giá nhà, ty lệ thất nghiệp,
biến động GDP, tỷ lệ thế chấp thị trường, tháng trong năm,,
Trong đó, ưu đãi lãi suất là một trong những yếu tô quan trọng nhất quyết địnhviệc trả trước Khi lãi suất của hợp đồng thế chấp mới thấp hơn so với hợp đồng cũ,người vay có động cơ tài chính để trả hết thế chấp của mình và nhận một hợp đồngmới Lee Nai & Ong Seow (2003) đã phân tích các yếu tố xác định rủi ro trả trước củacác khoản thế chấp đối với nhà ở công cộng (nhà ở xã hội được hỗ trợ 1 phần bởi Nhànước) ở Singapore Kết quả nghiên cứu cho thấy, việc trả trước có mối tương quanthuận với tâm lý thị trường và lãi suất các khoản vay Ngược lại, nó có mối tươngquan nghịch với tăng trưởng thu nhập và chênh lệch tương đối giữa giá nhà ở tư nhân
và công cộng Các phát hiện cũng cho răng tỷ lệ trả trước của các khoản thế chấp nhànước bị ảnh hưởng trực tiếp bởi bất kỳ chính sách nào nâng cao khả năng chỉ trả của
người dân các khu nhà công cộng đê chuyên sang nhà ở tư nhân.
Một nghiên cứu khác của Chong Guo, John Boccio, Cameron (2018), khi phân
tích tầm quan trọng, đã chỉ ra rằng thuộc tính quan trọng nhất ảnh hưởng đến khả năngtrả trước là "current_UPB" Thuộc tính nay đề cập đến số dư nợ hiện tại của khoảnvay Số dư nợ càng ít, càng có nhiều khả năng người vay sẽ trả trước
Các khoản trả trước thường thể hiện mối quan hệ hình chữ S với thời hạn cho
vay Trên thực tế, các khoản trả trước hiếm khi diễn ra hoặc tỷ lệ trả trước thường
thấp sau khi khoản vay bắt đầu; mà chúng sẽ tăng dần lên cho đến khi đạt mức 6n
định vào ngày gần đáo hạn của khoản thế chấp (Charlier và Bussel, 2001; Jacobs và
cộng sự, 2005).
Xu hướng giá nha cũng là một yếu tố ảnh hưởng đến khả năng trả trước hạn
các khoản vay của khách Trong những khoảng thời gian tăng giá nhà, việc bán nhà
và thé chấp có thé tăng lên, vì lợi nhuận sẽ được tao ra khi ban tai sản Các khoản tratrước do chuyên nhà sẽ thường xuyên hơn trong những giai đoạn này (Agency, 2014).Ngược lại, trong thời kỳ mat giá hoặc giá cả bap bênh, nguồn gốc bán nhà và thé chấp
11195210 — Dinh Thị Quynh Trang 22
Trang 23Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
có xu hướng giảm do những người mua nhà ngại rủi ro miễn cưỡng tham gia thị trường Đối lại, điều này dẫn đến việc trả trước ít hơn do chuyên địa điểm.
Tháng trong năm cũng có thể ảnh hưởng đến tỷ lệ trả trước Hiệu ứng này đượcgọi là tính thời vụ, và nó thé hiện tính thời vụ mạnh mẽ trên thị trường nhà ở Nhiềucăn nhà được ban hơn đáng kể trong những tháng mùa hè và đầu mùa thu Bán nhà
(hoặc doanh thu bán nhà) thường sẽ kích hoạt một khoản thanh toán trước (P Kang
và S A Zenios, 1992) Bên cạnh đó, việc trả trước một phần vào thang 12 va thang 1
có nhiều kha năng xảy ra hon, do tiền thưởng hoặc do các khoản lợi thuế có thé có
của khoản vay trả trước thường được trả cuối năm.
11195210 — Dinh Thị Quynh Trang 23
Trang 24Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
KET LUẬN CHƯƠNG 1
Chương này đã trình bày được cơ sở lý luận về hoạt động cho vay, cho vaymua nhà và hành vi vay trả trước hạn của khách hàng, đồng thời tổng quan được các
mô hình được sử dụng để dự báo khách hàng vay thế chấp trả trước hạn
Hoạt động cho vay là hoạt động mang lại lợi nhuận chủ yếu cho ngân hang Sựkhác biệt giữa lãi được tính từ người đi vay và lãi được trả cho những người gửi tiền
là nguồn thu nhập chính của họ Việc khách hàng trả trước hạn các khoản vay sẽ làmngân hàng mắt đi một khoản tiền lãi Đặc biệt, với những khách hàng vay mua nhà,
họ thường có khoảng thời gian ân hạn Kết thúc khoảng thời gian này, khách hàng trảtrước rất nhiều Do đó, việc đánh giá khả năng khách hàng trả trước hạn khoản vay
mua nhà là rât cân thiệt.
Có hai mô hình chính được sử dụng dé dự đoán hành vi trên của khách hàng,
đó là mô hình trả trước theo lý thuyết tùy chọn và mô hình trả trước ngoại sinh Các
mô hình lý thuyết tuỳ chọn chỉ tính đến các khía cạnh tài chính, do đó không thể giảithích được đầy đủ hành vi trả trước nói chung Trong khi đó, các mô hình trả trướcngoại sinh dựa trên thông tin liên quan đến cả tài chính và phi tài chính, với việc sử
dụng các thuật toán Logistic, Random Forest, Neural Networks , đã được chứng
minh là có khả năng dự báo và phân loại tốt hơn
Các nhóm biến được kỳ vọng đưa vào mô hình dự báo bao gồm: Đặc điểm
khoản vay (số tiền vay, thời hạn vay, lãi suất, giá trị tài sản đảm bảo ); Nhân khẩu học (tudi, giới tinh, tinh trang hôn nhân, trình độ hoc vấn, nghề nghiệp ); Lịch sử tín
dụng của khách hàng (số lượng và số tiền của các khoản tín dụng mở, số dư trung
bình trong tải khoản séc, dư nợ cho vay, khoản nợ qua han ); Khả năng tai chính của
khách hàng (tông tài sản, tổng thu nhập, ty lệ nợ trên thu nhập ); Các biến số kinh
tế vĩ mô (diễn biến của giá nhà, tỷ lệ thất nghiệp, biến động GDP, tỷ lệ thế chấp thị
trường, thang trong năm, ).
Do tính ưu việt của hồi quy Logistic nên chuyên đề đã lựa chọn mô hình này
để đánh giá khả năng khách hàng trả trước hạn khoản vay mua nhà tại ngân hàng
Techcombank Cùng với mô hình Logistic, cách thức xử lí dữ liệu quen thuộc trong
Ngân hàng là WOE cũng như với các tiêu chí kiểm định mô hình cũng sẽ được trình
bày ở chương 2.
11195210 — Dinh Thị Quynh Trang 24
Trang 25Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
CHƯƠNG 2
PHƯƠNG PHÁP NGHIÊN CỨU
Mục tiêu của Chương 2 là trình bày phương pháp sử dụng trong chuyên đề dé
dự đoán khách hàng vay mua nhà trả trước hạn Mục 2.1 đề cập đến cách thức xử líbiến WOE và các tiêu chí lựa chọn biến đưa vào mô hình Mục 2.2 trình bay về môhình được sử dụng trong nghiên cứu là mô hình hồi quy Logistic, cùng với các tiêu
chí dé đánh giá mô hình Cuối cùng, Mục 2.3 trình bày về định dạng và vai trò của thẻ
điểm trong việc ra quyết định và quản lý rủi ro
2.1 XỨ LÍ VÀ LỰA CHỌN BIEN
2.1.1 Cách thức xử lí biến
Mục này trình bày về cách thức biến đổi, xử lí biến quen thuộc trong ngânhàng, đó là trọng số dấu hiệu — (WOE - Weight of evidence)
WOE sẽ nhóm các giá trị thành các khoảng gia trị Với biến liên tục, WOE sẽ
nhóm các giá tri lại thành các khoảng liên tục Chăng han, với biến tuổi, chúng ta có
thé nhóm các quan sát thành các khoảng: < 18 tuổi, 18 - 30 tuôi Một khách hang 25tudi sẽ được phân vào khoảng 18-30 Với biến phân loại, WOE có thé coi mỗi giá tri
là một nhóm hoặc gộp các nhóm có sỐ lượng quan sat it lại với nhau Ngoài ra, cácgiá trị bị Missing cũng có thể được coi là một nhóm riêng biỆt
Việc nhóm các khoảng giá trị phải đáp ứng một số tiêu chí nhóm nhất định,chăng hạn mỗi khoảng giá trị phải chứa ít nhất 5% số quan sát mẫu Hoặc nhữngkhoảng giá trị có giá tri WOE gần bằng nhau thì có thé nhóm lại với nhau Việc nàynhằm làm giảm số lượng nhóm và tăng tính phân loại cho mô hình Ngoài ra, việcnhóm các khoảng giá trị phải đảm bảo phù hợp kỳ vọng lý thuyết kinh tế về mỗi quan
hệ WOE và biến độc lập (Logical Trend)
Logical Trend là một đường thường biểu thị mối quan hệ tuyến tính và logic
giữa các đầu vào và tỷ lệ quan sát xấu hoặc WOE Ví dụ, khi tỷ lệ trung bình dư nợ trong vòng 3 tháng so với 6 tháng gần nhất càng cao, thì gánh nặng tài chính phải trả
nhiều nợ càng lớn, ít có khả năng trả trước Tức số lượng quan sát xấu giảm, WOE
tăng, nên xu thế (Trend) kỳ vọng ở đây là đường WOE đi lên Tuy nhiên, các mốiquan hệ WOE với biến độc lập có thé là mối quan hệ phi tuyến (hình chữ “U”, chữ
“S” ), miễn là có thé giải thích được mỗi quan hệ.
11195210 — Dinh Thị Quynh Trang 25
Trang 26Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
WOE do lường sự khác biệt giữa phân phối Good (0: quan sát tốt — khách hàngkhông trả trước hạn) va phân phối Bad (1: quan sát xấu — khách hàng trả trước hạn)
trên từng khoảng giá tri:
WOE; = In (Dist_Good;/ Dist_Bad,)
Với:
Dist_Good;: phân phối của quan sát tốt, bằng số lượng quan sát tốt ở mỗikhoảng giá trị chia cho tong số lượng quan sát tốt
Dist_Bad;: phần phôi của quan sát xâu, băng sô lượng quan sát xâu ở mỗi
khoảng giá trị chia cho tổng số lượng quan sát xấu
WOE được sử dụng để chuẩn hoá biến Bởi các biến đầu vào sẽ có đơn vị khác
nhau, có biến có gia tri quan sat rất lớn, có biến lại rất nhỏ Điều này ảnh hưởng đếnlúc hồi quy, kết qua các hệ số ước lượng sẽ bị chênh lệch nhau rất nhiều, do đó có théđánh giá vai trò của biến không chính xác WOE sẽ tính số lượng Good, Bad và đưa
về tỷ lệ nên sẽ không có sự khác biệt quá lớn giữa giá trị các biến Bên cạnh đó, cáchthức xử lí biến này có ưu điểm là giúp biến đổi các biến đầu vào liên tục thành nhữngbiến đơn điệu đối với biến phụ thuộc Do đó các hệ số trong phương trình hồi quilogistic sẽ giải thích được đúng thực tế mối quan hệ giữa biến độc lập với biến phụ
thuộc Ngoài ra, WOE còn giúp loại bỏ các gia trị ngoại lai vì chúng đã được nhóm
chung về các khoảng giá trị và được gán giá trị bằng trọng số WOE, nên giá trị của
các quan sát đó sẽ không còn khác biệt so với các những quan sát khác thuộc cùng nhóm.
Tuy nhiên, nó cũng có những hạn chế nhất định Chăng hạn, khi tính toánWOE, rất khó dé biết phân chia bao nhiêu khoảng giá trị là phù hợp hay khi nào thìnên nhóm hoặc tách nhóm Mặt khác, các biến WOE luôn đơn điệu với biến phụ thuộc
nên giữa các biến độc lập luôn có sự tương quan (do cùng tương quan với bién phụ
thuộc) Điều này có thé dẫn đến nguy cơ đa cộng tuyến Ngoài ra, nếu chia quá nhiều
khoảng giá trị thi sẽ dễ xảy ra hiện tượng mô hình bi quá khớp (overfitting).
11195210 — Dinh Thị Quynh Trang 26
Trang 27Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
2.1.2 Các tiêu chí lựa chọn biến cho mô hình
- _ Chỉ số giá trị thông tin:
Một chỉ tiêu được tính toán dựa trên WOE là IV Đây là một tiêu chi dé chọnlọc biến, có kha năng phân biệt giữa Good và Bad của biến IV càng lớn thì càng có
khả năng phân biệt:
IV =} (Dist_Good; - Dist_Bad;) WOE;
IV < 0.02: Biến không có tác dụng trong việc phân loại quan sát tốt, xấu
0.02 <IV < 0.1: biến có khả năng phân loại yếu0.1<IV < 0.3: biến có khả năng phân loại trung bình0.3<IV < 0.5: biến có khả năng phân loại mạnh
‹ ‹Ẳ © @
¢ IV > 0.5: Biến có khả năng phân loại rất mạnh, tuy nhiên trường hopnày cần xem xét lại đề tránh trường hợp biến có mối quan hệ trực tiếp đến biến phụ
thuộc.
- Khia cạnh kinh doanh (Business sense):
Mô hình được xây dung từ bộ dữ liệu thực tế tại ngân hàng Techcombank để
đánh giá khả năng khách hàng trả trước hạn khoản vay mua nhà, nên khía cạnh kinh
doanh là một trong những tiêu chí cần thiết trong lựa chọn biến của mô hình Các biến
được chọn cần phải phù hợp với lý thuyết thực tế (Logical Trend) và có giải thể giải
thích được về mặt kinh doanh Trong trường hợp một biến có IV nhỏ hơn 0.02, nhưngnếu bên đó có ý nghĩa kinh tế và có ảnh hưởng đến biến phụ thuộc thì vẫn nên cânnhắc đề giữ lại
- Ma trận hệ số tương quan:
Hệ sô tương quan là chỉ sô thông kê đo lường mức độ mạnh yêu của môi quan
hệ giữa hai biến số Ta có công thức tính hệ số tương quan 2 biến X và Y:
i=i,— Ä)Œ¡— Y)
" J i=1%i — xy | tei; — Y)?
Với X;, Y; lần lượt là giá trị quan sát thứ i của biến X, Y trong mau,
X,Y lần lượt là giá trị trung bình của biến X, Y
11195210 — Dinh Thi Quỳnh Tran 27
Trang 28Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
Ma trận tương quan thê hiện mức độ tương quan giữa các biến độc lập trong
mô hình Nếu hai biến tương quan cao lớn hơn 0.8 thi dé xảy ra hiện tượng đa cộngtuyến, dẫn đến sai số chuẩn của các hệ số ước lượng lớn, các hệ số không có ý nghĩathống kê, dấu ước lượng các hệ số hồi quy có thé sai và không tin cậy Do đó, nếuhai biến có hệ số tương quan lớn hơn 0.8, biến nào có chỉ số IV hoặc Gini thấp hơnthì loại biến đó
- Hoi quy Logistics theo phương pháp hoi quy từng bước:
Hồi quy Logistic theo phương pháp hồi quy từng bước (Stepwise) là việc xâydựng lặp di lặp lại từng bước cua mô hình Logistic dé lựa chọn các biến độc lập đưavào mô hình Nó sẽ thêm và xóa tự động các đặc điểm trong mỗi bước cho đến khiđạt được sự kết hợp tốt nhất Hồi quy từng bước là kết hợp của hai kỹ thuật hồi quytiến và hồi quy lùi
e Hỏi quy tiễn (Forward): Chạy lần lượt mô hình với từng biến độc lập, rồi chọn ra
một mô hình đặc trưng tốt nhất dựa trên sức mạnh dự đoán riêng của từng biến;sau đó thêm các biến khác vào mô hình này dé tao ra các mô hình gồm hai, babiến tốt nhất, cho đến khi không còn biến nào có ý nghĩa thống kê dé đưa vàohoặc mô hình không cải thiện hơn thì dừng lại (được đánh giá thông qua kiểmđịnh F, p-value, hoặc chỉ số Gini ) Phương pháp này có thể kém hiệu quả nếu
có quá nhiều đầu vào hoặc giữa các biến có độ tương quan cao cũng như có thể
bỏ sót biến.
e Hồi quy lùi (Backward): Bắt đầu với tất cả các biến độc lập trong mô hình và loại
bỏ tuần tự các biến được coi là ít có ý nghĩa nhất, dựa trên các đặc điểm khác
trong mô hình, cho đến khi tất cả các biến còn lại có giá trị p - value dưới một
mức đáng kề hoặc dựa trên một số thước đo khác về ý nghĩa đa biến Phương pháp
này cũng hạn chê khi mô hình có quá nhiêu biên dau vào.
Do đó, phương pháp hồi quy từng bước được cho là hiệu quả hơn khi kết hợp
hai phương pháp trên Bước đầu của phương pháp này chính là hai bước hồi quy tiến
dé đưa biến vào kết hợp với một bước hồi quy lùi dé loại biến Sau đó sẽ là kết hợpmột bước hồi quy tiễn và một bước hồi quy lùi Cứ như vậy cho đến khi chon đượccách kết hợp tốt nhất của các biến thì đừng lại
-P— value:
Với mô hình logistic dạng tuyến tính:
11195210 — Dinh Thị Quynh Trang 28
Trang 29Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
In (C—) 1-p 0 1⁄11 2+2 pp= Bo + Brxr + Box2 + + Byx
Ta có cặp giả thuyết:
Hạ: B¡ = 0 (Hệ số ước lượng của X; không có ý nghĩa thống kê)
voii=Lp
H,: 8; #0 (Hệ số ước lượng của X; có ý nghĩa thống kê)
Nếu p-value của kiểm định lớn hơn 0.05 thì chưa bác bỏ Hạ, với độ tin cậy95%, hệ số không có ý nghĩa thống kê, hay biến Xp không có tác động đến biến phụ
thuộc và ngược lại Do đó, trong kết quả hồi quy, nếu một biến có p-value cao thì
không nên giữ lại biến đó
- Dau hệ số hồi quy:
Ta có khi xác suất P(Y=1) tăng lên, đồng nghĩa với việc số lượng quan sát xấu
cũng sẽ tăng Mặt khác, theo công thức WOE, khi số lượng quan sát xấu tăng, thìWOE sẽ giảm Do đó, với thuật toán in ra xác suất của P(Y =1) và các giá trị đầu vàođược gán bằng giá trị WOE của mỗi khoảng biến, thì kết quả hồi quy của mô hình
Logistic dâu hệ sô của các biên độc lập đêu phải âm.
2.2 MÔ HÌNH HOI QUY LOGISTIC
2.2.1 Mô hình hồi quy Logistic
Logistic là một thuật toán loại Classification Nếu như mô hình hồi quy tuyếntính trả về kết quả là một đại lượng liên tục như chi phí khám chữa bệnh, giá nhà sau khi biết các thông tin liên quan; thì hồi quy Logistic hướng đến việc dự báo xácsuất biến Y đạt giá tri 0 hoặc 1 - biểu thị cho một sự kiện được dự đoán có xảy ra hay
không; dựa trên mối quan hệ giữa nó với các biến độc lập X.
Mô hình Logistic, sẽ chạy kết quả thông qua một hàm phi tuyến được gọi là hàmlogistic dé tạo ra đầu ra là một xác suất p có giá trị từ 0 đến 1 Với z là hàm nhập vào,
ta CÓ:
11195210 — Dinh Thị Quynh Trang 29
Trang 30Chuyên dé tốt nghiệp chuyên ngành Toán tải chính
Ta có: Odds = > là ti sô của xác suât một sự kiện sé xảy ra trên cho xác suat
`
1-p
tỷ số odds làm cho mô hình logit trở thành tuyến tính trong các tham số
không xảy ra Ham logarit của giá trị Odds - In ( ) được gọi là ham logit Log của
Ham này sẽ chuyền đổi giá trị xác suất trong khoảng (0; 1] thành những giá trị
số thực năm trong khoảng (- œ, + 0) Cu thể, gia trị cua ham logit sẽ tiến đến + œ khixác suất p > 1, và tiến đến — œ khi p > 0
- Cong thức:
ePotBixX1t B2ox2t-+BpxXp Odds
PY, = 1) = 1+ ePotBix1t B2x2t-+BpXp = 1+ Odds
- COng thức dang chuyền đổi thành hồi quy tuyến tính:
In () = By + qxi + Box, + + ByXp = In (Odds(Y=1))
Ta sẽ thực hiện hồi quy mô hình Logistic với các biến đầu vào được gan bằng
giá trị WOE của mỗi nhóm được tạo ở trên.
Dù mô hình Logit là tuyến tính, nhưng nó không thé được ước lượng theo
phương pháp bình phương nhỏ nhất (OLS) Nếu đưa trực tiếp gia tri xác suat bang 1
và 0 vào mô hình, thì các biểu thức In(0/1) và In(1/0) là không xác định Vậy nên, các
hệ số của mô hình Logistic được ước lượng phải dùng phương pháp ước lượng khác,
đó là phương pháp Ước lượng hợp lý tối đa (Maximum Likehood Estimation, viết tắt
là MLE).
2.2.2 Các tiêu chí đánh giá mô hình
2.2.2.1 Độ chính xác
Độ chính xác (Accuaracy) đo lường tỷ lệ các trường hợp được dự báo đúng
trên tổng số các trường hợp là bao nhiêu, dé đánh giá hiệu qua dự báo của mô hìnhtrên một bộ dữ liệu Độ chính xác càng cao thì mô hình cảng chuẩn xác
Với mức xác suất dự báo nằm trong khoảng 0 đến I, ta có thê lựa chọn ngưỡngcut-off Thông thường ngưỡng cut-off là 0,5, khi đó các quan sát có xác suất lớn honhoặc băng 0,5 sẽ được dự đoán là quan sát xấu (Y = 1), các quan sát có xác suất nhỏhơn 0,5 sẽ được dự đoán là quan sát tốt (Y = 0)
Trang 31Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
Bảng 2.1 Ma trận nhầm lẫn
Thực tế (1) Thực tế (0)
Dự đoán (1) TP FP
Dự đoán (0) FN TN
Ta có ma trận nhằm lẫn (Confusion matrix) ở bảng 2.1 với:
True Positive (TP): sô lượng quan sát dự đoán là xấu và thực tế đúng là xấu
True Negative (TN): số lượng quan sát dự đoán là tốt và thực tế đúng là tốt
False Positive (FP): số lượng quan sát dự đoán là xấu nhưng thực tế là tốt
False Negative (FN): số lượng quan sát dự đoán là tốt nhưng thực tế là xấu
Độ chính xác được tính theo công thức:
TP + TN
Độ chính xác = —msszzxax
Tổng số lượng quan sat mau
Tuy nhiên hạn chế cua chỉ tiêu này là đo lường trên tất cả các nhãn mà khôngquan tâm đến độ chính xác trên từng nhãn tốt, xấu Do đó khi tầm quan trọng của việc
dự báo các nhãn không còn như nhau, nó không còn phủ hợp dé đánh giá Độ chính
xác chỉ cho biết được bao nhiêu % lượng đữ liệu được phân loại đúng mà không chỉ
ra được cụ thể mỗi loại được phân loại như thế nào, lớp nào được phân loại đúng
nhiều nhất hay đữ liệu của lớp nào thường bị phân loại nhằm nhất vào các lớp khác.2.2.2.2 Đường cong ROC và chỉ số AUC
Đường cong ROC (Receiver operating characteristic) cho biết sức mạnh phânloại của một model ROC thé hiện mối quan hệ giữa FPR - tỷ lệ dự báo nhằm nhómkhách hàng tốt thành xấu và TPR - tỷ lệ dự đoán chính xác nhóm khách hàng xấu Khi
đồ thị của ROC càng cong và tiệm cận với đường viền trên của hình chữ nhật thì môhình phân loại càng tốt
11195210 — Dinh Thị Quynh Trang 31
Trang 32Chuyên đê tốt nghiệp chuyên ngành Toán tài chỉnh
False Positive Rate
Hình 2.1 Đồ thị biểu diễn đường cong ROC
Chỉ số AUC (Area Under the ROC Curve) đo lường phần diện tích nằm dưới đường cong ROC, cho biết khả năng phân loại của các hợp đồng tốt, xấu của mô hình
hồi qui logistic là mạnh hay yếu AUC € [0,1], giá trị của nó càng gan 1 thì mô hình
càng tốt.
¢ AUC>0.§: Mô hình tốt
® 0.7< AUC<0.8: Mô hình trung bình
@ AUC <0.7: Mô hình không hiệu qua
Trang 33Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
Hình 2.2 Đồ thị biểu diễn Gini
Ở đồ thị trên, trục hoành biểu diễn phần trăm tích lũy của số lượng quan sátkhách hàng tốt và trục tung biêu diễn phan trăm tích ly của số lượng quan sát kháchhàng xấu được thống kê từ mẫu tương ứng Các quan sát sẽ được chia ra thành các
khoảng giá tri và sap xêp theo xác suât dự đoán giảm dan.
Trong đó, đường thang tạo với trục hoành một góc 45 ° biêu diễn mô hình ngẫu
nhiên ngẫu nhiên Ở đường này, tỷ lệ Bad lấy được ở mỗi khoảng giá trị là như nhau
va phân phối Good bang phân phối Bad ở mỗi khoảng giá trị Lúc này, mô hình không
có nhiều ý nghĩa, bởi vì dang kỳ vọng số lượng % Bad giảm dan khi xác suất Y = 1
giảm dan
Đường bao gồm một đường thăng đi lên và một đường đi ngang biểu diễn môhình hoàn hảo Đường này thể hiện những % quan sát đầu tiên lấy ra từ mẫu đều làkhách hàng xấu (đường đi lên), đến khi hết khách hàng xấu rồi chỉ lấy được kháchhàng tốt (đường năm ngang)
Các mô hình được xây dựng thường có khả năng phân biệt tốt hơn mô hình ngẫunhiên và kém hơn mô hình hoàn hảo, thường được biéu diễn qua đường nằm giữa hai
đường phía trên.
Giá trị Gini năm trong khoảng từ 0% đến 100% Hệ số Gini của mô hình càngcao (càng gan 100%), tức có thé gom được nhiều quan sát khách hàng xấu nhất có thé
vào các dai điểm được cho là rủi ro cao, do đó mô hình có độ phân biệt càng tốt.
Ta có:
e Gini >60%: Mô hình tốt
@ 40% < Gini < 60%: Mô hình trung bình
@ Gini < 40%: Mô hình không hiệu quả
Lưu ý, Gini của một biến chính là Gini của mô hình hồi quy với biến độc lập
duy nhất là biến đó
2.2.2.4 Chỉ số PSI và CSI
Trang 34Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
e Chí số PSI
Mô hình theo thời gian có thé bị ảnh hưởng bởi những thay đổi kinh tế, chính
sách Nếu các đầu vào của mô hình bị thay đổi đáng kể, thì sẽ không còn hợp lý nữa
khi sử dụng mô hình này.
Chỉ số PSI (Population Stability Index) đo lường sự ôn định mô hình Cụ thé,
dựa trên thẻ điểm được in ra, PSI đo lường sự thay đổi phân bố giữa tập Train và tập
Validation, tập Train va tap Test.
Với D; (%) là tỷ lệ của sỐ quan sát trong xếp hang i đối với tập dữ liệu Train,
V; (%) là tỷ lệ của số quan sát trong xếp hang i đối với tập dir liệu
Validation/Test
D;
PSI = YL,(D; — V,) + In(24)
L
¢ PSI<0.1: không có sự thay déi đáng ké giữa 2 tập, mô hình ôn định
¢ 0.1 < PSI < 0.25: Có sự thay đổi, cần xem xét lại dé xác định nguồn
gốc của sự thay đổi
¢ PSI>0.25: có sự thay đối lớn giữa 2 tập, không nên dùng mô hình
e Chisé CSI
CSI (Characteristic Stability Index) là chi số đo lường ôn định từng biến Khihiệu suất của mô hình xấu đi, việc kiểm tra sự thay đổi trong phân phối của các biếnđộc lập có thể giúp xác định các nguyên nhân có thể xảy ra CSI cho biết biến nàodang gây ra sự thay đổi chủ yếu trong phân bồ tông thé CSI có công thức và ngưỡngđánh gia tương tự PSI Sự khác biệt duy nhất là thay vì dựa vào thẻ điểm cuối cùng,
quyết định được đưa ra dựa trên bảng phân tích đơn biến khi chia khoảng giá trị của
CSI = Ni (D; Thi (D; — Vi) + In (7)— Vị) * In( —
¢ CSI <0.1: biến có sự ôn định
11195210 — Dinh Thị Quynh Trang 34
Trang 35Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
¢ 0.1 <CSI < 0.25: biến biến động vừa
¢ CSI> 0.25: biến biến động mạnh, có thé cân nhắc không dùng biến này
2.3 THẺ DIEM VA VAI TRÒ CUA THẺ DIEM
Sau khi có được xác suất dự đoán hành vi trả trước hạn của từng khách hàng,
ta sẽ xây dựng một thẻ điểm Ở dạng đơn giản nhất, thẻ điểm được thống kê về mặt
số lượng và tỷ lệ quan sát tốt, xấu theo những khoảng điểm; dé có thể phân loại kháchhàng Khoảng điểm có thé được quy đổi theo nhiều cách, băng xác suất dự báo nhânvới 1000, tổng điểm của các đặc tính Một khách hàng sẽ được xem xét là tốt hoặcxấu dựa trên tong điểm đó “Xấu” thường được định nghĩa là các hoạt động tiêu cực
gây rủi ro và thiệt hại cho ngân hàng như vỡ nợ, gian lận, rời bỏ Những xác suất
hoặc điểm số này, cùng với những cân nhắc kinh doanh khác, sau đó được sử dụnglàm cơ sở đề ra quyết định
Chăng hạn, ngân hàng có thê sử dụng thông tin về điểm rủi ro, kết hợp với cácyếu tô khác như ty lệ chấp thuận dự kiến và tiềm năng về lợi nhuận ở mỗi mức độ rủi
ro dé phát triển các chiến lược ứng dụng mới nhằm tối đa hóa lợi nhuận và giảm thiểu
nợ xấu Với những khách hàng nộp đơn có rủi ro cao, và cách quy đổi điểm càng caothì càng tốt, ngân hàng có thể quyết định từ chối tat cả những người nộp don đạt điểm
dưới 200 hoặc tính lãi suất cao hơn đối với khoản vay đo rủi ro lớn hơn mà họ có.
Ngược lại, những khách hàng đạt điểm cao có thể được hưởng mức giá ưu đãi và hạn
mức tín dụng cao hơn, được nâng cấp lên các sản phâm cao cấp, chăng hạn như thẻ
vàng hoặc bach kim
Thẻ điểm cũng có thể giúp thiết lập các chính sách thấm định Cu thé, mộtngười nộp đơn đạt điểm rất cao hoặc rất thấp có thé bi từ chối hoặc chấp thuận hoàntoàn mà không cần thu thập thêm thông tin về bất động sản hay xác minh thu nhập
Do đó, làm giảm thời gian quay vòng để xử lý các hồ sơ khách hàng thông qua việc
ra quyết định tự động Thậm chí, thẻ điểm còn hợp lý hóa quy trình ra quyết định, ví
dụ, các hồ sơ có rủi ro cao hơn sẽ được giao cho các nhân viên có kinh nghiệm hơn
dé được giám sát chặt chẽ, trong khi các ứng dụng rủi ro thấp được giao cho các nhânviên cấp dưới
Trên cơ sở đó, kết hợp với kiến thức kinh doanh, thẻ điểm giúp ngân hàng đưa
ra những quyết định về mặt chính sách, phòng ngừa rủi ro cũng như xác định nhómkhách hàng mục tiêu và có chiến lược phù hợp cho những nhóm khách hàng này Với
Trang 36Chuyên dé tốt nghiệp chuyên ngành Toán tải chính
ưu điểm là dé theo dõi, dé giải thích (Ly do từ chối, điểm thấp hoặc điểm cao có thé
được giải thích cho khách hàng, cơ quan quan ly và các nhân viên khác), có tính minh
bạch và có thé tính toán được băng những công cụ đơn giản, thẻ điểm là một công cụhữu hiệu dé quản lý rủi ro
Trang 37Chuyên dé tốt nghiệp chuyên ngành Toán tải chính
KET LUẬN CHUONG 2
Chương nay đã trình bay phương pháp nghiên cứu trong dé tài đánh giá khảnăng khách hàng trả trước hạn khoản vay mua nhà Với những ưu điểm như giúp
chuẩn hoá biến, loại bỏ các giá trị ngoại lai, giúp biến đổi các biến đầu vào liên tục
thành những biến đơn điệu đối với biến phụ thuộc, WOE được sử dụng dé xử lí biến.Bên cạnh đó, cần phải lựa chọn biến dé đưa vào mô hình cuối cùng, thông qua việc
sử dụng chỉ số IV được tính toán từ WOE, ma trận hệ số tương quan, hồi quy Logistic
bằng phương pháp hồi quy từng bước
Chuyên đề sử dụng mô hình hồi quy Logistic với biến đầu vào được gán bằnggiá trị WOE của mỗi nhóm được tạo ở trên dé dự đoán Logistic chạy kết qua thôngqua ham sigmoid dé tạo ra đầu ra là một xác suất p có giá trị từ 0 đến 1 Với odds là
tỷ số của xác suất một sự kiện sẽ xảy ra trên cho xác suất không xảy ra, thì log của tỷ
số odds sẽ làm cho hàm logit (logarit của giá trị Odds) trở thành tuyến tính trong cáctham số Điều này giúp dễ giải thích ảnh hưởng gián tiếp của biến độc lập lên biến
mục tiêu.
Chương này cũng trình bày về các tiêu chí đánh giá mô hình như Độ chính xác,
Gini, AUC, PSI , cho biết sức mạnh phân loại quan sát tốt, xấu và khả năng áp dụng
trong tương lai của mô hình Cuối cùng, định nghĩa về thẻ điểm và vai trò của thẻ
điểm được nêu ra, cho thấy đây là một công cụ hữu hiệu đề quản lý rủi ro.
11195210 — Dinh Thị Quynh Trang 37