1. Trang chủ
  2. » Luận Văn - Báo Cáo

Chuyên đề thực tập: Ứng dụng mô hình logistic trong xếp hạng tín dụng đánh giá rủi ro tín dụng khách hàng cá nhân tại ngân hàng tmcp kỹ thương Việt Nam

57 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Trang 1

TRUONG DAI HỌC KINH TE QUOC DAN KHOA TOAN KINH TE

Dé tai:

UNG DUNG MO HINH LOGISTIC TRONG XEP HANG TIN

DUNG DANH GIA RUI RO TIN DUNG KHACH HANG CA NHAN TAI NGAN HANG TMCP KY THUONG VIET NAM

Sinh viên thực hiện: Nguyễn Khánh Ly

HÀ NỘI - 08/2022

Trang 2

Dé tai:

UNG DUNG MO HINH LOGISTIC TRONG XEP HANG TIN

DUNG DANH GIA RUI RO TIN DUNG KHACH HANG CA NHAN TAI NGAN HANG TMCP KY THUONG VIET NAM

Giang viên hướng dan: Hoang Đức Mạnh Sinh viên thực hiện : Nguyễn Khánh Ly

Ngành : Toán Kinh tế

Lớp : Toán Kinh tế 61

Hà Nội, 08/2022

Trang 3

Chuyên đề thực tập chuyên ngành Toán Tài chính

LỜI CAM ĐOAN

Tôi xin cam đoan đây là nghiên cứu được thực hiện bởi riêng tôi Bộ dữ liệu

được sử dụng trong xây dựng mô hình, kết quả được đưa ra trong trong bài chuyên dé dưới đây là trung thực và chưa từng được tác giả nào công bố trong bat kì nghiên

cứu khác.

Hà Nội, ngày 25 tháng 11 năm 2022

Sinh viên thực hiện

Nguyễn Khánh Ly

Trang 4

Chuyên dé thực tập chuyên ngành Toán Tài chính

LỜI CẢM ƠN

Em xin chân thành cảm ơn Ban giám đốc Ngân hàng cùng các anh chị Phòng Mô hình và phân tích rủi ro tín dụng tại Techcombank đã tạo điều kiện và hướng dẫn em

trong quá trình thực tập, dé em có thé tìm hiểu về một số kiến thức liên quan đến xây

dựng mô hình.

Em cũng xin chân thành cảm ơn thầy giáo TS Hoàng Đức Mạnh đã giúp đỡ và hướng dẫn em hoàn thành chuyên đề này Em cũng xin cảm ơn sâu sắc tới các thầy cô giáo trong khoa Toán Kinh Tế đã dạy dỗ và chỉ bảo em trong quá trình học tập tại trường.

11193221 — Nguyễn Khánh Ly

Trang 5

Chuyên dé thực tập chuyên ngành Toán Tài chính

MỤC LỤC

LỜI CAM ĐOAN LỜI CẢM ƠN

DANH MỤC TỪ VIET TAT DANH MỤC BANG BIEU

DANH MỤC HÌNH VE

MỞ ĐẦU %9 E141 EE77140 EE72130 E972141 EAr2idpeorrrdetie 1 CHƯƠNG 1: CO SỞ LÝ LUẬN VE XÉP HẠNG TÍN DỤNG TẠI NGÂN HANG

VA TONG QUAN NGHIÊN CỨUU -2°-es°©©EE+esEEEExAdeetrvxerorrrdeeree 3

1.1 Tống quan về xếp hang tín dung cc.cccccssssssessescesssssseseescsssssseeseessesssssseseessessesseess 3

i50 3

1.1.3 Đối tượng ¿5c 5c TEExỀE1211211211211 1111111111111 11 1111 111gr 4 1.1.4 Tầm quan trọng của xếp hạng tín dụng cá nhân -. 2- ¿5552 4 1.2 Các yếu tố ảnh hưởng đến xếp hạng tín dụng của khách hang cá nhân 6

1.2.1 Thông tin cá nhân - ¿<< E111 SE HT HH HH HH 6I2 šÈ 09v 6n Ầ 7

1.2.3 Hanh vi sử dụng tin dụng của các nhân - + Sc + s+xseseerrssreerres 7

1.2.4 Các thông tin liên quan đến viễn thông - 2-2 2s x+£++£+2£szE+zxzez 7 1.3 Các phương pháp xếp hạng tín dụng s-s- s-s<ssessesss=ssssessezsersssse 8

1.3.1 Phương pháp chuyÊn Ø1a - - s13 13112339111 11911 11 1 ng ng ngư 8

1.3.2 Phương pháp thống kê -2- 22 +¿©2++E+2EE+2EE+EEEEEEESEEvSEEerEeerkrsrkerrxee 9

1.4 Tổng quan về các nghiên cứu sử dụng hồi quy Logistic dé đánh giá rủi ro tin

dụng của khách hàng << << 9 9 9 0.0 0 00004 06000400009 800096 10

KET LUẬN CHƯNG -. <2 2s ©ssEss£SsEEseEseEssetserserserssrtsrrszrssrssese 12

CHƯƠNG 2: QUY TRÌNH NGHIÊN CỨU TRONG XÉP HẠNG TÍN DỤNG TẠI e8: 13

2.1 Mô hình Logistic 0 5G (G5 9 9 99.59 9.9 9 00.00 :900800809 6804050 13

QLD su 13

11193221 — Nguyễn Khánh Ly

Trang 6

Chuyên dé thực tập chuyên ngành Toán Tài chính

2.1.2 Ưu điểm, nhược điểm -c-: 22vcctttErrrrrttrttirrrrttirrrrririrrriirrrre 14

2.2 Các phương pháp xử lý biến và ước lượng hệ số trong mô hình 15

2.2.1 XU ly vì i0) 15

2.2.2 Cách biến đồi dữ liệu 55cc tt tre l6

2.2.3 Phương pháp ước lượng hợp lý cực đại c- «cc«csscssessssssee 18

2.3 Các chỉ tiêu lựa chọn biến cho mô hình -2- 2s ssssessesssessessess 18 2.4.1 Ly thuyét kinh 0n“ 2 18 2.4.2 Chỉ số Information Value c c.sccsscescsssessessessessesseessessessesseessessesseesessesseesees 19

2.4.3 Ma y0) i50 n 19

2.4.4 Hồi quy Logistic theo Stepwise c.ccccsessesssessessessessessessessssssessessessseeseesees 19 2.4.5 Hồi quy Logistic và dựa vào trị số P-value ccscccssecsseessesssessseestesseesseessees 20 2.4 Các tiêu chí để đánh giá m6 hình - - << 5° 5< se se sessessessesseseesessesse 21

2.5.1 Hệ 86 Gini ¿2v 22 v22 t2 1 2T T.rirrireiei 21

2.5.2 Chỉ số PSI ssceesccsssessscsssseescesssneccesssnecessnnecesssneesssnnneseesunseceesnnesesssnneseessneess 22

KET LUẬN CHƯNG 2 << 5° 5£ s9 ESsESSESSESSESE se EEESE25E3503505559 52525256 23 CHƯƠNG 3: KET QUÁ THUC NGHIỆM Error! Bookmark not defined.

3.1 Thực trạng về cho vay khách hàng cá nhân tại Ngân hàng TMCP Kỹ thương Việt Nam (từ 2014 đến 2019) - 2s se se ©ss©ssEEseEseEssExseEserserssetssersersersssse 24

3.2 Xây dựng mô hình xếp hạng tín dụng khách hàng cá nhân - 25

3.2.1 Dit LGU Str QUIN 25

3.2.2 Tông quan các bước xây dung mô hình xếp hạng tin dung tại ngân hang 26 3.2.3 Ap dụng vào dit liệu thực tế và phân tích kết quả - 5 5-5226

KET LUẬN CHƯNG 3 s- << se se EssESsEEsEESEssExserserseresesserserssrsssse 40

CHUONG 4: KET LUẬN VÀ KHUYEN NGHỊ, -5- 5° ss©ssccsecssesses 41

Trang 7

Chuyên dé thực tập chuyên ngành Toán Tài chính

DANH MỤC TỪ VIET TAT

NHTW Ngân hàng Trung ương

NHTM Ngân hang thương mai

XHTD Xép hang tin dung

Techcombank Ngân hàng TMCP Kỹ thương Việt Nam

VCB Ngân hàng TMCP Ngoại thương Việt Nam

DANH MỤC BANG BIEU

Bảng 2.1: Các khoảng IV để xét sức mạnh ảnh hưởng của các biến

11193221 — Nguyễn Khánh Ly

Trang 8

Chuyên dé thực tập chuyên ngành Toán Tài chính

Bảng 2.2: Các ngưỡng đề xét sự ôn định của mô hình -¿- ¿©2522 22 Bang 3.1: Thống kê mô tả một số biến 2-2 2 2 +E+E+EE+EE£EE+E£E£ErEeExerxrreee 28 Bang 3.2: Các biến còn lại sau khi hồi quy theo Stepwise - ¿52c sccxsccee 29 Bang 3.3: Các nhóm giá trị của biến “non lending bal_25” -:- 55+: 30 Bảng 3.4: Các nhóm giá tri của biến “non _lending bal 19” -5- 3l Bang 3.5: Các nhóm giá trị của biến “non _lending bal 30” - 32 Bảng 3.6: Các nhóm giá trị của biến “trans channel_withdraw_9” 33 Hình 3.4: Xu thé của biến “trans_channel_withdraw_9” cccccccssssssssssssesesescscscsceseeesesene 33 Bang 3.7: Các nhóm giá trị của biến “pcb_produet _ 1 Í” s z+sz+s+zs+zs+zs+ceez 34 Bang 3.8: Các nhóm giá trị của biến “trans channel 33” - sec: 35 Bảng 3.9: Các nhóm giá trị của biến “peb_ produet_ 12” -z-sz+-sz5-sze- 36

Bảng 3.10: Kết quả hồi quy LogisfiC 2-22-5255 2S22SE‡EE‡EE2E2EEEEEEEEEEEErEkrrkerrrres 37

Bảng 3.11: Bảng XHTD với KHCN dựa trên xác suất được dự báo từ mô hình 37

Bang 3.12: Gini của mô hình trên 3 tập Train — Validation — Tesf - + 38Bang 3.13: PSI giữa Train — Validation và Train — 'Ï€Sf . 5+5 << s++sesssess 39

DANH MỤC HÌNH VE

11193221 — Nguyễn Khánh Ly

Trang 9

Chuyên dé thực tập chuyên ngành Toán Tài chính

Hình 2.1: Biểu diễn Gini của mô hình -225c+cccvvcrrtrEktrrrrtrttrrrrrtrirrrrrrieg 21

Hình 3.1: Xu thế của biến “non lending bal 25” -22©52+c+£x+cserserssreee 30

Hình 3.2: Xu thế của biến “non lending bal 19” -252+52+s+£E+£sererssreee 31 Hình 3.3: Xu thế của biến “non lending bal 30” - 2©52+5+secse£ersseeez 32 Hình 3.5: Xu thế của biến “peb_produet _ Ï 1”” ¿ ¿-s+2++2x++zx++zxezxeerxezrxzrxees 34 Hình 3.6: Xu thé của biến “trans_channel,_ 33”” - ¿+ + s+k+E+Et+E+E+EEE+EvErtzxerereree 35 Hình 3.7: Xu thé của biến “peb_produet_ Í2”” ¿ s¿s2++2x++cx+2x+tzx+erxzrxerxecree 36 Hình 3.8: Hình biểu diễn Gini trên tập Train - 2-2552 2+£E+EE+EEtEEzEeerxerxeres 39 Hình 3.9: Hình biểu diễn Gini trên tập Validation 2- 2-52 2+c2+EczEecxerxerxereee 38 Hình 3.10: Hình biểu diễn Gini trên tập Test ¿- ¿5c 5 SsSE+EE2E£2E££Ee£EeExerxerxee 38

11193221 — Nguyễn Khánh Ly

Trang 10

Chuyên đề thực tập chuyên ngành Toán Tài chính

MỞ ĐẦU

a Lí do chọn đề tài

Hiện nay, hệ thống ngân hàng từ NHTW đến các NHTM là một mắt xích vô cùng quan trọng trong sự phát triển nền kinh tế của mỗi quốc gia, việc thiếu sót gây sai lệch trong quản trị rủi ro sẽ gây ra hậu quả nghiêm trọng và tác động tiêu cực đến hoạt động của các ngân hàng Đây có thé là một phần nguyên ngân gay ra sự suy giảm nền kinh tế

của quôc ø1a.

Trong các NHTM hiện nay, tín dụng là loại tài sản chiếm ty trọng lớn nhất (chiếm khoảng 50%-70% tổng tài sản), phản ánh hoạt động đặc trưng của ngân hàng Tín dung

luôn được đánh giá là một trong những hoạt động phức tạp của ngân hàng Chính vì vậy,

rủi ro từ hoạt động tín dụng là rất lớn và đến từ nhiều nguyên nhân khác nhau; chủ yếu

là do KH không có khả năng trả nợ hoặc trả nợ quá hạn (quá thời gian quy định tại mỗi

ngân hàng/tô chức tin dụng) Và nếu tốn thất xảy ra sẽ làm giảm mức lợi nhuận dự tính và có thé dan đến một khoản lỗ lớn hoặc nghiêm trọng hơn là phá sản cho ngân hàng.

Một bài toán đặt ra trong NHTM là khi KHCN nộp hồ sơ vay vốn tại ngân hàng thì làm sao để dự đoán được khả năng trả nợ của KH giúp bộ phận có liên quan đưa ra các chính sách cho vay phù hợp với từng nhóm KH Hầu hết các NHTM giải quyết bài toán này bằng cách tạo ra một bảng XHTD với KHCN từ việc xây dựng mô hình dựa trên các thông tin có thể thu thập được của KH và đưa ra một ngưỡng nào đó tùy thuộc vào chiến lược của ngân hàng mà hạn chế các khoản vay không thể trả hoặc trả quá hạn

của KH.

b Đối tượng và phạm vi nghiên cứu

e Đối tượng nghiên cứu: hệ thống XHTD của KHCN vay vốn tại Techcombank.

e Phạm vi nghiên cứu: một mẫu 89,592 quan sát thuộc danh mục KHCN tại

Techcombank từ 2014 đến 2019.

Trang 11

Chuyên dé thực tập chuyên ngành Toán Tài chính

d Phương pháp nghiên cứu: Bài chuyên đề áp dụng phương pháp phân tích định lượng, các thống kê mô tả và mô hình Logistic để phân tích dữ liệu.

Trang 12

Chuyên dé thực tập chuyên ngành Toán Tài chính

CHƯƠNG 1

CƠ SỞ LÝ LUẬN VỀ XÉP HẠNG TÍN DỤNG TẠI NGÂN HÀNG VÀ TỎNG QUAN NGHIÊN CỨU

Chương 1 đề cập đến các vấn đề liên quan đến XHTD trong ngân hàng Chúng ta sẽ tìm hiểu XHTD là gì, đối tượng trong XHTD, các phương pháp xây dựng mô hình XHTD và mục đích cũng như tầm quan trọng của XHTD đối với cả NHTM và KHCN Bên cạnh đó, chương này cũng nêu ra một số nghiên cứu trước đây về sử dụng hồi quy Logistic để xây dựng mô hình dự báo xác suất không trả được nợ của KH.

1.1 Tổng quan về xếp hạng tín dụng

1.1.1 Khái niệm

Ngày nay, dự báo rủi ro tài chính ngày càng phát triển mạnh mẽ tại các doanh nghiệp Rui ro tài chính gan liền với các bài toán về quan lý danh mục đầu tư, định giá quyền chon, và các công cụ tài chính khác XHTD cũng là một trong các hoạt động về quản lý rủi ro tài chính, đặc biệt là được ứng dụng nhiều trong các NHTM.

XHTD là sự đánh giá rủi ro tín dụng của ngân hàng với KH vay vốn (có thé là cá nhân, doanh nghiệp, ) từ các báo cáo về thông tin của họ; dự đoán khả năng trả nợ của khách hàng và dự báo ngầm về khả năng không trả được nợ của họ Từ kết quả của bảng XHTD, các tổ chức tin dụng có thé ra quyết định trong việc chấp nhận hay từ chối cho

KH vay.

Đề tài này tập trung phân tích và nghiên cứu hệ thống XHTD dành cho nhóm

1.1.2 Mục dich

XHTD giúp ngân hàng hay các tổ chức tin dụng có thể tránh được rủi ro vỡ nợ/phá sản khi quyết định cho một đối tượng nào đó vay tín dụng Khi nhận được hồ sơ vay

vốn của KH, ngân hàng/các tô chức tín dụng cần dựa trên những thông tin của những

3

Trang 13

Chuyên dé thực tập chuyên ngành Toán Tài chính

KH đó dé tiến hành phân tích và xây dựng mô hình dự báo khả năng trả nợ của họ Từ

đó xây dựng một bảng XHTD của những KH đó dé ngân hàng có thé đưa ra được quyết

định cho vay đối với họ 1.1.3 Đối tượng

XHTD ca | +) Hinh thức xếp hạng được áp dụng đối với các KHCN tham gia

nhân vào hoạt động tín dụng của các ngân hàng thương mại.

+) XHTD cá nhân dựa trên việc phân tích các thông tin, đặc điểm

của mỗi cá nhân (tuổi tác, trình độ học vấn, lịch sử tín dung, )

XHTD | +) Hình thức xếp hạng được áp dụng đối với các KHDN.

nghiệp +) Việc XHTD doanh nghiệp dựa trên các báo cáo các cáo tài chính,

báo các kinh doanh, của doanh nghiệp.

XHTD quôc | +) Hình thức xếp hạng dùng đề đánh giá mức độ tín nhiệm của mỗi gia quốc gia Quốc gia được đánh giá càng cao thì dòng vốn đầu tư nước

ngoài sẽ càng lớn.

+) Việc XHTD dựa trên các chỉ số phát triển chung như: chỉ số phát

triên của các ngành, toc độ tăng trưởng của quôc gia,

XHTD các | +) Hình thức xếp hạng được áp dụng chủ yếu đối với các loại trái

công cụ tài | phiếu: trái phiếu công ty, trái phiếu chính phủ,

chính , ,

+) Việc XHTD dựa trên một sô tiêu chí: lãi suât, mệnh giá, kì han,

1.1.4 Tâm quan trọng của xếp hạng tín dụng cá nhân

1.1.4.1 Đối với các ngân hàng thương mại

XHTD cá nhân của NHTM nhằm cung cấp một bảng XHTD của KHCN tại ngân hang dựa trên mô hình dự đoán khả năng không trả được nợ của KHCN dé quyết định

cho vay mà phù hợp với khâu vi rủ ro của ngân hàng Do đó, đê hiêu được tâm quan

Trang 14

Chuyên dé thực tập chuyên ngành Toán Tài chính

trọng của XHTD thì chúng ta cần sơ lược về RRTD và thiệt hại mà nó gây ra cho mỗi

RRTD là khả năng không chi trả được no/ trả nợ quá thời han được quy định của

KH vay vốn tại các NHTM/ các tổ chức tín dụng Rủi ro xảy ra khi KH vay vốn nhưng họ dùng sai mục đích gây thua lỗ hoặc năng lực tài chính của KH đi vay ở mức thấp dẫn đến họ không có khả năng trả nợ hay trả nợ quá hạn so với mức quy định của mỗi

Bên cạnh đó, các NHTM ra đời dé giải quyết các van dé liên quan đến nhu cầu luân chuyền vốn, phát triển sản xuất kinh doanh hay tiêu dùng của các doanh nghiệp, cá

nhân, NHTM là một trung gian tài chính, là doanh nghiệp kinh doanh hàng hóa đặc

biệt: đó là tiền tệ; NHTM sẽ huy động tiền từ thị trường sau đó cho các tô chức, cá nhân vay với lãi suất cao hơn lãi suất huy động để sinh lợi nhuận Nếu trong trường hợp NHTM không huy động đủ vốn dé đáp ứng nhu cầu của nền kinh tế hay huy động được đủ vốn nhưng số lượng KH muốn vay bị hạn chế, thì ngân hàng sẽ hoạt động không hiệu

quả và dẫn đến rủi ro mang tính chủ quan của NHTM.

RRTD xảy ra gây ảnh hưởng lớn tới hoạt động kinh doanh của NHTM Khi NHTM

huy động vốn từ các nguồn trong nền kinh tế và họ phải trả một khoản tiền định kì, tuy nhiên, nễu NHTM không có thị trường dé cho vay thì họ sẽ không có lợi nhuận từ việc đó dé có khoản tiền trả cho nguồn mà NHTM huy động vốn Điều đó dẫn đến sự mat uy tín của ngân hàng đối với đối tượng gửi tiền, khiến ho 6 ạt muốn rút tiền và gây khó khăn cho NHTM Vì vậy, NHTM phải thường xuyên thu số tiền đã giải ngân để đảm bảo khả năng hoàn trả vốn cho người gửi tiền và thu được lợi nhuận Từ đó, chúng ta thấy răng XHTD là vô cùng quan trọng đối với hoạt động kinh doanh của NHTM:

+) Hạn chế RRTD và một số rủi ro khác

+) Hỗ trợ ra quyết định trong việc cấp tín dụng cho KH: xác định mức lãi suất, hạn mức

tín dụng, đối với KH đi vay.

Trang 15

Chuyên dé thực tập chuyên ngành Toán Tài chính

+) Giám sát và đánh giá KH khi khoản tín dụng còn đang dư nợ Thứ hạng của KH sẽ

giúp NHTM dự báo được chất lượng tín dụng và có biện pháp đối phó kịp thời.

+) Ngân hàng có thể dựa vào vốn đã cho vay nhưng không thu hồi được từ những dữ liệu trong quá khứ dé ước lượng mức vốn không thu hồi được trong thời gian tới dé trích lập dự phòng tốn that tin dụng.

1.1.4.2 Đối với khách hàng cá nhân

XHTD là cơ sở dé chia nhóm KH theo mức độ rủi ro dé có những chính sách phù

hợp với từng nhóm:

-Nhóm có rủi ro thấp: cho vay với chế độ ưu đãi

-Nhóm có rủi ro trung bình: cho vay với điều kiện bình thường

-Nhóm có rủi ro cao: có thể không cho vay hoặc cho vay với lãi suất cao

Vi vậy, hầu hết KHCN đều có thé sử dụng sản phẩm tin dụng của NHTM tùy vào

mức độ rủi ro của mình mà NHTM sẽ đặt những chính sách với từng nhóm KH tùy

thuộc vào chiên lược đặt ra.

1.2 Cac yếu tố ảnh hưởng đến xếp hạng tín dụng của khách hang cá nhân

1.2.1 Thông tin cá nhân

Mỗi cá nhân đều có những thông tin, hoàn cảnh sống riêng của bản thân để phân biệt với những người xung quanh Những đặc điểm đó đều có những ảnh hưởng nhất

định tới cuộc sống của họ Chính vì vậy, khi tiễn hành XHTD với KHCN, NHTM thường

xem xét một sô đặc diém sau:

-Thông tin cơ bản về bản thân: độ tuổi, giới tính, tình trạng hôn nhân, trình độ học

-Thông tin về điều kiện sống: quy mô hộ gia đình, số thành viên đi làm trong gia đình, nghề nghiệp, tài sản sở hữu,

Trang 16

Chuyên dé thực tập chuyên ngành Toán Tài chính

1.2.2 Tài chính cá nhân

Phân tích thông tin tài chính và các mối quan hệ liên quan đến tài chính của mỗi KHCN là yếu tố quan trọng nhất khi tiến hành XHTD Nó là cơ sở chính để NHTM dự đoán được khả năng trả nợ của KHCN và đưa ra các mức xếp hạng phù hợp với từng cá nhân đi vay Một số yếu t6 đưa vào phân tích:

-Giá tri tài sản đảm bảo

-Tiết kiệm

-Tổng giá trị tài sản nợ

-Số lần vay mới

1.2.3 Hành vi sử dụng tín dụng của các nhân

Ngoài những yếu tố đã được nêu ở trên, NHTM cũng dựa vào hành vi sử dụng tin

dụng của KHCN để tiến hành XHTD Những yếu tổ này giúp cho NHTM có cái nhìn

tong quan về cách thức và nhu cầu của từng KHCN khi sử dụng tin dụng cũng như uy tín trong việc trả nợ của họ với ngân hàng Từ đó, NHTM có thé đưa ra những hạn mức tín dụng phù hợp, có những cách thức thu hồi nợ tín dụng hoặc ngưng cấp tín dụng cho KHCN dựa trên thói quen chỉ tiêu của KHCN dé giảm bớt rủi ro cho ngân hàng Một số yếu tô cần phân tích:

-Thói quen chi tiêu hàng ngày-Ủy tín trong giao dịch

-Lịch sử vay và trả nợ

-Tổng dư nợ

-Số lượng thẻ tín dụng hiện có/ số lần dùng thẻ/ mục đích dùng thẻ

Trang 17

Chuyên dé thực tập chuyên ngành Toán Tài chính

1.2.4 Các thông tin liên quan đến viễn thông

Đối với nhóm di liệu liên quan đến thông tin viễn thông của khách hàng, các NHTM cần có sự hợp tác với các công ty viễn thông để mua được những thông tin liên

quan của khách hàng Một số thông tin có thê đưa vào phân tích:

-Lịch sử nạp tiền qua điện thoại

-Lịch sử trả tiền trong việc sử dụng mạng viễn thông: Wifi, 3G/4G, -Lịch sử trả tiền điện, nước, qua internet.

Bên cạnh đó, hiện nay các NHTM đã áp dụng các ứng dụng chuyền tiền thay vì

phải trực tiếp đến ngân hàng thì KH có thể giao dịch qua internet banking, hay ngân

hàng hợp tác với một số ứng dụng khác dé tạo ra các ví điện tử được KH khá ưa chuộng: Zalopay, Shopeepay, Bởi chúng dé dang sử dung và nhanh chóng giúp tiết kiệm thời gian Những thông tin giao dịch của KH qua các ứng dụng trên đều sẽ phần nào ảnh hưởng tới khả năng trả nợ của KH vì nó thể hiện được khả năng tài chính của KH đó.

1.3 Cac phương pháp xếp hang tin dụng

1.3.1 Phương pháp chuyên gia

Phương pháp chuyên gia là phương pháp thu thập và xử lý các đánh giá dự báo

bằng cách hỏi ý kiến của các chuyên gia giỏi hoạt động trong một lĩnh vực khoa học nào

đó liên quan Những chuyên gia giỏi là những người hiểu rõ những van đề tồn tai trong

một lĩnh vực hoạt động của họ Họ luôn hướng tới tương lai để giải quyết các vấn đề

dựa trên sự hiểu biết, kinh nghiệm và linh cảm nghề nghiệp của bản thân họ tích lũy

trong nhiêu năm.

Tiến hành XHTD bằng phương pháp này chủ yếu dựa vào những kinh nghiệm đã

được đúc kết từ nhiều năm của các chuyên gia, qua đó chúng ta có thể tìm ra bản chất

của môi quan hệ giữa khả năng trả nợ của khách hàng và các yêu tô tác động tới nó.

Trang 18

Chuyên dé thực tập chuyên ngành Toán Tài chính

Chất lượng của việc sử dụng phương pháp chuyên gia dé XHTD phụ thuộc vào kinh

nghiệm chủ quan của các chuyên gia tín dụng chính xác đến mức độ nào.

1.3.2 Phương pháp thông kê

Đây là một trong những phương pháp nghiên cứu chính xác, là một quá trình bao

gồm điều tra thống kê, khái quát hóa thông tin, phân tích và dự báo Phương pháp này

cũng được gọi là quá trình mô hình hóa toán học các vấn đề cần phân tích tùy thuộc vào

mục tiêu nghiên cứu Phương pháp này giúp ta có khả năng được tiếp cận nhiều hơn với các phương pháp phân tích thống kê, các mô hình dự báo, cũng như việc sử dụng phần mềm phân tích trong quá trình nghiên cứu Một số mô hình được sử dụng trong XHTD: Mô hình tuyến tính, mô hình Logistic, mô hình cây quyết định, XGboost,

Nếu phương pháp chuyên gia phụ thuộc chủ yếu vào đánh giá chủ quan từ phía các chuyên gia thì những mô hình thống kê lại dùng các kiểm định dé chấp nhận hay bác bỏ các giả thuyết được đưa ra liên quan đến tiêu chuẩn kha năng trả nợ của khách hàng Khi các giả thuyết được kiểm định qua các phương pháp thống kê thì sự lựa chọn và xác định các tham số cho những yếu tố ảnh hưởng đến khả năng trả nợ của khách hàng cá nhân được tiền hành một cách khách quan từ những thông tin đã được thu thập từ thực tế trước đó Tuy nhiên, muốn có một mô hình phù hợp thì bộ dữ liệu đưa vào

phải đủ lớn.

Bên cạnh đó, ta cũng có thể áp dụng việc kết hợp hai hay nhiều mô hình trong phương pháp thống kê dé đưa ra một mô hình tốt nhất Chúng ta có thé kê đến một số

nghiên cứu trước đây của Peter và cộng sự (2015), Radall (2017) đã tiến hành kết hợp

mô hình cây quyết định và mô hình mạng noron nhân tạo ANN Sự kết hop này được

đánh giá là hiệu quả khi hai mô hình có chung khả năng là xử lý bộ dữ liệu lớn Mô hình

cây quyết định với ưu điểm là khả năng giải thích biến rõ ràng giúp cải thiện khả năng giải thích của mô hình XHTD khi kết hợp với ANN.

Trang 19

Chuyên dé thực tập chuyên ngành Toán Tài chính

1.4 Tổng quan về các nghiên cứu sử dụng hồi quy Logistic dé đánh giá rủi ro tín

dụng của khách hàng

Trước đây, dé tiến hành XHTD đánh giá mức độ tín nhiệm của KHCN, các NHTM

thường sử dụng phương pháp chuyên gia: dựa trên các thông tin, dữ liệu thu thập được

trên thị trường, các chuyên gia tiến hành đánh giá rủi ro tin dụng của KH Và từ kết quả

đánh giá đó, NHTM sẽ quyết định cấp hay không cấp các khoản tín dụng.

Tuy nhiên, phương pháp này có hạn chế là phụ thuộc vào tính chủ quan của chuyên

gia đánh giá Chính vì vậy, hiện nay, các NHTM dan chuyên sang tiếp cận phương pháp

thống kê- sử dụng định lượng thay vì định tính như trước đây; đặc biệt là sử dụng hồi quy Logit để phân tích và dự báo khả năng không trả được nợ của KH Ngày nay, có nhiều nhà nghiên cứu đã tìm hiểu chuyên sâu về việc sử dụng hồi quy Logistic trong

Nam Tac gia Kết qua nghiên cứu

2006 | Vương Quân Áp dụng phương pháp thống kê dé xây dựng mô hình

Hoàng và định mức tín nhiệm Tác giả đưa ra 16 biến vào mô hình

cộng sự để tiến hành hồi quy Logistic nhưng sau đó tác giả đã loại 2 biến do chúng không có khả năng giải thích trong mô hình Các biến: mức thu nhập hàng tháng, chênh lệch

thu nhập va chi tiêu, gia tri tài sản khách hàng có tác

động cùng chiều với biến phụ thuộc; các biến còn lại: tuổi tác, trình độ hoc van, loại hình công việc, tình trạng hôn nhân, nơi cư trú, thời gian cư trú, SỐ người phụ

thuộc, phương tiện đi lại, phương tiện thông tin, giá trịcác khoản nợ, quan hệ với Techcombank thì có ảnh

hưởng ngược chiều tới biến phụ thuộc.

2007 | Maria Nghiên cứu này nói về việc áp dụng mô hình hồi quy

Aparecida Binary Logistic, Neutral network va mô hình Genetic

Gouvéa va | Algorithm dé phân tích rủi ro.

10

Trang 20

Chuyên dé thực tập chuyên ngành Toán Tài chính

Eric Bacconi

Bài nghiên cứu này tac gia đã su dung dữ liệu từ một

ngân hàng tại Brazil và mô hình dùng hồi quy Logistic cho ra kết quả tốt nhất nên Maria Aparecida Gouvéa đã dùng mô hình đó là mô hình xếp hạng tín dụng phục

vụ cho nghiên cứu Maria Aparecida Gouvéa va Eric

Bacconi Goncalves đã đưa 18 nhóm biến độc lập vào

mô hình và phân tích tác động: giới tính, tình trạng hôn

nhân, lương, thời gian làm việc hiện tại, Và cuối

cùng, các biến có ảnh hưởng tích cực tới biến phụ

thuộc là các biến thuộc nhóm biến liên quan đến số

lượng các khoản nợ và tông dư nợ.

2010Eliana Costa

e Silva vacong su

Nghiên cứu nay áp dụng hôi quy Logistic dé đánh giá

rủi ro không trả được nợ của KH.

Trong bài nghiên cứu, tác giả đã sử dụng dữ liệu từ

một ngân hang tại Bồ Dao Nha từ thang 1 năm 2008 đến thang 12 năm 2009 gồm 13 biến độc lập: Số tiền vay trong hợp đồng, lãi suất cho vay, kì hạn, tuổi của KH, số tiền KH phải trả mỗi tháng, số năm mà KH đã vay tại ngân hàng, số thẻ tín dụng của KH, giới tính, tình trạng hôn nhân, lương, thuế IRS, sản pham tin dụng khác, lương va mô hình cuối cùng gồm có 6 biến tốt nhất Trong đó, biến lãi suất, kì hạn, tuổi có

tác động cùng chiều với biến phụ thuộc; còn số thẻ tín

dụng của KH, lương, thuế IRS của KH có ảnh hưởng ngược chiều tới biến phụ thuộc.

11

Trang 21

Chuyên dé thực tập chuyên ngành Toán Tài chính

KET LUẬN CHƯƠNG 1

Chương 1 đã đưa cho chúng ta một cái nhìn tổng quan về XHTD tại các NHTM Chúng ta hiểu được thé nào là XHTD, tại sao phải XHTD hay XHTD hướng tới những

đối tượng nào Chương I cũng đưa ra được tầm quan trọng của XHTD với cả NHTM và KHCN: với NHTM thì nó giúp NHTM đưa ra quyết định cho vay đối với một nhóm KHCN nào thì phù hợp với chiến lược của ngân hàng: nó giúp KHCN được hưởng

những chế độ ưu đãi phù hợp Các phương pháp XHTD cũng được nêu ra cụ thể: phương

pháp chuyên gia dựa vào ý kiến chủ quan của các chuyên gia giỏi trong lĩnh vực đó,

phương pháp thống kê áp dụng các phân tích thống kê đữ liệu để xây dựng mô hình dự

báo, phương pháp kết hợp sử dụng cả hai phương pháp trên Bên cạnh đó, chương này cũng đưa ra được một số nghiên cứu liên quan đến chủ đề dùng hồi quy Logistic để đánh

giá RRTD.

12

Trang 22

Chuyên dé thực tập chuyên ngành Toán Tài chính

CHƯƠNG 2

QUY TRÌNH NGHIÊN CỨU XÉP HẠNG TÍN DỤNG TẠI

NGÂN HÀNG

Chương 2 tập trung vào giới thiệu các phương pháp được sử dụng trong xây dựng

mô hình XHTD tại ngân hàng Chúng ta sẽ tìm hiểu về mô hình Logistic và lí do chọn Logistic trong bài toán XHTD này Ngoài ra, chương này cũng đưa ra một số phương

pháp xử lý biên, chọn lọc biên cùng với một sô tiêu chí đê đánh giá mô hình.

2.1 Mô hình Logistic

2.1.1 Khải niệm

Hau hết NHTM ưu tiên sử dụng mô hình Logistic trong xây dựng mô hình dự báo

xác suất không trả được nợ của KH thay vì sử dụng phương pháp chuyên gia hay kết

hợp các mô hình trong phương pháp thống kê Nguyên nhân chính là bài toán cụ thể được đặt ra tại ngân hàng: dự báo xác suất không trả được nợ của KH nên các NHTM cần đưa ra những lời giải thích hợp lý khi từ chối/ chấp nhận một khoản vay nào đó từ khách hàng Những giải thích khi dựa trên những phân tích từ mô hình sẽ thuyết phục hơn khi sử dụng phương pháp thu thập ý kiến chủ quan từ chuyên gia; còn việc sử dụng

cách kết hợp các mô hình trong phương pháp thống kê thì khá phức tạp và không cần

thiết trong bài toán này.

Mô hình Logistic là một mô hình thống kê mà mô hình hóa xác suất của một sự

kiện đang diễn ra băng cách đặt in) la su két hop tuyén tính của một hoặc nhiều

biến độc lập Ham Logistic là một hàm được dùng phổ biến vì nó dé hiểu về mặt toán

P=VỚI XB = Bo + BX, a

Tuy nhiên, ham Logistic lại phi tuyến với cả các tham số và các biến độc lập nên ta sẽ khó giải thích khi hồi quy, vì vậy, ta sẽ biến đổi nó về dang tuyến tính:

13

Trang 23

Chuyên dé thực tập chuyên ngành Toán Tài chính

In (2) = In(odds) = By + BX, + ĐạX;¿ ++ voip € (0;1)

Như vậy, ta biến déi từ ham Logistic về hàm có dạng tuyến tính sẽ dé hồi quy và đưa ra lời giải thích về ảnh hưởng của biến độc lập tới biến phụ thuộc.

2.1.2 Uu điểm, nhược điểm

Một số ưu điểm của hồi quy Logistic trong xây dựng mô hình XHTD tại NHTM:

Thứ nhất, hồi quy Logistic dé đưa ra lời giải thích về sự tác động của biến giải

thích lên biến phụ thuộc Chúng ta có thé tuyến tính hóa hàm Logistic hồi quy, nó sẽ dé

dàng dé giải thích tại sao biến độc lập này thay đổi thì biến phụ thuộc cũng sẽ gián tiếp thay đổi theo Một số mô hình Machine Learning khác có khả năng dự báo tốt hơn nhưng

nó có chứa những tham số mà chúng ta khó có thê đưa ra được những sự lý giải thích

hợp với thực tế.

Thứ hai, cách thực hiện hồi quy Logistic cũng dễ thực hiện vì đây là một quy trình

với các phép biến đổi và giải thích rõ ràng Các bước thực hiện có thể được lý giải dựa trên những cơ sở lý thuyết đã có, khác với một số mô hình Machine Learning khác cần

chỉnh sửa những tham số dé chọn ra mô hình tốt nhất mà không có cơ sở hay phương

pháp cụ thé nao.

Bên cạnh những ưu điểm trên, hồi quy Logit cũng có những nhược điểm cần phải

khắc phục:

Thứ nhất, hồi quy Logistic không dự báo được kết quả liên tục Nó chỉ có thể được

dùng dé đưa ra những dự báo với những mô hình có biến phụ thuộc là biến phân loại Thứ hai, hồi quy Logistic có thé không đưa ra được kết qua dự báo chính xác với mẫu có kích thước nhỏ Nếu kích thước mẫu nhỏ thì mô hình được tạo ra từ hồi quy

Logistic dựa trên số quan sát nhỏ hơn Điều đó sẽ có thê dẫn đến “overfitting”- một lỗi

mô hình hóa xảy ra khi mô hình quá khớp với một bộ dữ liệu hạn chế.

14

Trang 24

Chuyên dé thực tập chuyên ngành Toán Tài chính

2.2 Các phương pháp xử lý biến và ước lượng hệ số trong mô hình

2.2.1 Xử lý “missing values”

Hau hết dữ liệu liên quan đến lĩnh vực tài chính đều có “missing values”; đặc biệt trong đữ liệu về thông tin, lịch sử tín dụng, của khách hàng tại NHTM đều có chưa các giá trị trên Nó xảy ra với nhiều nguyên nhân khách nhau: do khách hàng không điền/ không biết điền như thế nào, do khách hàng làm thẻ tín dụng nhưng không sử

dụng, Và chúng ta có bôn cách đê xử lý các “missing value” trong bộ đữ liệu:

Thứ nhất, loại bỏ tất cả các quan sát có chứa “missing values” Tuy nhiên, việc bỏ này có thé sẽ gây ra van dé mắt rất nhiều quan sát trong bộ dữ liệu; ví dụ: mỗi một biến có “missing values” ở những quan sát khác nhau, nếu chúng ta loại bỏ hết thì bộ đữ liệu

sẽ mat nhiều quan sát Chúng ta chỉ nên loại bỏ “missing values” nếu chúng chiếm nhỏ

hơn 5% tông số quan sát trong bộ dữ liệu.

Thứ hai, loại bỏ hêt các biên có “missing values” ra khỏi mô hình Trong trường

hợp này, ta nên loại biên nêu biên đó có chứa trên 50% quan sát là “missing value” hoặc

các biến đó vẫn sẽ có khả năng thiếu đữ liệu trong tương lai.

Thứ ba, ta có thể đưa hết “missing values” vào mô hình bằng cách gộp chúng lại thành 1 nhóm đối với từng biến, sau đó sẽ dùng WOE của chúng là đầu vào thay vì đưa

dtr liệu thô vào.

Thứ tư, chúng ta có thé thay thé “missing values” bằng giá trị trung bình, mean

của biến đó Tuy nhiên, điều này có thê ảnh hưởng đến xu thế của các biến độc lập với

biên mục tiêu.

Các NHTM thường áp dụng phương pháp biến đổi thứ ba dé xử lý “missing values”

vì các phương pháp 1,2,4 đều giả định các “missing value” không có giá trị gì- không

thê thu thập được những thông tin hữu ích cho việc kinh doanh từ các giá trị đó Tuy

nhiên, điêu đó chưa chắc đã hoàn toàn đúng, những giá tri đó có thê là một phân của xu

15

Trang 25

Chuyên dé thực tập chuyên ngành Toán Tài chính

hướng, được liên kêt với các giá trị khác trong biên đó đê tạo nên một xu hướng đúng

với thực tế.

2.2.2 Cách biến đổi dữ liệu

Dé hiểu rõ hơn về cách biến đổi WOE, chúng ta có thé tìm hiểu về ý nghĩa, cách

tính toán và những ưu - nhược điêm của nó:

WOE là một trong những kĩ thuật tao biến và lựa chọn biến thường được xử dụng

trong xây dựng mô hình XHTD Phương pháp biến đổi này sẽ đánh giá sức mạnh dự báo dựa trên điểm số đánh giá về sức mạnh dự báo nợ xấu Tiêu chuẩn đánh giá sẽ dựa trên chỉ số IV- được tính toán thông qua WOE Cách biến đổi WOE có các kĩ thuật xử

lý khác nhau đôi với biên liên tục và biên phân loại:

Đối với biến liên tục: WOE sẽ chia các quan sát trong biến thành các nhóm giá trị.

Số lượng nhóm và số quan sát mỗi nhóm phụ thuộc vào xu thế và phải được lý giải đúng với thực tế Sau đó, áp dụng công thức và tính WOE rồi đưa vào mô hình thay giá trị

thô của biên đó.

Doi với biên rời rạc: WOE có thê can nhac moi một giá tri rời rac là một nhómhoặc có thê gộp nhiêu giá tri roi rac có sô lượng quan sat ít vào một nhóm Bên cạnh đó,

trường hop “missing values” cũng có thé được coi là một nhóm riêng biệt nêu sô lượngcủa nó là đáng kê hoặc nhóm vào các nhóm khác nêu nó là thiêu sô Sau đó thì tính toán

WOE và thay vào mô hình như làm với biến liên tục.

Distr 7

Công thức: WOE = Ln = Bad

e Good: những quan sát ma KH có khả nang trả được nợ P(Y=0)-hồ sơ Good e Distr Good: tỷ lệ giữa tổng Good trong một nhóm và tông Good của cả biến

WOE dùng dé đo lường sự khác biệt giữa phân phối của Good và phân phối của

Bad trên từng nhóm gia trị Giá tri WOE tại một nhóm nao đó càng lớn thì chứng tỏ

16

Trang 26

Chuyên dé thực tập chuyên ngành Toán Tài chính

nhóm đó có số lượng Good càng cao Như đã trình bày ở trên, cách biến đổi WOE có

rat nhiêu ưu điêm trong vân dé xử lý biên trước khi đưa vào mô hình cuôi cùng:

Thứ nhất, cách biên d6i WOE giúp loại bỏ ảnh hưởng của các giá trị ngoại lai vì chúng sẽ được gộp vào nhóm giá trị gần đó Khi đó, các giá trị ngoại lai sẽ không còn khác biệt so với các những quan sát khác thuộc cùng nhóm vì tất cả các quan sát trong nhóm đó cùng được gán giá trị bằng trọng số WOE Bên cạnh đó, cách biến đổi này

cũng giúp chúng ta giải quyết van đề với “missing values” bằng cách thay thé giá trị của

WOE tương ứng vào cho cua “missing values”.

Thứ hai, khi sử dung biến chưa xử ly thì trong một số trường hợp xu thé của biến độc lập có thé không quan hệ đơn điệu với biến mục tiêu: chữ U, A, Do đó, phương

pháp biến đổi WOE sé đảm bảo mối quan hệ đơn điệu (đồng biến/ nghịch biến) với biến

mục tiêu Cách biến đổi này giúp ta chia nhỏ các biến liên tục thành các nhóm mà giá trị của nó đơn điệu với bién mục tiêu Do đó, các hệ số trong hồi quy Logistic sẽ giải

thích được đúng mối quan hệ giữa các biến độc lập và biến phụ thuộc.

Thứ ba, WOE giúp chúng ta giải quyết được các vấn đề về mâu thuẫn đơn vị giữa

các biến độc lập trong mô hình Giả sử như biến tuổi và biến số tiền dư trong tài khoản

tiết kiệm của khách hàng có sự chênh lệch đơn vị khá lớn, thường chúng ta sẽ dùng hàm log đối với các biến có đơn vị lớn để cân bằng với các biến khác và WOE cũng giúp chúng ta giải quyết van dé này với hiệu quả tương tự

Thứ tư, WOE có thé thay cho việc chúng ta dùng biến giả với các biến định tính Việc sử dụng biến giả có nhược điểm là nó giả định sự khác biệt giữa một nhóm biến

phân loại này với nhóm biến phân loại tiếp theo là như nhau Điều này sẽ ảnh hưởng đến kết quả phân tích từ mô hình.

Tuy nhiên, cách biến đổi WOE cũng có một vài nhược điểm như sau:

Thứ nhất, khi dùng WOE thì chúng ta rất khó để biết nên chia bao nhiêu nhóm trong một biến là phù hợp Hiện nay có một số công cụ có cách chia tự động nhưng để

17

Trang 27

Chuyên dé thực tập chuyên ngành Toán Tài chính

phù hợp với xu thế theo lý thuyết kinh tế thì chúng ta vẫn phải kết hợp với việc chia

nhóm thủ công.

Thứ hai, do WOE luôn đơn điệu với biên mục tiêu nên giữa các biên độc lập sẽ

xuất hiện tương quan và gây hiện tượng đa cộng tuyến trong mô hình hồi quy.

2.2.3 Phương pháp ước lượng hợp lý cực đại

Ta có mô hình Logistic sau khi đưa về dạng tuyến tính như sau:

In (2) = In(odds) = Bo + BiXin + BoXig ++ + BuXix C®)

Dé ước lượng các hệ số trong mô hình này, ta không thé dùng phương pháp OLS vì khi thay giá trị phân loại thực tế (0,1) vào mô hình (*) thì về trái có thể không xác định Ví dụ, xác suất KH không tra được nợ p=1 và xác suất KH trả được nợ p=0, khi đó về trái của mô hình sẽ là In(1/0) không xác định.

Bên cạnh đó, phương pháp OLS giả định phần dư tuân theo phân phối chuẩn mà phan dư 1u = p; — p, và p theo phân phối Logistic Do đó, chúng ta cần dùng một

phương pháp khác dé ước lượng- phương pháp ước lượng hợp lý cực dai.

Hop lý cực đại là phương pháp thống kê dùng để ước lượng giá trị tham số của một mô hình xác suất dựa trên những đữ liệu quan sát được Phương pháp này ước lượng

các tham số nói trên bởi những giá trị làm cực đại hóa hàm hợp lý.

2.3 Các chỉ tiêu lựa chọn biến cho mô hình

2.4.1 Ly thuyết kinh tế

Do mô hình được xây dựng từ bộ dữ liệu thực tế tại Techcombank nên lý thuyết kinh tế là một trong những tiêu chí cần thiết trong lựa chọn biến cho mô hình Các biến

được chọn cần phải phù hợp với lý thuyết kinh tế tài chính Trong trường hợp một biến

độc lập không thỏa mãn theo những tiêu chuẩn về mặt thống kê nhưng biến đó có ảnh hưởng lớn tới biến phụ thuộc thì chúng ta vẫn cần cân nhắc đề giữ lại.

18

Trang 28

Chuyên đề thực tập chuyên ngành Toán Tài chính

2.4.2 Chỉ số Information Value

Information Value (IV) là một trong những chỉ số tốt nhất trong việc lựa chọn biến cho một mô hình dự báo Nó giúp đo lường sức mạnh của từng biến trong mô hình và đưa ra một xếp hạng cơ bản thể hiện mức độ mạnh / yếu của các biến đầu vào.

IV được tính toán dựa trên WOE:

IV =}?_:(Distr Good; — Distr Bad,) x WOE; (2)

>0.5 Anh hưởng rất lớn, cần xem xét

Bang 2.1: Các khoảng IV để xét sức mạnh ảnh hưởng của các biến

2.4.3 Ma trận tương quan

Ma trận tương quan thê hiện mức độ tương quan giữa các biến độc lập trong mô

hình, từ đó, ta có thể quan sát được tất cả các cặp biến có tương quan cao Nếu ta giữ các biến có tương quan cao với nhau trong mô hình thi dé xảy ra hiện tượng đa cộng

tuyến, do đó ta nên cân nhắc loại bỏ 1 trong 2 biến trong cặp tương quan cao.

2.4.4 Hồi quy Logistic theo Stepwise

Hồi quy theo Stepwise là phương pháp dé xây dựng một mô hình bang cách lặp đi lặp lại từng bước hồi quy Logit để chọn ra các biến độc lập có sức ảnh hưởng nhất định cho mô hình Phương pháp này là sự kết hợp của phương pháp Forward Selection và

phương pháp Backward Elimination.

19

Ngày đăng: 11/04/2024, 20:33

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN