1492 ứng dụng học máy trong dự báo vỡ nợ tại nhtm cp quốc tế vn 2023

56 2 0
1492 ứng dụng học máy trong dự báo vỡ nợ tại nhtm cp quốc tế vn 2023

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

NGÂN HÀNG NHÀ NƯỚC VIỆT NAM BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP.HCM ỨNG DỤNG HỌC MÁY TRONG DỰ BÁO VỠ NỢ TẠI NGÂN HÀNG THƯƠNG MẠI CỔ PHẦN QUỐC TẾ VIỆT NAM Sinh viên: Nguyễn Minh Hiếu MSSV: 030805170097 Lớp: HQ5-GE08 Khóa học: 2017 – 2021 GVHD: ThS Trần Kim Long Thành phố Hồ Chí Minh, Tháng 09 năm 2021 LỜI CAM ĐOAN Tơi xin cam đoan nội dung viết khoá luận với đề tài “Ứng dụng học máy dự báo vỡ nợ Ngân hàng TMCP Quốc Tế Việt Nam” cơng trình nghiên cứu thân kết sau tháng thực với hướng dẫn ThS Trần Kim Long Các liệu thông tin khố luận hồn tồn trung thực phù hợp với quy định ngân hàng Tôi xin chịu hoàn toàn trách nhiệm lời cam đoan vấn đề liên quan đến khoá luận Tác giả Nguyễn Minh Hiếu MỤC LỤC MỤC LỤC DANH MỤC BẢNG VÀ HÌNH DANH MỤC CÁC TỪ VIẾT TẮT CHƯƠNG TỔNG QUAN VỀ NGHIÊN CỨU .6 1.1 Lý chọn đề tài .6 1.2 Mục tiêu nghiên cứu .7 1.2.1 Mục tiêu nghiên cứu tổng quát 1.2.2 Các câu hỏi nghiên cứu 1.3 Phạm vi nghiên cứu 1.4 Phương pháp nghiên cứu 1.5 Những đóng góp đề tài .8 1.6 Quy trình nghiên cứu 1.7 Cấu trúc đề tài CHƯƠNG CƠ SỞ LÝ THUYẾT VÀ CÁC BẰNG CHỨNG THỰC NGHIỆM VỀ VẤN ĐỀ NGHIÊN CỨU 10 2.1 Khái niệm vỡ nợ 10 2.2 Ảnh hưởng vỡ nợ với ngân hàng .11 2.3 Các yếu tố dẫn đến khả vỡ nợ khoản vay 12 2.3.1.Yếu tố thông tin pháp lý khách hàng 12 2.3.2.Yếu tố hoàn cảnh sống khách hàng 13 2.3.3.Yếu tố tài khách hàng 13 2.3.4.Yếu tố hành vi khách hàng 14 2.4 Khái quát học máy 14 2.5 Các phương pháp phân loại dự báo vỡ nợ 15 2.5.1 Phương pháp rừng ngẫu nhiên 15 2.5.2 Phương pháp hồi quy logistic 16 2.5.3 Phương pháp định 17 2.6 Tổng quan nghiên cứu trước 17 2.6.1 Các nghiên cứu nước 17 2.6.2 Các nghiên cứu nước 20 CHƯƠNG PHƯƠNG PHÁP NGHIÊN CỨU 22 3.1 Phương pháp nghiên cứu quy trình nghiên cứu 22 3.1.1 Phương pháp nghiên cứu .22 3.1.2 Quy trình nghiên cứu 22 3.2 Phương pháp thu thập liệu 22 3.3 Biến nghiên cứu 22 3.4 Phương pháp phân tích liệu 23 3.4.1 Phương pháp rừng ngẫu nhiên .23 3.4.2 Phương pháp định 24 3.4.3 Phương pháp hồi quy logistic 25 3.4.4 Các phương pháp đánh giá hiệu mơ hình dự báo 26 3.4.4.1 Confusion matrix .26 3.4.4.2 Sensitivity Specificity 26 3.4.4.3 Accuracy (Precision) 26 3.4.4.4 F1-Score 27 3.4.4.5 Khu vực đường cong (AUC) 27 3.5 Chuẩn bị tiền xử lý liệu 28 3.5.1 Kỹ thuật phân loại 28 3.5.2 Xác định mẫu xây dựng mẫu kiểm định 29 CHƯƠNG KẾT QUẢ NGHIÊN CỨU 30 4.1 Thống kê mô tả .30 4.2 Kết dự báo phương pháp 32 4.2.1 Kết phân loại phương pháp rừng ngẫu nhiên 32 4.2.2 Kết phân loại phương pháp định 33 4.2.3 Kết phân loại phương pháp hồi quy logistic 34 4.2.4 So sánh phương pháp phân loại 35 4.2.5 Thảo luận kết 36 4.2.6 Giới hạn định hướng nghiên cứu .37 CHƯƠNG KẾT LUẬN .38 TÀI LIỆU THAM KHẢO .40 PHỤ LỤC – KẾT QUẢ CHẠY MÔ HÌNH .47 DANH MỤC BẢNG VÀ HÌNH Bảng 3.1 Biến nghiên cứu khả vỡ nợ khách hàng 22 Bảng 3.2 Mẫu xây dựng mẫu kiểm định .29 Bảng 4.1 Thống kê mô tả biến phân loại 30 Bảng 4.2 Mức độ dự báo phương pháp rừng ngẫu nhiên 33 Bảng 4.3 Mức độ dự báo phương pháp định 34 Bảng 4.4 Kết phương pháp hồi quy logistic 34 Bảng 4.5 Mức độ dự báo phương pháp hồi quy logistic 35 Bảng 4.6 So sánh kết dự báo phương pháp 36 Hình 3.1 Quy trình nghiên cứu 22 Hình 3.2 Đồ thị chứa ROC phân loại ngẫu nhiên hai phân loại hoạt động tốt 28 Hình 4.1 Mức độ quan trọng biến phương pháp rừng ngẫu nhiên 32 Hình 4.2 Kết phương pháp định 33 Hình 4.4 Đường cong ROC cho phương pháp khác 36 DANH MỤC CÁC TỪ VIẾT TẮT ACPR Cơ quan giám sát hành Pháp AUC Area under the curve – Diện tích đường cong FI Tổ chức tài VIB Văn Thánh Ngân hàng TMCP Quốc tế Việt Nam – Chi nhánh Sài Gòn – Phòng Giao dịch Văn Thánh CHƯƠNG TỔNG QUAN VỀ NGHIÊN CỨU 1.1 Lý chọn đề tài Trong năm gần đây, hoạt động cho vay ngân hàng phát triển mạnh, kèm với phát triển tiềm ẩn nguy rủi ro vỡ nợ khách hàng Việc đánh giá rủi ro tín dụng khách hàng cá nhân vấn đề quan trọng quản lý rủi ro ngân hàng, điều góp phần quan trọng việc tạo định: ngân hàng có nên cho khách hàng vay hay khơng (Lou & Wang, 2013) Do số lượng khách hàng vay tiềm lớn, phương pháp chấm điểm thủ công, ngân hàng nên áp dụng mơ hình hay thuật tốn việc phân tích mức độ tín nhiệm khách hàng (Khandani cộng sự, 2010) Trên thực tế, Twala (2010) nhiều ngân hàng lớn giới phát triển thuật tốn thơng minh tự động để lập mơ hình rủi ro tín dụng, cung cấp thơng tin quan trọng cho việc định điển hình học máy (machine learning) Học máy chương trình máy tính lập trình để học hỏi kinh nghiệm từ tác vụ, từ đưa dự đốn xác cải thiện hiệu suất (Cooper cộng sự, 1997) Trong bối cảnh nghiên cứu rủi ro tín dụng sử dụng kỹ thuật học máy, số nghiên cứu đưa nhiều hướng phân tích mức độ rủi ro mơ hình liệu cụ thể Tuy nhiên, nghiên cứu chưa xác định kỹ thuật dự báo rủi ro tín dụng dự báo mức độ xác cao (Dastile cộng sự, 2020) Mục tiêu nghiên cứu giúp cải thiện khả dự đoán phương pháp học máy dựa kỹ thuật “classification” “cross validation” giúp cho mơ hình dễ dàng giải thích Từ đó, mục đích tiếp cận tác giả nhằm đề xuất phương pháp chấm điểm tín dụng phù hợp dự báo rủi ro tín dụng ngân hàng Việc sử dụng các phương pháp học máy để chấm điểm tín dụng xuất từ năm 1960, hoạt động kinh doanh thẻ tín dụng xuất cần có quy trình định tự động Đến năm 1970, sau điểm tín dụng chấp nhận hoàn toàn, chúng sử dụng rộng rãi hầu hết ngân hàng công ty cho vay khác Các phương pháp khác sử dụng học máy bao gồm phương pháp “Discriminant functions” Altman (1968), “Proportional hazards” Stepanova and Thomas (2001), “Hồi quy logistic” Steenackers Goovaerts (1989), nhiều phương pháp khác Sau đó, mơ hình hồi quy logistic dần trở thành mơ hình chấm điểm tiêu chuẩn ngành tín dụng, chủ yếu tính đơn giản khả diễn giải chúng Hầu hết ngân hàng giới sử dụng mơ hình này, đặc biệt phận tín dụng, mơ hình hồi quy logistic sử dụng để chấm điểm tín dụng khách hàng cá nhân có nhu cầu vay vốn Chấm điểm tín dụng lĩnh vực áp dụng kỹ thuật học máy ngành kinh tế Một số phương pháp sử dụng Cây định (Makowski, 1985; Srinivasan Kim, 1987), Neural networks (NN) (Tam Kiang, 1992), Support Vector Machine (Van Gestel cộng sự, 2003) Tại thời điểm này, việc tăng mức độ xác (so với mơ hình hồi quy logistic tiêu chuẩn) để đánh giá độ tin cậy dường bị hạn chế (các khảo sát Thomas cộng sự, 2000 Van Gestel cộng sự, 2003) Tuy nhiên, hiệu suất mơ hình chấm điểm dựa học máy cải thiện đáng kể từ áp dụng phương pháp tổng hợp, đặc biệt phương pháp “Packing” phương pháp “Reinforcement” (Paleologo et al, 2010) so sánh 41 thuật tốn với tiêu chí đánh giá khác liệu chấm điểm tín dụng Họ xác nhận phương pháp rừng ngẫu nhiên Breiman (2001) phần lớn vượt trội hồi quy logistic dần trở thành phương pháp tiêu chuẩn chấm điểm tín dụng (Grennepois cộng sự, 2018) Trong nhiều thập kỷ qua, kỹ thuật học máy ngày nhiều ngân hàng tổ chức tín dụng khác sử dụng để dự báo rủi ro tín dụng (ACPR, 2020) Tuy nhiên, hạn chế kỹ thuật học máy xét duyệt tín dụng ngành tài – ngân hàng đến từ việc chúng thiếu khả giải thích diễn giải Điều mối quan tâm quan quản lý tài (đặc biệt chấm điểm tín dụng) khả quản lý “AI” diễn giải kỹ thuật học máy Nhìn chung, nghiên cứu lĩnh vực thực nhiều quốc gia khác giới Việt Nam mẻ, chưa phổ biến nhiều Các nghiên cứu ứng dụng giúp dự báo vỡ nợ hạn chế nên em định chọn đề tài “Ứng dụng học máy dự báo vỡ nợ Ngân hàng thương mại cổ phần Quốc Tế Việt Nam” để phần tìm mặt tích cực hạn chế, đưa số đề xuất giúp ứng dụng phát triển 1.2 Mục tiêu nghiên cứu 1.2.1 Mục tiêu nghiên cứu tổng quát Mục tiêu nghiên cứu tổng quát đề tài ứng dụng học máy dự báo vỡ nợ Ngân hàng TMCP Quốc Tế Việt Nam, từ đề xuất khuyến nghị nhằm hạn chế rủi ro tín dụng khách hàng cá nhân Ngân hàng TMCP Quốc Tế Việt Nam 1.2.2 Các câu hỏi nghiên cứu Tổng quan ứng dụng học máy dự báo rủi ro vỡ nợ? Những biện pháp giúp hạn chế rủi ro tín dụng khách hàng cá nhân Ngân hang TMCP Quốc tế Việt Nam? 1.3 Phạm vi nghiên cứu Đề tài sử dụng liệu thứ cấp thu thập từ nghiên cứu thực nghiệm, tài liệu, văn báo cáo, nguồn tài liệu tham khảo tin cậy tổ chức ngồi nước rủi ro tín dụng khách hàng cá nhân ngân hàng thương mại khoảng thời gian từ năm 2010 – 2020 Và tác giả tiến hành phân tích báo cáo hàng ngày Ngân hàng TMCP Quốc Tế Việt Nam thời gian từ 2019 – 2020 Về không gian: Nghiên cứu tiến hành khách hàng cá nhân Ngân hàng TMCP Quốc Tế Việt Nam – Chi nhánh Sài Gòn – Phòng Giao dịch Văn Thánh Về thời gian: Báo cáo nợ báo cáo kinh doanh Ngân hàng TMCP Quốc Tế Việt Nam – Chi nhánh Sài Gòn – Phòng Giao dịch Văn Thánh thời gian 2019 – 2020 1.4 Phương pháp nghiên cứu Dữ liệu xử lý chương trình Microsoft Excel R, với phương pháp phân tích sử dụng mơ hình rừng ngẫu nhiên, định, hồi quy logistic, thống kê mô tả kỹ thuật lấy mẫu lớp cân 1.5 Những đóng góp đề tài Bài nghiên cứu giúp cải thiện chất lượng dịch vụ Ngân hàng TMCP Quốc Tế Việt Nam tương lai tài Ngân hàng Dựa kết thu được, nghiên cứu trở thành tài liệu phân tích Ngân hàng TMCP Quốc Tế Việt Nam việc xác định mức độ quan tâm khách hàng tiềm Ngân hàng tương lai 1.6 Quy trình nghiên cứu Bước 1: Xây dựng đề tài, lên ý tưởng, kế hoạch cho nghiên cứu Bước 2: Làm đề cương nghiên cứu Bước 3: Tìm tài liệu nghiên cứu phân loại tài liệu phục vụ cho nghiên cứu, từ xây dựng đề cương riêng Bước 4: Xử lý liệu thơ thu thập, sử dụng tiêu chí đánh giá kết chạy sau so với kết trước thu Bước 5: Sử dụng kết chạy tốt thảo luận kết so với nghiên cứu trước, đưa kết luận cho nghiên cứu bạn Tiến hành nộp giáo viên hướng dẫn 1.7 Cấu trúc đề tài Chương Tổng quan nghiên cứu Chương Cơ sở lý thuyết chứng thực nghiệm vấn đề nghiên cứu Chương Phương pháp nghiên cứu Chương Kết nghiên cứu Chương Kết luận Ngoài ra, để cung cấp minh chứng nhằm củng cố nội dung phân tích đề tài bao gồm phụ lục liên quan danh mục tài liệu tham khảo trình bày theo quy định APA

Ngày đăng: 28/08/2023, 22:07