Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 82 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
82
Dung lượng
2,07 MB
Nội dung
HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC Đề tài: “ỨNG DỤNG MƠ HÌNH CÂY QUYẾT ĐỊNH VÀO QUẢN TRỊ RỦI RO TÍN DỤNG NGÂN HÀNG” Giảng viên hướng dẫn : ThS Trần Thị Huế Sinh viên thực : Nguyễn Đình Tài Lớp : HTTTB Khố : 12 (2009-2013) Hệ : Chính quy Hà Nội, tháng 5/2013 HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THƠNG TIN QUẢN LÝ KHỐ LUẬN TỐT NGHIỆP ĐẠI HỌC Đề tài: “ỨNG DỤNG MÔ HÌNH CÂY QUYẾT ĐỊNH VÀO QUẢN TRỊ RỦI RO TÍN DỤNG NGÂN HÀNG” Giảng viên hướng dẫn : ThS Trần Thi Huế Sinh viên thực : Nguyễn Đình Tài Lớp : HTTTB Khố : 12 (2009-2013) Hệ : Chính quy Hà Nội, tháng 5/2013 LỜI CẢM ƠN Tôi xin bày tỏ lòng biết ơn sâu sắc tới giảng viên hướng dẫn Ths Trần Thị Huế người định hướng đề tài tận tình hướng dẫn bảo tơi suốt q trình thực khố luận tốt nghiệp Tôi xin chân thành cảm ơn thầy cô trường Học viện ngân hàng đặc biệt thầy cô khoa Hệ Thống Thông Tin Quản Lý tận tình giảng dạy truyền đạt kiến thức suốt năm học đại học Bên cạnh tơi muốn gửi lời cảm ơn chân thành tới anh, chị phòng giao dịch Ngân hàng Nông nghiệp Phát triển Nông thôn chi nhánh Xuân Mai tạo điều kiện giúp đỡ q trình tơi thực tập ngân hàng cung cấp số liệu để tơi hồn thành khố luận tốt nghiệp Trong trình thực luận văn khơng tránh khỏi thiếu sót, hạn chế, tơi mong nhận góp ý, nhận xét thầy để tơi hồn thiện khố luận tốt nghiệp iii ii DANH MỤC CÁC CHỮ VIẾT TẮT LỜI CAM ĐOAN Tôi xin cam đoan kết đạt khóa luận sản phẩm nghiên cứu, tìm hiểu cá nhân tơi Trong tồn nội dung khóa luận, điều trình bày cá nhân tôi, tổng hợp từ nhiều nguồn tài liệu Tơi xin hồn tồn chịu trách nhiệm chịu hình thức kỉ luật theo quy định cho lời cam đoan Hà Nội, tháng năm 2013 Sinh viên Nguyễn Đình Tài NHTM Ngân Hàng Thương Mại RRTD Rủi Ro Tín Dụng QTRRTD Quản Trị Rủi Ro Tín Dụng XHTD Xep Hạng Tín Dụng CBTD Cán Bộ Tín Dụng CNTT Cơng Nghệ Thông Tin KPDL Khai Phá Dữ Liệu CSDL Cơ Sở Dữ Liệu NHNoN & PTNT Ngân hàng Nông Nghiệp Phát triển Nơng thơn ιv DANH MỤC CÁC HÌNH VẼ Hình 2.1 Quy trình phát tri thức 19 Hình 2.2 Cây định phân lớp mức lương 32 Hình 2.3 Cây định cho khái niệm “có chơi tennis khơng” 41 Hình 2.4 Xây dựng định chobài toán Play Golf 42 Hình 2.5 Xây dựng định chobài toán Play 42 Golf .(2) Hình 2.6 Xây dựng định chobài tốn Play 43 Golf .(3) Hình 2.7 Cây định cho toán Play Golf (Phần mềm WEKA) 44 Hình 3.1 Giao diện đồ họa Weka 50 Hình 3.2 Các chức Weka Explorer 51 Hình 3.3 Bộ sở liệu mẫu 54 Hình 3.4 Nạp CSDL vào WEKA .56 Hình 3.5 Thuộc tính ID .56 Hình 3.6 Thuộc tính Nhóm nợ 57 Hình 3.7 Loại bỏ thuộc tính ID 58 Hình 3.8 Nội dung file bank-tài2.arrf .59 Hình 3.9 Giao diện tiền xử lý sau loại bỏ thuộc tính ID 60 Hình 3.10 Kết dạng Text sau chạy thuật toán .61 Hình 3.11 Kết dạng Text sau chạy thuật toán (2) 61 Hình 3.12 Mơ hình định tốn quản trị rủi ro tín dụng 62 Hình 3.13 Dữ liệu cần xác định nhóm nợ .65 v DANH MỤC CÁC BẢNG BIỂU Bảng 2.1 Play Golf Dataset .40 Bảng 3.1 Thuộc tính CSDL 54 Bảng 3.2 Tỷ lệ nhóm nợ CSDL 57 vi MỤC LỤC LỜI CẢM ƠN .i LỜI CAM ĐOAN ii DANH MỤC CÁC CHỮ VIẾT TẮT .iii DANH MỤC CÁC HÌNH VẼ iv LỜI MỞ ĐẦU .1 CHƯƠNG 1: LÝ LUẬN CHUNG VỀ RỦI RO TÍN DỤNG TRONG HOẠT ĐỘNG KINH DOANH CỦA NGÂN HÀNG THƯƠNG MẠI 1.1 Khái niệm đặc điểm rủi ro tín dụng 1.1.1 Khái niệm rủi ro tín dụng 1.1.2 Đặc điểm rủi ro tín dụng .5 1.2 Phân loại rủi ro tín dụng 1.2.1 Căn vào nguyên nhân phátsinh rủi ro 1.2.2 Căn vào khả trả nợ chongân hàng 1.3 Các dấu hiệu nhận biết rủi ro tín dụng hoạt động kinh doanh ngân hàng 1.3.1 Nhóm dấu hiệu liên quan đến mối quan hệ với khách hàng 1.3.2 Nhóm dấu hiệu liên .quan đến phương pháp quản lý ngân hàng 1.3.3 Nhóm dấu hiệu liên quan tới ưu tiên kinh doanh 1.3.4 Nhóm dấu hiệu xử lý thơng tin tài chính, kế tốn 1.3.5 Nhóm dầu hiệu thuộc vấn đề kỹ thuật thương mại 1.4 Hậu rủi ro tín dụng .8 1.4.1 Đối với khách hàng 1.4.1.1 Đối với người gửi tiền 1.4.1.2 Đối với người vay tiền 1.4.1.3 Đối với khách hàng gây nợ xấu, nợ hạn cho ngân hàng .9 1.4.2 Đối với ngân hàng .9 1.4.2.1 Rủi ro tín dụng làm tăng chi phí ngân hàng 1.4.2.2 Rủi ro tín dụng làm giảm khả toán ngân hàng 10 1.4.2.3 Rủi ro tín dụng làm giảm uy tín ngân hàng thịtrường 10 1.4.2.4 Rủi ro tín dụng làm cho ngân hàng bị phá sản 10 1.4.3 Đối với kinh tế 10 vii 1.5 Nguyên nhân phát sinh rủi ro tín dụng 11 1.5.1 Nguyên nhân từ phía khách hàng .11 1.5.2 Nguyên nhân từ phía ngân hàng 11 1.5.3 Nguyên nhân khách quan từ kinh tế 12 1.6 Quản trị rủi ro tín dụng tốn dự báo rủi ro tín dụng .13 1.7 Xep hạng tín dụng .14 1.7.1 Khái niệm xếp hạng tín dụng 14 1.7.2 Quy trình xếp hạng tín dụng 15 1.7.3 Vai trò xếp hạng tín dụng 16 CHƯƠNG 2: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU VÀ CÂY QUYẾT ĐỊNH 18 2.1 Tổng quan khai phá liệu 18 2.1.1 Khái niệm khai phá liệu 18 2.1.2 Các ứng dụng khai phá liệu .18 2.1.3 Các bước trình khai phá liệu .19 2.1.4 Nhiệm vụ khai phá liệu 20 2.1.4.1 Phân lớp (phân loại - classification) 20 2.1.4.2 Hồi qui (regression) 21 2.1.4.3 Phân nhóm (clustering) 21 2.1.4.4 Tổng hợp (summarization) 21 2.1.4.5 Mơ hình hố phụ thuộc (dependency modeling) 22 2.1.4.6 Phát biến đổi độ lệch(change and deviation dectection) 22 2.1.5 Các phương pháp khai phá liệu 23 2.1.5.1 Phương pháp suy diễn / quy nạp 23 2.1.5.2 Phương pháp ứng dụng K-láng giềng gần 23 2.1.5.3 Phương pháp sử dụng định 24 2.1.5.4 Phương pháp phát luật kết hợp 25 2.1.6 Những thách thức ứng dụng nghiên cứu kỹ thuật khai phá liệu 26 2.1.6.1 Các vấn đề sở liệu 26 2.1.6.2 Một số vấn đề khác 28 2.2 Tổng quan định 30 2.2.1 Khái niệm định 30 2.2.2 Đánh giá định 32 Khóa luận tốt nghiệp 55 Khoa Hệ thống thơng tin quản lý Phân tích u cầu tốn Muc đích: Tạo ' định WEKA để dự đốn xem với thơng tin KH có sẵn ngân hàng đánh giá KH thuộc nhóm nợ mấy? 3.4.2 Tiền xử lý liệu Trong qui trình khai phá liệu, cơng việc xử lý liệu trước đưa vào mơ hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc - original data) áp dụng (thích hợp) với mơ hình khai phá liệu (data mining model) cụ thể Các công việc cụ thể tiền xử lý liệu bao gồm cơng việc như: Filtering Attributes: Chọn thuộc tính phù hợp với mơ hình Filtering samples: Lọc mẫu (instances, patterns) liệu cho mơ hình Clean data: Làm liệu xóa bỏ liệu bất thường (Outlier) Transformation: Chuyển đổi liệu cho phù hợp với mơ chuyển đổi liệu từ numeric qua nomial hay ordinal Discretization (rời rạc hóa liệu): Nếu có liệu liên tục vài mơ hình áp dụng cho liệu rời rạc (như luật kết hợp chẳng hạn) phải thực việc rời rạc hóa liệu Các bước tiền xử lý liệu thưc sau: Sinh viên: Nguyễn Đình Tài Lớp: HTTTB-K12 Khóa luận tốt nghiệp 57 56 Khoa KhoaHệ Hệthống thốngthông thôngtin tinquản quảnlýlý Thuộc Bước 1: tính nạpnhom_no: liệu (Loading the Data) vào Weka: chọn tab “Preprocess” > Open file Nhóm Nhóm Nhóm Số lượng Cơ cấu Hình 3.4 Nạp CSDL vào WEKA 32 7.21% Sau liệu nạp lên, panel bên trái thể thuộc tính file liệu, panel bên phải thể thống kê tương ứng với thuộc tính bên trái (xem 81 18.24% hình sau) Hình 3.6 Thuộc tính Nhóm nợ 36.71% Nhóm 163 Nhóm 120 27.03% Trong đó, số lượng khoản vay nhóm nợ sau: Nhóm 48 10.91% Hình 3.5 Thuộc tính ID Sinh viên: Nguyễn Đình Tài Lớp: HTTTB-K12 Bảng 3.2 Tỷ lệ nhóm nợ CSDL Sau nạp liệu, ta tiến hành lọc liệu Trong file liệu bank-tài.csv, khách hàng xác định thuộc tính id Chúng ta cần loại bỏ thuộc tính trước thực bước Công việc thực Sinh viên: Nguyễn Đình Tài Lớp: HTTTB-K12 Khóa luận tốt nghiệp 58 Khoa Hệ thống thông tin quản lý dễ dàng Weka sau: Trong panel Filter > Choose > filters >unsupervised > attribute > Remove: Bước bấm chọn textbox bên phải nút “Choose” gỏ vào (đây index thuộc tính id file liệu) Hình 3.7 Loại bỏ thuộc tính ID Bấm nút “Apply” tạo liệu (working relation) với 19 thuộc tính sau loại bỏ thuộc tính id Bây ta lưu lại liệu sau loại bỏ thuộc tính id dạng file arff với tên "bank-tài2.arff" Để thực việc rời rạc hóa liệu bước Chọn nút “save” gõ vào tên file "bank-tài2.arff" Nội dung file “bank-tài2.arff” sau (trong Word): Sinh viên: Nguyễn Đình Tài Lớp: HTTTB-K12 Khóa luận tốt nghiệp 59 Khoa Hệ thống thơng tin quản lý ^relation Bank-Tai-Weka filters.un3upervi3ed.attribute.Remove-Rl Sattribute tuoi numeric (!attribute gioi_tinh {nam,nu} Sattribute hoc_van {duoi th,dh,cd, tren_dh, th} Sattribute tienan_tiensu {co,khong} Sattribute tinhtrang_cutru {CSHfNCC,THUE,KHAC,V0IJ3D} Sattribute cocau_giadinh {voi_gd_khac, hat_nhan,VOi borne,khac} Sattribute baohiem_nhanmang {khong,co} Sattribute Songuoi phuthuoc numeric Sattribute tinhchat_congviec {ld_thoi_vu, quan ly, Chuyenjnon,ld_duoc_dt, that nghiep} Sattribute thoigian_lamviec numeric Sattribute ruirojιghenghiep {tb,thap,cao} Sattribute thu Jihap numeric Sattribute tyle_pt/tn numeric Sattribute taisan_dambao {co,khong} Sattribute thoihan_trano {da_co_nqh, khjnoi, dung_han, da_gh, dang_co_nqh} Sattribute dichvu_3udung {khong_sd, tg+dvkhac, dv_tt} Sattribute Songayjquahan numeric Sattribute 3olan_giahan numeric Sattribute nhomjιo {V,III,I,II,IV} Sdata 57,nam, duoi th, co, CSH,VOijjdJchac, khong, 1, ld_thoi_vu, O, tb, 5.3,0.5, co, da C OJiqh, khong_3 d, 0, 2, V 57, nu,dh,khong,NCC,hat_nhan, co,4, quan ly, 3, thap, 9.6,0.66, khong, khjnoi, tg+ dvkhac, O, O, III 22,nam, cd,khong, THUE, VOi borne, khong,O, Chuyenjnon,l,tb, 6.1,0.35, khong, khjn 0i, tg+dvkhac, O,O,III 58, nam, trenjdh, khong,CSH, hat Jihan, co,5, quan ly, 7,tb,10.3, 0.76, khong,khjno i,tg+dvkhac,O,O, III 52,nu,tren_dh,khong, KHAC, khac, khong,O, quan ly,5, thap, 8.9, 0.3,co,dungJ1an, tg+dvkhac,O,O,I Hình 3.8 Nội dung file bank-tai2.arrf 3.4.3 Xây dựng mơ hình định Mơ hình thử nghiệm thực sau: Bước 1: Chọn menu Preprocess để vào panel lấy nguồn thử nghiệm Bước 2: Click Open File để đến vị trí file nguồn liệu Bước 3: Chọn file nguồn liệu file bank-data.arff thu sau thực tiền xử lý liệu Sau thực thao tác ta thu hình 3.9: Sinh viên: Nguyễn Đình Tài Lớp: HTTTB-K12 Khóa luận tốt nghiệp 60 Khoa Hệ thống thơng tin quản lý Hình 3.9 Giao diện tiền xử lý sau loại bỏ thuộc tính ID Đầu tiên chế độ kiểm thử Use training set: Sau chọn nguồn liệu chế độ kiểm thử Use training set, ta tiến hành thử nghiệm nguồn sau: - Chọn menu Classify để thực chức phân lớp - Click nút Choose để lựa chọn thuật toán cho việc phân lớp Ở ta chọn thuật tốn J48, Weka, thuật toán C4.5 thực phân loại J48 Click vào nút Start để thực chức phân lớp hình 3.10 Ket thử nghiệm: Ta thu kết dạng: - Dạng text (hình 3.10 3.11): bao gồm thơng tin: ■ Số node lá: 34 ■ Kích thước cây: 55 ■ Số mẫu phân loại đúng: 435 chiếm 97,97% ■ Số mẫu phân loại chưa đúng: chiếm 2,03% Sinh viên: Nguyễn Đình Tài Lớp: HTTTB-K12 Khóa luận tốt nghiệp 61 Khoa Hệ thống thông tin quản lý Hình 3.10 Ket dạng Text sau chạy thuật tốn Hình 3.11 Ket dạng Text sau chạy thuật tốn (2) Sinh viên: Nguyễn Đình Tài Lớp: HTTTB-K12 Khóa luận tốt nghiệp 62 Khoa Hệ thống thơng tin quản lý Dạng mơ hình (hình 3.12): đầu định thông thường mà node phân loại Hình 3.12 Mơ hình định toán quản trị rủi ro tín dụng Nhận thấy kết chạy thử nghiệm với số liệu chế độ kiểm thử khác Use training set, Cross - validatio, Percentage split thu mơ hình định 3.4.4 Rút luật Sau khởi chạy sở liệu phần mềm WEKA, ta thu luật sau solan_giahan |3.4.5 solan_giahan định dự báo nhóm nợ khoản vay chưa Sử dụngvề | solan_giahan thuộc tính tuổi, giới tính, trình độ học vấn, tiền án tiền sự, tình trạng cư trú, số người phụ thuộc, cấu gia đình, bảo hiểm nhân mạng, tính chất | | songay_quahan 2: V (34.08/0.08) Luật 1: Neu số lần gia hạn