Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 79 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
79
Dung lượng
2,64 MB
Nội dung
HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC Đề tài: “ỨNG DỤNG MƠ HÌNH CÂY QUYẾT ĐỊNH VÀO QUẢN TRỊ RỦI RO TÍN DỤNG NGÂN HÀNG” Giảng viên hƣớng dẫn : ThS Trần Thị Huế Sinh viên thực : Nguyễn Đình Tài Lớp : HTTTB Khố : 12 (2009-2013) Hệ : Chính quy Hà Nội, tháng 5/2013 HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THƠNG TIN QUẢN LÝ KHỐ LUẬN TỐT NGHIỆP ĐẠI HỌC Đề tài: “ỨNG DỤNG MƠ HÌNH CÂY QUYẾT ĐỊNH VÀO QUẢN TRỊ RỦI RO TÍN DỤNG NGÂN HÀNG” Giảng viên hƣớng dẫn : ThS Trần Thi Huế Sinh viên thực : Nguyễn Đình Tài Lớp : HTTTB Khố : 12 (2009-2013) Hệ : Chính quy Hà Nội, tháng 5/2013 i LỜI CẢM ƠN Tôi xin bày tỏ lòng biết ơn sâu sắc tới giảng viên hướng dẫn Ths Trần Thị Huế người định hướng đề tài tận tình hướng dẫn bảo tơi suốt q trình thực khố luận tốt nghiệp Tôi xin chân thành cảm ơn thầy cô trường Học viện ngân hàng đặc biệt thầy cô khoa Hệ Thống Thông Tin Quản Lý tận tình giảng dạy truyền đạt kiến thức suốt năm học đại học Bên cạnh tơi muốn gửi lời cảm ơn chân thành tới anh, chị phòng giao dịch Ngân hàng Nông nghiệp Phát triển Nông thôn chi nhánh Xuân Mai tạo điều kiện giúp đỡ q trình tơi thực tập ngân hàng cung cấp số liệu để tơi hồn thành khố luận tốt nghiệp Trong q trình thực luận văn khơng tránh khỏi thiếu sót, hạn chế, tơi mong nhận góp ý, nhận xét thầy để tơi hồn thiện khố luận tốt nghiệp ii LỜI CAM ĐOAN Tơi xin cam đoan kết đạt khóa luận sản phẩm nghiên cứu, tìm hiểu cá nhân tơi Trong tồn nội dung khóa luận, điều trình bày cá nhân tơi, tổng hợp từ nhiều nguồn tài liệu Tôi xin hồn tồn chịu trách nhiệm chịu hình thức kỉ luật theo quy định cho lời cam đoan Hà Nội, tháng năm 2013 Sinh viên Nguyễn Đình Tài iii DANH MỤC CÁC CHỮ VIẾT TẮT NHTM Ngân Hàng Thương Mại RRTD Rủi Ro Tín Dụng QTRRTD Quản Trị Rủi Ro Tín Dụng XHTD Xếp Hạng Tín Dụng CBTD Cán Bộ Tín Dụng CNTT Cơng Nghệ Thơng Tin KPDL Khai Phá Dữ Liệu CSDL Cơ Sở Dữ Liệu NHNoN & PTNT Ngân hàng Nông Nghiệp Phát triển Nơng thơn iv DANH MỤC CÁC HÌNH VẼ Hình 2.1 Quy trình phát tri thức 19 Hình 2.2 Cây định phân lớp mức lƣơng 32 Hình 2.3 Cây định cho khái niệm “có chơi tennis khơng” 41 Hình 2.4 Xây dựng định cho toán Play Golf 42 Hình 2.5 Xây dựng định cho toán Play Golf (2) 42 Hình 2.6 Xây dựng định cho toán Play Golf (3) 43 Hình 2.7 Cây định cho toán Play Golf (Phần mềm WEKA) 44 Hình 3.1 Giao diện đ họa Weka 50 Hình 3.2 Các chức Weka Explorer 51 Hình 3.3 Bộ sở liệu mẫu 54 Hình 3.4 Nạp CSDL vào WEKA 56 Hình 3.5 Thuộc tính ID 56 Hình 3.6 Thuộc tính Nhóm nợ 57 Hình 3.7 Loại bỏ thuộc tính ID 58 Hình 3.8 Nội dung file bank-tài2.arrf 59 Hình 3.9 Giao diện tiền xử lý sau loại bỏ thuộc tính ID 60 Hình 3.10 Kết dạng Text sau chạy thuật toán 61 Hình 3.11 Kết dạng Text sau chạy thuật toán (2) 61 Hình 3.12 Mơ hình định toán quản trị rủi ro tín dụng 62 Hình 3.13 Dữ liệu cần xác định nhóm nợ 65 Hình 3.14 Bảng kết phân lớp nhóm nợ 66 v DANH MỤC CÁC BẢNG BIỂU Bảng 2.1 Play Golf Dataset 40 Bảng 3.1 Thuộc tính CSDL 54 Bảng 3.2 Tỷ lệ nhóm nợ CSDL 57 vi MỤC LỤC LỜI CẢM ƠN i LỜI CAM ĐOAN ii DANH MỤC CÁC CHỮ VIẾT TẮT iii DANH MỤC CÁC HÌNH VẼ iv LỜI MỞ ĐẦU CHƢƠNG 1: LÝ LUẬN CHUNG VỀ RỦI RO TÍN DỤNG TRONG HOẠT ĐỘNG KINH DOANH CỦA NGÂN HÀNG THƢƠNG MẠI 1.1 Khái niệm đặc điểm rủi ro tín dụng 1.1.1 Khái niệm rủi ro tín dụng 1.1.2 Đặc điểm rủi ro tín dụng 1.2 Phân loại rủi ro tín dụng 1.2.1 Căn vào nguyên nhân phát sinh rủi ro 1.2.2 Căn vào khả trả nợ cho ngân hàng 1.3 Các dấu hiệu nhận biết rủi ro tín dụng hoạt động kinh doanh ngân hàng 1.3.1 Nhóm dấu hiệu liên quan đến mối quan hệ với khách hàng 1.3.2 Nhóm dấu hiệu liên quan đến phương pháp quản lý ngân hàng 1.3.3 Nhóm dấu hiệu liên quan tới ưu tiên kinh doanh 1.3.4 Nhóm dấu hiệu xử lý thơng tin tài chính, kế tốn 1.3.5 Nhóm dầu hiệu thuộc vấn đề kỹ thuật thương mại 1.4 Hậu rủi ro tín dụng 1.4.1 Đối với khách hàng 1.4.1.1 Đối với người gửi tiền 1.4.1.2 Đối với người vay tiền 1.4.1.3 Đối với khách hàng gây nợ xấu, nợ hạn cho ngân hàng 1.4.2 Đối với ngân hàng 1.4.2.1 Rủi ro tín dụng làm tăng chi phí ngân hàng 1.4.2.2 Rủi ro tín dụng làm giảm khả toán ngân hàng 10 1.4.2.3 Rủi ro tín dụng làm giảm uy tín ngân hàng thị trường 10 1.4.2.4 Rủi ro tín dụng làm cho ngân hàng bị phá sản 10 1.4.3 Đối với kinh tế 10 vii 1.5 Nguyên nhân phát sinh rủi ro tín dụng 11 1.5.1 Nguyên nhân từ phía khách hàng 11 1.5.2 Nguyên nhân từ phía ngân hàng 11 1.5.3 Nguyên nhân khách quan từ kinh tế 12 1.6 Quản trị rủi ro tín dụng tốn dự báo rủi ro tín dụng 13 1.7 Xếp hạng tín dụng 14 1.7.1 Khái niệm xếp hạng tín dụng 14 1.7.2 Quy trình xếp hạng tín dụng 15 1.7.3 Vai trị xếp hạng tín dụng 16 CHƢƠNG 2: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU VÀ CÂY QUYẾT ĐỊNH 18 2.1 Tổng quan khai phá liệu 18 2.1.1 Khái niệm khai phá liệu 18 2.1.2 Các ứng dụng khai phá liệu 18 2.1.3 Các bước trình khai phá liệu 19 2.1.4 Nhiệm vụ khai phá liệu 20 2.1.4.1 Phân lớp (phân loại - classification) 20 2.1.4.2 Hồi qui (regression) 21 2.1.4.3 Phân nhóm (clustering) 21 2.1.4.4 Tổng hợp (summarization) 21 2.1.4.5 Mơ hình hố phụ thuộc (dependency modeling) 22 2.1.4.6 Phát biến đổi độ lệch (change and deviation dectection) 22 2.1.5 Các phương pháp khai phá liệu 23 2.1.5.1 Phương pháp suy diễn / quy nạp 23 2.1.5.2 Phương pháp ứng dụng K-láng giềng gần 23 2.1.5.3 Phương pháp sử dụng định 24 2.1.5.4 Phương pháp phát luật kết hợp 25 2.1.6 Những thách thức ứng dụng nghiên cứu kỹ thuật khai phá liệu 26 2.1.6.1 Các vấn đề sở liệu 26 2.1.6.2 Một số vấn đề khác 28 2.2 Tổng quan định 30 2.2.1 Khái niệm định 30 2.2.2 Đánh giá định 32 viii 2.2.2.1 Ưu điểm định 32 2.2.2.2 Nhược điểm định 33 2.2.3 Xây dựng định 33 2.2.4 Thuật toán C4.5 định 35 2.2.5 Ví dụ minh họa xây dựng định 39 CHƢƠNG 3: ỨNG DỤNG CÂY QUYẾT ĐỊNH VÀO QUẢN TRỊ RỦI RO TÍN DỤNG TẠI NGÂN HÀNG NƠNG NGHIỆP VÀ PHÁT TRIỂN NÔNG THÔN CHI NHÁNH XUÂN MAI 45 3.1 Thực trạng quản trị rủi ro tín dụng Ngân hàng Nơng Nghiệp Phát triển Nông thôn chi nhánh Xuân Mai 45 3.1.1 Lịch sử hình thành phát triển 45 3.1.2 Đánh giá quản trị rủi ro tín dụng Ngân hàng Nông Nghiệp Phát triển Nông thôn chi nhánh Xuân Mai 46 3.1.2.1 Kết đạt 46 3.1.2.2 Những tồn 47 3.1.2.3 Nguyên nhân tồn 48 3.2 Mơ tả tốn 49 3.3 Công cụ sử dụng – Phần mềm khai phá liệu WEKA 49 3.4 Xây dựng định với sở liệu ngân hàng Nông nghiệp Phát triển Nông thôn- chi nhánh Xuân Mai 53 3.4.1 Bộ CSDL phân tích yêu cầu toán 53 3.4.2 Tiền xử lý liệu 55 3.4.3 Xây dựng mơ hình định 59 3.4.4 Rút luật 62 3.4.5 Sử dụng định dự báo nhóm nợ khoản vay chưa biết 65 3.5 Đánh giá kết việc ứng dụng định vào quản trị rủi ro tín dụng đƣợc thử nghiệm với phần mềm WEKA 66 KẾT LUẬN CHUNG 68 DANH MỤC TÀI LIỆU THAM KHẢO 69 Khóa luận tốt nghiệp 55 Khoa Hệ thống thông tin quản lý Phân tích u cầu tốn I Thơng tin khách hàng WEKA II Decision III Tree IV V Mục đích: Tạo định WEKA để dự đốn xem với thơng tin KH có sẵn ngân hàng đánh giá KH thuộc nhóm nợ mấy? 3.4.2 Tiền xử lý liệu Trong qui trình khai phá liệu, công việc xử lý liệu trước đưa vào mơ hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc - original data) áp dụng (thích hợp) với mơ hình khai phá liệu (data mining model) cụ thể Các công việc cụ thể tiền xử lý liệu bao gồm công việc như: Filtering Attributes: Chọn thuộc tính phù hợp với mơ hình Filtering samples: Lọc mẫu (instances, patterns) liệu cho mơ hình Clean data: Làm liệu xóa bỏ liệu bất thường (Outlier) Transformation: Chuyển đổi liệu cho phù hợp với mơ chuyển đổi liệu từ numeric qua nomial hay ordinal Discretization (rời rạc hóa liệu): Nếu có liệu liên tục vài mơ hình áp dụng cho liệu rời rạc (như luật kết hợp chẳng hạn) phải thực việc rời rạc hóa liệu Các bước tiền xử lý liệu thưc sau: Sinh viên: Nguyễn Đình Tài Lớp: HTTTB-K12 56 Khóa luận tốt nghiệp Khoa Hệ thống thơng tin quản lý Bước 1: nạp liệu (Loading the Data) vào Weka: chọn tab “Preprocess” > Open file Hình 3.4 Nạp CSDL vào WEKA Sau liệu nạp lên, panel bên trái thể thuộc tính file liệu, panel bên phải thể thống kê tương ứng với thuộc tính bên trái (xem hình sau) Hình 3.5 Thuộc tính ID Sinh viên: Nguyễn Đình Tài Lớp: HTTTB-K12 57 Khóa luận tốt nghiệp Khoa Hệ thống thơng tin quản lý Thuộc tính nhom_no: Hình 3.6 Thuộc tính Nhóm nợ Trong đó, số lượng khoản vay nhóm nợ sau: Nhóm Số lượng Cơ cấu Nhóm 32 7.21% Nhóm 81 18.24% Nhóm 163 36.71% Nhóm 120 27.03% Nhóm 48 10.91% Bảng 3.2 Tỷ lệ nhóm nợ CSDL Sau nạp liệu, ta tiến hành lọc liệu Trong file liệu bank-tài.csv, khách hàng xác định thuộc tính id Chúng ta cần loại bỏ thuộc tính trước thực bước Công việc thực Sinh viên: Nguyễn Đình Tài Lớp: HTTTB-K12 58 Khóa luận tốt nghiệp Khoa Hệ thống thơng tin quản lý dễ dàng Weka sau: Trong panel Filter > Choose > filters >unsupervised > attribute > Remove: Bước bấm chọn textbox bên phải nút “Choose” gỏ vào (đây index thuộc tính id file liệu) Hình 3.7 Loại bỏ thuộc tính ID Bấm nút “Apply” tạo liệu (working relation) với 19 thuộc tính sau loại bỏ thuộc tính id Bây ta lưu lại liệu sau loại bỏ thuộc tính id dạng file arff với tên "bank-tài2.arff" Để thực việc rời rạc hóa liệu bước Chọn nút “save” gõ vào tên file "bank-tài2.arff" Nội dung file “bank-tài2.arff” sau (trong Word): Sinh viên: Nguyễn Đình Tài Lớp: HTTTB-K12 59 Khóa luận tốt nghiệp Khoa Hệ thống thông tin quản lý Hình 3.8 Nội dung file bank-tài2.arrf 3.4.3 Xây dựng mơ hình định Mơ hình thử nghiệm thực sau: Bước 1: Chọn menu Preprocess để vào panel lấy nguồn thử nghiệm Bước 2: Click Open File để đến vị trí file nguồn liệu Bước 3: Chọn file nguồn liệu file bank-data.arff thu sau thực tiền xử lý liệu Sau thực thao tác ta thu hình 3.9: Sinh viên: Nguyễn Đình Tài Lớp: HTTTB-K12 Khóa luận tốt nghiệp 60 Khoa Hệ thống thơng tin quản lý Hình 3.9 Giao diện tiền xử lý sau loại bỏ thuộc tính ID Đầu tiên chế độ kiểm thử Use training set: Sau chọn nguồn liệu chế độ kiểm thử Use training set, ta tiến hành thử nghiệm nguồn sau: - Chọn menu Classify để thực chức phân lớp - Click nút Choose để lựa chọn thuật toán cho việc phân lớp Ở ta chọn thuật tốn J48, Weka, thuật tốn C4.5 thực phân loại J48 Click vào nút Start để thực chức phân lớp hình 3.10 Kết thử nghiệm: Ta thu kết dạng: - Dạng text (hình 3.10 3.11): bao gồm thông tin: Số node lá: 34 Kích thước cây: 55 Số mẫu phân loại đúng: 435 chiếm 97,97% Số mẫu phân loại chưa đúng: chiếm 2,03% Sinh viên: Nguyễn Đình Tài Lớp: HTTTB-K12 Khóa luận tốt nghiệp 61 Khoa Hệ thống thơng tin quản lý Hình 3.10 Kết dạng Text sau chạy thuật tốn Hình 3.11 Kết dạng Text sau chạy thuật toán (2) Sinh viên: Nguyễn Đình Tài Lớp: HTTTB-K12 Khóa luận tốt nghiệp 62 Khoa Hệ thống thông tin quản lý Dạng mơ hình (hình 3.12): đầu định thông thường mà node phân loại Hình 3.12 Mơ hình định tốn quản trị rủi ro tín dụng Nhận thấy kết chạy thử nghiệm với số liệu chế độ kiểm thử khác Use training set, Cross – validatio, Percentage split thu mơ hình định 3.4.4 Rút luật Sau khởi chạy sở liệu phần mềm WEKA, ta thu luật sau solan_giahan | solan_giahan | | songay_quahan 2: V (34.08/0.08) Luật 1: Nếu số lần gia hạn