Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 14 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
14
Dung lượng
589,32 KB
Nội dung
Cơng trình hồn thành BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG ĐẠI HỌC ĐÀ NẴNG NGUYỄN TRẦN TIẾN Người hướng dẫn khoa học: TS NGUYỄN VĂN HIỆU Phản biện 1: XÂY DỰNG HỆ HỖ TRỢ RA QUYẾT ĐỊNH TRONG VIỆC PHÂN LOẠI KHÁCH HÀNG VAY VỐN CỦA NGÂN HÀNG Phản biện 2: Luận văn bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ Thạc sĩ kỹ thuật họp Đại học Đà Nẵng vào ngày 18 tháng 07 năm 2015 Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60.48.01.01 TĨM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Có thể tìm hiểu luận văn tại: Đà Nẵng – Năm 2015 Trung tâm Thông tin – Học liệu, Đại học Đà Nẵng Trung tâm Học liệu, Đại học Đà Nẵng MỞ ĐẦU tài sản bảo đảm hay không tài sản bảo đảm, mà phần lớn đến từ hoạt Lý chọn đề tài động phân tích tín dụng hệ thống ngân hàng thương mại Bởi Trong lĩnh vực dịch vụ tài chính, hoạt động gắn liền với đánh giá khách hàng vay vốn, ngân hàng phải trả lời việc tiếp nhận xử lý thông tin, việc ứng dụng công nghệ câu hỏi “khách hàng cho vay có đáng tin cậy khơng?”, độ tin thơng tin có ý nghĩa quan trọng ngành ngân hàng để phát triển cậy cao đồng nghĩa với khả trả nợ hạn lớn bền vững có hiệu cao Qua q trình hoạt động, liệu ngân Với mong muốn nghiên cứu việc xây dựng hệ thống hàng tích lũy có kích thước ngày lớn, ẩn hỗ trợ định để đánh giá, phân loại khách hàng vay vốn chứa nhiều thông tin dạng quy luật chưa khám phá Chính Ngân hàng VPBank, tơi chọn đề tài “Xây dựng hệ hỗ trợ vậy, nhu cầu đặt cần tìm cách trích rút từ tập liệu định việc phân loại khách hàng vay vốn ngân hàng” làm luật phân lớp liệu hay dự đoán xu hướng liệu tương luận văn tốt nghiệp lai Mục tiêu nhiệm vụ Công nghệ, kỹ thuật phân lớp liệu đã, phát triển Nghiên cứu lý thuyết hệ hỗ trợ định, khai phá mạnh mẽ trước khao khát tri thức người, thu hút liệu, lý thuyết định để từ xây dựng hệ thống hỗ quan tâm nhà nghiên cứu nhiều lĩnh vực khác học trợ định ứng dụng vào việc phân loại khách hàng vay vốn ngân máy, hệ chuyên gia, thống kê Nhiều phương pháp kỹ thuật phân lớp hàng đề xuất khơng có phương pháp tiếp cận phân loại Đối tượng phạm vi nghiên cứu tối ưu xác hẳn phương pháp khác Tuy nhiên sử dụng định để tìm luật phân lớp công cụ khai phá tri thức tương đối hiệu Đối tượng nghiên cứu: hệ hỗ trợ định, thuật toán xây dựng định, khai phá liệu Phạm vi nghiên cứu: Ứng dụng thuật toán để xây dựng Ngày 24/7/2014, Ngân hàng nhà nước ban hành văn số định việc phân loại đối tượng khách hàng vay vốn Các biểu 5342/NHNN – TTGSNH yêu cầu tổ chức tín dụng, chi nhánh ngân mẫu, số liệu liên quan đến việc phân loại khách hàng vay vốn tín hàng nước triển khai Chỉ thị 11/CT – TTg Thủ tướng Chính dụng Mẫu liệu danh sách đối tượng khách hàng vay vốn phủ Phần lớn giải pháp văn NHNN nhằm hướng (gói vay mua nhà- xây dựng sửa chữa nhà) ngân hàng VPBank đến hoàn thiện hoạt động cấp tín dụng TCTD Một Phương pháp nghiên cứu giải pháp quan tâm “tăng cường khả cho vay Phương pháp nghiên cứu lý thuyết: Tìm hiểu, phân tích, tổng hợp khơng có bảo đảm tài sản” loại cho vay có rủi ro cao tài liệu hệ hỗ trợ định, khai phá liệu sử dụng nhân tố ảnh hưởng mạnh đến gia tăng nợ xấu Nợ xấu khơng đến từ có thuật tốn định Thu thập, tìm hiểu, nghiên cứu tài liệu quy định vay vốn tín dụng ngân hàng VPBank Chương luận văn trình bày phương pháp xây dựng, cài đặt ứng Phương pháp nghiên cứu thực nghiệm: Phân tích yêu cầu thực tế dụng tiến hàng thử nghiệm ứng dụng để phân tích, đánh giá cơng việc, áp dụng lý thuyết, thuật toán liên quan để xây đưa nhận xét dựng hệ hỗ trợ định; Xây dựng liệu mẫu dùng để kiểm tra, thử nghiệm chương trình đưa đánh giá kết đạt Ý nghĩa khoa học thực tiễn đề tài Về mặt khoa học: Nắm bắt vận dụng kiến thức lĩnh vực CHƯƠNG TỔNG QUAN VỀ HỆ HỖ TRỢ RA QUYẾT ĐỊNH 1.1 khai phá liệu để phát triển hệ thống ứng dụng hỗ trợ 1.1.1 Khái niệm định định phân loại khách hàng vay vốn ngân hàng HỆ HỖ TRỢ RA QUYẾT ĐỊNH Về mặt thực tiễn: Xây dựng hệ thống hỗ trợ định ứng dụng 1.1.2 Khái niệm hệ hỗ trợ định việc phân loại khách hàng vay vốn ngân hàng VPBank Hệ thống thiết kế đơn giản, linh hoạt dễ sử dụng Sản phẩm hệ thống 1.2 PHÂN LOẠI DỮ LIỆU VÀ DỰ BÁO TRONG KHAI PHÁ DỮ LIỆU hỗ trợ cho cán tín dụng phân loại khách hàng vay vốn Bố cục luận văn 1.2.1 Khai phá liệu Luận văn chia làm ba chương CHƯƠNG TỔNG QUAN VỀ HỆ HỖ TRỢ RA QUYẾT ĐỊNH 1.2.2 Phân lớp liệu Trong chương này, luận văn trình bày khái quát hệ hỗ trợ 1.2.3 Dự báo định Trình bày thuật tốn xây dựng định C4.5, giới thiệu giải thuật C5.0 CHƯƠNG ỨNG DỤNG CÂY QUYẾT ĐỊNH TRONG VIỆC PHÂN LOẠI KHÁCH HÀNG VAY VỐN TẠI NGÂN HÀNG 1.3 CÂY QUYẾT ĐỊNH 1.3.1 Giới thiệu chung Luận văn phân tích số liệu cụ thể đưa giải pháp ứng dụng định để xây dựng hệ thống trợ giúp định 1.3.2 Phân lớp liệu dựa kiểu định phân loại khách hàng vay vốn Để phân lớp mẫu liệu chưa biết, giá trị thuộc tính CHƯƠNG XÂY DỰNG VÀ THỬ NGHIỆM ỨNG DỤNG mẫu đưa vào kiểm tra định Mỗi mẫu tương ứng có đường từ gốc đến biểu diễn dự đoán giá trị phân lớp mẫu 5 Q trình phân lớp liệu thông qua bước [2], [12] (5) IF THEN ; Bước 1: Xây dựng mơ hình từ tập huấn luyện (6) FOR DO Bước 2: Sử dụng mơ hình, kiểm tra tính đắn mơ hình (7) dùng để phân lớp liệu ; (8) ELSE 1.3.3 Giải thuật xây dựng định 1.4 IF THEN ; (9) ; 1.4.1 Giới thiệu (10) ; } b Đánh giá độ phức tạp thuật toán C4.5 1.4.2 Thuật toán C4.5 c Chọn thuộc tính phân loại tốt a Thuật tốn C4.5 d Entropy đo tính Thuật tốn C4.5 thực sau: Đầu vào tập liệu huấn luyện T Đầu định e Độ lợi thông tin đo mức độ giảm Entropy mong đợi f Function Tao_Cay_C4.5(T) { Tỷ suất lợi ích Gain Ratio g Xử lí thuộc tính có giá trị liên tục bị thiếu (1) ; 1.4.3 Thuật toán See5/C5.0 (2) IF Thuật toán See5/C5.0 thuật toán cải tiến từ thuật toán THEN ; ELSE ; (3) FOR DO ; (4) ; C4.5 (được gọi C4.5 hệ điều hành Unix, hệ điều hành Window See5) Thuật tốn C5.0 có điểm bật [17], [18]: Tạo tập luật nhanh tốn nhớ Tạo định nhanh nhỏ 7 Tăng cường phân lớp việc tạo vài định trường hợp hay ví dụ gặp tương lai Hay cụ thể có phối hợp để nâng cao khả dự đoán khả phân loại ví dụ khơng nằm tập liệu huấn Thêm số thuộc tính thời gian, dấu thời gian, luyện thuộc tính rời rạc xếp thứ tự Là thuật toán thiết kế để xử lí tốt tập liệu lớn có nhiều thuộc tính Thuật tốn C5.0 thực sau: Đầu vào: Tập liệu huấn luyện, tập thuộc tính Đầu ra: Cây định Các bước xử lí thuật tốn: Để đánh giá mức độ hiệu định, người ta thường sử dụng tập ví dụ rời rạc, tập khác với tập liệu huấn luyện, để đánh giá khả phân loại ví dụ tập Tập liệu gọi tập kiểm tra Thơng thường, tập liệu sẵn có chia thành hai tập, tập huấn luyện chiếm 2/3 số ví dụ tập kiểm tra chiếm 1/3 [14], [17] 1.4.5 Chuyển dạng luật (1) Kiểm tra điều kiện cho việc phân loại (2) Duyệt thuộc tính A tập liệu huấn luyện: TỔNG KẾT CHƯƠNG Tính độ lợi thơng tin Gain cho thuộc tính A Đặt A _best thuộc tính có độ lợi thơng tin lớn Tạo nút chia định ứng với thuộc tính A _best định, bao gồm khái niệm hệ hỗ trợ định, trình Gọi đệ quy thực xây dựng ứng với danh sách định thành phần hệ hỗ trợ định thu từ việc tìm thuộc tính A _best Trong chương này, luận văn trình bày khái quát hệ hỗ trợ Giới thiệu chung phân loại liệu, định ưu Thuật toán C5.0 chia tập liệu theo độ lợi thông tin lớn nhược điểm điểm Bên cạnh luận văn trình bày Lần đầu chia định nghĩa tập ví dụ Lần chia thuật toán xây dựng định sâu nghiên cứu giải thuật thực thuộc tính khác Thủ tục thực lặp C4.5, giới thiệu giải thuật C5.0 để xây dựng định Đây đến tập chia Cuối cùng, kiểm tra bước chia sở lý thuyết cần thiết để xây dựng đề tài mức thấp nhất, tập ví dụ khơng có giá trị bị cắt bỏ Trong chương tiếp theo, luận văn trình bày chi tiết cách thức 1.4.4 Phương pháp đánh giá mức độ hiệu Một định sinh thuật toán C4.5 hay See5/C5.0 đánh giá tốt có khả phân loại vận dụng định để giải toán phân loại khách hàng vay vốn ngân hàng CHƯƠNG 10 Như giải toán liệu thu nhập đầu vào ỨNG DỤNG CÂY QUYẾT ĐỊNH TRONG VIỆC PHÂN LOẠI thông tin liên quan đến cá nhân tổ chức, công ty đứng đơn vay KHÁCH HÀNG VAY VỐN TẠI NGÂN HÀNG tín dụng Kết tốn định cho vay khơng cho vay khả trả nợ hạn khách hàng vay Thơng tin 2.1 QUY TRÌNH TÍN DỤNG VAY VỐN CỦA KHÁCH cần xử lý thông cá nhân, sở hữu tài sản chấp, phương HÀNG án kinh doanh… 2.1.1 Quy trình tín dụng 2.2.3 Phương pháp giải toán 2.1.2 Ý nghĩa quy trình tín dụng Hiện để đánh giá thẩm định hồ sơ vay vốn, ngân hàng thực theo phương pháp thủ cơng, nhận định hồ sơ vay 2.2 XÂY DỰNG BÀI TOÁN PHÂN LOẠI KHÁCH HÀNG vốn theo kinh nghiệm cán tín dụng, kết hợp với sử dụng phần VAY VỐN mềm xếp hạng tín dụng sau thẩm định hồ sơ Q trình 2.2.1 Giới thiệu thực sau: Ngân hàng cử cán tín dụng thẩm định khách hàng Cán tín 2.2.2 Bài tốn dụng kiểm tra tài sản vay chấp, hay phương án kinh Ngân hàng thương mại cổ phần tổ chức tín dụng thực doanh, độ tin cậy vay tín chấp thơng tin (thơng tin hiên hoạt động kinh doanh ngày Trong có hoạt động cho khoản vay tổ chức khác, quan cơng tác, cách sống uy tín vay, thực xem xét, kiểm tra hồ sơ khách hàng dự địa phương nơi cư trú, tuổi tác…) đốn khả hồn trả vay hay khơng khoản tín dụng Để thực Việc kiểm tra thơng cán tín dụng dựa thơng tin vấn đề ngân hàng tiến hành thu thập thơng tin khách hàng người vay điền vào mẫu có sẵn, đơn vay ngân hàng phát hành (bao (tuổi tác, nơi cư trú, thu nhập, tài sản đảm bảo…) Từ thông tin gồm thông tin nghề nghiệp, chức vụ, số người phụ thuộc, năm ban đầu đặt tốn cán tín dụng ngân hàng làm công tác, tuổi tác, giới tính…) Trên sở thơng tin cụ thể cán xác định đơn vay khách hàng vay hay ngược lại tín dụng cán tín dụng đề xuất biện pháp cụ thể cho đơn vay khách hàng đơn vay không duyệt vay, đơn hàng vay khả trả nợ đơn hàng nào, có hạn hay không Đơn vay sau xét duyệt cho vay cán tín dụng chuyển tồn hồ sơ đầy đủ thẩm định đến phòng Quản lý giám sát tín dụng Cán quản phòng ứng dụng phần mềm 11 12 tin học áp dụng hệ thống Ngân hàng VPBank để đánh giá xếp hạng đơn vay Giải pháp sử dụng định phù hợp để xây dựng hệ hỗ trợ định phân loại khách hàng, xử lý khối Như việc ứng dụng CNTT góp phần giải lượng lớn liệu với tốc độ tính tốn tương đối nhanh đưa lương lớn công việc ngân hàng Tuy nhiên chưa mang tính tồn tập luật trực quan Việc học tập phân loại định đơn vẹn, giúp vài phận nghiệp vụ ngân hàng tăng hiệu giản, nhanh chóng có độ xác chấp nhận suất thời gian làm việc Nó chưa hỗ trợ cho lãnh đạo việc định, xếp loại đơn vay sau cán tín dụng 2.3 định chọn hồ sơ vay vốn 2.3.1 Phân tích liệu Thêm vào chương trình sử dụng chung cho tồn gói tín dụng, điều có nghĩa có khuyết điểm áp dụng cho gói tín dụng cụ thể Chẳng hạn gói tín dụng “Cho vay cá nhân xây dựng/sửa chữa nhà” dựa vào giá trị thông tin “văn liên quan đến xây dựng” giấy phép xây dựng, hợp đồng xây dựng… để đánh giá, gói tín dụng khác khơng cần thiết thông tin Luận văn giới thiệu xây dựng hệ thống hỗ trợ cán tín dụng định từ khâu đánh giá, thẩm định đơn vay cho gói tín dụng “Cho vay cá nhân xây dựng/sửa chữa nhà” kết nhanh chóng dựa tập liệu đồ sộ ngân hàng XÂY DỰNG CÂY QUYẾT ĐỊNH Để thuật toán xây dựng định hiệu quả, đáng tin cậy, trước tiên phải lượng hóa liệu nhằm có tập liệu huấn luyện Tập liệu huấn luyện có tầm quan trọng lớn, xác, bao quát hầu hết trường hợp xảy thực tế tập luật rút từ định xác đưa kết có độ tin cậy lớn Minh họa việc ứng dụng hệ hỗ trợ định việc phân loại khách hàng vay vốn, tiến hành thử nghiệm với liệu ngân hàng VPBank, gói liệu xây dựng - sửa chữa nhà Tập liệu kết xuất từ chương trình lưu trữ ngân hàng Phụ lục Với hồ sơ vay có nhiều thông tin ảnh hưởng đến kết 2.2.4 Giải pháp xây dựng hệ thống trợ giúp định xét duyệt đơn vay Tuy nhiên ta cần quan tâm trọng Với khối lượng liệu lớn khách hàng năm phân tích yếu tố liên quan tới việc vay vốn gói vay qua, cần có phương pháp phân tích liệu cách khoa học, “Cho vay cá nhân xây dựng/sửa chữa nhà” Những thuộc tính chủ yếu sở đánh giá đơn vay đưa dự đoán khả gồm: Tuổi khách hàng vay; nghề nghiệp; mức thu nhập hàng năm; tình chi trả nợ đơn vay Từ đó, giúp cho cán tín dụng có trạng nhân; số người phụ thuộc; nhóm nợ khách hàng tổ định hợp lí xem xét, đánh giá hồ sơ vay chức tín dụng trước đây; khách hàng có sở hữu nhà khơng; đầy đủ văn liên quan đến việc xây dựng/ sửa chữa nhà Từ thuộc tính 13 14 chủ yếu để kết luận hồ sơ vay vốn có vay vốn hay Hình 2.6 Cây định hồn chỉnh khơng Tập liệu có dạng: 48 Nghe Nghiep CBQL Thu Nhap 120 Ket Hon NO 57 KDDK 100 YES 44 Khac Tuoi b Rút luật từ định Phu Nhom SoHuu Van Thuoc No Nha Ban YES NO Ket Qua YES tạo thành luật, luật có vế trái giá trị Từ định, đường dẫn từ gốc đến nút YES YES YES thuộc tính chọn để phân lớp, vế phải giá trị 240 NO 1 YES Bảng 2.3 Danh sách liệu khách hàng NO YES thuộc tính kết Ta rút số luật sau từ định vừa xây dựng: 2.3.2 Triển khai giải thuật C4.5 xây dựng định IF (NgheNghiep=CBQL and NhomNo=2) THEN KetQua=YES a Xây dựng định IF (NgheNghiep=NV and SoHuuNha=NO) THEN KetQua=NO Dữ liệu vào gồm 29 ví dụ, 08 thuộc tính điều kiện 01 thuộc tính định có 02 nhãn lớp YES/NO Dữ liệu mơ hình định cho vay không cho vay Áp dụng giải thuật, xây dựng định hình 2.8 IF (NgheNghiep=Khac and ThuNhap160) THEN KetQua=YES IF (NgheNghiep=KDDK and Tuoi