Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 69 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
69
Dung lượng
2,9 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN NGUYỄN THÀNH VINH XÂY DỰNG HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNH CHO THUÊ TÀI CHÍNH TẠI VIETINBANK Chuyên ngành : Khoa học máy tính Mã số : 8480101 Người hướng dẫn: TS LÊ XUÂN VIỆT LỜI CAM ĐOAN Tơi cam đoan cơng trình nghiên cứu riêng Các số liệu, kết nêu luận văn trung thực chưa công bố tài liệu khác Bình Định, ngày 12 tháng 07 năm 2019 Học viên thực luận văn Nguyễn Thành Vinh LỜI CẢM ƠN Với tình cảm chân thành lòng biết ơn sâu sắc, cho phép gửi lời cảm ơn tới quý Thầy/Cô khoa Công nghệ thông tin, Trường Đại học Quy Nhơn tận tình giảng dạy tạo điều kiện giúp đỡ cho tơi q trình học tập, nghiên cứu Trường Đặc biệt tơi xin bày tỏ lịng biết ơn sâu sắc đến TS Lê Xuân Việt, người tận tình hướng dẫn, bảo giúp đỡ, động viên tơi suốt q trình nghiên cứu hồn thành luận văn Cảm ơn bạn đồng nghiệp, bạn bè, gia đình động viên, khích lệ giúp đỡ tơi q trình học tập nghiên cứu Mặc dù cố gắng nhiều, luận văn khơng tránh khỏi thiếu sót; tác giả mong nhận thông cảm, dẫn, giúp đỡ đóng góp ý kiến thầy bạn đồng nghiệp Xin chân thành cảm ơn! Bình Định, ngày 12 tháng 07 năm 2018 Học viên thực luận văn Nguyễn Thành Vinh MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT DANH SÁCH BẢNG DANH SÁCH HÌNH VẼ MỞ ĐẦU 1 Lý chọn đề tài Tổng quan tình hình nghiên cứu đề tài Mục đích nghiên cứu 3.1.Mục tiêu chung 3.2 Mục tiêu cụ thể 3.3 Kết đạt Đối tượng phạm vi nghiên cứu 4.1 Đối tượng nghiên cứu 4.2 Phạm vi nghiên cứu: Phương pháp nghiên cứu Cấu trúc luận văn Chương KHAI PHÁ DỮ LIỆU VÀ PHÂN LỚP ĐỐI TƯỢNG 1.1 Sơ lược khai phá liệu 1.1.1 Khái niệm 1.1.2 Một số kỹ thuật khai phá liệu 1.1.3 Các công cụ khai phá liệu 1.2 Ứng dụng khai phá liệu lĩnh vực tài chính, ngân hàng 1.3 Phân lớp đối tượng dựa Naive Bayes 11 1.3.1 Giới thiệu chung 11 1.3.2 Ví dụ minh họa 12 1.3.3 Ưu điểm Naive Bayes 15 1.3.4 Nhược điểm Naive Bayes 16 1.4 Tổng kết chương 16 Chương XÂY DỰNG HỆ THỐNG PHÂN LOẠI KHÁCH HÀNG HỖ TRỢ RA QUYẾT ĐỊNH THUÊ TÀI CHÍNH TẠI VIETINBANK 17 2.1 Khái niệm cho thuê tài 17 2.2 Lợi cho thuê tài 17 2.3 Quy trình cho th tài 18 2.4 Nhu cầu thực tế 24 2.5 Mơ tả tốn: 25 2.6 Giải pháp xây dựng hệ hỗ trợ định cho thuê tài 27 2.7 Tổng quát trình xây dựng hệ thống 28 2.8 Tổng Kết Chương 29 Chương XÂY DỰNG ỨNG DỤNG VÀ THỬ NGHIỆM 30 3.1 Xây dựng ứng dụng 30 3.1.1 Chức hệ thống 31 3.1.2 Kiến trúc tổng thể hệ thống 33 3.1.3 Đặc tả chi tiết thành phần 34 3.2 Thử nghiệm ứng dụng 35 3.2.1 Thử nghiệm 35 3.2.2 Thử nghiệm 48 3.2.3 Thử nghiệm 54 3.3 Nhận xét đánh giá kết 55 3.4 Tổng kết chương 55 KẾT LUẬN CHUNG 56 Kết đạt 56 Hạn chế 56 Hướng phát triển 57 DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT Viết tắt Tiếng Anh Tiếng Việt ∏ Product Tích đại số {xi} The set whose elements are xi Tập gồm phần tử xi |X| The cardinality of the set X Số lượng phần tử tập hợp X #X The cardinality of the set X Số lượng phần tử tập hợp X VLC Vietinbank Leasing Company Công ty cho thuê tài Vietinbank CSDL Database Cơ sở liệu NHNN VN State Bank of Viet Nam Ngân hàng nhà nước Việt Nam NHTMCPCTVN Viet Nam Joint Stock Commercial Bank for Industry and Trade Ngân hàng Thương Mại Cổ Phần Công Thương Việt Nam DANH SÁCH BẢNG Bảng 1.1: Dữ liệu đăng ký chơi Golf 13 Bảng 2.1: Bảng liệu thông tin khách hàng 26 Bảng 3.1: Bảng thông tin liệu huấn luyện 34 Bảng 3.2: Thơng tin nhóm nợ khách hàng VLC 36 DANH SÁCH HÌNH VẼ Hình 1.1: Mối tương quan khai phá liệu với ngành khác Hình 2.1: Quy trình cho th tài 03 bên 20 Hình 2.2: Sơ đồ tổng quát xây dựng hệ thống 28 Hình 3.1: Quy trình đánh giá khách hàng cho thuê 31 Hình 3.2: Kiến trúc tổng thể hệ thống 33 Hình 3.3: Mẫu danh sách khách hàng cần dự đoán 35 Hình 3.4: Màn hình liệu thử nghiệm khơng có hệ số Laplace 38 Hình 3.5(a): Kết thử nghiệm khơng có hệ số Laplace huấn luyện hệ thống 39 Hình 3.5(b): Kết thử nghiệm khơng có hệ số Laplace huấn luyện 39 hệ thống Hình 3.5(c): Kết thử nghiệm khơng có hệ số Laplace huấn luyện 40 hệ thống Hình 3.5(d): Kết thử nghiệm khơng có hệ số Laplace huấn luyện 40 hệ thống Hình 3.5(e): Kết thử nghiệm khơng có hệ số Laplace huấn luyện hệ thống 41 Hình 3.5(f): Kết thử nghiệm khơng có hệ số Laplace huấn luyện hệ thống 41 Hình 3.6: Màn hình liệu thử nghiệm với hệ số Laplace 42 Hình 3.7(a): Kết thử nghiệm với hệ số Laplace hệ thống 43 Hình 3.7(b): Kết thử nghiệm với hệ số Laplace hệ thống 43 Hình 3.7(c): Kết thử nghiệm với hệ số Laplace hệ thống 44 Hình 3.7(d): Kết thử nghiệm với hệ số Laplace hệ thống 44 Hình 3.7(e): Kết thử nghiệm với hệ số Laplace hệ thống 45 Hình 3.7(f): Kết thử nghiệm với hệ số Laplace hệ thống 45 Hình 3.8: Kết dự đốn thử nghiệm khơng có hệ số Laplace 46 Hình 3.9: Kết dự đốn thử nghiệm hệ số Laplace 47 Hình 3.10: Màn hình lấy liệu khách hàng từ Oracle ERP 48 Hình 3.11: Màn hình liệu 100 khách hàng khơng có hệ số Laplace 50 Hình 3.12: Kết thử nghiệm khơng có hệ số Laplace 50 Hình 3.13: Kết dự đốn khách hàng khơng có hệ số Laplace 51 Hình 3.14: Màn hình liệu 100 khách hàng thiết lập hệ số Laplace 52 Hình 3.15: Kết thử nghiệm với hệ số laplace 53 Hình 3.16: Kết dự đoán khách hàng thiếp lập hệ số Laplace 54 45 Hình 3.7(e) Hình 3.7(f) Hình 3.7(a, b, c, d, e, f): Kết thử nghiệm với hệ số Laplace 46 3.2.1.3 Dự đoán khách hàng hệ thống Trường hợp thông tin khách hàng sau: Ngành nghề TT21 = Vận tải kho bãi, Ngành nghề 337 = Hoạt động dịch vụ cá nhân khác, Loại tài sản = Vận tải đường bộ, Nhóm thành phần kinh tế = Doanh nghiệp , Loại khách hàng = ngoại ngành, Quy mô doanh nghiệp = Vừa nhỏ, Khách hàng thuộc khu công nghiệp, sản xuất = False (0), Loại hình doanh nghiệp = Doanh nghiệp tư nhân, rơi vào nhóm nào? a Kết dự đốn khách hàng thuộc nhóm khơng có hệ số Laplace Hình 3.8: Kết dự đốn thử nghiệm khơng có hệ số Laplace Vậy khách hàng dự đốn rơi vào nhóm với kết tính 0.00118 47 b Kết dự đốn khách hàng thuộc nhóm có hệ số Laplace Hình 3.9: Kết dự đốn thử nghiệm hệ số Laplace Vậy khách hàng dự đốn rơi vào nhóm với kết tính 0.00069 Với kết khách hàng thuộc nhóm với liệu thực VietinBank Như ta thấy kết thay đổi khác hẳn việc có áp dụng hệ số không sử dụng hệ số Laplace Trong trường hợp việc áp dụng hệ số laplace cho ta kết khách hàng thuộc nhóm theo liệu ban đầu mang thử nghiệm 48 3.2.2 Thử nghiệm 3.2.2.1 Dữ liệu thử nghiệm (Danh sách khách hàng thực VLC) Đầu tiên hệ thống lấy liệu trực tiếp từ hệ thống OrVLCe ERP vận hành VLC (hình 3.10): Hình 3.10: Màn hình lấy liệu khách hàng từ Oracle ERP 3.2.2.2 Kết thử nghiệm Ta tiến hành lấy 100 khách hàng từ hệ thống OrVLCe ERP ta kết xuất làm liệu học cho chương trình khách hàng thuộc năm nhóm khác để tiến dự đoán kiểm tra chứng kết Ta có liệu khách hàng cụ thể sau: - KH1 = (Ngành nghề TT21 = Hoạt động kinh doanh bất động sản, Ngành nghề 337 = Hoạt động dịch vụ cá nhân khác, Loại tài sản = Dây chuyền sản xuất, Nhóm thành phần kinh tế = Doanh nghiệp , Loại khách hàng = nội ngành, Quy mô doanh nghiệp = Vừa nhỏ, Khách hàng thuộc khu cơng nghiệp, sản xuất = False (0), Loại hình doanh nghiệp = Doanh nghiệp tư nhân) - KH2 = (Ngành nghề TT21 = Hoạt động dịch vụ khác, Ngành nghề 337 = Sản xuất hóa chất sản phẩm hố chất, Loại tài sản = Máy móc thiết bị, 49 Nhóm thành phần kinh tế = Hộ SXKD, Loại khách hàng = ngoại ngành, Quy mô doanh nghiệp = Vừa nhỏ, Khách hàng thuộc khu công nghiệp, sản xuất = False (0), Loại hình doanh nghiệp = Cơng ty cổ phần khác) - KH3 = (Ngành nghề TT21 = Máy Hoạt động dịch vụ khác, Ngành nghề 337 = Hoạt động dịch vụ phục vụ cá nhân khác, Loại tài sản = Tài sản khác, Nhóm thành phần kinh tế = Doanh Nghiệp, Loại khách hàng = ngoại ngành, Quy mô doanh nghiệp = Vừa nhỏ, Khách hàng thuộc khu công nghiệp, sản xuất = False (0), Loại hình doanh nghiệp = Cơng ty trách nhiệm hữu hạn khác) - KH4 = (Ngành nghề TT21 = Xây dựng, Ngành nghề 337 = Xây dựng cơng trình kỹ thuật dân dụng, Loại tài sản = Tài sản khác, Nhóm thành phần kinh tế = Doanh Nghiệp, Loại khách hàng = ngoại ngành, Quy mô doanh nghiệp = Khác, Khách hàng thuộc khu công nghiệp, sản xuất = False (0), Loại hình doanh nghiệp = Cơng ty cổ phần khác) - KH5 = (Ngành nghề TT21 = Vận tải kho bãi, Ngành nghề 337 = Vận tải đường thuỷ, Loại tài sản = Vận tải đường sơng, Nhóm thành phần kinh tế = Doanh Nghiệp, Loại khách hàng = ngoại ngành, Quy mô doanh nghiệp = Khác, Khách hàng thuộc khu cơng nghiệp, sản xuất = False (0), Loại hình doanh nghiệp = Doanh nghiệp tư nhân) Sau nạp liệu huấn luyện Hình 3.11, ta có kết Hình 3.12: 50 Hình 3.11: Màn hình liệu 100 khách hàng khơng có hệ số Laplace Hình 3.12: Kết thử nghiệm khơng có hệ số Laplace 51 Ta tiến hành dự đoán năm khách hàng với tập huấn luận chưa có hệ số laplace ta kết quả: Hình 3.13: Kết dự đốn khách hàng khơng có hệ số Laplace Nhìn kết ta thấy khách hàng KH1, KH2, KH5 rơi vào nhóm N1; khách hàng KH3 rơi vào nhóm N3; khách hàng KH4 rơi vào nhóm N2; Qua kết hình 3.12 3.13, ta dễ dàng thấy có nhiều xác suất rơi vào trường hợp đặc biệt ví dụ minh họa thuật tốn Naive Bayes Để khắc phục tình trạng này, ta phải áp dụng hệ số Laplace việc tính xác suất (Hình 3.14) 52 Hình 3.14: Màn hình liệu 100 khách hàng thiết lập hệ số Laplace Sau ta huấn luyện lại liệu có kết Hình 3.15: 53 Hình 3.15: Kết thử nghiệp với hệ số laplace Ta tiến hành dự đoán năm khách hàng với tập huấn luận thiết lập hệ số laplace ta kết quả: Hình 3.16: Kết dự đoán khách hàng thiết lập hệ số Laplace 54 Từ kết ta thấy khách hàng KH1 rơi vào nhóm N1, KH2 Nhóm 2, KH3 nhóm N3; KH4 nhóm N4 khách hàng KH5 rơi vào nhóm N5 theo liệu ban đầu trước thử nghiệm Khi so sánh kết dự đốn năm khách hàng hình 3.13 hình 3.16 ta thấy có hai khách hàng KH1, KH3 nhóm dự đốn tỉ lệ xác suất khác Cịn khách hàng KH2, KH4, KH5 hai kết dự đốn hồn tồn khách Qua kết thử nghiệm cho ta biết việc áp dụng hệ số laplace vào thuật tốn NaiveBayes kết dự đốn trở nên xác 3.2.3 Thử nghiệm 3.2.3.1 Dữ liệu thử nghiệm: Đánh giá độ xác hệ thống qua liệu gồm 2120 khách hàng ta chia làm đợt kiểm tra áp dụng hệ số laplace sau: Đợt 1: chia 2020 khách hàng với 1800 khách hàng làm liệu huấn luyện 320 khách hàng cần dự đốn nhóm Nợ Đợt 1: chia 2020 khách hàng với 1900 khách hàng làm liệu huấn luyện 220 khách hàng cần dự đốn nhóm Nợ Đợt 1: chia 2020 khách hàng với 2000 khách hàng làm liệu huấn luyện 120 khách hàng cần dự đốn nhóm Nợ Đợt 1: chia 2020 khách hàng với 2100 khách hàng làm liệu huấn luyện 20 khách hàng cần dự đốn nhóm Nợ 3.2.3.2 Kết thử nghiệm Dữ liệu Training Dữ liệu Test Kết 1800 320 259/320 (81%) 1900 220 191/220 (87%) 2000 120 109/120 (91%) 2100 20 19/20 (95%) 55 Từ kết thử nghiệm cho ta thấy khả dự đốn xác hệ thống tỉ lệ thuận với nguồn liệu dùng làm liệu huấn luyện cho hệ thống Nguồn liệu huấn luyện cang lớn độ xác dự đoán cao 3.3 Nhận xét đánh giá kết Với liệu thử nghiệm mô trên, hệ thống cho kết thuộc tính phân lớp đơn giản, dễ hiểu xác Tốc độ xử lý hệ thống tương đối nhanh, tiết kiệm thời gian áp dụng xử lý cho khối liệu lớn Như vậy, sử dụng hệ thống để đánh giá tiềm khách hàng cho th thơng qua việc dự đốn nhóm nợ khách hàng, từ kết có quyền định cho thuê không cho thuê khách hàng để VLC có lợi nhuận tốt Do đó, mặt khoa học ứng dụng góp phần nâng cao hiệu kinh doanh tồn ngân hàng nói chung VLC nói riêng Hệ thống cơng cụ phân tích hữu ích, giúp cho VLC tăng cường lực cạnh tranh với đối thủ thị trường thông qua việc giảm thiểu tối đa rủi ro nguồn vốn cho cho thuê công ty 3.4 Tổng kết chương Trong chương cuối này, luận văn trình bày cách thức tổ chức, xây dựng ứng dụng thử nghiệm Đồng thời phân tích giải toán đánh giá khách hàng dựa số liệu cụ thể từ Công ty cho thuê tài Vietinbank Qua thấy khả ứng dụng giải pháp toàn hệ thống ngân hàng cần thiết Hệ thống giúp cho người sử dụng dễ dàng đánh giá khách hàng, sở hỗ trợ nhân viên kinh doanh đưa định hợp lý nhằm nâng cao lợi nhuận VLC 56 KẾT LUẬN CHUNG Kết đạt Về mặt lý thuyết Thứ tìm hiểu quy trình đánh giá khách hàng việc cho thuê tài chính, kiến thức liên quan đến nghiệp vụ pháp lý cho thuê ngân hàng Biết hệ thống hỗ trợ nằm khâu q trình cho vay tài Thứ hai tìm hiểu kiến thức khai phá liệu, cụ thể thuật tốn phân lớp, cơng cụ phục vụ khai phá liệu Thứ ba nắm vững phương pháp Naive Bayes, áp dụng để giải toán dự đoán khả xảy lĩnh vực khác nói chung ngành cho thuê tài nói riêng Về mặt thực tiễn Luận văn nêu giải pháp kỹ thuật để xây dựng hệ thống nhằm hỗ trợ đánh giá tiềm khách hàng cho thuê Việc kết hợp lý thuyết khai phá liệu phân tích liệu Naive Bayes cần thiết, giúp giảm thiểu đáng kể thời gian đánh giá xếp loại khách hàng hoạt động cho thuê tài Xây dựng ứng dụng phân tích liệu khách hàng VLC, đáp ứng nhu cầu tương lai VLC Hệ thống giúp cho kết cách khoa học, tránh tình đánh giá theo cảm tính, hạn chế trường hợp rủi ro tăng cường lợi nhuận ngân hàng Hạn chế Dữ liệu đầu vào cung cấp cho hệ thống u cầu phải có thuộc tính độc lập với Phải lọc bớt trường thuộc tính dư thừa tập liệu huấn luyện dự đốn để thuật tốn có kết xác 57 Giao diện tương tác với người sử dụng chưa sinh động Hướng phát triển Có thể đồng nhiều chức với hệ thống Oracle ERP như: Thông tin giải ngân, thông tin tài sản, thông tin nhà cung ứng tài sản, giá trị hợp đồng, phụ lục hợp đồng kỳ trả gốc lãi v v Tích hợp báo cáo ngày, tháng, quý, niên, hàng năm gửi tới NHNN, NHTMCPCTVN trực tiếp qua hệ thống Xây dựng giao diện trực quan để dễ dàng tương tác với người dùng Hoàn thiện thêm số chức để triển khai quan cơng ty cho th tài khác Cần tiếp tục nghiên cứu thêm thuật toán khai phá liệu nâng cao DANH MỤC TÀI LIỆU THAM KHẢO [1] Nguyễn Dương Hùng (2013), Luận văn cao học “Ứng dụng định để phân loại khách hàng vay vốn ngân hàng thương mại”, Học viện công nghệ bưu viễn thơng [2] Nguyễn Lê Phương (2012), Luận văn cao học “Ứng dụng khai phá liệu tìm hiểu thơng tin khách hàng viễn thơng”, Học viện cơng nghệ Bưu Viễn thơng [3] Đỗ Phúc (2005), Giáo trình khai phá liệu, Trung tâm nghiên cứu phát triển công nghệ thông tin, Đại học Quốc gia Tp Hồ Chí Minh [4] Lê Văn Dực (2006), Hệ hỗ trợ định, Đại học Quốc gia Tp Hồ Chí Minh [5] Ngân hàng Thương Mại Cổ Phần Cơng Thương Việt Nam (2000), Quy trình cho th tài chính, Lưu hành nội [6] Majid Sharahi, Mansoureh Aligholi (2015), Classify the Data of Bank Customers Using Data Mining and Clustering Techniques, Islamic Azad University, Iran [7] Asli Calis, Ahmet Boyaci, Kasım Baynal (2015), Data mining application in banking sector with clustering and classification, Turkey [8] Jiawei Han, Micheline Kamber, Jian Pei (2011), Data Mining - Concepts and Techniques, 3rd Ed, Morgan Kaufmann [9] Efraim Turban (2001), Decision Support Systems and Intelligent Systems, Prentice Hall [10] http://bis.net.vn/forums/t/390.aspx, truy cập ngày 29/03/2019 [11] http://www.tapchitaichinh.vn/Nghien-cuu-dieu-tra/Buc-tranh-thi-phanngan-hang-Viet-Nam/51534.tctc, truy cập ngày 29/03/2019 [12] https://vi.wikipedia.org/wiki/%C4%90%E1%BB%8Bnh_l%C3%BD_Bay es, truy cập ngày 29/03/2019 [13] https://gialuan1991.wordpress.com/2016/04/15/2-naive-bayes/, truy cập ngày 29/03/2019 [14] https://stackoverflow.com/questions/10059594/a-simple-explanation-ofnaive-bayes-classification, truy cập ngày 29/03/2019 [15] https://www.sbv.gov.vn, truy cập ngày 29/03/2019 [16] https://ongxuanhong.wordpress.com/2015/08/10/scikit-learn-naive-bayes- classifier/, truy cập ngày 29/03/2019 ... XÂY DỰNG HỆ THỐNG PHÂN LOẠI KHÁCH HÀNG HỖ TRỢ RA QUYẾT ĐỊNH THUÊ TÀI CHÍNH TẠI VIETINBANK 17 2.1 Khái niệm cho thuê tài 17 2.2 Lợi cho thuê tài 17 2.3 Quy trình cho th tài. .. trình bày chi tiết quy trình cho th tài chính, q trình xây dựng ứng dụng 17 Chương XÂY DỰNG HỆ THỐNG PHÂN LOẠI KHÁCH HÀNG HỖ TRỢ RA QUYẾT ĐỊNH THUÊ TÀI CHÍNH TẠI VIETINBANK Trong chương 1, luận... đó, tơi lựa chọn đề tài “XÂY DỰNG HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNH CHO THUÊ TÀI CHÍNH TẠI VIETINBANK? ?? để làm đề tài luận văn tốt nghiệp thạc sĩ Tổng quan tình hình nghiên cứu đề tài Hiện với phát