Xây dựng mô hình đánh giá mức độ trung thành của khách hàng tại các ngân hàng thương mại dựa trên các kỹ thuật khai phá dữ liệu,đề tài nghiên cứu khoa học cấp cơ sở năm 2016

71 5 0
Xây dựng mô hình đánh giá mức độ trung thành của khách hàng tại các ngân hàng thương mại dựa trên các kỹ thuật khai phá dữ liệu,đề tài nghiên cứu khoa học cấp cơ sở năm 2016

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

NGÂN HÀNG NHÀ NƯỚC VIỆT NAM HỌC VIỆN NGÂN HÀNG - ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP CƠ SỞ NĂM 2016 XÂY DỰNG MƠ HÌNH ĐÁNH GIÁ MỨC ĐỘ TRUNG THÀNH CỦA KHÁCH HÀNG TẠI CÁC NGÂN HÀNG THƯƠNG MẠI DỰA TRÊN CÁC KỸ THUẬT KHAI PHÁ DỮ LIỆU MÃ SỐ: DTHV.08/2016 CHỦ NHIỆM ĐỀ TÀI: PGS.TS LÊ VĂN LUYỆN ĐỒNG CHỦ NHIỆM ĐỀ TÀI: ThS NGUYỄN DƯƠNG HÙNG HÀ NỘI – 2017 NGÂN HÀNG NHÀ NƯỚC VIỆT NAM HỌC VIỆN NGÂN HÀNG - ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP CƠ SỞ NĂM 2016 XÂY DỰNG MƠ HÌNH ĐÁNH GIÁ MỨC ĐỘ TRUNG THÀNH CỦA KHÁCH HÀNG TẠI CÁC NGÂN HÀNG THƯƠNG MẠI DỰA TRÊN CÁC KỸ THUẬT KHAI PHÁ DỮ LIỆU MÃ SỐ: DTHV.08/2016 Chủ nhiệm đề tài: Đồng chủ nhiệm đề tài: Thư ký đề tài: PGS.TS Lê Văn Luyện ThS Nguyễn Dương Hùng ThS Vũ Duy Hiến ThS Bùi Thị Hồng Nhung Thành viên tham gia: ThS Phạm Thu Thủy CN An Phương Điệp HÀ NỘI – 2017 DANH SÁCH THÀNH VIÊN THAM GIA NGHIÊN CỨU ĐỀ TÀI Học hàm, học vị STT Vai trò Họ tên PGS.TS Lê Văn Luyện Chủ nhiệm đề tài ThS Nguyễn Dương Hùng Đồng chủ nhiệm đề tài ThS Vũ Duy Hiến Thư ký đề tài ThS Bùi Thị Hồng Nhung Thành viên ThS Phạm Thu Thủy Thành viên CN An Phương Điệp Thành viên iii Chức vụ, Đơn vị cơng tác Phó Giám đốc Học viện Giảng viên, Khoa HTTTQL Giảng viên, Khoa HTTTQL Giảng viên, Khoa HTTTQL Giảng viên, Khoa Ngân hàng Giảng viên, Khoa HTTTQL DANH MỤC HÌNH VẼ Hình 1- Hai khách hàng đặc tính đầu vào họ 19 Hình 2-Mơ hình dự báo trung thành khách hàng 20 Hình 3-Mơ hình dự báo trung thành khách hàng 21 Hình 4-Cây định việc định vay vốn 23 Hình 5-Cây sau chọn thuộc tính Thu nhập (ID3) 26 Hình 6-Cây sau chọn thuộc tính Tuổi (ID3) 27 Hình 7-Cây kết (ID3) 28 Hình 8-Mơ hình neuron sinh học 33 Hình 9-Mơ hình neuron nhân tạo mức đơn giản 34 Hình 10-Mơ hình mạng lớp 36 Hình 11-Ví dụ mơ hình mạng đa tầng 37 Hình 12: Siêu phẳng tối ưu chia tách liệu vec tơ hỗ trợ 40 Hình 13: Kết việc phân cụm tập liệu đầu vào thành hai cụm 40 Hình 14: Mạng thần kinh hướng thuận với tầng đầu vào, tầng ẩn tầng đầu 41 Hình 15-Mơ hình phân lớp 45 Hình 16-Mơ hình đánh giá phân lớp sử dụng kiểm thử chéo 45 Hình 17-Một phần định sinh 46 Hình 18-Độ đo xác thuật tốn 46 iv DANH MỤC BẢNG BIỂU Bảng 1-Bảng liệu huấn luyện 24 Bảng 2-Bảng thuộc tính tập liệu Bankfull 42 v MỤC LỤC DANH MỤC HÌNH VẼ iii DANH MỤC BẢNG BIỂU v MỤC LỤC vi MỞ ĐẦU Error! Bookmark not defined CHƯƠNG 1: LÝ THUYẾT SỰ TRUNG THÀNH CỦA KHÁCH HÀNG TẠI CÁC NGÂN HÀNG THƯƠNG MẠI 1.1 Tổng quan Ngân hàng thương mại 1.1.1 Khái niệm Ngân hàng thương mại 1.1.2 Vai trò ngân hàng thương mại 1.1.3 Các chức ngân hàng thương mại 1.2 Cơ sở lý thuyết trung thành khách hàng ngân hàng thương mại 1.2.1 Khách hàng ngân hàng thương mại 1.2.2 Khái niệm hài lòng lòng trung thành khách hàng 1.2.3 Phân loại hài lòng 10 1.2.4 Sự trung thành khách hàng ngân hàng thương mại 11 1.3 Các nhân tố ảnh hưởng tới trung thành khách hàng ngân hàng thương mại 12 CHƯƠNG 2: CÁC PHƯƠNG PHÁP PHÂN TÍCH DỰ BÁO TRONG KHAI PHÁ DỮ LIỆU .18 2.1 Các khái niệm 18 2.1.1 Phân tích dự báo 18 vi 2.1.2 Mơ hình dự báo 18 2.2 Mơ hình dự báo sử dụng kỹ thuật phân lớp .21 2.2.1 Giới thiệu kỹ thuật phân lớp 21 2.2.2 Kỹ thuật phân lớp định (DT: Decision Tree) 22 2.2.3 Kỹ thuật phân lớp Naive Bayes 28 2.2.4 Mạng thần kinh nhân tạo (ANN: Artificial Neural Network) 32 2.2.5 Một số mô hình dự báo khác 39 CHƯƠNG 3: ỨNG DỤNG CÂY QUYẾT ĐỊNH TRONG DỰ BÁO SỰ TRUNG THÀNH CỦA KHÁCH HÀNG TẠI CÁC NGÂN HÀNG THƯƠNG MẠI 42 3.1 Cơ sở liệu – Dữ liệu đầu vào .42 3.2 Ứng dụng thuật toán dự báo phần mềm Rapidminer 43 3.2.1 Mục tiêu 43 3.2.2 Bài toán ứng dụng 43 3.2.3 Dữ liệu 43 3.2.4 Xây dựng mơ hình 43 3.2.5 Kết đầu 45 3.3 Kết luận 61 KẾT LUẬN 62 TÀI LIỆU THAM KHẢO 64 vii MỞ ĐẦU Lý chọn đề tài Những năm gần đây, ngành Công nghệ thơng tin phát triển mạnh mẽ có tiến vượt bậc với bùng nổ thông tin Thông tin tổ chức theo phương thức sử dụng giấy giao dịch trình số hóa, nhiều tính vượt trội mà phương thức mang lại như: lưu trữ lâu dài, cập nhật, sửa đổi, tìm kiếm cách nhanh chóng Do lượng thơng tin số hóa ngày tăng với dung lượng lưu hàng Gigabyte hàng Tetabyte Hiện nay, hầu hết lĩnh vực cần đến hỗ trợ công nghệ thông tin thành cơng lĩnh vực phụ thuộc vào việc nắm bắt thông tin cách nhạy bén, nhanh chóng hữu ích Với thao tác thủ công truyền thống việc xử lý liệu độ xác khơng cao nhiều thời gian Do việc khai phá tri thức từ nguồn tài liệu lớn chứa đựng thông tin phục vụ nhu cầu nắm bắt thơng tin có vai trò to lớn Việc khai phá tri thức có từ lâu, nhiên bùng nổ xảy năm gần Các công cụ thu thập liệu tự động công nghệ xây dựng sở liệu phát triển dẫn đến vấn đề là: lượng liệu khổng lồ lưu trữ sở liệu kho thông tin tổ chức, cá nhân Do việc khai phá tri thức từ liệu vấn đề nhận nhiều quan tâm nhà nghiên cứu lĩnh vực CNTT mà nhiều lĩnh vực khác Một vấn đề quan trọng phổ biến kỹ thuật khai phá liệu phân lớp, ứng dụng rộng rãi lĩnh vực tài chính, ngân hàng, y tế, giáo dục, nhiều lĩnh khác Với xu tồn cầu hóa cạnh tranh khốc liệt nay, ngân hàng phải đối mặt với nhiều khó để đạt lợi cạnh tranh tốt Ngoài việc thực quy trình kinh doanh, việc tạo sở tri thức sử dụng cho lợi ích ngân hàng trở thành công cụ chiến lược để cạnh tranh Những năm gần đây, khả tạo ra, nắm bắt lưu trữ liệu tăng lên nhiều Các thông tin có liệu quan trọng Sự đa dạng thể loại lớn số lượng liệu, với nhu cầu chuyển liệu thành tri thức khuyến khích ngành cơng nghiệp CNTT sử dụng kỹ thuật khai phá liệu (DM: Data mining) Ngành công nghiệp ngân hàng giới trải qua thay đổi to lớn cách thức kinh doanh thực Ngành ngân hàng bắt đầu nhận cần thiết kỹ thuật khai phá liệu, kỹ thuật giúp họ cạnh tranh thị trường Các ngân hàng hàng đầu sử dụng công cụ khai phá liệu (DM: Data Mining) cho việc phân khúc khách hàng lợi nhuận,chấm điểm tín dụng phê duyệt, quảng bá bán sản phẩm, phát giao dịch gian lận, vv… Có nhiều phương pháp phân lớp đề xuất, nhiên khơng có phương pháp tiếp cận phân loại tối ưu xác hẳn phương pháp khác Dù với phương pháp có lợi bất lợi riêng sử dụng Một công cụ khai phá tri thức hiệu sử dụng định để tìm luật phân lớp Với mong muốn nghiên cứu việc ứng dụng khai phá liệu vào lĩnh vực ngân hàng, nhóm nghiên cứu lựa chọn mơ hình định để phân loại khách hàng Ngân hàng thương mại Tên đề tài mà nhóm lựa chọn q trình nghiên cứu: “Xây dựng mơ hình dự báo trung thành khách hàng Ngân hàng thương mại” Mục tiêu nghiên cứu Nghiên cứu vấn đề thuật toán xây dựng định ID3, cài đặt đánh giá thuật tốn đó; bước đầu áp dụng mơ hình định (ID3: Decision Tree) xây dựng vào việc phân loại khách hàng vay vốn Ngân hàng thương mại Đối tượng, phạm vi nghiên cứu  Nghiên cứu, ứng dụng thuật toán dự báo lĩnh vực khai phá liệu để dự báo trung thành khách hàng tín dụng dựa liệu ngân hàng có  Cài đặt thử nghiệm với liệu tập tin Excel phần mềm Rapidminer Phương pháp nghiên cứu  Phương pháp nghiên cứu tài liệu: Phân tích tổng hợp tài liệu khai phá liệu sử dụng thuật tốn Decision Tree có thuật tốn ID3, phân loại liệu, mơ hình dự báo  Phương pháp thực nghiệm: Ứng dụng kết hợp kỹ thuật phân loại mơ hình định để phân loại khách hàng vay vốn Ngân hàng thương mại Bố cục đề tài Kết cấu đề tài: phần mở đầu kết luận, đề tài gồm ba chương chính: - Chương 1: Lý thuyết trung thành khách hàng ngân hàng thương mại - Chương 2: Các phương pháp phân tích dự báo khai phá liệu - Chương 3: Ứng dụng định dự báo trung thành khách hàng ngân hàng thương mại | | | | | duration ≤ 328: no {no=2, yes=0} | | | day ≤ 16.500 | | | | pdays > 95.500 | | | | | age > 73.500: yes {no=0, yes=2} | | | | | age ≤ 73.500: no {no=43, yes=11} | | | | pdays ≤ 95.500 | | | | | duration > 179.500 | | | | | | age > 59.500: no {no=3, yes=1} | | | | | | age ≤ 59.500: yes {no=1, yes=11} | | | | | duration ≤ 179.500 | | | | | | day > 7.500 | | | | | | | duration > 132: no {no=4, yes=1} | | | | | | | duration ≤ 132 | | | | | | | | day > 14: no {no=1, yes=1} | | | | | | | | day ≤ 14: yes {no=0, yes=3} | | | | | | day ≤ 7.500: no {no=4, yes=0} | | month = oct | | | duration > 183.500 | | | | loan = no | | | | | day > 6.500 | | | | | | previous > 5.500: no {no=3, yes=0} | | | | | | previous ≤ 5.500: yes {no=16, yes=33} | | | | | day ≤ 6.500: no {no=4, yes=0} | | | | loan = yes: no {no=7, yes=0} | | | duration ≤ 183.500 | | | | job = admin.: no {no=17, yes=0} | | | | job = blue-collar: no {no=4, yes=0} | | | | job = entrepreneur: no {no=2, yes=0} | | | | job = housemaid: no {no=2, yes=1} | | | | job = management | | | | | duration > 105.500 | | | | | | balance > 7326: no {no=3, yes=0} | | | | | | balance ≤ 7326 | | | | | | | age > 39: no {no=4, yes=1} | | | | | | | age ≤ 39: yes {no=0, yes=3} | | | | | duration ≤ 105.500: no {no=6, yes=0} | | | | job = retired: no {no=8, yes=1} | | | | job = self-employed: no {no=2, yes=0} | | | | job = services: yes {no=1, yes=2} | | | | job = technician 50 | | | | | pdays > 140.500: yes {no=0, yes=3} | | | | | pdays ≤ 140.500: no {no=7, yes=0} | | | | job = unemployed: no {no=2, yes=0} | | month = sep | | | duration > 169.500 | | | | day > | | | | | age > 24: yes {no=15, yes=27} | | | | | age ≤ 24: no {no=4, yes=0} | | | | day ≤ | | | | | duration > 405.500 | | | | | | duration > 497: no {no=2, yes=0} | | | | | | duration ≤ 497: yes {no=0, yes=2} | | | | | duration ≤ 405.500: no {no=13, yes=1} | | | duration ≤ 169.500: no {no=40, yes=3} | poutcome = other | | month = apr | | | day > 21.500 | | | | duration > 250.500 | | | | | age > 47: no {no=3, yes=0} | | | | | age ≤ 47 | | | | | | day > 28: yes {no=0, yes=9} | | | | | | day ≤ 28 | | | | | | | balance > 1081.500: yes {no=0, yes=3} | | | | | | | balance ≤ 1081.500: no {no=2, yes=0} | | | | duration ≤ 250.500 | | | | | balance > 10: no {no=13, yes=1} | | | | | balance ≤ 10 | | | | | | housing = no: yes {no=0, yes=2} | | | | | | housing = yes: no {no=2, yes=0} | | | day ≤ 21.500: no {no=175, yes=6} | | month = aug | | | duration > 156.500 | | | | age > 48 | | | | | duration > 305.500 | | | | | | balance > 2280: no {no=2, yes=1} | | | | | | balance ≤ 2280: yes {no=0, yes=3} | | | | | duration ≤ 305.500: no {no=11, yes=1} | | | | age ≤ 48 | | | | | duration > 199.500 | | | | | | job = admin 51 | | | | | | | marital = married: yes {no=0, yes=3} | | | | | | | marital = single: no {no=2, yes=0} | | | | | | job = blue-collar: yes {no=0, yes=3} | | | | | | job = management | | | | | | | pdays > 170: yes {no=0, yes=2} | | | | | | | pdays ≤ 170: no {no=4, yes=0} | | | | | | job = student: yes {no=0, yes=3} | | | | | | job = technician: no {no=2, yes=0} | | | | | duration ≤ 199.500: yes {no=0, yes=8} | | | duration ≤ 156.500: no {no=31, yes=1} | | month = dec | | | duration > 161.500 | | | | campaign > 3.500: no {no=2, yes=0} | | | | campaign ≤ 3.500: yes {no=0, yes=6} | | | duration ≤ 161.500: no {no=9, yes=0} | | month = feb | | | day > 9.500 | | | | pdays > 148 | | | | | day > 18.500 | | | | | | age > 38: yes {no=1, yes=2} | | | | | | age ≤ 38: no {no=4, yes=0} | | | | | day ≤ 18.500: yes {no=0, yes=5} | | | | pdays ≤ 148: no {no=4, yes=0} | | | day ≤ 9.500 | | | | balance > 2198.500 | | | | | pdays > 178.500: no {no=9, yes=0} | | | | | pdays ≤ 178.500: yes {no=1, yes=4} | | | | balance ≤ 2198.500: no {no=204, yes=4} | | month = jan | | | day > 27.500: no {no=113, yes=1} | | | day ≤ 27.500 | | | | duration > 136.500 | | | | | age > 33.500 | | | | | | day > 14.500: yes {no=0, yes=2} | | | | | | day ≤ 14.500: no {no=7, yes=1} | | | | | age ≤ 33.500: yes {no=0, yes=3} | | | | duration ≤ 136.500: no {no=7, yes=0} | | month = jul | | | duration > 274.500: yes {no=0, yes=12} | | | duration ≤ 274.500 52 | | | | campaign > 1.500 | | | | | day > 10.500 | | | | | | campaign > 5.500: no {no=2, yes=0} | | | | | | campaign ≤ 5.500: yes {no=3, yes=9} | | | | | day ≤ 10.500: no {no=3, yes=0} | | | | campaign ≤ 1.500: no {no=11, yes=1} | | month = jun | | | duration > 217.500 | | | | marital = divorced: yes {no=0, yes=2} | | | | marital = married | | | | | pdays > 68 | | | | | | pdays > 312.500: yes {no=0, yes=2} | | | | | | pdays ≤ 312.500: no {no=6, yes=1} | | | | | pdays ≤ 68: yes {no=0, yes=3} | | | | marital = single | | | | | day > 14.500: yes {no=0, yes=7} | | | | | day ≤ 14.500 | | | | | | balance > 359.500: no {no=2, yes=1} | | | | | | balance ≤ 359.500: yes {no=0, yes=3} | | | duration ≤ 217.500 | | | | pdays > 119.500: no {no=18, yes=0} | | | | pdays ≤ 119.500 | | | | | education = primary: no {no=4, yes=1} | | | | | education = secondary: no {no=6, yes=0} | | | | | education = tertiary | | | | | | campaign > 1.500: no {no=3, yes=1} | | | | | | campaign ≤ 1.500: yes {no=0, yes=4} | | month = mar | | | duration > 134.500 | | | | balance > 997 | | | | | age > 40.500 | | | | | | previous > 5: yes {no=0, yes=3} | | | | | | previous ≤ | | | | | | | day > 15.500: no {no=3, yes=0} | | | | | | | day ≤ 15.500: yes {no=1, yes=2} | | | | | age ≤ 40.500: no {no=6, yes=0} | | | | balance ≤ 997 | | | | | housing = no: yes {no=0, yes=9} | | | | | housing = yes: no {no=2, yes=1} | | | duration ≤ 134.500: no {no=8, yes=0} 53 | | month = may | | | day > 18.500 | | | | pdays > 252: yes {no=0, yes=7} | | | | pdays ≤ 252 | | | | | balance > 1240.500 | | | | | | balance > 5629.500 | | | | | | | balance > 17493.500: yes {no=0, yes=2} | | | | | | | balance ≤ 17493.500: no {no=2, yes=0} | | | | | | balance ≤ 5629.500: yes {no=0, yes=4} | | | | | balance ≤ 1240.500: no {no=15, yes=0} | | | day ≤ 18.500 | | | | pdays > 90.500 | | | | | duration > 378 | | | | | | housing = no | | | | | | | balance > 49.500: no {no=4, yes=1} | | | | | | | balance ≤ 49.500: yes {no=0, yes=2} | | | | | | housing = yes | | | | | | | age > 28.500 | | | | | | | | duration > 410: no {no=26, yes=0} | | | | | | | | duration ≤ 410 | | | | | | | | | duration > 402.500: yes {no=1, yes=2} | | | | | | | | | duration ≤ 402.500: no {no=7, yes=0} | | | | | | | age ≤ 28.500 | | | | | | | | balance > 295: yes {no=1, yes=2} | | | | | | | | balance ≤ 295: no {no=3, yes=0} | | | | | duration ≤ 378: no {no=443, yes=1} | | | | pdays ≤ 90.500 | | | | | balance > 518.500: yes {no=0, yes=3} | | | | | balance ≤ 518.500: no {no=5, yes=1} | | month = nov | | | duration > 366.500 | | | | pdays > 188: yes {no=0, yes=4} | | | | pdays ≤ 188 | | | | | day > 8.500 | | | | | | education = primary: no {no=2, yes=0} | | | | | | education = secondary: no {no=8, yes=0} | | | | | | education = tertiary | | | | | | | age > 32: no {no=4, yes=1} | | | | | | | age ≤ 32: yes {no=0, yes=2} | | | | | day ≤ 8.500: yes {no=0, yes=2} 54 | | | duration ≤ 366.500 | | | | day > 14.500: no {no=137, yes=1} | | | | day ≤ 14.500 | | | | | day > 11.500: yes {no=1, yes=3} | | | | | day ≤ 11.500: no {no=13, yes=1} | | month = oct | | | duration > 180.500 | | | | day > 20 | | | | | housing = no | | | | | | age > 56.500: no {no=2, yes=1} | | | | | | age ≤ 56.500: yes {no=0, yes=10} | | | | | housing = yes | | | | | | duration > 335: yes {no=0, yes=2} | | | | | | duration ≤ 335: no {no=4, yes=0} | | | | day ≤ 20: no {no=10, yes=2} | | | duration ≤ 180.500: no {no=20, yes=2} | | month = sep | | | duration > 165 | | | | previous > 2.500 | | | | | marital = divorced: no {no=2, yes=1} | | | | | marital = married: yes {no=0, yes=7} | | | | | marital = single: yes {no=0, yes=6} | | | | previous ≤ 2.500 | | | | | balance > 1146.500: no {no=3, yes=0} | | | | | balance ≤ 1146.500 | | | | | | age > 34.500 | | | | | | | previous > 1.500: no {no=2, yes=0} | | | | | | | previous ≤ 1.500: yes {no=0, yes=2} | | | | | | age ≤ 34.500: yes {no=0, yes=3} | | | duration ≤ 165 | | | | pdays > 169: no {no=14, yes=0} | | | | pdays ≤ 169 | | | | | pdays > 99.500 | | | | | | balance > 2003.500: no {no=2, yes=0} | | | | | | balance ≤ 2003.500: yes {no=0, yes=3} | | | | | pdays ≤ 99.500: no {no=9, yes=0} | poutcome = success | | duration > 162.500: yes {no=245, yes=692} | | duration ≤ 162.500: no {no=247, yes=113} | poutcome = unknown 55 | | month = apr | | | housing = no | | | | duration > 141.500: yes {no=174, yes=191} | | | | duration ≤ 141.500: no {no=168, yes=34} | | | housing = yes | | | | day > 20.500 | | | | | duration > 262.500 | | | | | | duration > 502: no {no=3, yes=1} | | | | | | duration ≤ 502 | | | | | | | duration > 325.500: yes {no=2, yes=14} | | | | | | | duration ≤ 325.500: no {no=2, yes=2} | | | | | duration ≤ 262.500 | | | | | | duration > 145 | | | | | | | age > 55: yes {no=0, yes=2} | | | | | | | age ≤ 55 | | | | | | | | campaign > 3.500: yes {no=0, yes=2} | | | | | | | | campaign ≤ 3.500 | | | | | | | | | duration > 233.500: no {no=6, yes=0} | | | | | | | | | duration ≤ 233.500 | | | | | | | | | | day > 29.500 | | | | | | | | | | | marital = married: yes {no=0, yes=2} | | | | | | | | | | | marital = single: no {no=2, yes=0} | | | | | | | | | | day ≤ 29.500: no {no=5, yes=0} | | | | | | duration ≤ 145: no {no=30, yes=2} | | | | day ≤ 20.500: no {no=887, yes=20} | | month = aug: no {no=5027, yes=194} | | month = dec | | | duration > 263 | | | | marital = divorced | | | | | job = management: yes {no=0, yes=2} | | | | | job = retired | | | | | | age > 72.500: yes {no=0, yes=2} | | | | | | age ≤ 72.500: no {no=2, yes=0} | | | | | job = unemployed: yes {no=0, yes=2} | | | | marital = married | | | | | education = primary: yes {no=1, yes=2} | | | | | education = secondary: yes {no=0, yes=6} | | | | | education = tertiary | | | | | | balance > 1386.500: yes {no=0, yes=4} | | | | | | balance ≤ 1386.500: no {no=1, yes=1} 56 | | | | | education = unknown: no {no=1, yes=1} | | | | marital = single | | | | | balance > 1776: no {no=3, yes=0} | | | | | balance ≤ 1776 | | | | | | day > 15.500: yes {no=0, yes=4} | | | | | | day ≤ 15.500 | | | | | | | balance > 1398: yes {no=0, yes=2} | | | | | | | balance ≤ 1398: no {no=4, yes=1} | | | duration ≤ 263: no {no=40, yes=7} | | month = feb | | | day > 9.500 | | | | duration > 129.500: yes {no=32, yes=90} | | | | duration ≤ 129.500 | | | | | duration > 68.500: no {no=34, yes=22} | | | | | duration ≤ 68.500 | | | | | | balance > 1281 | | | | | | | housing = no: no {no=6, yes=0} | | | | | | | housing = yes: yes {no=0, yes=2} | | | | | | balance ≤ 1281: no {no=21, yes=0} | | | day ≤ 9.500: no {no=1274, yes=71} | | month = jan | | | day > 16.500: no {no=721, yes=16} | | | day ≤ 16.500 | | | | duration > 181.500 | | | | | balance > 302.500 | | | | | | balance > 5909.500: no {no=1, yes=1} | | | | | | balance ≤ 5909.500 | | | | | | | balance > 628: yes {no=0, yes=17} | | | | | | | balance ≤ 628 | | | | | | | | education = secondary: no {no=1, yes=1} | | | | | | | | education = tertiary: yes {no=0, yes=2} | | | | | balance ≤ 302.500 | | | | | | balance > 163.500: no {no=3, yes=0} | | | | | | balance ≤ 163.500 | | | | | | | balance > 7.500: yes {no=0, yes=2} | | | | | | | balance ≤ 7.500: no {no=1, yes=1} | | | | duration ≤ 181.500 | | | | | age > 25.500: no {no=15, yes=1} | | | | | age ≤ 25.500: yes {no=0, yes=3} | | month = jul: no {no=5653, yes=132} 57 | | month = jun | | | contact = cellular | | | | duration > 156.500: yes {no=109, yes=125} | | | | duration ≤ 156.500: no {no=140, yes=20} | | | contact = telephone | | | | duration > 199 | | | | | campaign > 1.500 | | | | | | age > 59: yes {no=1, yes=2} | | | | | | age ≤ 59 | | | | | | | balance > 2551.500 | | | | | | | | balance > 4275: no {no=3, yes=0} | | | | | | | | balance ≤ 4275: yes {no=0, yes=2} | | | | | | | balance ≤ 2551.500: no {no=6, yes=0} | | | | | campaign ≤ 1.500 | | | | | | balance > 472: yes {no=1, yes=5} | | | | | | balance ≤ 472: no {no=2, yes=1} | | | | duration ≤ 199: no {no=29, yes=1} | | | contact = unknown: no {no=4030, yes=31} | | month = mar | | | duration > 173.500: yes {no=31, yes=91} | | | duration ≤ 173.500: no {no=110, yes=49} | | month = may: no {no=9859, yes=167} | | month = nov | | | day > 16.500: no {no=2286, yes=43} | | | day ≤ 16.500 | | | | duration > 146.500: yes {no=30, yes=56} | | | | duration ≤ 146.500 | | | | | job = admin.: no {no=5, yes=0} | | | | | job = blue-collar | | | | | | age > 36: no {no=3, yes=0} | | | | | | age ≤ 36: yes {no=0, yes=2} | | | | | job = entrepreneur: no {no=2, yes=0} | | | | | job = management: no {no=16, yes=2} | | | | | job = retired: no {no=4, yes=1} | | | | | job = services: no {no=4, yes=0} | | | | | job = student: yes {no=1, yes=2} | | | | | job = technician: no {no=12, yes=0} | | | | | job = unemployed: no {no=4, yes=0} | | month = oct | | | duration > 130.500 58 | | | | day > 15.500 | | | | | campaign > 1.500 | | | | | | duration > 186 | | | | | | | campaign > 2.500 | | | | | | | | balance > 2315: no {no=1, yes=1} | | | | | | | | balance ≤ 2315: yes {no=0, yes=8} | | | | | | | campaign ≤ 2.500 | | | | | | | | day > 29.500: yes {no=0, yes=4} | | | | | | | | day ≤ 29.500 | | | | | | | | | balance > 322.500 | | | | | | | | | | day > 26.500 | | | | | | | | | | | duration > 249: yes {no=1, yes=2} | | | | | | | | | | | duration ≤ 249: no {no=5, yes=0} | | | | | | | | | | day ≤ 26.500 | | | | | | | | | | | day > 20.500: yes {no=0, yes=4} | | | | | | | | | | | day ≤ 20.500: no {no=3, yes=1} | | | | | | | | | balance ≤ 322.500: no {no=6, yes=0} | | | | | | duration ≤ 186 | | | | | | | balance > 247: no {no=15, yes=1} | | | | | | | balance ≤ 247: yes {no=0, yes=2} | | | | | campaign ≤ 1.500 | | | | | | job = admin | | | | | | | balance > 9994.500: no {no=2, yes=0} | | | | | | | balance ≤ 9994.500 | | | | | | | | balance > 731.500 | | | | | | | | | balance > 1840.500: yes {no=0, yes=5} | | | | | | | | | balance ≤ 1840.500: no {no=3, yes=1} | | | | | | | | balance ≤ 731.500: yes {no=0, yes=5} | | | | | | job = blue-collar | | | | | | | day > 29.500: yes {no=0, yes=2} | | | | | | | day ≤ 29.500 | | | | | | | | contact = cellular: yes {no=1, yes=2} | | | | | | | | contact = telephone: no {no=3, yes=0} | | | | | | job = entrepreneur: yes {no=1, yes=3} | | | | | | job = housemaid: no {no=1, yes=1} | | | | | | job = management | | | | | | | age > 34 | | | | | | | | day > 18.500: yes {no=0, yes=14} | | | | | | | | day ≤ 18.500: no {no=1, yes=1} | | | | | | | age ≤ 34: no {no=3, yes=0} 59 | | | | | | job = retired | | | | | | | age > 65.500 | | | | | | | | age > 71 | | | | | | | | | age > 74.500: yes {no=0, yes=3} | | | | | | | | | age ≤ 74.500: no {no=1, yes=1} | | | | | | | | age ≤ 71: no {no=3, yes=0} | | | | | | | age ≤ 65.500: yes {no=0, yes=5} | | | | | | job = self-employed: yes {no=0, yes=3} | | | | | | job = services: yes {no=0, yes=5} | | | | | | job = student: yes {no=0, yes=5} | | | | | | job = technician | | | | | | | marital = divorced: yes {no=0, yes=3} | | | | | | | marital = married: yes {no=1, yes=7} | | | | | | | marital = single | | | | | | | | day > 26.500: yes {no=0, yes=2} | | | | | | | | day ≤ 26.500: no {no=2, yes=1} | | | | | | job = unknown: no {no=1, yes=1} | | | | day ≤ 15.500 | | | | | education = primary: no {no=12, yes=1} | | | | | education = secondary | | | | | | age > 25.500 | | | | | | | day > | | | | | | | | campaign > 2.500: no {no=4, yes=0} | | | | | | | | campaign ≤ 2.500 | | | | | | | | | balance > 80 | | | | | | | | | | balance > 310.500 | | | | | | | | | | | balance > 659.500 | | | | | | | | | | | | duration > 219 | | | | | | | | | | | | | duration > 430.500: yes {no=0, yes=2} | | | | | | | | | | | | | duration ≤ 430.500: no {no=3, yes=0} | | | | | | | | | | | | duration ≤ 219: yes {no=0, yes=4} | | | | | | | | | | | balance ≤ 659.500: no {no=4, yes=0} | | | | | | | | | | balance ≤ 310.500: yes {no=0, yes=3} | | | | | | | | | balance ≤ 80: no {no=2, yes=0} | | | | | | | day ≤ 4: no {no=5, yes=0} | | | | | | age ≤ 25.500: yes {no=0, yes=3} | | | | | education = tertiary | | | | | | duration > 291.500: yes {no=1, yes=3} | | | | | | duration ≤ 291.500 | | | | | | | age > 28.500: no {no=13, yes=0} 60 | | | | | | | age ≤ 28.500 | | | | | | | | duration > 204.500: yes {no=0, yes=2} | | | | | | | | duration ≤ 204.500: no {no=4, yes=0} | | | | | education = unknown: yes {no=1, yes=2} | | | duration ≤ 130.500 | | | | marital = divorced | | | | | day > 21.500: yes {no=0, yes=5} | | | | | day ≤ 21.500 | | | | | | campaign > 1.500: yes {no=1, yes=2} | | | | | | campaign ≤ 1.500: no {no=7, yes=0} | | | | marital = married | | | | | duration > 95.500 | | | | | | day > 26.500: yes {no=0, yes=3} | | | | | | day ≤ 26.500 | | | | | | | duration > 105.500: no {no=20, yes=1} | | | | | | | duration ≤ 105.500 | | | | | | | | balance > 228 | | | | | | | | | education = secondary: yes {no=0, yes=3} | | | | | | | | | education = tertiary: no {no=1, yes=1} | | | | | | | | balance ≤ 228: no {no=3, yes=0} | | | | | duration ≤ 95.500: no {no=46, yes=0} | | | | marital = single: no {no=39, yes=1} | | month = sep | | | duration > 184.500: yes {no=52, yes=66} | | | duration ≤ 184.500: no {no=100, yes=11} 3.3 Kết luận Trong chương này, đề tài sử dụng liệu Bankfull để kiểm chứng thuật toán xây dựng định chương Bộ liệu với 45211 ghi 17 thuộc tính, phù hợp việc sử dụng định để dự báo khách hàng có khả rịi bỏ dịch vụ ngân hàng thương mại Đồng thời, dựa vào mơ hình định (các luật định) xây dựng, đề tài đánh giá, phân tích luật q trình phân loại khách hàng để từ tiếp tục hỗ trợ việc định kinh doanh hợp lý ngân hàng thương mại Căn vào kết này, ngân hàng tham khảo để thêm thơng tin q trình định cho khách hàng có vay vốn tiêu dùng hay khơng Các luật giải thích minh họa số luật đại diện: 61 + Luật 1: IF(Nghenghiep: Giaovien) and (Thunhap: Thap) and (TaiKhoanHienTai: Khong) THEN => Quyết định: True Một khách hàng giáo viên với thu nhập không cao chưa có tài khoản ngân hàng ngân hàng định cho khách hàng vay tiêu dùng Điều lý giải hình tài cần hỗ trợ tốt ngân hàng định với khách hàng không cho vay theo kết thuật toán ID3 cung cấp Trong đối với: + Luật 2: IF(Nghenghiep: Giaovien) AND (Thunhap: Thap) AND (TaiKhoanHienTai: Co) AND (Thunhaptuluong: Co) THEN (=> Quyết định: False) Một khách hàng khác làm nghề giáo viên thu nhập cao tài sản chấp có thu nhập từ lương định khơng cho khách hàng vay vốn tiêu dùng Chỉ cần đổi thuộc tính khơng có thu nhập từ lương định cho khách hàng vay tiêu dùng Kết khơng với số sách số ngân hàng cơng cụ khai phá liệu tìm kiếm thông tin để hỗ trợ việc định Việc định cuối phụ thuộc vào người quản trị ngân hàng + Luật 3: IF(Nghenghiep: LDPT) THEN (=> Quyết định: False) Có thể nhận xét sau, khách hàng lao động phổ thông khả trả nợ họ khó, để tránh rủi ro, ngân định khách hàng không thuộc diện vay vốn tiêu dùng Kết dự đốn thể [Hình 6], kết việc đánh giá kết phương pháp K-Folder với k = 10 Hình 5: Độ xác phần mềm RapidMiner Nghiên cứu trình bày ứng dụng cụ thể kỹ thuật khai phá liệu mà ngân hàng áp dụng để phân loại khách hàng Đây sở ban đầu, từ ngân hàng có thêm thơng tin khách hàng để định có cho họ vay tiêu dùng hay khơng Tuy nhiên, để có kết mang tính ứng dụng thực tế, cần bổ sung tập liệu cho tập liệu mẫu để mơ hình định có độ tin cậy cao hoạt động hiệu Đồng thời, cần tìm hiểu nhu cầu thực tế để từ cải tiến chương trình, cài đặt toán theo thuật toán nghiên cứu để làm việc tốt với sở liệu lớn mang tính thực tế 62 Khai phá liệu lĩnh vực thu hút nhà nghiên cứu cho phép phát tri thức sở liệu khổng lồ phương thức thông minh Nghiên cứu lĩnh vực này, địi hỏi người nghiên cứu phải biết tổng hợp kết nghiên cứu nhiều lĩnh vực khoa học máy tính việc ứng dụng nhiệm vụ khai phá liệu Qua thời gian nghiên cứu thử nghiệm, đặc biệt khoảng thời gian làm đề tài, nhóm nghiên cứu hồn thiện đề tài với mục tiêu đặt ban đầu Cụ thể đề tài đạt kết sau: - Trình bày kiến thức khám phá tri thức khai phá liệu - Giới thiệu phương pháp tổng quát xây dựng định, trình bày thuật tốn xây dựng định số ví dụ minh họa cho phương pháp xây dựng định - Thử nghiệm phần mềm khai phá phá liệu Rapidminer với liệu gồm 45211 ghi 17 thuộc tính khách hàng mà nhóm sưu tầm xử lý Một số vấn đề đề tài phải tiếp tục nghiên cứu, tìm hiểu: - Cần tiếp tục nghiên cứu thuật toán dự báo khác Bayers, mạng Noron nhân tạo, phân cụm kết hợp thuật toán để kết dự báo tốt - Cần bổ sung thêm thuộc tính số lượng ghi cho liệu, cụ thể cho tập huấn luyện để mơ dự báo có độ tin cậy cao hoạt động hiệu Nhóm tiếp tục phát triển hồn thiện theo hướng trở thành phần mềm khai phá liệu lĩnh vực ngân hàng dùng nhằm hỗ trợ cho ngân hàng định kinh doanh hợp lý - Tìm hiểu nhu cầu thực tế để từ cải tiến chương trình, cài đặt lại tốn theo thuật toán nghiên cứu để làm việc tốt với sở liệu lớn có sản phẩm thị trường 63 TÀI LIỆU THAM KHẢO [1] Christopher Westphal and C Westphal, Data Mining for Intelligence, Fraud & Criminal Detection: Advanced Analytics & Information Sharing Technologies 2008 [2] L Vera, “Analytical Customer Relationship Management in Retailing Supported by Data Mining Techniques,” 2012 [3] C Wang, J Ignacio, C Wang, and J Ignacio, “Corporate Failure Prediction and Financial Risk Spillover Corporate Failure Prediction and Financial Risk Spillover,” 2014 [4] A Trnka and M Iaeng, “Position of Retraining CHURN Data Mining Model in Six Sigma Methodology,” vol I, 2012 [5] B Krollner, “Risk Management in the Australian Stockmarket using Artificial Neural Networks,” no December, 2011 [6] C Technology and M B Science, “A D ATA M INING A PPROACH T O P REDICT P ROSPECTIVE B USINESS S ECTORS F OR L ENDING IN R ETAIL B ANKING U SING,” vol 5, no 2, 2015 [7] S Chivarar, “Data Mining and Risk Manage- ment in Banking,” no June, 2012 [8] A Al-Shawabkeh, “Developing a knowledge management approach to support managing credit risk in Jordanian banks,” 2010 [9] M Bramer, Principles of Data Mining 2007 [10] V Pacelli and M Azzollini, “An Artificial Neural Network Approach for Credit Risk Management,” J Intell Learn Syst Appl., vol 3, no 2, pp 103–112, 2011 [11] G a Marcoulides, Discovering Knowledge in Data: an Introduction to Data Mining:Discovering Knowledge in Data: An Introduction to Data Mining, vol 100, no 472 2005 64

Ngày đăng: 15/12/2023, 00:15

Tài liệu cùng người dùng

Tài liệu liên quan