1. Trang chủ
  2. » Tài Chính - Ngân Hàng

Xây dựng mô hình đánh giá mức độ trung thành của khách hàng tại các ngân hàng thương mại dựa trên các kỹ thuật khai phá dữ liệu,đề tài nghiên cứu khoa học cấp cơ sở năm 2016

75 14 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây Dựng Mô Hình Đánh Giá Mức Độ Trung Thành Của Khách Hàng Tại Các Ngân Hàng Thương Mại Dựa Trên Các Kỹ Thuật Khai Phá Dữ Liệu
Tác giả PGS.TS. Lê Văn Luyện, ThS. Nguyễn Dương Hùng, ThS. Vũ Duy Hiến, ThS. Bùi Thị Hồng Nhung, ThS. Phạm Thu Thủy, CN. An Phương Điệp
Trường học Học viện Ngân hàng
Thể loại Đề tài nghiên cứu khoa học
Năm xuất bản 2016
Thành phố Hà Nội
Định dạng
Số trang 75
Dung lượng 836,09 KB

Nội dung

NGÂN HÀNG NHÀ NƯỚC VIỆT NAM HỌC VIỆN NGÂN HÀNG ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP CƠ SỞ NĂM 2016 XÂY DỰNG MƠ HÌNH ĐÁNH GIÁ MỨC ĐỘ TRUNG THÀNH CỦA KHÁCH HÀNG TẠI CÁC NGÂN HÀNG THƯƠNG MẠI DỰA TRÊN CÁC KỸ THUẬT KHAI PHÁ DỮ LIỆU MÃ SỐ: DTHV.08/2016 CHỦ NHIỆM ĐỀ TÀI: PGS.TS LÊ VĂN LUYỆN ĐỒNG CHỦ NHIỆM ĐỀ TÀI: ThS NGUYỄN DƯƠNG HÙNG HÀ NỘI - 2017 DANH SÁCH THÀNH VIÊN THAM GIA NGHIÊN CỨU ĐỀ TÀI NGÂN HÀNG NHÀ NƯỚC VIỆT NAM HỌC VIỆN NGÂN HÀNG ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP CƠ SỞ NĂM 2016 XÂY DỰNG MƠ HÌNH ĐÁNH GIÁ MỨC ĐỘ TRUNG THÀNH CỦA KHÁCH HÀNG TẠI CÁC NGÂN HÀNG THƯƠNG MẠI DỰA TRÊN CÁC KỸ THUẬT KHAI PHÁ DỮ LIỆU MÃ SỐ: DTHV.08/2016 STT Học hàm, học vị Vai trò Họ tên PGS.TS Lê Văn Luyện Chủ nhiệm đề tài Chủ nhiệm đề tài: Đồng chủ nhiệm đề tài: ThS Nguyễn Dương Hùng ThS Vũ Duy Hiến Chức vụ, Đơn vị cơng tác Phó Giám đốc Học PGS.TS Lê Văn Luyện viện ThS Nguyễn Dương Hùng Đồng chủ nhiệm đề tài Giảng viên, Khoa Thư ký đề tài: Thư ký đề tài Thành viên tham gia: ThS Vũ Duy Hiến HTTTQL ThS Bùi Thị Hồng Nhung Giảng viên, Khoa ThS Phạm Thu Thủy HTTTQL CN An Phương Điệp ThS Bùi Thị Hồng Nhung Thành viên ThS Phạm Thu Thủy Thành viên CN An Phương Điệp Thành viên Giảng viên, Khoa HTTTQL Giảng viên, Khoa Ngân hàng Giảng viên, Khoa HTTTQL HÀ NỘI - 2017 iii DANH MỤC HÌNH VẼ Hình 1- Hai khách hàng đặc tính đầu vào họ 19 Hình 2-Mơ hình dự báo trung thành khách hàng 20 Hình 3-Mơ hình dự báo trung thành khách hàng 21 Hình 4-Cây định việc định vay vốn 23 Hình 5-Cây sau chọn thuộc tính Thu nhập (ID3) .26 Hình 6-Cây sau chọn thuộc tính Tuổi (ID3) .27 Hình 7-Cây kết (ID3) .28 Hình 8-Mơ hình neuron sinh học 33 Hình 9-Mơ hình neuron nhân tạo mức đơn giản 34 Hình 10-Mơ hình mạng lớp 36 Hình 11-Ví dụ mơ hình mạng đa tầng 37 Hình 12: Siêu phẳng tối ưu chia tách liệu cácvec tơ hỗ trợ 40 Hình 13: Kết việc phân cụm tập liệu đầu vào thành hai cụm 40 Hình 14: Mạng thần kinh hướng thuận với tầng đầu vào, tầng ẩn tầng đầu 41 Hình 15-Mơ hình phân lớp .45 Hình 16-Mơ hình đánh giá phân lớp sử dụng kiểm thử chéo 45 Hình 17-Một phần định sinh 46 Hình 18-Độ đo xác thuật tốn 46 iv DANH MỤC BẢNG BIỂU Bảng 1-Bảng liệu huấn luyện 24 Bảng 2-Bảng thuộc tính tập liệu Bankfull 42 v MỤC LỤC DANH MỤC HÌNH VẼ iii DANH MỤC BẢNG BIỂU .v MỤC LỤC vi MỞ ĐẦU Error! Bookmark not defined CHƯƠNG 1: LÝ THUYẾT Sự TRUNG THÀNH CỦA KHÁCH HÀNG TẠI CÁC NGÂN HÀNG THƯƠNG MẠI 1.1 Tổng quan Ngân hàng thương mại 1.1.1 Khái niệm Ngân hàng thương mại 1.1.2 Vai trò ngân hàng thương mại 1.1.3 Các chức ngân hàng thương mại 1.1.4 Cơ sở lý thuyết trung thành khách hàng ngân hàng thương mại 1.2.1 Khách hàng ngân hàng thương mại 1.2.2 Khái niệm hài lòng lòng trung thành khách hàng .9 1.2.3 Phân loại hài lòng 10 1.2.4 Sự trung thành khách hàng ngân hàng thương mại 11 1.2 .Các nhân tố ảnh hưởng tới trung thành khách hàng ngân hàng thương mại 12 CHƯƠNG 2: CÁC PHƯƠNG PHÁP PHÂN TÍCH DỰ BÁO TRONG KHAI PHÁ DỮ LIỆU 18 2.1 Các khái niệm 18 vi 2.1.2 Mơ hình dự báo 18 2.2 .Mơ hình dự báo sử dụng kỹ thuật phân lớp 21 2.2.1 .Giới thiệu kỹ thuật phân lớp 21 2.2.2 (DT: Kỹ thuật phân lớp Decision Tree) 2.2.3 .Kỹ thuật phân lớp Naive Bayes 28 2.2.4 Network) Mạng thần kinh nhân tạo (ANN: Artificial Neural 32 2.2.5 Một số mô hình dự báo khác 39 CHƯƠNG 3: ỨNG DỤNG CÂY QUYẾT ĐỊNH TRONG Dự BÁO Sự TRUNG THÀNH CỦA KHÁCH HÀNG TẠI CÁC NGÂN HÀNG THƯƠNG MẠI .42 3.1 Cơ sở liệu - Dữ liệu đầu vào 42 3.2 Ứng dụng thuật toán dự báo phần mềm Rapidminer 43 3.2.1 Mục tiêu 43 3.2.2 Bài toán ứng dụng 43 3.2.3 Dữ liệu 43 vii MỞ ĐẦU Lý chọn đề tài Những năm gần đây, ngành Cơng nghệ thơng tin phát triển mạnh mẽ có tiến vượt bậc với bùng nổ thông tin Thông tin tổ chức theo phương thức sử dụng giấy giao dịch trình số hóa, nhiều tính vượt trội mà phương thức mang lại như: lưu trữ lâu dài, cập nhật, sửa đổi, tìm kiếm cách nhanh chóng Do lượng thơng tin số hóa ngày tăng với dung lượng lưu hàng Gigabyte hàng Tetabyte Hiện nay, hầu hết lĩnh vực cần đến hỗ trợ công nghệ thông tin thành công lĩnh vực phụ thuộc vào việc nắm bắt thơng tin cách nhạy bén, nhanh chóng hữu ích Với thao tác thủ công truyền thống việc xử lý liệu độ xác khơng cao nhiều thời gian Do việc khai phá tri thức từ nguồn tài liệu lớn chứa đựng thông tin phục vụ nhu cầu nắm bắt thơng tin có vai trò to lớn Việc khai phá tri thức có từ lâu, nhiên bùng nổ xảy năm gần Các công cụ thu thập liệu tự động công nghệ xây dựng sở liệu phát triển dẫn đến vấn đề là: lượng liệu khổng lồ lưu trữ sở liệu kho thông tin tổ chức, cá nhân Do việc khai phá tri thức từ liệu vấn đề nhận nhiều quan tâm nhà nghiên cứu lĩnh vực CNTT mà nhiều lĩnh vực khác Một vấn đề quan trọng phổ biến kỹ thuật khai phá liệu phân lớp, ứng dụng rộng rãi lĩnh vực tài chính, ngân hàng, y tế, giáo dục, nhiều lĩnh khác Với xu toàn cầu hóa cạnh tranh khốc liệt nay, ngân hàng phải đối mặt với nhiều khó để đạt lợi cạnh tranh tốt Ngồi việc thực quy trình kinh doanh, việc tạo sở tri thức sử dụng cho lợi ích ngân hàng trở thành công cụ chiến lược để cạnh tranh Những năm gần đây, khả tạo ra, nắm bắt lưu trữ liệu tăng lên nhiều Các thơng tin có liệu quan trọng Sự đa dạng thể loại lớn số lượng liệu, với nhu cầu chuyển liệu thành tri thức khuyến khích ngành cơng nghiệp CNTT sử dụng kỹ thuật khai phá liệu (DM: Data mining) Ngành công nghiệp ngân hàng giới trải qua thay đổi to lớn cách Data Mining) cho việc phân khúc khách hàng lợi nhuận,chấm điểm tín dụng phê duyệt, quảng bá bán sản phẩm, phát giao dịch gian lận, vv Có nhiều phương pháp phân lớp đề xuất, nhiên khơng có phương pháp tiếp cận phân loại tối ưu xác hẳn phương pháp khác Dù với phương pháp có lợi bất lợi riêng sử dụng Một công cụ khai phá tri thức hiệu sử dụng định để tìm luật phân lớp Với mong muốn nghiên cứu việc ứng dụng khai phá liệu vào lĩnh vực ngân hàng, nhóm nghiên cứu lựa chọn mơ hình định để phân loại khách hàng Ngân hàng thương mại Tên đề tài mà nhóm lựa chọn q trình nghiên cứu: “Xây dựng mơ hình dự báo trung thành khách hàng Ngân hàng thương mạĩ\ Mục tiêu nghiên cứu Nghiên cứu vấn đề thuật toán xây dựng định ID3, cài đặt đánh giá thuật toán đó; bước đầu áp dụng mơ hình định (ID3: Decision Tree) xây dựng vào việc phân loại khách hàng vay vốn Ngân hàng thương mại Đối tượng, phạm vi nghiên cứu • Nghiên cứu, ứng dụng thuật toán dự báo lĩnh vực khai phá liệu để dự báo trung thành khách hàng tín dụng dựa liệu ngân hàng có • Cài đặt thử nghiệm với liệu tập tin Excel phần mềm Rapidminer Phương pháp nghiên cứu • Phương pháp nghiên cứu tài liệu: Phân tích tổng hợp tài liệu khai phá liệu sử dụng thuật tốn Decision Tree có thuật tốn ID3, phân loại liệu, mơ hình dự báo • Phương pháp thực nghiệm: Ứng dụng kết hợp kỹ thuật phân loại mơ hình định để phân loại khách hàng vay vốn Ngân hàng thương mại Bố cục đề tài Kết cấu đề tài: phần mở đầu kết luận, đề tài gồm ba chương chính: - Chương 1: Lý thuyết trung thành khách hàng ngân hàng thương | | | | | duration ≤ 105.500: no {no=6, yes=0} || || job = retired: no {no=8,yes=1} || || job = self-employed:no {no=2,yes=0} || || job = services: yes{no=1, yes=2} || || job = technician 50 Illl pdays > 140.500: yes ∣no=0, yes=3} III pdays < 140.500: no {no=7, yes=O} I job = unemployed: no ino=2, yes=O} month = Sep I duration > 169.500 I I day > III age > 24: yes ino=15, yes=27} III age < 24: no {no=4, yes=O} I I day < III duration > 405.500 Illl duration > 497: no {no=2, yes=O} Illl duration < 497: yes ino=0, yes=2} III duration < 405.500: no {no=13, yes=l} I duration < 169.500: no {no=40, yes=3} poιιtcone = other month = apr I day > 21.500 I I duration > 250.500 III age > 47: no {no=3, yes=O} III age 28: yes {no=0, yes=9} Illl day < 28 Illll balance > 1081.500: yes ino=0, yes=3} Illlll balance < 1081.500: no {no=2, yes=O} I I duration < 250.500 III balance > 10: no {no=13, yes=l} III balance 156.500 I I age > 48 III duration > 305.500 Illl balance > 2280: no {no=2r yes=l} Illll balance < 2280: yes {no=0r yes=3} Illl duration < 305.500: no {no=llr yes=l} III age < 48 Illl duration > 199.500 I I I I job = admin 51 | | | | | | | marital = married: yes {no=0, yes=3} || | || | | marital = single: no {no=2, yes=0} || | || | job = blue-collar:yes {no=0, yes=3} || | || | job = management || | || | | pdays > 170: yes {no=0, yes=2} || | || | | pdays ≤ 170: no {no=4, yes=0} || | || | job = student: yes{no=0, yes=3} || | || | job = technician: no {no=2, yes=0} | | | | | duration ≤ 199.500: yes {no=0, yes=8} | | | duration ≤ 156.500: no {no=31, yes=1} | | month = dec | | | duration | | | | campaign > 3.500: no {no=2, yes=0} | | | | campaign ≤ 3.500: yes {no=0, yes=6} | | | duration | | month = feb | | | day > 9.500 | | | | pdays > 148 | | | | | day > 18.500 | | | | | | age > 38: yes {no=1, yes=2} | | | | | | age ≤ 38: no {no=4, yes=0} | | | | | day ≤ 18.500: yes {no=0, yes=5} | | | | pdays ≤ 148: no {no=4, yes=0} | | | day ≤ 9.500 | | | | balance > 2198.500 | | | | | pdays > 178.500: no {no=9, yes=0} | | | | | pdays ≤ 178.500: yes {no=1, yes=4} | | | | balance ≤ 2198.500: no {no=204, yes=4} | | month = jan | | | day > 27.500: no {no=113, yes=1} | | | day ≤ 27.500 | | | | duration > 136.500 | | | | | age > 33.500 | | | | | | day > 14.500: yes {no=0, yes=2} | | | | | | day ≤ 14.500: no {no=7, yes=1} | | | | | age ≤ 33.500: yes {no=0, yes=3} | | | | duration ≤ 136.500: no {no=7, yes=0} | | month = jul | | | duration > 274.500: yes {no=0, yes=12} | | | duration ≤ 274.500 >161.500 ≤161.500: no {no=9, yes=0} 52 I campaign > 1.500 I I clay > 10.500 III campaign > 5.500: no {no=2r yes=O} III campaign 5.500: yes {no=3, yes=9} I I clay 10.500: no ino=3, yes=O} I campaign 1.500: no {no=ll, yes=l} month = jun I duration > 217.500 I marital = divorced: yes {no=0, yes=2} I marital = married I I pdays > 68 III pdays > 312.500: yes {no=0r yes=2} III pdays ≤ 312.500: no {no=6r yes=l} I I pdays 68: yes {no=0, yes=3} I marital = single I I day > 14.500: yes {no=0r yes=7} I I day 14.500 III balance > 359.500: no {no=2, yes=l} III balance ≤ 359.500: yes {no=0, yes=3} duration 217.500 I pdays > 119.500: no ino=18, yes=0} I pdays 119.500 I I education = primary: no {no=4r yes=l} I I education = secondary: no {no=6r yes=0} I I education = tertiary III campaign > 1.500: no {no=3r yes=l} III campaign ≤ 1.500: yes {no=0, yes=4} month = mar duration > 134.500 I balance > 997 I I age > 40.500 III previous > 5: yes {no=0, yes=3} III previous Illl day > 15.500: no ino=3, yes=0} Illll day ≤ 15.500: yes ino=l, yes=2} III age 40.500: no {no=6r yes=0} I I balance ≤ 997 III housing = no: yes {no=0, yes=9} III housing = yes: no {no=2, yes=l} 53 | | month = may | | | day > 18.500 | | | | pdays > 252: yes {no=0, yes=7} | | | | pdays ≤ 252 | | | | | balance > 1240.500 | | | | | | balance > 5629.500 | | | | | | | balance > 17493.500: yes {no=0, yes=2} | | | | | | | balance ≤ 17493.500: no {no=2, yes=0} | | | | | | balance ≤ 5629.500: yes {no=0, yes=4} | | | | | balance ≤ 1240.500: no {no=15, yes=0} | | | day < 18.500 | | | | pdays > 90.500 | | | | | duration > 378 | | | | | | housing = no || | | | | | balance > 49.500: no {no=4, yes=1} || | | | | | balance ≤ 49.500: yes {no=0,yes=2} | || | | | | | housing = yes | | | | | age > 28.500 | | | | | | | | duration > 410: no {no=26, yes=0} | | | | | | | | duration ≤ 410 | | | | | | | | | duration > 402.500: yes {no=1, yes=2} | | | | | | | | | duration ≤ 402.500: no {no=7, yes=0} | | | | | | | age < 28.500 | | | | | | | | balance > 295: yes {no=1, yes=2} | | | | | | | | balance ≤ 295: no {no=3, yes=0} || | | | | duration ≤ 378: no {no=443, yes=1} | | | pdays ≤ 90.500 || | | | balance > 518.500:yes {no=0, yes=3} || | | | balance ≤ 518.500:no {no=5, yes=1} | | month = nov | | | duration > 366.500 | | | | pdays > 188: yes {no=0, yes=4} | | | | pdays ≤ 188 | | | | | day > 8.500 || | | | | education =primary: no {no=2, yes=0} || | | | | education =secondary: no {no=8, yes=0} || | | | | education =tertiary | | | | | | | age > 32: no {no=4, yes=1} | | | | | | | age ≤ 32: yes {no=0, yes=2} | | | | | day ≤ 8.500: yes {no=0, yes=2} 54 | | | duration ≤ 366.500 | | | | day > 14.500: no {no=137, yes=1} | | | | day ≤ 14.500 | | | | | day > 11.500: yes {no=1, yes=3} | | | | | day ≤ 11.500: no {no=13, yes=1} | | month = oct | | | duration > 180.500 | | | | day > 20 | | | | | housing = no | | | | | | age > 56.500: no {no=2, yes=1} | | | | | | age ≤ 56.500: yes {no=0, yes=10} | | | | | housing = yes | | | | | | duration > 335: yes {no=0, yes=2} | | | | | | duration ≤ 335: no {no=4, yes=0} | | | | day ≤ 20: no {no=10, yes=2} | | | duration ≤ 180.500: no {no=20, yes=2} | | month = sep | | | duration > 165 | | | | previous > 2.500 | | | | | marital = divorced: no{no=2, yes=1} | | | | | marital = married: yes{no=0, yes=7} | | | | | marital = single: yes{no=0, yes=6} | | | | previous ≤ 2.500 | | | | | balance > 1146.500: no{no=3, yes=0} | | | | | balance ≤ 1146.500 | | | | | | age > 34.500 | | | | | | | previous > 1.500: no {no=2, yes=0} | | | | | | | previous ≤ 1.500: yes {no=0, yes=2} | | | | | | age ≤ 34.500: yes {no=0, yes=3} | | | duration ≤ 165 | | | | pdays > 169: no {no=14, yes=0} | | | | pdays ≤ 169 | | | | | pdays > 99.500 | | | | | | balance > 2003.500: no {no=2, yes=0} | | | | | | balance ≤ 2003.500: yes {no=0, yes=3} | | | | | pdays ≤ 99.500: no {no=9, yes=0} | poutcome = success | | duration > 162.500: yes {no=245, yes=692} | | duration ≤ 162.500: no {no=247, yes=113} | poutcome = unknown 55 | | month = apr | | | housing = no || | | duration > 141.500: yes {no=174,yes=191} || | | duration ≤ 141.500: no | || {no=168,yes=34} | | housing = yes | | day > 20.500 | | | | | duration > 262.500 | | | | | | duration > 502: no {no=3, yes=1} | | | | | | duration ≤ 502 | | | | | | | duration > 325.500: yes {no=2, yes=14} | | | | | | | duration ≤ 325.500: no {no=2, yes=2} | | | | | duration ≤ 262.500 | | | | | | duration > 145 | | | | | | | age > 55: yes {no=0, yes=2} | | | | | | | age ≤ 55 | | | | | | | | campaign > 3.500: yes {no=0, yes=2} | | | | | | | | campaign ≤ 3.500 | | | | | | | | | duration > 233.500: no {no=6, yes=0} | | | | | | | | | duration ≤ 233.500 | | | | | | | | | | day > 29.500 | | | | | | | | | | | marital = married: yes {no=0, yes=2} | | | | | | | | | | | marital = single: no {no=2, yes=0} | | | | | | | | | | day ≤ 29.500: no {no=5, yes=0} | | | | | | duration ≤ 145: no {no=30, yes=2} | | | | day ≤ 20.500: no {no=887, yes=20} | | month = aug: no {no=5027, yes=194} | | month = dec | | | duration > 263 | | | | marital = divorced || | | | job = management: yes {no=0,yes=2} || | | | job = retired | | | | | | age > 72.500: yes {no=0, yes=2} | | | | | | age ≤ 72.500: no {no=2, yes=0} || | | | | job = unemployed: yes {no=0,yes=2} | | | marital = married || | | | education =primary: yes {no=1, yes=2} || | | | education =secondary: yes {no=0, yes=6} || | | | education =tertiary | | | | | | balance > 1386.500: yes {no=0, yes=4} | | | | | | balance ≤ 1386.500: no {no=1, yes=1} 56 | | | | | education = unknown: no {no=1, yes=1} | | | | marital = single | | | | | balance > 1776: no {no=3, yes=0} | | | | | balance ≤ 1776 | | | | | | day > 15.500: yes {no=0, yes=4} | | | | | | day ≤ 15.500 | | | | | | | balance > 1398: yes {no=0, yes=2} | | | | | | | balance ≤ 1398: no {no=4, yes=1} | | | duration ≤ 263: no {no=40, yes=7} | | month = feb | | | day > 9.500 | | | | duration > 129.500: yes {no=32, yes=90} | | | | duration ≤ 129.500 | | | | | duration > 68.500: no {no=34, yes=22} | | | | | duration ≤ 68.500 | | | | | | balance > 1281 | | | | | | | housing = no: no {no=6, yes=0} | | | | | | | housing = yes: yes {no=0, yes=2} | | | | | | balance ≤ 1281: no {no=21, yes=0} || | | day ≤ 9.500: no{no=1274, yes=71} | month = jan || | day > 16.500: no{no=721, yes=16} || | day ≤ 16.500 | | | | duration > 181.500 | | | | | balance > 302.500 | | | | | | balance > 5909.500: no {no=1, yes=1} | | | | | | balance ≤ 5909.500 | | | | | | | balance > 628: yes {no=0, yes=17} | | | | | | | balance ≤ 628 | | | | | | | | education = secondary: no {no=1, yes=1} | | | | | | | | education = tertiary: yes {no=0, yes=2} | | | | | balance ≤ 302.500 | | | | | | balance > 163.500: no {no=3, yes=0} | | | | | | balance ≤ 163.500 | | | | | | | balance > 7.500: yes {no=0, yes=2} | | | | | | | balance ≤ 7.500: no {no=1, yes=1} | | | | duration ≤ 181.500 | | | | | age > 25.500: no | | | | | age ≤ 25.500: yes {no=0, yes=3} | | month = jul: no {no=5653, yes=132} {no=15, yes=1} 57 | | month | | day > 15.500 = jun | | I|contact | | campaign > 1.500 = cellular | | I|I duration | | | duration > 186yes {no=109r yes=125} > 156.500: | | I|I duration | | | | campaign > 2.500 156.500: no {no=140r yes=20} | | |I contact || | |= |telephone balance > 2315: no{no=1,yes=1} | | |I I duration || | | |> balance ≤ 2315: yes{no=0, yes=8} 199 | | | | | | | campaign ≤ 2.500 I I I campaign > 1.500 | || || | | | day > 29.500: yes{no=0,yes=4} II I I Illl age > 59: yes {no=lf yes=2} I II III age < 59 I day ≤ 29.500 | | | | | | | | | balance > 322.500 Illll balance > 2551.500 I I I I I I I I I I day > 26.500 Illlll balance > 4275: no {no=3, yes=O} | | | | | | | | | | | duration > 249: yes {no=1, yes=2} Illlll balance d 4275: yes {no=0, yes=2} | | | | | | | | | | | duration ≤ 249: no {no=5, yes=0} Illll balance d 2551.500: no {no=6, yes=O} I I I campaign ≤ 1.500 Illl balance > 472: yes {no=lf yes=5} Illl balance d 472: no {no=2f yes=l} I I duration ≤ 199: no {no=29f yes==l} I contact = unknown: no {no=4030, yes=31} month = mar I duration > 173.500: yes {no=31f yes=91} I duration < 173.500: no {no=110f yes=49} month = may: no {no=985 f yes=l67} month = nov I day > 16.500: no {no=2286r yes=43} I day d 16.500 I I duration > 146.500: yes {no=30r yes=56} I I duration d 146.500 I I I job = admin.: no {no=5f yes=O} I I I job = blue-collar Illl age > 36: no {no=3f yes=O} Illl age ≤ 36: yes {no=0f yes=2} I I I job = entrepreneur: no {no=2r yes=O} I I I job = management: no {no=16f yes=2} I I I job = retired: no {no=4f yes=l} I I I job = services: no {no=4f yes=O} Illl job = student: yes {no=lf yes=2} Illl job = technician: no {no=12f yes=O} Illl job = unemployed: no {no=4f yes=O} I month = OCt I I duration > 130.500 | day ≤ 26.500 | | day > 20.500: y e s n o {no=0, yes=4} {no=3, yes=1} 58 balance ≤ 322.500 age > 34 : n {no=6, yes=0} | day > 18.500: yes {no=0, | day ≤ 18.500: no {no=1, yes=1} age ≤ 34: no {no=3, yes=0} | | | | | | duration ≤ 186 | | | | | | | balance > 247: no {no=15, yes=1} | | | | | | | balance ≤ 247: yes {no=0, yes=2} | | | | | campaign ≤ 1.500 | | | | | | job = admin | | | | | | | balance > 9994.500: no {no=2, yes=0} | | | | | | | balance ≤ 9994.500 | | | | | | | | balance > 731.500 | | | | | | | | | balance > 1840.500: yes {no=0, yes=5} | | | | | | | | | balance ≤ 1840.500: no {no=3, yes=1} | | | | | | | | balance ≤ 731.500: yes {no=0, yes=5} | | | | | | job = blue-collar | | | | | | | day > 29.500: yes {no=0, yes=2} | | | | | | | day ≤ 29.500 | | | | | | | | contact = cellular: yes {no=1, yes=2} | | | | | | | | contact = telephone: no {no=3, yes=0} | || || | job = entrepreneur:yes {no=1, yes=3} | || || | job = housemaid: no{no=1, yes=1} | || || | job = management age > 71 | age > 74.500: yes {no=0, yes=3} | age ≤ 74.500: no {no=1, | | | | | | job = retired yes=1} age ≤ 71: no {no=3, yes=0} | | | | | | | age > 65.500 59 | | | | | | | age ≤ 65.500: yes {no=0, yes=5} | | | | | | job = self-employed: yes {no=0, yes=3} | | | | | | job = services: yes {no=0, yes=5} | | | | | | job = student: yes | | | | | | job = technician {no=0, yes=5} || || | | |marital = divorced: yes {no=0,yes=3} || || | | |marital = married: yes {no=1,yes=7} || || | | |marital = single | || || || | day > 26.500: yes {no=0, yes=2} | || || || | day ≤ 26.500: no {no=2, yes=1} | | | | | | job = unknown: no {no=1, yes=1} | | | | day ≤ 15.500 | | | | | education = primary: no {no=12, yes=1} | | | | | education = secondary | | | | | | age > 25.500 I I I I I I I day > | || || || | campaign > 2.500: no {no=4, yes=0} | || || || | campaign ≤ 2.500 | || || || | | balance > 80 | || || || | | | balance > 310.500 | || || || | | | | balance > 659.500 I I I I I I | || || || | | | | | | duration > 430.500: yes {no=0, yes=2} | || || || | | | | | | duration ≤ 430.500: no {no=3, yes=0} | || || || | | | | | duration ≤ 219: yes {no=0, yes=4} | || || || | | | | balance ≤ 659.500: no {no=4, yes=0} | || || || | | | balance ≤ 310.500: yes {no=0, yes=3} | || || || | | balance ≤ 80: no {no=2, yes=0} | | | | | | | day ≤ 4: no {no=5, yes=0} || | I I || | I I I I duration > 219 | age ≤ 25.500: yes {no=0,yes=3} | | | | education = tertiary || || | | duration > 291.500: yes {no=1, yes=3} || || | | duration ≤ 291.500 | | | | | | | age > 28.500: no {no=13, yes=0} 60 | | | | || | age ≤ 28.500 + Luật 1: IF(Nghenghiep: Giaovien) and (Thunhap: Thap) and | | | | || | | duration > 204.500: yes {no=0, yes=2} (TaiKhoanHienTai: Khong) THEN => Quyết định: True | | | | || | | duration ≤ 204.500: no {no=4, yes=0} Một khách hàng giáo viên với thu nhập không cao chưa có tài khoản ngân | | | | | education = unknown: yes {no=1, yes=2} hàng |thì| ngân hàng định cho khách hàng vay tiêu dùng Điều có | duration ≤ 130.500 thể lý| giải tài cần hỗ trợ tốt ngân hàng định với | | |hình marital = divorced khách| | | | | day > 21.500: yes {no=0, yes=5} | | | không | | daycho ≤ 21.500 hàng vay theo kết thuật toán ID3 cung cấp | | | | | | campaign > 1.500: yes {no=1, yes=2} Trong đối với: | | | | | | campaign ≤ 1.500: no {no=7, yes=0} + Luật 2: IF(Nghenghiep: Giaovien) AND (Thunhap: Thap) AND | | | | marital = married (TaiKhoanHienTai: Co) AND (Thunhaptuluong: Co) THEN (=> Quyết định: False) | | | | | duration > 95.500 Một khách hàng khác làm nghề giáo viên thu nhập cao khơng có | | | | || day > 26.500: yes {no=0, yes=3} tài sản| từ lương định khơng cho khách hàng vay | |chấp | |và | có thu day nhập ≤ 26.500 vốn tiêu Chỉ cần đổi| duration thuộc tính khơng có thu từ lương định cho | | dùng | | | | >105.500: no nhập{no=20, yes=1} | | | | vay | | duration ≤ khách| hàng tiêu dùng Kết khơng với số sách 105.500 số ngân hàng cơng cụ khai phá liệu tìm kiếm thơng tin để hỗ trợ việc | | | | | | | | balance > 228 định cuối phụ thuộc vào người quản trị ngân hàng | |định | | Việc | | | | | education =secondary:yes {no=00, yes=3} + Luật THEN (=> Quyết định: False) | | | |3: |IF(Nghenghiep: || | | LDPT) education =tertiary: no {no=1, yes=1} | | nhận | | | |xét | sau, khách balance ≤ 228: no lao {no=3, yes=0} Có| thể hàng động phổ thơng khả | | | | | duration ≤ 95.500: {no=46, yes=0} trả nợ họ khó, để tránh rủi ro,nongân định khách hàng không | | | | marital = single: no {no=39, yes=1} thuộcKết diệnquả vaydự vốn tiêuđược dùng đoán thể [Hình 6], kết việc đánh giá | | month = sep kết | | | duration > 184.500: yes {no=52, yes=66} phương pháp K-Folder với k = 10 | | | duration ≤ 184.500:no {no=100, yes=11} 3.3 Kết luận Trong chương này, đề tài sử dụng liệu Bankfull để kiểm chứng thuật toán xây dựng định chương Bộ liệu với 45211 ghi 17 thuộc tính, phù hợp việc sử dụng định để dự báo khách hàng có khả rịi bỏ dịch vụ ngân hàng thương mại Đồng thời, dựa vào mơ hình định (các luật định) xây dựng, đề tài đánh giá, phân tích luật q trình phân loại khách hàng để từ tiếp tục hỗ trợ việc định kinh doanh hợp lý ngân hàng thương mại Căn vào kết này, ngân hàng tham khảo để thêm thơng tin q trình true True true False class precision pred True 2Ũ2 77 72.40% pred False 72 class recall 73.72% 249 76.30% 61 77.57% Hình 5: Độ xác phần mềm RapidMiner Nghiên cứu chúng tơi trình bày ứng dụng cụ thể kỹ thuật khai phá liệu mà ngân hàng áp dụng để phân loại khách hàng Đây sở ban đầu, từ ngân hàng có thêm thơng tin khách hàng để định có cho họ vay tiêu dùng hay khơng Tuy nhiên, để có kết mang tính ứng dụng thực tế, cần bổ sung tập liệu cho tập liệu mẫu để mơ hình định có độ tin cậy cao hoạt động hiệu Đồng thời, cần tìm hiểu nhu cầu thực tế để từ cải tiến chương trình, cài đặt toán theo thuật toán nghiên cứu để làm việc tốt với sở liệu lớn mang tính thực tế 62 TÀI THAM KHẢO Khai phá liệu lĩnhLIỆU vực thu hút nhà nghiên cứu cho phép phát tri thức sở lồ cácMining phươngfor thức thông minh.Fraud Nghiên [1] Christopher Westphal andliệu C khổng Westphal, Data Intelligence, & cứuCriminal lĩnh vực này, đòi hỏi người nghiên cứu phải biết tổng hợp kết Detection: Advanced Analytics & Information Sharing Technologies nghiên 2008.cứu nhiều lĩnh vực khoa học máy tính việc ứng dụng nhiệm vụ khai phá liệu [2] L Vera, “Analytical Customer Relationship Management in Retailing Supported gianTechniques,” nghiên cứu thử nghiệm, đặc biệt khoảng thời gian làm by Qua Data thời Mining 2012 đề [3] C Wang, J Ignacio, C Wang, and J Ignacio, “Corporate Failure Prediction and tài, nhóm nghiên cứu hồn thiện đề tài với mục tiêu đặt ban đầu Cụ thể đề tài Financial Risk Spillover Corporate Failure Prediction and Financial Risk đạt kết sau: Spillover,” 2014 - Trình bày kiến thức khám phá tri thức khai phá liệu [4] A Trnka and M Iaeng, “Position of Retraining CHURN Data Mining Model in Giới thiệu phương pháp quát xây dựng định, trình bày thuật tốn Six-Sigma Methodology,” vol.tổng I, 2012 xây dựng định số ví dụ minh họa cho phương pháp xây [5] B Krollner, “Risk Management in the Australian Stockmarket using Artificial dựng định Neural Networks,” no December, 2011 - Thử nghiệm phần mềm khai phá phá liệu Rapidminer với liệu gồm [6] C Technology and M B Science, “A D ATA M INING A PPROACH T O P 45211 ghi 17 thuộc tính khách hàng mà nhóm sưu tầm xử lý REDICT P ROSPECTIVE B USINESS S ECTORS F OR L ENDING IN R Một B sốANKING vấn đề đềUtàiSING,” phải tiếp nghiên cứu, tìm hiểu: ETAIL vol.tục 5, no 2, 2015 -[7] Cần tiếp tục“Data nghiên cứu and Risk thuậtManagetoán dựment báo inkhác Bayers, mạng Noron S Chivarar, Mining Banking,” no June, 2012 nhân tạo, phân cụm kết hợp thuật toán để kết dự báo [8] A Al-Shawabkeh, “Developing a knowledge management approach to support tốt managing credit risk in Jordanian banks,” 2010 - Cần bổ sung thêm thuộc tính số lượng ghi cho liệu, cụ [9] M Bramer, Principles of Data Mining 2007 thể cho tập huấn luyện để mơ dự báo có độ tin cậy cao hoạt động hiệu [10]quảV.hơn Pacelli andsẽM.tiếp Azzollini, Neural Approach for Credit Nhóm tục phát“An triểnArtificial hoàn thiện theoNetwork hướng trở thành phần mềm Risk J Intell Syst.hàng Appl., vol nhằm 3, no hỗ 2, pp khai Management,” phá liệu lĩnh Learn vực ngân dùng trợ103-112, cho ngân2011 hàng kinh doanh hợp lý [11]quyết G định a Marcoulides, Discovering Knowledge in Data: an Introduction to Data Knowledge Data: to Data Mining, - MiningDiscovering Tìm hiểu nhu cầu thực tế để từinđó cải An tiếnIntroduction chương trình, cài đặt lại bàivol tốn theo 472.đã2005 100, thuậtno toán nghiên cứu để làm việc tốt với sở liệu lớn có sản phẩm thị trường 63 64 ... TÀI NGÂN HÀNG NHÀ NƯỚC VIỆT NAM HỌC VIỆN NGÂN HÀNG ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP CƠ SỞ NĂM 2016 XÂY DỰNG MƠ HÌNH ĐÁNH GIÁ MỨC ĐỘ TRUNG THÀNH CỦA KHÁCH HÀNG TẠI CÁC NGÂN HÀNG THƯƠNG MẠI DỰA TRÊN...NGÂN HÀNG NHÀ NƯỚC VIỆT NAM HỌC VIỆN NGÂN HÀNG ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP CƠ SỞ NĂM 2016 XÂY DỰNG MƠ HÌNH ĐÁNH GIÁ MỨC ĐỘ TRUNG THÀNH CỦA KHÁCH HÀNG TẠI CÁC NGÂN HÀNG THƯƠNG MẠI DỰA TRÊN... trung thành khách hàng ngân hàng thương CHƯƠNG 1: LÝ THUYẾT Sự TRUNG THÀNH CỦA KHÁCH HÀNG TẠI CÁC NGÂN HÀNG THƯƠNG MẠI 1.1 Tổng quan Ngân hàng thương mại 1.1.1 Khái niệm Ngân hàng thương mại Theo

Ngày đăng: 12/04/2022, 08:49

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w