ĐỒ ÁN NHÓM CUỐI HỌC PHẦN MÔN KHOA HỌC DỮ LIỆU Tên dự án: DỰ ĐOÁN KHẢ NĂNG KHÁCH HÀNG RỜI BỎ SỬ DỤNG DỊCH VỤ NGÂN HÀNG Thị trường ngân hàng Việt Nam đang ngày càng phát triển cạnh tranh gay gắt. Các ngân hàng không ngừng tìm kiếm các giải pháp để thu hút và giữ chân khách hàng. Trong đó, việc dự đoán khả năng khách hàng rời bỏ sử dụng dịch vụ ngân hàng là một vấn đề quan trọng.
BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC KINH TẾ TP.HCM KHOA CÔNG NGHỆ THÔNG TIN KINH DOANH - - ĐỒ ÁN NHĨM CUỐI HỌC PHẦN MƠN KHOA HỌC DỮ LIỆU Tên dự án: DỰ ĐOÁN KHẢ NĂNG KHÁCH HÀNG RỜI BỎ SỬ DỤNG DỊCH VỤ NGÂN HÀNG Lớp: 23C1INF50905952 – SÁNG THỨ (B2.104) Mã học phần: 23C1INF50905952 Giảng viên hướng dẫn: Nguyễn Mạnh Tuấn Nhóm thực hiện: Nhóm TP HỒ CHÍ MINH Tháng 12, 2023 MỤC LỤC CHƯƠNG 1: TỔNG QUAN 1.1 Lý chọn đề tài .1 1.2 Mục tiêu nghiên cứu 1.3 Đối tượng phạm vi nghiên cứu đề tài 1.4 Phương pháp nghiên cứu 1.4.1 Phương pháp nghiên cứu lý luận .2 1.4.2 Phương pháp nghiên cứu thực tiễn CHƯƠNG 2: QUY TRÌNH THỰC HIỆN VÀ KẾT QUẢ .3 2.1 Mô tả liệu 2.1.1 Mô tả tổng quát liệu .3 2.1.2 Mơ tả thuộc tính 2.2 Tiền xử lý 2.3 Bài toán 1: Bài toán phát điểm đặc thù xây dựng dashboard .6 2.3.1 Khái niệm dashboard .6 2.3.2 Quy trình xây dựng dashboard .6 2.3.3 Các biểu đồ cụ thể dashboard 2.3.4 Kết đánh giá .13 2.4 Bài toán 2: Dự đoán khách hàng rời bỏ tiếp tục sử dụng dịch vụ ngân hàng (Bài toán phân lớp) 13 2.4.1 Mơ tả tốn .13 2.4.2 Mô tả phương pháp thực toán 13 2.4.2.1 Phân lớp liệu .13 2.4.2.2 Các bước thực 14 2.4.2.3 Một số phương pháp phân lớp 14 2.4.3 Chạy mơ hình kết .15 2.4.4 Kết nhận xét .17 2.4.5 Kết luận 20 2.5 Bài toán 3: Phân loại nhóm khách hàng tiếp tục sử dụng chấm dứt, rời bỏ dịch vụ ngân hàng (bài toán phân cụm) 20 2.5.1 Mơ tả tốn .20 2.5.2 Mô tả phương pháp thực toán 21 2.5.2.1 Phân cụm liệu .21 2.5.2.2 Quy trình phân cụm liệu 21 2.5.2.3 Thực toán phân cụm liệu 22 2.5.3 Xây dựng mơ hình 24 2.5.4 Kết mơ hình phân cụm 25 2.5.5 Đánh giá kết sau phân cụm 26 2.5.6 Kết luận 30 CHƯƠNG 3: KẾT LUẬN 30 3.1.Kết luận toán 30 3.1.1 Bài toán .30 3.1.2 Bài toán .30 3.1.3 Bài toán .31 3.2.Hạn chế nghiên cứu .31 3.3.Giải pháp .32 DANH MỤC HÌNH ẢNH Hình Các biến, đối tượng khảo sát .5 Hình Số liệu sau tiền xử lí Hình Dashboard Hình Biểu đồ tỉ lệ số dư khách hàng theo giới tính Hình Biểu đồ tỉ lệ rời theo giới tính Hình Mức lương ước tính nhóm khách hàng tiếp tục rời .9 Hình Số thẻ tín dụng theo quốc gia 10 Hình Số thành viên hoạt động thường xuyên theo quốc gia 11 Hình Số thẻ ngân hàng mà khách hàng sử dụng 12 Hình 10 Số dư tài khoản khách hàng theo thời gian sử dụng quốc gia 13 Hình 11 Tổng quan quy trình phân lớp liệu .15 Hình 12 Màn hình liệu huấn luyện 16 Hình 13 Màn hình liệu dự báo 16 Hình 14 Kết đánh giá tốn qua SVM 17 Hình 15 Kết đánh giá toán qua LR 17 Hình 16 Kết đánh giá tốn theo Neural Network 18 Hình 17 Kết Test and Score 19 Hình18 Kết dự đoán toán 20 Hình 19 Đánh giá kết dự báo 22 Hình 21 Nhập liệu từ file 23 Hình 22 Mơ hình xây dựng tốn 24 Hình 23 Kết phương pháp K-Means 24 Hình 24 Kết Silhouette Plot 25 Hình 25 Dữ liệu DataTable với điểm Sihouette Plot cao .26 Hình 26 Biểu đồ thống kê số lượng khách hàng mang quốc tịch Pháp, Đức, Tây Ban Nha 26 Hình 27 Biểu đồ thống kê số dư tài khoản khách hàng 27 Hình 28 Biểu đồ mức độ thu nhập khách hàng .28 Hình 29 Biểu đồ so sánh 29 NHÓM SINH VIÊN THỰC HIỆN ĐỒ ÁN Nhóm Tỉ lệ phần trăm Họ Tên MSSV Hồ Vũ Quốc An 31221020609 100% Nguyễn Thị Quỳnh Anh 31221024400 100% Dáng 31221025972 100% Trần Phi Long 31221021007 100% Cam Nhã Thy 31221023683 100% Nguyễn Đào đóng góp Duyên MỨC ĐỘ LIÊN QUAN ĐẾN CHUYÊN NGÀNH Mức quan Đề tài độ liên Liên quan Liên quan gần Không liên quan x Link thư mục google drive chứa thông tin liên quan đến bài: CHƯƠNG 1: GIỚI THIỆU ĐỀ TÀI 1.1 Lý chọn đề tài Thị trường ngân hàng Việt Nam ngày phát triển cạnh tranh gay gắt Các ngân hàng khơng ngừng tìm kiếm giải pháp để thu hút giữ chân khách hàng Trong đó, việc dự đốn khả khách hàng rời bỏ sử dụng dịch vụ ngân hàng vấn đề quan trọng Về mặt kinh tế, khách hàng rời bỏ gây tổn thất đáng kể cho ngân hàng, bao gồm: - Mất doanh thu từ phí lãi suất Khách hàng rời bỏ vấn đề nan giải ngân hàng Theo nghiên cứu Bain & Company, khách hàng rời bỏ khiến ngân hàng từ 10% đến 30% doanh thu tương lai - Tốn chi phí để tiếp thị thu hút khách hàng - Giảm lòng tin khách hàng Về mặt chiến lược, khách hàng rời bỏ dấu hiệu cho thấy ngân hàng gặp vấn đề việc đáp ứng nhu cầu khách hàng Nếu không giải vấn đề này, ngân hàng khó phát triển bền vững Về mặt xã hội, khách hàng rời bỏ gây tác động tiêu cực đến kinh tế, chẳng hạn như: - Giảm lượng tiền lưu thơng kinh tế - Tăng chi phí tài cho doanh nghiệp cá nhân Việc dự đoán khả khách hàng rời bỏ giúp ngân hàng có thể: Xác định sớm khách hàng có nguy rời bỏ Thực biện pháp can thiệp kịp thời để ngăn chặn khách hàng rời bỏ Cải thiện chất lượng dịch vụ sản phẩm để đáp ứng nhu cầu khách hàng Với lý trên, đề tài " Dự đoán khả khách hàng rời bỏ sử dụng dịch vụ ngân hàng" đề tài có tính thực tiễn ứng dụng cao 1.2 Mục tiêu nghiên cứu: Bài nghiên cứu “ Dự đoán khả khách hàng rời bỏ sử dụng dịch vụ ngân hàng” chủ yếu tập trung mục tiêu sau: Tiến hành nghiên cứu phân tích lý thuyết tổng quan khai phá liệu nhằm tập trung làm rõ vấn đề nghiên cứu Thực nghiên cứu phương pháp cụ thể, đặc biệt phương pháp phân lớp liệu (phương pháp cho phép dự báo, phân loại phân lớp đối tượng) Nghiên cứu giới thiệu phương pháp phân lớp liệu, từ chọn phương pháp phù hợp tối ưu để tiến hành dự báo liệu Triển khai mơ hình thực nghiệm dựa thơng tin khách hàng để đưa dự đốn mức độ khách hàng rời bỏ ngân hàng giải pháp tốt để cải thiện mức độ 1.3 Đối tượng phạm vi nghiên cứu đề tài: Đối tượng nghiên cứu gồm 10.000 khách hàng khảo sát ngân hàng Bao gồm nhiều thuộc tính khác : số dư, thời gian sử dụng thẻ, khảo sát sử dụng thẻ ghi nợ, mức lương chủ sở hữu,… Dữ liệu lấy công ty đăng tải trang web Kaggle : https://www.kaggle.com/datasets/gauravtopre/bank-customer-churndataset Công cụ sử dụng: Orange, Excel 1.4 Phương pháp nghiên cứu 1.4.1 Phương pháp nghiên cứu lý luận Thực nghiên cứu thông tin liệu từ nguồn sách, báo, tài liệu học tập, sau thu thập, lọc phân tích để định rõ khái niệm quan điểm xác nhất, nhằm xây dựng tảng lý thuyết cho nghiên cứu, dự đốn thuộc tính đối tượng nghiên cứu xây dựng mơ hình lý thuyết ban đầu.Bao gồm: • Phương pháp phân tích – tổng hợp lý thuyết: từ nguồn tài liệu, sách, báo có sẵn, sau đọc tổng hợp để lọc, rút nội dung cần thiết cho luận điểm nghiên cứu • Phương pháp mơ hình hóa: xây dựng mơ hình nghiên cứu dựa lý thuyết áp dụng mơ hình để dự báo nhằm kiểm tra độ xác mơ hình 1.4.2.Phương pháp nghiên cứu thực tiễn Tiến hành vận dụng lý thuyết đưa vào phương pháp nghiên cứu thực tiễn: • Sử dụng phần mềm Orange - cơng cụ khai phá liệu phổ biến để phân tích, xử lý liệu làm rõ vấn đề nghiên cứu • Từ đó, xây dựng mơ hình dự báo dựa vào liệu huấn luyện có sẵn so sánh kết rút với nhằm chọn lựa mơ hình phù hợp giúp nhà quản lý có định xác làm việc hiệu CHƯƠNG 2: QUY TRÌNH THỰC HIỆN VÀ KẾT QUẢ 2.1 Mơ tả liệu 2.1.1 Mô tả tổng quát liệu - Bộ liệu nhóm sử dụng cho nghiên cứu có tên Bank-CustomerChurn-Prediction Size: 10.000 rows, 12 columns 11 features: categorical, numeric Target with values No missing data