Untitled BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG CÔNG NGHỆ VÀ THIẾT KẾ UEH KHOA CÔNG NGHỆ THÔNG TIN KINH DOANH BÀI TIỂU LUẬN KẾT THÚC HỌC PHẦN MÔN KHOA HỌC DỮ LIỆU ĐỀ TÀI DỰ ĐOÁN KHÁCH HÀNG CÓ RỜI BỎ NGÂN HÀNG[.]
lOMoARcPSD|18034504 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG CÔNG NGHỆ VÀ THIẾT KẾ UEH -KHOA CÔNG NGHỆ THÔNG TIN KINH DOANH BÀI TIỂU LUẬN KẾT THÚC HỌC PHẦN MÔN: KHOA HỌC DỮ LIỆU ĐỀ TÀI: DỰ ĐỐN KHÁCH HÀNG CĨ RỜI BỎ NGÂN HÀNG ABC BANK Giảng viên hướng dẫn: Võ Thành Đức Nhóm 4: Âu Phi Nhung_31201021289 Dương Gia Linh_31201022248 Nguyễn Thanh Phong_31201020774 Lê Huỳnh Minh Huy_31201026067 Phạm Ngọc Thuỷ_31201022776 TP Hồ Chí Minh, ngày 26 tháng 10 năm 2022 lOMoARcPSD|18034504 MỤC LỤC Giới thiệu đề tài 1.1 Giới thiệu sơ lược đề tài 1.2 Mục đích nghiên cứu Thu thập liệu 2.1 Mô tả tổng quát liệu 2.2 Các thuộc tính liệu 2.3 Tiền xử lý liệu Kiểm định đánh giá mơ hình 3.1 Thực loại mơ hình dự đốn 3.2 Đánh giá mơ hình Lựa chọn mơ hình toán dự báo 10 4.1 Lựa chọn mơ hình 10 4.2 Kết dự báo 11 4.3 Đọc bảng kết quả: 11 4.4 Giải pháp 13 Ý nghĩa 14 Đánh giá đóng góp thành viên tham gia dự án 15 Tài liệu tham khảo 16 lOMoARcPSD|18034504 Giới thiệu đề tài 1.1 Giới thiệu sơ lược đề tài “Trong bối cảnh kinh tế khơng ngừng phát triển có thành tựu vượt bậc nay, việc xuất canh tranh gay gắt ngành nghề khách điều tránh khỏi ngành ngân hàng khơng ngoại lệ Chính vậy, ngày doanh nghiệp lĩnh vực nói chung riêng doanh nghiệp ngành ngân hàng nói riêng khơng ngừng mở rộng cải tiến chất lượng dịch vụ sản phẩm họ nhằm mang đến trải nghiệm tốt cho khách hàng Tuy nhiên, tồn trường hợp khách hàng rời hay nói cách khác họ ngừng kết nối, hợp tác hay làm việc với ngân hàng họ cảm thấy khơng hài lịng, thỏa mãn với dịch vụ sản phẩm mà ngân hàng cung cấp Cũng lẽ đó, từ liệu Bank Customer Churn Dataset mà nhóm thu thập từ Kaggle, nhóm thực xử lý nguồn liệu, sử dụng phương pháp phân lớp để tiến hành phân tích, đánh giá độ hiệu mơ hình, từ đưa dự đốn rằng: “Liệu khách hàng có khả rời bỏ ngân hàng hay khơng?” với biến phụ thuộc Customer churn số biến độc lập khác nêu chi tiết phần sau.” 1.2 Mục đích nghiên cứu Giúp ngân hàng tiếp cận nhóm khách hàng cung cấp gói dịch vụ, sản phẩm cho phù hợp với nhu cầu nhóm khách hàng khác Điều chỉnh hệ thống quản lý hoạt động cung cấp dịch vụ, sản phẩm trở nên hiệu hơn, hạn chế tối đa tỷ lệ khách hàng rời bỏ ngân hàng đồng thời thu hút giữ chân nhiều khách hàng Thu thập liệu 2.1 Mô tả tổng quát liệu Bộ liệu Bank Customer Churn Dataset nhóm thu thập từ Kaggle Với biến phụ thuộc Customer Churn lOMoARcPSD|18034504 Các biến độc lập bao gồm: “ Customer_id, Credit_score, Country, Gender, Age, Tenure, Balance, Product_number, Credit_card, Active_member, Estimated_salary, Churn Customer_id, Credit_score, Country, Gender, Age, Tenure, Balance, Product_number, Credit_card, Active_member, Estimated_salary.” 2.2 Các thuộc tính liệu Tên biến Credit_score Loại biến Định lượng Ý nghĩa Các giá trị biến Có ảnh hưởng đến tỷ lệ khách hàng rời bỏ ngân hàng, khách hàng có số điểm tín dụng cao có khả rời bỏ ngân hàng Country Định tính Quốc tịch France(Pháp), Spain(Tây Ban Nha),Germany(Đức) Gender Định tính Giúp tìm hiểu xem liệu giới tính đóng vai trò việc rời bỏ ngân hàng khơng Age Định tính Đây biến chắn liên quan, khách hàng có số tuổi cao có khả rời bỏ ngân hàng khách hàng trẻ Nam, nữ lOMoARcPSD|18034504 Tenure Định lượng Liên quan đến số năm từ lúc họ bắt đầu trở thành khách hàng ngân hàng Thơng thường, khách hàng lâu năm có lịng trung thành nhiều có khả rời bỏ ngân hàng Balance Định lượng Số dư tài khoản trung bình biến biểu thị rõ ràng cho tỉ lệ khách hàng rời bỏ ngân hàng, khách hàng có số dư tài khoản cao có khả rời bỏ ngân hàng người có số dư tài khoản thấp Product_number Định lượng Liên quan đến số lượng dịch vụ mà khách hàng giao dịch thông qua ngân hàng, số lượng giao dịch nhiều có khả khách hàng rời bỏ ngân hàng Credit_card Định tính Xem xét khách hàng có 1: Đã có thẻ tín dụng hay khơng , 0: Chưa có khách hàng có thẻ tín dụng thường có khả ngưng rời bỏ ngân hàng lOMoARcPSD|18034504 Active_member Định tính Khách hàng trở thành 1: Là thành viên thành viên có thường có 0: Khơng thành viên khả rời bỏ ngân hàng Estimated_salar Định lượng Khách hàng có mức lương thấp có nhiều khả y rời bỏ khách hàng có mức lương cao Customer Churn Định tính Khách hàng có định rời 0: tiếp tục sử dụng bỏ ngân hàng hay không 2.3 Tiền xử lý liệu Làm liệu: Dữ liệu gốc tốt, khơng có giá trị bị thiếu 1: rời bỏ ngân hàng lOMoARcPSD|18034504 Nhóm định loại bỏ biến customer_id, country khơng ảnh hưởng đến định khách hàng có rời bỏ ngân hàng không Từ liệu gốc gồm 10.000 mẫu, nhóm thực chọn ngẫu nhiên 300 mẫu để tạo thành liệu Dùng để kiểm thử thực dự đốn mơ hình phân lớp Kiểm định đánh giá mơ hình 3.1 Thực loại mơ hình dự đốn Nhóm sử dụng phương pháp: Tree, SVM, Logistic Regression, Neural Network để tiến hành phân lớp liệu lOMoARcPSD|18034504 3.2 Đánh giá mơ hình Sử dụng cơng cụ Test&Score Confusion Matrix để đánh giá mơ hình sử dụng • Giá trị AUC: Gía trị tiến mơ hình tốt • CA (tính xác): tỷ lệ số mẫu phân lớp tồn liệu • Precision (độ xác): cho biết số m mẫu phân lớp vào lớp i có tỷ lệ mẫu có • Recall (độ phủ) • F1: giá trị trung bình điều hịa cùa hai độ đo Precision Recall Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Tuy nhiên, số phương thức tốt để đánh giá mơ hình tốt Để đánh giá phương pháp tốt để phân lớp liệu, ta dùng ma trận nhầm lẫn ( Confusion Matrix) Sử dụng Confusion Matrix (ma trận nhầm lẫn) để đánh giá mơ hình Ma trận nhầm lẫn mơ hình Logistic Regression: • Mơ hình dự đốn khách hàng tiếp tục sử dụng dịch vụ ngân hàng chiếm 79.3% • Mơ hình dự đốn sai khách hàng tiếp tục sử dụng dịch vụ ngân hàng thành khách hàng rời bỏ ngân hàng chiếm 0% • Mơ hình dự đốn sai khách hàng rời bỏ ngân hàng thành khách hàng tiếp tục sử dụng dịch vụ ngân hàng chiếm 20.7% • Mơ hình dự đốn khách hàng rời bỏ ngân hàng chiếm 100% Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Ma trận nhầm lẫn mơ hình Tree: • Mơ hình dự đốn khách hàng tiếp tục sử dụng dịch vụ ngân hàng chiếm 83.3% • Mơ hình dự đốn sai khách hàng tiếp tục sử dụng dịch vụ ngân hàng thành khách hàng rời bỏ ngân hàng chiếm 59.3% • Mơ hình dự đốn sai khách hàng rời bỏ ngân hàng thành khách hàng tiếp tục sử dụng dịch vụ ngân hàng chiếm 16.7% • Mơ hình dự đốn khách hàng rời bỏ ngân hàng chiếm 40.7% Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Ma trận nhầm lẫn mơ hình SVM: • Mơ hình dự đốn khách hàng tiếp tục sử dụng dịch vụ ngân hàng chiếm 79.8% • Mơ hình dự đốn sai khách hàng tiếp tục sử dụng dịch vụ ngân hàng thành khách hàng rời bỏ ngân hàng chiếm 0% • Mơ hình dự đốn sai khách hàng rời bỏ ngân hàng thành khách hàng tiếp tục sử dụng dịch vụ ngân hàng chiếm 20.2% • Mơ hình dự đốn khách hàng rời bỏ ngân hàng chiếm 100% Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Ma trận nhầm lẫn mơ hình Neural Network: • Mơ hình dự đốn khách hàng tiếp tục sử dụng dịch vụ ngân hàng chiếm 83.3% • Mơ hình dự đốn sai khách hàng tiếp tục sử dụng dịch vụ ngân hàng thành khách hàng rời bỏ ngân hàng chiếm 32.0% • Mơ hình dự đốn sai khách hàng rời bỏ ngân hàng thành khách hàng tiếp tục sử dụng dịch vụ ngân hàng chiếm 16.7% • Mơ hình dự đốn khách hàng rời bỏ ngân hàng chiếm 68% Lựa chọn mơ hình tốn dự báo 4.1 Lựa chọn mơ hình Mơ hình SVM có tổng sai lầm loại loại nhỏ Nên nhóm chọn mơ hình SVM Sử dụng liệu dự đoán gồm 30 mẫu để tiến hành dự đoán phân lớp 10 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 4.2 Kết dự báo Sử dụng mô hình SVM cơng cụ predictions để dự báo 30 mẫu thử nghiệm cho kết cuối 4.3 Đọc bảng kết quả: 11 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 • Giới tính nam có sử dụng thẻ thành viên, có sản phẩm, số năm sử dụng thẻ< 5, số tuổi< 40, điểm tín dụng>= 641, số dư tài khoản> 67450, lương< 93524 => tiếp tục sử dụng ngân hàng • Giới tính nam có sử dụng thẻ thành viên, có nhiều sản phẩm, số năm sử dụng thẻ >=5, số tuổi>=40, điểm tín dụng< 641, số dư tài khoản >67450, lương< 93524 => tiếp tục sử dụng ngân hàng • Giới tính nam có sử dụng thẻ thành viên, có nhiều sản phẩm, số năm sử dụng thẻ >=5, số tuổi= 641, số dư tài khoản tiếp tục sử dụng ngân hàng • Giới tính nam có sử dụng thẻ thành viên, có nhiều sản phẩm, số năm sử dụng thẻ >=5, số tuổi= 641, số dư tài khoản 93524 => tiếp tục sử dụng ngân hàng • Giới tính nam có sử dụng thẻ khơng thành viên, có sản phẩm, số năm sử dụng thẻ> 5, số tuổi>= 40, điểm tín dụng>=641, số dư tài khoản< 67450, lương> 93524 => tiếp tục sử dụng ngân hàng • Giới tính nam có sử dụng thẻ khơng thành viên, có sản phẩm, số năm sử dụng thẻ< 5, số tuổi< 40, điểm tín dụng>=641, số dư tài khoản< 67450, lương> 93524 => tiếp tục sử dụng ngân hàng • Giới tính nam có sử dụng thẻ khơng thành viên, có nhiều sản phẩm, số năm sử dụng thẻ> 5, số tuổi< 40, điểm tín dụng 67450, lương> 93524 => tiếp tục sử dụng ngân hàng • Giới tính nam có sử dụng thẻ khơng thành viên, có sản phẩm, số năm sử dụng thẻ> 5, số tuổi< 40, điểm tín dụng 67450, lương< 93524 => tiếp tục sử dụng dịch vụ ngân hàng • Giới tính nữ khơng có sử dụng thẻ, thành viên, có sản phẩm, số năm sử dụng< 5, số tuổi>=40, điểm tín dụng>=641, số dư tài khoản>67450, lươngrời bỏ ngân hàng (số năm sử dụng 3, lương thấp 738) 12 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 • Giới tính nữ khơng sử dụng thẻ, khơng thành viên, có sản phẩm, số năm sử dụng=40, điểm tín dụng=40, điểm tín dụng< 641, số dư tài khoản< 67450, lương> 93524 (balance =0, điểm tín dụng thấp 481)=> rời bỏ ngân hàng Kết luận: Nhìn chung, khách hàng có khả hủy/ ngưng sử dụng dịch vụ ngân hàng ABC nữ, có độ tuổi 40 Hầu hết khách hàng sử dụng sản phẩm/ dịch vụ ngân hàng cung cấp Bên cạnh đó, phần lớn khách hàng có ý định ngưng sử dụng dịch vụ ngân hàng có mức lương thấp Vậy nên, lý mà khách hàng ngưng sử dụng dịch vụ ngân hàng chi phí trì dịch vụ cao họ khơng thể tiếp tục chi trả Ngồi ra, số dư trung bình tài khoản họ không cao mức lương thấp Điều khiến họ khơng thật có nhu cầu sử dụng dịch vụ Điểm tín dụng khách hàng không cao 4.4 Giải pháp “Đối với khách hàng có ý định rời bỏ (ngừng sử dụng dịch vụ ngân hàng), nhóm đề xuất giải pháp: • Với khách hàng thành viên có sử dụng thẻ dịch vụ Khách hàng có điểm tín dụng số dư tài khoản cao Giải pháp để giữ chân khách hàng tăng hạn mức tín dụng Vì sử dụng dịch vụ năm, khách hàng quen thuộc với cách thức giao dịch, khả giữ chân khách hàng cao • Với khách hàng chưa mở thẻ không thành viên có sử dụng dịch vụ Khách hàng khách hàng Giải pháp để giữ chân họ khuyến khích đăng ký thẻ đăng kí thành viên để hưởng nhiều ưu đãi từ phía ngân hàng 13 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 • Với khách hàng có sử dụng thẻ đăng ký thành viên, khách hàng sử dụng nhiều sản phẩm mà ngân hàng cung cấp Khách hàng có mức lương cao nên khơng cần thiết sử dụng dịch vụ tín dụng ngân hàng Để giữ chân khách hàng này, ngân hàng nên khuyến khích họ gửi tiết kiệm với lãi suất ưu đãi Do sử dụng nhiều dịch vụ ngân hàng nên khả giữ chân họ cao Giải pháp chung: Các khách hàng muốn hủy dịch vụ sử dụng sản phẩm ngân hàng Nguyên nhân nằm thái độ phục vụ giải đáp thắc mắc nhân viên chất lượng gói sản phẩm chưa đáp ứng đủ nhu cầu họ Để hạn chế việc khách hàng rời bỏ ngân hàng, phía ngân hàng cần nắm bắt yếu tố mà khách hàng yêu thích quan tâm như: • Chi phí giao dịch, quản lý tài khoản, chuyển khoản ngồi ngân hàng • Giao dịch tiện lợi, nhanh chóng • Nhiều ưu đãi hấp dẫn • Độ uy tín ngân hàng • Chất lượng sản phẩm, dịch vụ • Phản hồi nhanh chóng thắc mắc, khiếu nại • Thái độ phục vụ nhân viên giao dịch, … Kết luận: Giải vấn đề trên, ngân hàng giảm thiểu lượng khách hàng rời bỏ, không sử dụng dịch vụ/sản phẩm ngân hàng.” Ý nghĩa Tỷ lệ khách hàng ngưng sử dụng dịch vụ ảnh hưởng trực tiếp tới ngân hàng Các ngân hàng thu thập liệu từ khách hàng sử dụng liệu để phát triển mơ hình dự đốn Việc dự đốn khách hàng có rời bỏ ngân hàng hay không vấn đề cấp bách Dự đốn khách hàng giúp cho ngân hàng: • Đưa nhìn tổng quan tình hình hoạt động ngân hàng • Có thể phân tích lý khách hàng lại ngưng sử dụng dịch vụ 14 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 • Tìm đâu khách hàng quan trọng đối tượng ngân hàng nên trọng vào • Đưa sách, ưu đãi dành cho khách hàng có dấu hiệu ngưng sử dụng dịch vụ • Đề chiến lược giúp giảm tỷ lệ khách hàng ngưng sử dụng dịch vụ ngân hàng Đánh giá đóng góp thành viên tham gia dự án 15 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Tài liệu tham khảo TS Võ Thành Đức, 2022, Tài liệu hướng dẫn học tập môn Khoa Học Dữ Liệu Accessed 26 october 2022 SANTOSH KUMAR “Bank Customers Churn.” Kaggle, SANTOSH KUMAR, 2018, https://www.kaggle.com/datasets/santoshd3/bank-customers Accessed 26 October 2022 16 Downloaded by vu ga (vuchinhhp2@gmail.com) ... dự đoán khách hàng tiếp tục sử dụng dịch vụ ngân hàng chiếm 83.3% • Mơ hình dự đoán sai khách hàng tiếp tục sử dụng dịch vụ ngân hàng thành khách hàng rời bỏ ngân hàng chiếm 59.3% • Mơ hình dự. .. dự đốn sai khách hàng rời bỏ ngân hàng thành khách hàng tiếp tục sử dụng dịch vụ ngân hàng chiếm 16.7% • Mơ hình dự đoán khách hàng rời bỏ ngân hàng chiếm 68% Lựa chọn mơ hình tốn dự báo 4.1... hình dự đốn khách hàng tiếp tục sử dụng dịch vụ ngân hàng chiếm 79.8% • Mơ hình dự đốn sai khách hàng tiếp tục sử dụng dịch vụ ngân hàng thành khách hàng rời bỏ ngân hàng chiếm 0% • Mơ hình dự đoán