1. Trang chủ
  2. » Luận Văn - Báo Cáo

Chuyên ngành kinh tế dữ liệu ứng dụng phần mềm knime kết hợp thuật toán phân lớp trong bài toàn dự đoán khách hàng rời bỏ dịch vụ ngân hàng

75 130 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 75
Dung lượng 3,26 MB

Nội dung

BỘ KẾ HOẠCH VÀ ĐẦU TƯ HỌC VIỆN CHÍNH SÁCH VÀ PHÁT TRIỂN - - ĐOÀN THU TRANG KHĨA LUẬN TỐT NGHIỆP CHUN NGÀNH: PHÂN TÍCH DỮ LIỆU LỚN TRONG KINH TẾ VÀ KINH DOANH ĐỀ TÀI: ỨNG DỤNG PHẦN MỀM KNIME KẾT HỢP THUẬT TOÁN PHÂN LỚP TRONG DỰ ĐOÁN KHÁCH HÀNG RỜI BỎ NGÂN HÀNG Hà Nội – 2023 HỌC VIỆN CHÍNH SÁCH VÀ PHÁT TRIỂN KHOA KINH TẾ SỐ - - KHÓA LUẬN TỐT NGHIỆP ĐỀ TÀI: ỨNG DỤNG PHẦN MỀM KNIME KẾT HỢP THUẬT TOÁN PHÂN LỚP TRONG DỰ ĐOÁN KHÁCH HÀNG RỜI BỎ DỊCH VỤ NGÂN HÀNG Sinh viên thực hiện: Đoàn Thu Trang Khoa: Kinh tế số Lớp: KTDL10 MSV: 7103101347 Giảng viên hướng dẫn: TS Nguyễn Hữu Xuân Trường Hà Nội – 2023 LỜI CAM ĐOAN Tôi xin cam đoan Khóa luận với đề tài “Ứng dụng phần mềm KNIME kết hợp thuật toán phân lớp dự đoán khách hàng rời bỏ dịch vụ ngân hàng” tự thân thực hiện, có hỗ trợ giáo viên hướng dẫn không chép cơng trình nghiên cứu người khác Các số liệu Khóa luận sử dụng trung thực trích dẫn rõ ràng Nếu sai tơi xin hồn tồn chịu trách nhiệm Hà Nội, tháng 04 năm 2023 Sinh viên Trang Đoàn Thu Trang LỜI CẢM ƠN Sau bốn năm học tập, nghiên cứu, thân tơi có trải nhiệm mơi trường học tập tốt ngồi việc nâng cao kiến thức tơi cịn hồn thiện kĩ phát triển thân, xin bày tỏ lịng biết ơn tới Học viện Chính sách Phát triển trường theo học suốt quãng thời gian sinh viên Đặc biệt muốn gửi lời cảm ơn trân thành sâu sắc đến TS Nguyễn Hữu Xuân Trường, thầy tận tình hướng dẫn, quan tâm giúp đỡ, đóng góp nhiều ý kiến giúp tơi hồn thiện khóa luận tốt nghiệp Ngồi muốn gửi lời cảm ơn tới khoa Kinh Tế Số thuộc Học viện Chính sách Phát triển, thầy cô tham gia quản lý giảng dạy tư vấn suốt trình học tập, kiến thức thầy cô truyền đạt lớp viên gạch cho việc đặt móng để áp dụng vào cơng việc sau Tuy nhiên q trình hồn thiện luận văn trình độ kỹ cịn hạn chế nên khơng tránh khỏi khuyết điểm thiếu sót Tơi mong nhận ý kiến đóng góp thầy để luận văn thiện hơn, đồng thời giúp nâng cao kiến thức để phục vụ tốt cho trình cơng tác thực tế thời gian tới Tơi xin trân thành cảm ơn! Hà Nội, tháng năm 2023 MỤC LỤC DANH MỤC TỪ VIẾT TẮT i DANH MỤC BẢNG BIỂU ii MỞ ĐẦU iv Tính cấp thiết đề tài iv Lý chọn đề tài v Mục đích nghiên cứu v 3.1 Về lý thuyết v 3.2 Về đối tượng v Đối tượng phạm vi nghiên cứu vi Phương pháp nghiên cứu vi Ý nghĩa đóng góp đề tài vii Bố cục luận vii CHƯƠNG 1: CƠ SỞ LÝ LUẬN VỀ KHAI PHÁ TRI THỨC 1.1 Khám phá tri thức khai phá liệu 1.2 Qúa trình hình thành khám phá tri thức khai phá liệu 1.3 Các ứng dụng khai phá liệu 1.4 Các phương pháp khai phá liệu 1.5 Lợi ích khai phá liệu 11 1.6 Những thách thức khai phá liệu 12 CHƯƠNG 2: GIỚI THIỆU PHẦN MỀM KNIME VÀ CÁC THUẬT TOÁN SỬ DỤNG TRONG DỰ ĐOÁN KHÁCH HÀNG RỜI BỎ NGÂN HÀNG 15 2.1 Phần mềm khai phá liệu KNIME 15 2.1.1 Giới thiệu phần mềm 15 2.1.2 Qúa trình phát triển cơng cụ KNIME 15 2.1.3 Ưu điểm phần mềm 17 2.1.4 Nhược điểm phần mềm KNIME 17 2.1.5 Giao diện làm việc KNIME 18 2.2 Thuật toán Cây định (Decision Tree) 19 2.2.1 Giới thiệu thuật toán 19 2.2.2 Các kiểu định 20 2.2.3 Ưu điểm thuật toán định 20 2.2.4 Nhược điểm thuật toán Cây định 21 2.1.5 Xây dựng thuật toán định 22 2.3 Thuật toán Rừng ngẫu nhiên (Random Forest) 22 2.3.1 Giới thiệu thuật toán rừng ngẫu nhiên (Random Forest) 22 2.3.2 Ưu điểm thuật toán Rừng ngẫu nhiên 23 2.3.3 Nhược điểm thuật toán 23 2.3.4 Xây dựng thuật toán rừng ngẫu nhiên 23 2.4 Thuật tốn Nạve Bayes 24 2.4.1 Giới thiệu thuật tốn Nạve Bayes 24 2.4.2 Ưu điểm thuật toán 24 2.4.3 Nhược điểm thuật toán 24 2.4.4 Ứng dụng thuật tốn Nạve Bayes 25 2.5 Thuật toán Logistic Regression 25 2.5.1 Giới thiệu thuật toán Logistic Regression 25 2.5.2 Ưu điểm thuật toán 26 2.5.3 Nhược điểm thuật toán 27 2.5.3 Ứng dụng thuật toán Logistic Regression 27 2.6 Phương pháp đánh giá 28 2.6.1 ROC Curve 28 2.6.2 Ma trận nhầm lẫn (Confusion Matrix) 29 CHƯƠNG 3: THỰC NGHIỆM VÀ KẾT QUẢ 32 3.1 Tổng quan nghiên cứu 32 3.1.1 Giới thiệu toán 32 3.1.2 Các nghiên cứu liên quan 32 3.2 Chuẩn bị liệu 34 3.2.1 Mô tả liệu 34 3.2.2 Tiền xử lý liệu 36 3.2.3 Trực quan hóa liệu 39 3.3 Xây dựng mơ hình 49 3.3.1 Thuật toán Cây định (Decision Tree) 51 3.3.2 Thuật toán Rừng ngẫu nhiên (Random Forest) 51 3.3.3 Thuật tốn Nạve Bayes 52 3.3.4 Thuật toán Logistic Regression 53 3.3.5 Lựa chọn mơ hình 53 3.3.6 Chạy kiểm mơ hình tập liệu thật 54 3.4 Đánh giá & Kết luận 56 3.5 Khuyến nghị 58 KẾT LUẬN 60 TÀI LIỆU THAM KHẢO 61 DANH MỤC TỪ VIẾT TẮT Tên đầy đủ Ký hiệu NHTM Ngân hàng thương mại KPDL Khai phá liệu CSDL Cơ sở liệu KDD Knowledge discovery in database i DANH MỤC BẢNG BIỂU BẢNG Bảng 1: Dữ liệu tổng quan toán 34 Bảng 2: Bảng thống kê tính toán liệu 36 Bảng 3: Thông tin trường liệu 37 Bảng 4: Bảng màu thể đặc trưng trường Exited 38 Bảng 5: Các số đánh giá mơ hình Decision Tree 51 Bảng 6: Các số đánh giá mơ hình Random Forest 51 Bảng 7: Các số đánh giá mơ hình Nạve Bayes 52 Bảng 8: Các số đánh giá mơ hình Logistic Regression 53 Bảng 9: Tổng hợp kết mơ hình 56 HÌNH Hình 1: Mối quan hệ KDD tri thức Hình 2: Quy trình bước khai phá liệu Hình 3: Biểu đồ so sánh tuổi khách hàng với quy mơ bán hàng Hình 4: Logo cơng cụ phân tích liệu KNIME 15 Hình 5: Giao diện làm việc phần mềm KNIME Analytics Platfom 18 Hình 6: Sơ đồ thuật tốn Cây định (Decision Tree) 20 Hình 7: Đồ thị AUC - ROC 29 Hình 8: Chuyển trường “Exited” từ dạng integer sang dạng string 37 Hình 9: Xóa trường “RowNumber”, “CustomerID”, “Surname” 38 Hình 10: Dữ liệu sau tiền xử lý liệu 39 Hình 11: Trực quan hóa liệu 39 Hình 12: Biểu đồ tỷ lệ phần trăm khách hàng chuyển đổi 40 Hình 13: Biểu đồ tỷ lệ phân phối giới tính khách hàng 41 Hình 14: Biểu đồ thể rời bỏ khách hàng theo địa lý 41 ii Hình 15: Biểu đồ tỷ lệ khách hàng sử dụng rời bỏ dịch vụ ngân hàng 42 Hình 16: Biểu đồ khách hàng hoạt động thẻ rời bỏ dịch vụ ngân hàng 43 Hình 17: Biểu đồ phân bố điểm tín dụng khách hàng lại rời bỏ 43 Hình 18: Biểu đồ thể tuổi khách hàng lại rời 44 Hình 19: Biểu đồ thể thời gian khách hàng gắn bó với ngân hàng 45 Hình 20: Biểu đồ thể khách hàng gửi tiền vào ngân hàng rời 45 Hình 21: Biểu đồ thể phân phối số sản phẩm khách hàng mua mua rời 46 Hình 22: Biểu đồ phân bổ tiền lương khách hàng rời bỏ ngân hàng 47 Hình 23: Biểu đồ tương quan biến 48 Hình 24: Dữ liệu trước sau phương pháp SMOTE Tome 50 Hình 25: Các bước xây dựng mơ hình 50 Hình 26: Đánh giá hiệu mơ hình ROC-AUC 54 Hình 28: Các bước lưu mơ hình PMML 55 Hình 29: Triển khai mơ hình liệu thật 55 Hình 30: Kết dự đoán liệu thật 56 iii Hình 22: Biểu đồ phân bổ tiền lương khách hàng rời bỏ ngân hàng Trích chọn đặc trưng nhiệm vụ bắt buộc cần phải thực xây dựng mơ hình machine learning Việc trích chọn đặc trưng quan trọng việc chọn thuộc tính (đặc trưng) phù hợp khơng giúp xây dựng mơ hình có độ xác cao mà cịn giúp xây dựng mơ hình đơn giản hơn, tốc độ thực thi cao lẫn giảm tượng overfitting mơ hình xây dựng Sử dụng phương pháp LabelEncoder để biến đổi biến định danh chuyển thành dạng số Các trường liệu thuộc biến độc lập lúc chuẩn hóa Gaussian đưa liệu phân bố phạm vi [-1, 1] 47 Hình 23: Biểu đồ tương quan biến Dựa vào biểu đồ Hệ số tương quan biến (Hình 18), ta thấy mối tương quan biến số không cao nên không cần lo lắng tượng đa cộng tuyến Hệ số tương quan có giá trị từ -1.0 đến 1.0 Kết tính lớn 1.0 nhỏ (-1) có nghĩa có lỗi phép đo tương quan - Hệ số tương quan có giá trị âm cho thấy hai biến có mối quan hệ nghịch biến tương quan âm (nghịch biến tuyệt đối giá trị -1) - Hệ số tương quan có giá trị dương cho thấy mối quan hệ đồng biến tương quan dương (đồng biến tuyệt đối giá trị 1) - Tương quan cho hai biến độc lập với 48 Về thang đo màu sắc, thuộc tính có mối quan hệ nghịch biến có màu đậm dần tiến gần đến giá trị âm Các thuộc tính có mối quan hệ đồng biến có màu nhạt dần tiến gần đến giá trị dương 3.3 Xây dựng mơ hình Vấn đề cần giải cân liệu, hiểu đơn giản cân liệu trở ngại lớn toán phân loại Các mơ hình phân loại thường tập trung vào lớp đa số, mơ hình khơng học tốt với lớp thiểu số Để đạt độ xác cao điểm liệu lớp thiểu số, nghĩa số lượng phần tử đại diện cho lớp lớn nhiều so với lớp lại (lớp tối thiểu) Các mơ hình phân loại thường tập trung vào lớp đa số, mơ hình khơng học tốt với lớp thiểu số để đạt độ xác cao điểm liệu lớp thiểu số, nghĩa số lượng phần tử đại diện cho lớp lớn nhiều so với lớp lại (lớp tối thiểu) Khảo sát tập liệu khách hàng rời bỏ chiếm 20% so với khách hàng không rời bỏ 80%, tỷ lệ khách hàng không rời bỏ dịch vụ cao nhiều so với khách hàng rời bỏ (Hình 19a) Tồn liệu chia thành hai tập liệu tập huấn luyện (80%) tập thử nghiệm (20%) Việc chia hai tập liệu theo tỷ lệ 80:20 giúp mơ hình đạt hiệu tốt tỷ lệ liệu huấn luyện dẫn đến phương sai lớn ước tính tham số mơ hình, liệu thử nghiệm dẫn đến phương sai lớn hiệu suất mơ hình Vì mục tiêu để đảm bảo liệu chia thành tập huấn luyện thử nghiệm dẫn đến phương sai không cao, nên lựa chọn tỷ lệ 80:20 Sử dụng phương pháp SMOTE Tomek sinh thêm phần tử thiểu số nhân tạo khả Tomek Links để xóa liệu xác định liên kết Tomek khỏi lớp đa số, có nghĩa mẫu liệu từ lớp đa số gần với liệu lớp thiểu số (Hình 19b) 49 18a Dữ liệu trước chuyển đổi 18b Dữ liệu sau chuyển đổi Hình 24: Dữ liệu trước sau phương pháp SMOTE Tome Hình 25: Các bước xây dựng mơ hình 50 3.3.1 Thuật toán Cây định (Decision Tree) Sau chạy thuật toán Decision Tree (Cây định) ta Bảng thống kê độ xác giá trị test train Bảng 5: Các số đánh giá mơ hình Decision Tree Dựa vào bảng ta thấy kết mơ hình Decision Tree (Cây định) có số Precision nhãn 87.6%, nhãn 54.9%, số Recall nhãn 89.4%, nhãn 50.6% số F1-Score nhãn 88.5%, nhãn 52.7% 88.5% Vậy nên ta thấy số cao, đặc biệt độ xác mơ hình lên đến 81.5% 3.3.2 Thuật tốn Rừng ngẫu nhiên (Random Forest) Đánh giá mơ hình thuật tốn Random Forest ta thấy: Bảng 6: Các số đánh giá mơ hình Random Forest 51 Dựa vào bảng ta thấy kết mơ hình Random Forest (Cây định) có số Precision nhãn 87.1%, nhãn 82.7%, số Recall nhãn 97.7%, nhãn 43.5% số F1-Score nhãn 84.8%, nhãn 57% Đặc biệt độ xác mơ hình lên đến 86.65%, độ xác cao mơ hình Decision Tree 3.3.3 Thuật tốn Nạve Bayes Đánh giá mơ hình thuật tốn Nạve Bayes ta thấy: Bảng 7: Các số đánh giá mơ hình Nạve Bayes 52 Dựa vào bảng ta thấy kết mơ hình Nạve Bayes có số Precision nhãn là 83.9%, nhãn 77.9%, số Recall nhãn 98.1%, nhãn 26% số F1-Score nhãn 90.4%, nhãn 39% Độ xác mơ hình (Accuracy) 83.45%, thấp so với so với mơ hình Random Forest cao mơ hình Decision Tree 3.3.4 Thuật tốn Logistic Regression Đánh giá mơ hình thuật tốn Nạve Bayes ta thấy: Bảng 8: Các số đánh giá mơ hình Logistic Regression Dựa vào bảng ta thấy kết mô hình Logistic Regresion có số Precision nhãn 83%, nhãn 59.6%, số Recall nhãn 96%, nhãn 22.9% số F1-Score nhãn 89%, nhãn 33% Độ xác mơ hình (Accuracy) 81.15% nên thấp mơ hình Random Forest Nạve Bayes, mơ hình Decision Tree 3.3.5 Lựa chọn mơ hình Tuy nhiên, để lựa chọn mơ hình có hiệu tốt nhất, sử dụng ROC để đánh giá mơ hình có độ xác cao 53 Hình 26: Đánh giá hiệu mơ hình ROC-AUC Xếp hạng thứ tự qua đường cong ROC ta thấy mơ hình tốt Rừng định (Random Forest) 84.9%, mơ hình Nạve Bayes 82%, mơ hình Logistic Regression 78.2% cuối mơ hình Decision Tree 73.3% Vậy nên, mơ hình tốt lựa chọn để dự đoán khách hàng rời bỏ dịch vụ ngân hàng Random Forest 3.3.6 Chạy kiểm mơ hình tập liệu thật Khi hài lòng với hiệu suất mơ hình mình, tơi chuyển vào sản xuất để triển khai liệu thực Ở đây, cần đọc luồng liệu thực tế đến từ tệp sở liệu nguồn liệu khác mơ hình tạo Sau đó, tơi áp dụng Cơng cụ dự đốn định, Cơng cụ dự đốn PMML để chạy mơ hình liệu đầu vào thực tế Dữ liệu đầu chứa vài cột bổ sung với lớp dự đoán phân phối xác suất cho hai lớp churn=0 churn=1, định cài đặt cấu hình 54 Hình 27: Các bước lưu mơ hình PMML Tuy nhiên, liệu thật cần tiền xử lý liệu điều thêm vào mơ hình PMML nút thao tác liệu tương thích với PMML quy trình đào tạo Cũng lưu ý rằng, phần chuẩn bị liệu tích hợp vào mơ hình PMML, nút thực cần thiết quy trình làm việc hiệu triển khai này, bên cạnh nút trình đọc, nút dự đốn Hình 28: Triển khai mơ hình liệu thật Sử dụng PMML, bạn cần nút cho tồn quy trình cơng việc để xuất liệu cho báo cáo Tuy nhiên, liệu cần tiền xử lý liệu, việc thêm vào mơ hình cách sử dụng node PMML minh bạch mô hình Cây định, nút Dự đốn PMML hiểu tất 55 Hình 29: Kết dự đốn liệu thật 3.4 Đánh giá & Kết luận Sau thực chạy liệu mơ hình: Decision Tree (Cây định), Random Forest (Rừng ngẫu nhiên), Nạve Bayes mơ hình Logistic Regressionthu bảng kết sau: Bảng 9: Tổng hợp kết mô hình STT Mơ hình ROC_AUC Score Accuracy Decision Tree 73.3% 81.5% 84.9% 86.65% (Cây định) Random Forest (Rừng ngẫu nhiên) Naïve Bayes 82% 83.45% Logistic Regression 78.2% 81.15% Dựa vào q trình phân tích bảng kết chạy mơ hình (Bảng 9) liệu ta rút số kết luận sau: Đây liệu mẫu tình hình khách hàng ngân hàng chứa thơng tin ngân hàng hư cấu phần giúp hiểu khách hàng, dịch vụ toán khách hàng rời bỏ dịch vụ ngân hàng Ngồi cịn mang lại hội giải vấn đề kinh doanh thực tế xử lý kỹ thuật khoa học liệu Q trình phân tích trực quan hóa liệu mang lại nhiều thơng tin hữu ích: 56 • Khách hàng lớn tuổi rời bỏ dịch vụ nhiều so với khách hàng trẻ tuổi, điều cho thấy có khác biệt sở thích dịch vụ theo nhóm tuổi Ngân hàng cần xtơi xét lại thị trường mục tiêu họ xtôi xét lại chiến lược trì nhóm tuổi khác • Giới tính khơng ảnh hưởng nhiều nghiên cứu cho thấy khách hàng nam rời bỏ so với khách hàng nữ • Việc có thẻ tín dụng yếu tố dự báo tốt cho tình trạng rời bỏ chủ yếu tỷ lệ sở hữu thẻ tín dụng cao Đức, Pháp Tây Ban Nha • Điểm tín dụng coi yếu tố quan trọng, tầm quan trọng tối thiểu số yếu tố khác việc phân phối điểm tín dụng tương tự khách hàng bị rời bỏ khách hàng giữ lại • Khách hàng sử dụng nhiều sản phẩm cơng ty có nhiều khả rời bỏ liệu cho thấy số khách hàng có sản phẩm, phần lớn số họ rời bỏ • Những khách hàng có nhiệm kỳ dài ngắn có nhiều khả rời bỏ so với khách hàng có nhiệm kỳ trung bình • Đáng ngạc nhiên, khách hàng rời bỏ người có số dư ngân hàng lớn với ngân hàng Điều đáng quan tâm ngân hàng họ khách hàng cung cấp vốn cao Với thông tin rút từ trình phân tích trực quan hóa liệu, khơng giúp công ty hiểu thêm khách hàng mà hỗ trợ nhà quản lý, hoạch định đưa biện pháp để giải vấn đề cơng ty gặp phải sách tương lai Phương pháp SMOTE sử dụng để xử lý vấn đề cân liệu Cụ thể Oversampling: phương pháp điều chỉnh để giảm cân liệu cách tăng số lượng phần tử tối thiểu giúp kết mơ hình có chất lượng cao Để dự đốn liệu khách hàng có rời hay không, sử dụng loại mơ hình: Cây định (Decision Tree), Rừng ngẫu nhiên (Random Forest), Naïve Bayes, Logistic Regression Khả thể mơ hình mức với độ 57 xác dao động từ 73% - 85% Các số hiệu suất khác mà xét độ nhạy (recall), precision f1-scores đường cong ROC cho thấy kết tốt Nhìn chung, mơ hình thuật tốn Rừng ngẫu nhiên (Random Forest) mơ hình tốt để dự đốn tình trạng rời bỏ dịch vụ số mơ hình với độ xác đo 84.9% 3.5 Khuyến nghị Dựa vào kết luận đưa đưa số khuyến nghị ngân hàng sau: Đối với nhóm khách hàng nguời cao tuổi (SeniorCitizen) có tỷ lệ rời bỏ cao nhiên nhóm khách hàng sẵn sàng chi trả chi phí hàng tháng nhiều so với nhóm khách hàng khác với múc dịch vụ tốt Vì nhóm khách hàng người cao tuổi cơng ty cần có sách riêng, cải thiện dịch vụ tốt hơn, thường xuyên gọi điện quan tâm, hỏi thăm ý kiến nhóm khách hàng chất lượng dịch vụ cơng ty Bạn cung cấp dịch vụ hỗ trợ xuất sắc cách chủ động Bởi khách hàng muốn lắng nghe Hãy chứng minh cho họ thấy bạn làm điều Đừng đợi khách hàng liên hệ với phận dịch vụ giao tiếp với họ theo “nghĩa vụ” Nếu bạn biết có nâng cấp cho sản phẩm mua phát có trục trặc sản phẩm, chủ động thông tin tới họ Việc khiến họ đánh giá cao hỗ trợ bạn, kể khơng q quan trọng với khách hàng Khảo sát số nhóm đối tượng bỏ để hiểu lý họ tìm thương hiệu khác Phân tích liệu giúp bạn đến số kết luận quan trọng thay đổi mà công ty bạn cần thực để giảm tỷ lệ rời bỏ Sau xác định chiến lược cần thay đổi, bước cần thực bắt tay thực Cho dù việc giao tiếp, hỗ trợ khách hàng chậm, sản phẩm bị lỗi hay yếu tố khác…v.v Cuối cùng, phân tích kết thay đổi cách so sánh tỷ lệ bỏ với tỷ lệ ban đầu 58 Giữ liên lạc với khách hàng không giới hạn việc thu thập phản hồi Ý tưởng đằng sau tương tác tạo cảm giác tin tưởng thoải mái Hãy khiến khách hàng cảm nhận bạn bán hàng mà giải vấn đề cho họ Hầu hết doanh nghiệp thành cơng có chung cách làm Bạn sử dụng dịch vụ SMS Marketing để giữ liên lạc tạo dựng mối quan hệ mà bạn hướng tới 59 KẾT LUẬN Phân tích liệu vấn đề thiểu tổ chức, cơng ty Đặc biệt phân tích liệu ngày có vai trị quan trọng giải vấn đề quan, tổ chức gặp phải Thông tin mạnh đất nước Phân tích quản lý liệu giúp cho cơng việc quản lý dễ dàng hơn, nâng cao hiệu sản xuất, tiết kiệm thời gian công sức Đi sâu bám sát mục tiêu nghiên cứu đặt ra, sở vận dụng tổng hợp phương pháp nghiên cứu khoa học từ lý thuyết đến thực tiễn, giải toán “Ứng dụng phần mềm KNIME kết hợp thuật toán phân lớp dự đoán khách hàng rời bỏ dịch vụ ngân hàng” Nghiên cứu cung cấp cho ngân hàng công cụ giúp dự đốn khách hàng rời bỏ dịch vụ Bằng cách sử dụng kỹ thuật Machine Learning, cung cấp cho nhà quản lý nhìn tổng quát hiệu khách hàng mình, dự đốn khách hàng có khả rời bỏ cao, từ nhà quản lý hoạch định sách lược đưa biện pháp hạn chế khách hàng rời bỏ, nhằm giúp cải thiện khả giữ chân khách hàng Ngồi ra, cịn giúp nhà quản lý, công ty thấu hiểu khách hàng mình, có biện pháp, sách để nâng cao hiệu chăm sóc khách hàng, cải thiện thời gian khách hàng gắn bó với cơng ty,… từ giúp ngân hàng phát triển hoạt động kinh doanh Bài luận thành cột mốc cuối đánh dấu bốn năm đại học, dù nỗ lực hồn thiện luận văn khơng tránh khỏi thiếu sót, tơi mong nhận đước ý kiến đóng góp thầy giáo để luận văn hồn thiện 60 TÀI LIỆU THAM KHẢO Bộ liệu sử dụng tài nghiên cứu https://www.kaggle.com/datasets/adammaus/predicting-churn-for-bankcustomers tải xuống ngày 05/03/2023 WQD 7004 Group 7, “ Bank Customer churn Prediction”, 03/05/2020 https://rpubs.com/leexinyang/bankcustomerchurnprediction Rajeev Kumar Gupta (Pandit Deendayal Energy University, India), Santosh Bharti (Pandit Deendayal Energy University, India), Nikhlesh Pathik (Amity University, India) and Ashutosh Sharma (University of Petroleum and Energy Studies, India) (2022), “Predicting Churn of Credit Card Customers Using Machine Learning and AutoML” Dr Maheswari R, truy cập vào ngày 17/03/2023 Dr Maheswari R, truy cập vào ngày 17/03/2023 Amgad Muneer, Rao Faizan Ali, Amal Alghamdi, Shakirah Mohd Taib, Ahmed Almaghthawi, Ebrahim Abdulwasea Abdullah Ghaleb năm 2021 “Predicting customers churning in banking industry: A machine learning approach” Praveen Lalwani, Manas Kumar Mishra, Jasroop Singh Chadha & Pratyush Sethi (2021), “Customer churn prediction systtôi: a machine learning approach”, VIT Bhopal University, Bhopal, India Tk4.vn, “Quy trình xây dựng triển khai ứng dụng sử dụng machine learning”, truy cập ngày 20 tháng 12 năm 2022 từ 61

Ngày đăng: 16/06/2023, 09:40

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN