Nguồn thu nhập chính của ngân hàng xuất phát từ việc khách hàng sử dụng cácsản phẩm, dịch vụ của ngân hàng : gửi tiền tiết kiệm, thẻ tín dụng, bao thanh toán ...Nếu chúng ta có thể dự đo
Trang 1ĐẠI HỌC UEH TRƯỜNG KINH DOANH KHOA KINH DOANH QUỐC TẾ - MARKETING
ĐỒ ÁN NHÓM BỘ MÔN KHOA HỌC DỮ LIỆU
NHÓM
Trang 3ĐẠI HỌC UEH TRƯỜNG KINH DOANH KHOA KINH DOANH QUỐC TẾ - MARKETING
Trang 4CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI I Lý do chọn đề tài
Khách hàng giữ một vai trò vô cùng quan trọng đối với ngân hàng Khách hàng quyếtđịnh doanh thu, uy tín và tiềm năng phát triển của ngân hàng
Doanh thu và lợi nhuận: của ngân hàng phụ thuộc vào số lượng và chất lượng kháchhàng Nguồn thu nhập chính của ngân hàng xuất phát từ việc khách hàng sử dụng cácsản phẩm, dịch vụ của ngân hàng : gửi tiền tiết kiệm, thẻ tín dụng, bao thanh toán Nếu chúng ta có thể dự đoán được khách hàng nào có nguy cơ rời đi, ngân hàng có thểkịp thời đưa ra các biện pháp làm hài lòng khách hàng để giữ chân khách hàng, từ đócó thể tăng thêm doanh thu và lợi nhuận
Khả năng phát triển của ngân hàng: khách hàng là một nơi hữu ích để ngân hàng cóthể phát triển, bởi vì ngân hàng có thể lắng nghe ý kiến, phản hồi, mong muốn củakhách hàng, từ đó rút ra bài học, chỉnh sửa chính sách sao cho phù hợp => giúp ngânhàng phát triển và tiến xa hơn vì được sự tín nhiệm của khách hàng Nếu không dựbáo khả năng rời đi hay ở lại của khách hàng, chúng ta sẽ không biết khách hàngkhông hài lòng ở điểm nào, có bất cập, bất tiện gì khi sử dụng dịch vụ ở ngân hàng.Vậy nên việc dự báo là vô cùng cần thiết, nó giúp cho ngân hàng hiểu rõ về kháchhàng hơn, từ đó điều chỉnh dịch vụ , chính sách để ngân hàng có thể phát triển, tiến xahơn nữa
Truyền thông: khi một ngân hàng được sự tín nhiệm, yêu quý của khách hàng dànhcho ngân hàng, khách hàng sẽ có xu hướng giới thiệu ngân hàng mà họ tín nhiệm chongười thân, gia đình và bạn bè => việc đáp ứng nhu cầu của khách hàng, tạo được uytín cho khách hàng sẽ giúp ngân hàng gia tăng uy tín, vị thế của mình trên thị trường.Cho nên đây cũng là một trong những lý do nên tiến hành dự báo khả năng rời đi hayở lại của khách hàng để có thể có những biện pháp phù hợp nhằm gia tăng uy tín củangân hàng Ngân hàng có thể tạo ra những dịch vụ và trải nghiệm thú vị, tích cực cho
Trang 5II Mục tiêu nghiên cứu 1 Mục tiêu tổng quát
Giúp cho ngân hàng phân tích, xác định được một số đặc điểm đặc trưng cụ thể củamột khách hàng có ý định rời khỏi ngân hàng Từ đó, các ngâ hàng tại Việt Nam cóthể có một cái nhìn tổng quát hơn về khách hàng để kịp thời đưa ra các chính sách,giải pháp, những đề nghị mới để có thể hạn chế tối đa việc mất khách hàng
2 Mục tiêu cụ thể
Sử dụng phần mềm Orange để xử lý dữ liệu và giải quyết các bài toán sau:Bài toán 1: Phát hiện các điểm đặc thù của dữ liệu liên quan đến lựa chọn rời đi hay ởlại của khách hàng dựa vào lược đồ và các công cụ thống kê
Bài toán 2: Dự đoán khả năng rời đi hay ở lại của khách hàng tại ngân hàng (bài toánphân lớp dữ liệu)
Bài toán 3: Phân cụm/ nhóm khách hàng có khả năng cao sẽ rời khỏi ngân hàng (bàitoán phân cụm dữ liệu)
3 Đối tượng và phạm vi nghiên cứu.
3.1 Đối tượng nghiên cứu Nghiên cứu được dựa trên kết quả khảo sát khách hàng của ngân hàng ABCMultistate tại Pháp, Tây Ban Nha và Đức
3.2 Phạm vi nghiên cứu.Phạm vi nghiên cứu bao gồm phân tích dữ liệu khách hàng trong ngân hàng, phát triểncác mô hình dự đoán khách hàng rời bỏ ngân hàng và đưa ra các khuyến nghị cải tiếnvà tối ưu hóa chiến lược giữ chân khách hàng của ngân hàng Nó có thể cung cấp giátrị cho các công ty tài chính và ngân hàng đang muốn tăng cường mối quan tâm đếnviệc giữ chân khách hàng và hiểu về hành vi của họ
Trang 6CHƯƠNG 2: QUY TRÌNH THỰC HIỆN VÀ KẾT QUẢ BÀI TOÁN 1 BÀI TOÁN PHÁT HIỆN ĐIỂM ĐẶC THÙ CỦA DỮ LIỆU 1 Mô tả bài toán 1:
Sử dụng các công cụ thống kê thông dụng, các hàm của Excel, Orange và các dạnglược đồ, biểu đồ để phát hiện, thể hiện các điểm đặc thù của dữ liệu và mối quan hệgiữa chúng
2 Mô tả nguồn dữ liệu và cấu trúc dữ liệu
Nguồn dữ liệu mà nhóm thu thập phục vụ cho nghiên cứu: • Bộ dữ liệu về thanh toán tài chính – Dự báo khả năng thanh toán khoản phải thu:https://www.kaggle.com/datasets/hhenry/finance-factoringibm-late-payment-historiesBộ dữ liệu được lấy từ Kaggle là nguồn thu thập đáng tin cậy được dùng trong nghiêncứu và học tập Nhóm sử dụng bộ dữ liệu thứ nhất để giải quyết bài toán 1 và 2 và bàitoán 3 Từ việc ứng dụng bộ dữ liệu vào giải quyết bài toán đặt ra, chúng ta có thểthấy được mối tương quan giữa các yếu tố của khách hàng trong ngân hàng và tỷ lệ rờibỏ ngân hàng của họ Sau đó dự báo và đưa ra kết luận cuối cùng cho bài Dự ánnghiên cứu của nhóm
Dữ liệu gồm: 10000 dòng (đối tượng) và 12 cột thuộc tính được thu thập bởi ngânhàng ACB Multistate như sau:
Thuộc tính Mô tả Kiểu dữ liệucustomer_ id Số tài khoản integercredit_ score Điểm tín dụng integer
Trang 7active_ member Có phải thành viên tích
3 Mô tả chi tiết dữ liệu
+ ID: Dữ liệu thu thập của từng người sẽ được đánh 1 con số nhất định và duy nhất
+ Điểm tín dụng: mỗi người khác nhau sẽ có mức thu nhập không giống nhau, nằm trong khoảng từ 350-850
+ Tuổi: Trong khoảng từ 18-92 tuổi.+ Số năm tham gia ngân hàng: Từ 0-10 năm kinh nghiệm.+ Số dư tài khoản: từ 0- 250898.09
+ Lương: Từ 11.58-199992.48+ Quốc gia: Gồm 3 nước Đức, Pháp, Tây Ban Nha+ Giới tính: gồm nam và nữ
+ Các cột credit_card, active_member và churn được đưa thành 2 nhóm 0 và 1
4 Tiền xử lý dữ liệu:
Đồ án sử dụng bộ dữ liệu được lấy từ nguồn kaggle.com đã được xác minh nên không có dữ liệu thiếu, và bộ dữ liệu này đầy đủ thông tin để tiến hành làm đồ án nên không cần phải thực hiện tiền xử lí dữ liệu
5 Những lược đồ và kết quả:
5.1 T5.2 Thống kê lượng khách hàng rời bỏ ngân hàng qua các yếu tố:
Trang 85.2.1 Điểm tín dụng
Điểm tín dụng của khách hàng rời bỏ ngân hàng
Từ hình ta thấy trong số những khách hàng có điểm tín dụng từ 350- 850 thì các kháchhàng đều có ý định từ bỏ ngân hàng nhưng với số điểm dưới 400 thì hầu như người tasẽ bỏ ngân hàng còn trong khoảng từ 580-680 thì lại có số lượng người từ bỏ ngânhàng nhiều nhất
5.2.2 Độ tích cực của khách hàng
Trang 9Độ tích cực của khách hàng rời bỏ ngân hàng
Từ hình ta thấy những khách hàng thường xuyên tích cực tham gia các hoạt động củangân hàng sẽ ít có xu hướng rời bỏ ngân hàng hơn
5.2.3 Độ tuổi
Độ tuổi của khách hàng rời bỏ ngân hàng
Qua hình ta có thể thấy đối tượng sự dụng ngân hàng là từ 18-92 tuy nhiên phần lớnnằm trong khoảng từ 30- 40 tuổi và từ độ tuổi này càng về sau người ta càng có xuhương rời bỏ ngân hàng
Trang 10BÀI TOÁN 2: DỰ ĐOÁN KHẢ NĂNG RỜI BỎ CỦA KHÁCH HÀNG ĐỐI VỚI VIỆC SỬ DỤNG TÍN DỤNG
1 Quy trình thực hiện bài toán 2
+ Chọn dữ liệu file ‘’ bank customer churn dataset ‘’ được lấy từ kaggle và chọn cột ‘’churn ‘’ làm target
+ Sử dụng công cụ ‘’ Data Sample ‘’ để chia dữ liệu thành 2 phần: 70% được dùnglàm mô hình và đặt tên file là ‘’ data ‘’, 30% còn lại được dùng làm dự đoán và đượcđặt tên là ‘’ forecast data ‘’
+ Mở file ‘’ data’’ rồi nối file với 3 phương pháp : Logistic Regression, NeauralNetwork và Test and core Sau đó đánh giá xem mô hình nào hiệu quả nhất
+ Nối file ‘’ forecast data ‘’ với phương pháp tốt nhất vừa đánh giá ở bước 3 để nhậnxét và đưa ra kết luận
+ Xuất kết quả dự báo bằng công cụ “ data table ‘’
Trang 112 Xây dựng mô hình
Hình 1 Mô hình phân lớp khả năng rủi ro của khách hàng đối với việc rời đi hay ở lại ở ngân hàng
Trang 123 Đánh giá
3.1.Đánh giá mô hình dựa trên kết quả của Confunsion Matrix:
Hình 1: Kết quả Tree
Trang 13Hình 3: Kết quả Logistic Regression
Trang 14Hình 4: Kết quả SMVSai lầm loại 2: Dự đoán là khách hàng tiếp tục ở lại sử dụng nghiệp vụ tín dụng nhưngthực tế là khách hàng rời bỏ ngân hàng Nếu sai lầm này càng nhiều thì sẽ gây nhiễuthông tin và ngân hàng có nguy cơ sụp đổ.
TREE= 726 < SMV=867< LR=1410 à Sai lầm loại 2 của phương pháp Tree=726 lànhỏ nhất trong 3 phương pháp
Trang 153.2 Kết quả dự báo.
Hình 5: Kết quả dự báo khả năng rời bỏ của khách hàng đối với việc sử dụng cácnghiệp vụ tín dụng của ngân hàng
Kết luận:- Theo bảng đánh giá kết quả ma trận nhầm lẫn của phương pháp Tree có sai lầmloại 2 bằng 761 là nhỏ nhất khi đánh giá bằng các phương pháp còn lại
- Việc khách hàng rời bỏ ngân hàng đối với các nghiệp vụ tín dụng là điều khôngthể tránh khỏi trên thị trường hiện nay, Với vô số sự ra đời của các ngân hàng vớimỗi chính sách, lãi suất khác nhau thu hút được nhiều nguồn khách hàng Sự rờibỏ của khách hàng gây nhiễu thông tin vì sự rời bỏ của khách hàng là không đượcthông báo Bên cạnh đó sự rời bỏ của khách hàng làm giảm nguồn thu của ngânhàng Tuy nhiên, thông qua kết quả dự báo, chúng ta có thể nắm bắt được thông tinrời bỏ hay tiếp tục sử dụng các nghiệp vụ tín dụng của khách hàng từ đó tìm rachính sách phù hợp nhằm giữ khách và và thu những khách hàng tiềm năng mớicho ngân hàng
Trang 16BÀI TOÁN 3: PHÂN CỤM/ NHÓM KHÁCH HÀNG CÓ VÀ KHÔNG TRUNG THÀNH VỚI NGÂN HÀNG
3.2 Xây dựng mô hình
Hình 7 Mô hình quá trình xử lý bài toán phân cụm
Trang 19Hình 9 Kết quả Silhouette Plot
Trang 20o Khách hàng thuộc nhóm C1 chiếm 82,68%o Khách hàng thuộc nhóm C2 chiếm 17.32%- Khách hàng thuộc nhóm C1 chủ yếu có số dư tài khoản ngân hàng nhỏ hơn
Trang 21Hình 11 Phân bố nhóm khách hàng không trung thành theo Product number- Đa số khách hàng không trung thành với ngân hàng ở nhóm C1 có product
numer chủ yếu là 2 và số ít có product number là 3- Khách hàng ở nhóm C2 có product number là 1Cụ thể:
o Ở product number 1: Có gần 2200 người ở nhóm C2o Ở product number 2: Có gần 2600 người ở nhóm C1o Ở product number 3: Phần ít người còn lại ở nhóm C1
Trang 22Hình 12 Phân bố nhóm khách hàng không trung thành theo thẻ tín dụng- Khách hàng không trung thành ở cả hai nhóm phần lớn là có thẻ tín dụng với hơn
1800 khách hàng thuộc nhóm C1 và hơn 1400 khách hàng thuộc nhóm C2- Khách hàng chưa có thẻ tín dụng:
o Đối với nhóm C1: gần 800 ngườio Đối với nhóm C2: hơn 600 người
Trang 23Hình 13 Phân bố nhóm khách hàng không trung thành theo active memberKhách hàng không trung thành không là active member:
- Đối với nhóm C1: Hơn 1200 người- Đối với nhóm C2: Hơn 900 ngườiKhách hàng không trung thành là active member:
- Đối với nhóm C1: Gần 1400 người- Đối với nhóm C2: Khoảng 1200 người
Trang 24Hình 14 Phân bố nhóm khách hàng không trung thành theo lương ước tínhCác nhóm khách hàng không trung thành nhìn chung có mức lương ước tính nhỏ hơn200000
Số khách hàng không trung thành ở nhóm C1 khá cao khi có mức lương nhỏ hơn200000 Cụ thể:
- Mức lương nhỏ hơn 25000: Khoảng 300 người- Mức lương từ 25000 đến 50000: Gần 340 người- Mức lương từ 50000 đến 75000: Hơn 320 người
Trang 25- Mức lương nhỏ hơn 25000: Khoảng 300 người- Mức lương từ 25000 đến 50000: Hơn 260 người- Mức lương từ 50000 đến 75000: Hơn 260 người- Mức lương từ 75000 đến 100000: Hơn 280 người- Mức lương từ 100000 đến 125000: Khoảng 300 người- Mức lương từ 125000 đến 150000: Khoảng 260 người- Mức lương từ 150000 đến 175000: Gần 240 người- Mức lương lớn hơn 175000: Hơn 240 ngườiTừ các kết quả của Distribution, ta có thể thấy:
Từ đây, để có cái nhìn tổng quát và toàn thể hơn, ta xem sự phân bổ của các thuộctính ở các nhóm qua bảng Feature Statistic
Trang 26Hình 15 Kết quả của Feature StatisticTừ kết quả của Feature Statistic nhóm nhận thấy một số điểm đặc thù trung bình củadữ liệu như sau:
- Khách hàng không trung thành thường có độ tuổi là 36- Khách hàng không trung thành thường sống ở France- Khách hàng không trung thành thường có thẻ tín dụng- Khách hàng không trung thành thường là active member- Khách hàng không trung thành có credit score trung bình là 649.78
Trang 27- Từ bài toán 2: phân lớp dữ liệu, nhóm thấy được, việc khách hàng không trungthành với ngân hàng là điều sẽ xảy ra do vấn đề nội bộ trong công ty hay những vấnđề làm khách hàng không hài lòng Từ đó đã tạo thành những vấn đề gây bất lợicho ngân hàng như: mất doanh số, giảm sức cạnh tranh, mất uy tín, chi phí tăngcao, giảm đội ngũ nhân viên,… Nhưng nhờ vào kết quả dự báo ta có thể dự đoánđược vấn đề từ trước và đưa ra hướng giải quyết hợp lý, cải thiện chất lượng ngânhàng.
- Từ bài toán 3: đánh giá kết quả phân cụm, theo phương pháp K-means nhóm chiadữ liệu thành 2 nhóm C1 và C2, sử dụng Feature Statistic để cho ra những đặc tínhtiêu biểu của dữ liệu, ngoài những đặc tính cơ bản như quốc gia, độ tuổi, mứclương ước tính, điểm tín dụng, Thì nhóm nhận thấy được đặc tính có xu hướngrời đi của khách hàng khá cao, từ đó ta cần tìm phương hướng giải quyết vấn đềnày
2 Đề xuất hướng giải quyết
- Ngân hàng có thể tăng cường đào tạo nhân viên để cung cấp dịch vụ tốt hơn chokhách hàng, cải thiện quy trình xử lý khiếu nại và giải quyết các vấn đề của kháchhàng nhanh chóng và hiệu quả
- Cải thiện trải nghiệm khách hàng: Ngân hàng có thể thực hiện các chương trìnhkhuyến mãi, giảm giá, tặng quà hay cung cấp các tiện ích mới nhằm tạo ra trảinghiệm tốt hơn cho khách hàng
- Tăng cường quảng bá thương hiệu: Ngân hàng có thể tăng cường quảng báthương hiệu của mình thông qua các phương tiện truyền thông, hội chợ triển lãmvà tài trợ các sự kiện để thu hút sự chú ý của khách hàng
- Cải thiện sản phẩm và dịch vụ: Ngân hàng có thể nghiên cứu và phát triển cácsản phẩm và dịch vụ mới để đáp ứng nhu cầu của khách hàng, cải thiện chất lượngsản phẩm và dịch vụ hiện có Ngân hàng cần cung cấp dịch vụ chất lượng cao,nhanh chóng và hiệu quả để đáp ứng nhu cầu của khách hàng
- Tăng cường quan hệ khách hàng: Ngân hàng có thể tăng cường quan hệ kháchhàng bằng cách giữ liên lạc thường xuyên với khách hàng, cung cấp thông tin mớinhất và hỗ trợ khách hàng khi cần thiết
- Giải quyết khiếu nại nhanh chóng và hiệu quả: Ngân hàng nên cải thiện quytrình xử lý khiếu nại và giải quyết các vấn đề của khách hàng nhanh chóng và hiệuquả
Trang 28- Tóm lại, để khắc phục tình trạng khách hàng không trung thành ở các ngân hàng,ngân hàng cần cải thiện dịch vụ khách hàng, trải nghiệm khách hàng, quảng báthương hiệu, sản phẩm và dịch vụ, tăng cường quan hệ khách hàng.