1. Trang chủ
  2. » Luận Văn - Báo Cáo

đồ án nhóm bộ môn khoa học dữ liệu

28 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Dự báo khả năng rời đi hay ở lại của khách hàng ở ngân hàng
Tác giả Sinh viên
Người hướng dẫn Giảng viên
Trường học ĐẠI HỌC UEH
Chuyên ngành Khoa học Dữ liệu
Thể loại Tiểu luận
Thành phố TP Hồ Chí Minh
Định dạng
Số trang 28
Dung lượng 2,83 MB

Nội dung

Nguồn thu nhập chính của ngân hàng xuất phát từ việc khách hàng sử dụng cácsản phẩm, dịch vụ của ngân hàng : gửi tiền tiết kiệm, thẻ tín dụng, bao thanh toán ...Nếu chúng ta có thể dự đo

Trang 1

ĐẠI HỌC UEH TRƯỜNG KINH DOANH KHOA KINH DOANH QUỐC TẾ - MARKETING

ĐỒ ÁN NHÓM BỘ MÔN KHOA HỌC DỮ LIỆU

NHÓM

Trang 3

ĐẠI HỌC UEH TRƯỜNG KINH DOANH KHOA KINH DOANH QUỐC TẾ - MARKETING

Trang 4

CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI I Lý do chọn đề tài

Khách hàng giữ một vai trò vô cùng quan trọng đối với ngân hàng Khách hàng quyếtđịnh doanh thu, uy tín và tiềm năng phát triển của ngân hàng

Doanh thu và lợi nhuận: của ngân hàng phụ thuộc vào số lượng và chất lượng kháchhàng Nguồn thu nhập chính của ngân hàng xuất phát từ việc khách hàng sử dụng cácsản phẩm, dịch vụ của ngân hàng : gửi tiền tiết kiệm, thẻ tín dụng, bao thanh toán Nếu chúng ta có thể dự đoán được khách hàng nào có nguy cơ rời đi, ngân hàng có thểkịp thời đưa ra các biện pháp làm hài lòng khách hàng để giữ chân khách hàng, từ đócó thể tăng thêm doanh thu và lợi nhuận

Khả năng phát triển của ngân hàng: khách hàng là một nơi hữu ích để ngân hàng cóthể phát triển, bởi vì ngân hàng có thể lắng nghe ý kiến, phản hồi, mong muốn củakhách hàng, từ đó rút ra bài học, chỉnh sửa chính sách sao cho phù hợp => giúp ngânhàng phát triển và tiến xa hơn vì được sự tín nhiệm của khách hàng Nếu không dựbáo khả năng rời đi hay ở lại của khách hàng, chúng ta sẽ không biết khách hàngkhông hài lòng ở điểm nào, có bất cập, bất tiện gì khi sử dụng dịch vụ ở ngân hàng.Vậy nên việc dự báo là vô cùng cần thiết, nó giúp cho ngân hàng hiểu rõ về kháchhàng hơn, từ đó điều chỉnh dịch vụ , chính sách để ngân hàng có thể phát triển, tiến xahơn nữa

Truyền thông: khi một ngân hàng được sự tín nhiệm, yêu quý của khách hàng dànhcho ngân hàng, khách hàng sẽ có xu hướng giới thiệu ngân hàng mà họ tín nhiệm chongười thân, gia đình và bạn bè => việc đáp ứng nhu cầu của khách hàng, tạo được uytín cho khách hàng sẽ giúp ngân hàng gia tăng uy tín, vị thế của mình trên thị trường.Cho nên đây cũng là một trong những lý do nên tiến hành dự báo khả năng rời đi hayở lại của khách hàng để có thể có những biện pháp phù hợp nhằm gia tăng uy tín củangân hàng Ngân hàng có thể tạo ra những dịch vụ và trải nghiệm thú vị, tích cực cho

Trang 5

II Mục tiêu nghiên cứu 1 Mục tiêu tổng quát

Giúp cho ngân hàng phân tích, xác định được một số đặc điểm đặc trưng cụ thể củamột khách hàng có ý định rời khỏi ngân hàng Từ đó, các ngâ hàng tại Việt Nam cóthể có một cái nhìn tổng quát hơn về khách hàng để kịp thời đưa ra các chính sách,giải pháp, những đề nghị mới để có thể hạn chế tối đa việc mất khách hàng

2 Mục tiêu cụ thể

Sử dụng phần mềm Orange để xử lý dữ liệu và giải quyết các bài toán sau:Bài toán 1: Phát hiện các điểm đặc thù của dữ liệu liên quan đến lựa chọn rời đi hay ởlại của khách hàng dựa vào lược đồ và các công cụ thống kê

Bài toán 2: Dự đoán khả năng rời đi hay ở lại của khách hàng tại ngân hàng (bài toánphân lớp dữ liệu)

Bài toán 3: Phân cụm/ nhóm khách hàng có khả năng cao sẽ rời khỏi ngân hàng (bàitoán phân cụm dữ liệu)

3 Đối tượng và phạm vi nghiên cứu.

3.1 Đối tượng nghiên cứu Nghiên cứu được dựa trên kết quả khảo sát khách hàng của ngân hàng ABCMultistate tại Pháp, Tây Ban Nha và Đức

3.2 Phạm vi nghiên cứu.Phạm vi nghiên cứu bao gồm phân tích dữ liệu khách hàng trong ngân hàng, phát triểncác mô hình dự đoán khách hàng rời bỏ ngân hàng và đưa ra các khuyến nghị cải tiếnvà tối ưu hóa chiến lược giữ chân khách hàng của ngân hàng Nó có thể cung cấp giátrị cho các công ty tài chính và ngân hàng đang muốn tăng cường mối quan tâm đếnviệc giữ chân khách hàng và hiểu về hành vi của họ

Trang 6

CHƯƠNG 2: QUY TRÌNH THỰC HIỆN VÀ KẾT QUẢ BÀI TOÁN 1 BÀI TOÁN PHÁT HIỆN ĐIỂM ĐẶC THÙ CỦA DỮ LIỆU 1 Mô tả bài toán 1:

Sử dụng các công cụ thống kê thông dụng, các hàm của Excel, Orange và các dạnglược đồ, biểu đồ để phát hiện, thể hiện các điểm đặc thù của dữ liệu và mối quan hệgiữa chúng

2 Mô tả nguồn dữ liệu và cấu trúc dữ liệu

Nguồn dữ liệu mà nhóm thu thập phục vụ cho nghiên cứu: • Bộ dữ liệu về thanh toán tài chính – Dự báo khả năng thanh toán khoản phải thu:https://www.kaggle.com/datasets/hhenry/finance-factoringibm-late-payment-historiesBộ dữ liệu được lấy từ Kaggle là nguồn thu thập đáng tin cậy được dùng trong nghiêncứu và học tập Nhóm sử dụng bộ dữ liệu thứ nhất để giải quyết bài toán 1 và 2 và bàitoán 3 Từ việc ứng dụng bộ dữ liệu vào giải quyết bài toán đặt ra, chúng ta có thểthấy được mối tương quan giữa các yếu tố của khách hàng trong ngân hàng và tỷ lệ rờibỏ ngân hàng của họ Sau đó dự báo và đưa ra kết luận cuối cùng cho bài Dự ánnghiên cứu của nhóm

Dữ liệu gồm: 10000 dòng (đối tượng) và 12 cột thuộc tính được thu thập bởi ngânhàng ACB Multistate như sau:

Thuộc tính Mô tả Kiểu dữ liệucustomer_ id Số tài khoản integercredit_ score Điểm tín dụng integer

Trang 7

active_ member Có phải thành viên tích

3 Mô tả chi tiết dữ liệu

+ ID: Dữ liệu thu thập của từng người sẽ được đánh 1 con số nhất định và duy nhất

+ Điểm tín dụng: mỗi người khác nhau sẽ có mức thu nhập không giống nhau, nằm trong khoảng từ 350-850

+ Tuổi: Trong khoảng từ 18-92 tuổi.+ Số năm tham gia ngân hàng: Từ 0-10 năm kinh nghiệm.+ Số dư tài khoản: từ 0- 250898.09

+ Lương: Từ 11.58-199992.48+ Quốc gia: Gồm 3 nước Đức, Pháp, Tây Ban Nha+ Giới tính: gồm nam và nữ

+ Các cột credit_card, active_member và churn được đưa thành 2 nhóm 0 và 1

4 Tiền xử lý dữ liệu:

Đồ án sử dụng bộ dữ liệu được lấy từ nguồn kaggle.com đã được xác minh nên không có dữ liệu thiếu, và bộ dữ liệu này đầy đủ thông tin để tiến hành làm đồ án nên không cần phải thực hiện tiền xử lí dữ liệu

5 Những lược đồ và kết quả:

5.1 T5.2 Thống kê lượng khách hàng rời bỏ ngân hàng qua các yếu tố:

Trang 8

5.2.1 Điểm tín dụng

Điểm tín dụng của khách hàng rời bỏ ngân hàng

Từ hình ta thấy trong số những khách hàng có điểm tín dụng từ 350- 850 thì các kháchhàng đều có ý định từ bỏ ngân hàng nhưng với số điểm dưới 400 thì hầu như người tasẽ bỏ ngân hàng còn trong khoảng từ 580-680 thì lại có số lượng người từ bỏ ngânhàng nhiều nhất

5.2.2 Độ tích cực của khách hàng

Trang 9

Độ tích cực của khách hàng rời bỏ ngân hàng

Từ hình ta thấy những khách hàng thường xuyên tích cực tham gia các hoạt động củangân hàng sẽ ít có xu hướng rời bỏ ngân hàng hơn

5.2.3 Độ tuổi

Độ tuổi của khách hàng rời bỏ ngân hàng

Qua hình ta có thể thấy đối tượng sự dụng ngân hàng là từ 18-92 tuy nhiên phần lớnnằm trong khoảng từ 30- 40 tuổi và từ độ tuổi này càng về sau người ta càng có xuhương rời bỏ ngân hàng

Trang 10

BÀI TOÁN 2: DỰ ĐOÁN KHẢ NĂNG RỜI BỎ CỦA KHÁCH HÀNG ĐỐI VỚI VIỆC SỬ DỤNG TÍN DỤNG

1 Quy trình thực hiện bài toán 2

+ Chọn dữ liệu file ‘’ bank customer churn dataset ‘’ được lấy từ kaggle và chọn cột ‘’churn ‘’ làm target

+ Sử dụng công cụ ‘’ Data Sample ‘’ để chia dữ liệu thành 2 phần: 70% được dùnglàm mô hình và đặt tên file là ‘’ data ‘’, 30% còn lại được dùng làm dự đoán và đượcđặt tên là ‘’ forecast data ‘’

+ Mở file ‘’ data’’ rồi nối file với 3 phương pháp : Logistic Regression, NeauralNetwork và Test and core Sau đó đánh giá xem mô hình nào hiệu quả nhất

+ Nối file ‘’ forecast data ‘’ với phương pháp tốt nhất vừa đánh giá ở bước 3 để nhậnxét và đưa ra kết luận

+ Xuất kết quả dự báo bằng công cụ “ data table ‘’

Trang 11

2 Xây dựng mô hình

Hình 1 Mô hình phân lớp khả năng rủi ro của khách hàng đối với việc rời đi hay ở lại ở ngân hàng

Trang 12

3 Đánh giá

3.1.Đánh giá mô hình dựa trên kết quả của Confunsion Matrix:

Hình 1: Kết quả Tree

Trang 13

Hình 3: Kết quả Logistic Regression

Trang 14

Hình 4: Kết quả SMVSai lầm loại 2: Dự đoán là khách hàng tiếp tục ở lại sử dụng nghiệp vụ tín dụng nhưngthực tế là khách hàng rời bỏ ngân hàng Nếu sai lầm này càng nhiều thì sẽ gây nhiễuthông tin và ngân hàng có nguy cơ sụp đổ.

TREE= 726 < SMV=867< LR=1410 à Sai lầm loại 2 của phương pháp Tree=726 lànhỏ nhất trong 3 phương pháp

Trang 15

3.2 Kết quả dự báo.

Hình 5: Kết quả dự báo khả năng rời bỏ của khách hàng đối với việc sử dụng cácnghiệp vụ tín dụng của ngân hàng

Kết luận:- Theo bảng đánh giá kết quả ma trận nhầm lẫn của phương pháp Tree có sai lầmloại 2 bằng 761 là nhỏ nhất khi đánh giá bằng các phương pháp còn lại

- Việc khách hàng rời bỏ ngân hàng đối với các nghiệp vụ tín dụng là điều khôngthể tránh khỏi trên thị trường hiện nay, Với vô số sự ra đời của các ngân hàng vớimỗi chính sách, lãi suất khác nhau thu hút được nhiều nguồn khách hàng Sự rờibỏ của khách hàng gây nhiễu thông tin vì sự rời bỏ của khách hàng là không đượcthông báo Bên cạnh đó sự rời bỏ của khách hàng làm giảm nguồn thu của ngânhàng Tuy nhiên, thông qua kết quả dự báo, chúng ta có thể nắm bắt được thông tinrời bỏ hay tiếp tục sử dụng các nghiệp vụ tín dụng của khách hàng từ đó tìm rachính sách phù hợp nhằm giữ khách và và thu những khách hàng tiềm năng mớicho ngân hàng

Trang 16

BÀI TOÁN 3: PHÂN CỤM/ NHÓM KHÁCH HÀNG CÓ VÀ KHÔNG TRUNG THÀNH VỚI NGÂN HÀNG

3.2 Xây dựng mô hình

Hình 7 Mô hình quá trình xử lý bài toán phân cụm

Trang 19

Hình 9 Kết quả Silhouette Plot

Trang 20

o Khách hàng thuộc nhóm C1 chiếm 82,68%o Khách hàng thuộc nhóm C2 chiếm 17.32%- Khách hàng thuộc nhóm C1 chủ yếu có số dư tài khoản ngân hàng nhỏ hơn

Trang 21

Hình 11 Phân bố nhóm khách hàng không trung thành theo Product number- Đa số khách hàng không trung thành với ngân hàng ở nhóm C1 có product

numer chủ yếu là 2 và số ít có product number là 3- Khách hàng ở nhóm C2 có product number là 1Cụ thể:

o Ở product number 1: Có gần 2200 người ở nhóm C2o Ở product number 2: Có gần 2600 người ở nhóm C1o Ở product number 3: Phần ít người còn lại ở nhóm C1

Trang 22

Hình 12 Phân bố nhóm khách hàng không trung thành theo thẻ tín dụng- Khách hàng không trung thành ở cả hai nhóm phần lớn là có thẻ tín dụng với hơn

1800 khách hàng thuộc nhóm C1 và hơn 1400 khách hàng thuộc nhóm C2- Khách hàng chưa có thẻ tín dụng:

o Đối với nhóm C1: gần 800 ngườio Đối với nhóm C2: hơn 600 người

Trang 23

Hình 13 Phân bố nhóm khách hàng không trung thành theo active memberKhách hàng không trung thành không là active member:

- Đối với nhóm C1: Hơn 1200 người- Đối với nhóm C2: Hơn 900 ngườiKhách hàng không trung thành là active member:

- Đối với nhóm C1: Gần 1400 người- Đối với nhóm C2: Khoảng 1200 người

Trang 24

Hình 14 Phân bố nhóm khách hàng không trung thành theo lương ước tínhCác nhóm khách hàng không trung thành nhìn chung có mức lương ước tính nhỏ hơn200000

Số khách hàng không trung thành ở nhóm C1 khá cao khi có mức lương nhỏ hơn200000 Cụ thể:

- Mức lương nhỏ hơn 25000: Khoảng 300 người- Mức lương từ 25000 đến 50000: Gần 340 người- Mức lương từ 50000 đến 75000: Hơn 320 người

Trang 25

- Mức lương nhỏ hơn 25000: Khoảng 300 người- Mức lương từ 25000 đến 50000: Hơn 260 người- Mức lương từ 50000 đến 75000: Hơn 260 người- Mức lương từ 75000 đến 100000: Hơn 280 người- Mức lương từ 100000 đến 125000: Khoảng 300 người- Mức lương từ 125000 đến 150000: Khoảng 260 người- Mức lương từ 150000 đến 175000: Gần 240 người- Mức lương lớn hơn 175000: Hơn 240 ngườiTừ các kết quả của Distribution, ta có thể thấy:

Từ đây, để có cái nhìn tổng quát và toàn thể hơn, ta xem sự phân bổ của các thuộctính ở các nhóm qua bảng Feature Statistic

Trang 26

Hình 15 Kết quả của Feature StatisticTừ kết quả của Feature Statistic nhóm nhận thấy một số điểm đặc thù trung bình củadữ liệu như sau:

- Khách hàng không trung thành thường có độ tuổi là 36- Khách hàng không trung thành thường sống ở France- Khách hàng không trung thành thường có thẻ tín dụng- Khách hàng không trung thành thường là active member- Khách hàng không trung thành có credit score trung bình là 649.78

Trang 27

- Từ bài toán 2: phân lớp dữ liệu, nhóm thấy được, việc khách hàng không trungthành với ngân hàng là điều sẽ xảy ra do vấn đề nội bộ trong công ty hay những vấnđề làm khách hàng không hài lòng Từ đó đã tạo thành những vấn đề gây bất lợicho ngân hàng như: mất doanh số, giảm sức cạnh tranh, mất uy tín, chi phí tăngcao, giảm đội ngũ nhân viên,… Nhưng nhờ vào kết quả dự báo ta có thể dự đoánđược vấn đề từ trước và đưa ra hướng giải quyết hợp lý, cải thiện chất lượng ngânhàng.

- Từ bài toán 3: đánh giá kết quả phân cụm, theo phương pháp K-means nhóm chiadữ liệu thành 2 nhóm C1 và C2, sử dụng Feature Statistic để cho ra những đặc tínhtiêu biểu của dữ liệu, ngoài những đặc tính cơ bản như quốc gia, độ tuổi, mứclương ước tính, điểm tín dụng, Thì nhóm nhận thấy được đặc tính có xu hướngrời đi của khách hàng khá cao, từ đó ta cần tìm phương hướng giải quyết vấn đềnày

2 Đề xuất hướng giải quyết

- Ngân hàng có thể tăng cường đào tạo nhân viên để cung cấp dịch vụ tốt hơn chokhách hàng, cải thiện quy trình xử lý khiếu nại và giải quyết các vấn đề của kháchhàng nhanh chóng và hiệu quả

- Cải thiện trải nghiệm khách hàng: Ngân hàng có thể thực hiện các chương trìnhkhuyến mãi, giảm giá, tặng quà hay cung cấp các tiện ích mới nhằm tạo ra trảinghiệm tốt hơn cho khách hàng

- Tăng cường quảng bá thương hiệu: Ngân hàng có thể tăng cường quảng báthương hiệu của mình thông qua các phương tiện truyền thông, hội chợ triển lãmvà tài trợ các sự kiện để thu hút sự chú ý của khách hàng

- Cải thiện sản phẩm và dịch vụ: Ngân hàng có thể nghiên cứu và phát triển cácsản phẩm và dịch vụ mới để đáp ứng nhu cầu của khách hàng, cải thiện chất lượngsản phẩm và dịch vụ hiện có Ngân hàng cần cung cấp dịch vụ chất lượng cao,nhanh chóng và hiệu quả để đáp ứng nhu cầu của khách hàng

- Tăng cường quan hệ khách hàng: Ngân hàng có thể tăng cường quan hệ kháchhàng bằng cách giữ liên lạc thường xuyên với khách hàng, cung cấp thông tin mớinhất và hỗ trợ khách hàng khi cần thiết

- Giải quyết khiếu nại nhanh chóng và hiệu quả: Ngân hàng nên cải thiện quytrình xử lý khiếu nại và giải quyết các vấn đề của khách hàng nhanh chóng và hiệuquả

Trang 28

- Tóm lại, để khắc phục tình trạng khách hàng không trung thành ở các ngân hàng,ngân hàng cần cải thiện dịch vụ khách hàng, trải nghiệm khách hàng, quảng báthương hiệu, sản phẩm và dịch vụ, tăng cường quan hệ khách hàng.

Ngày đăng: 25/09/2024, 16:32

HÌNH ẢNH LIÊN QUAN

Hình 1. Mô hình phân lớp khả năng rủi ro của khách hàng đối với việc rời đi hay - đồ án nhóm bộ môn khoa học dữ liệu
Hình 1. Mô hình phân lớp khả năng rủi ro của khách hàng đối với việc rời đi hay (Trang 11)
Hình 1: Kết quả Tree - đồ án nhóm bộ môn khoa học dữ liệu
Hình 1 Kết quả Tree (Trang 12)
Hình 3: Kết quả Logistic Regression - đồ án nhóm bộ môn khoa học dữ liệu
Hình 3 Kết quả Logistic Regression (Trang 13)
Hình 4: Kết quả SMV - đồ án nhóm bộ môn khoa học dữ liệu
Hình 4 Kết quả SMV (Trang 14)
Hình 5: Kết quả dự báo khả năng rời bỏ của khách hàng đối với việc sử dụng các nghiệp vụ tín dụng của ngân hàng. - đồ án nhóm bộ môn khoa học dữ liệu
Hình 5 Kết quả dự báo khả năng rời bỏ của khách hàng đối với việc sử dụng các nghiệp vụ tín dụng của ngân hàng (Trang 15)
Hình 9. Kết quả Silhouette Plot - đồ án nhóm bộ môn khoa học dữ liệu
Hình 9. Kết quả Silhouette Plot (Trang 19)
Hình 10. Phân bố nhóm khách hàng không trung thành theo Số dư tài khoản ngân hàng - đồ án nhóm bộ môn khoa học dữ liệu
Hình 10. Phân bố nhóm khách hàng không trung thành theo Số dư tài khoản ngân hàng (Trang 20)
Hình 11. Phân bố nhóm khách hàng không trung thành theo Product number - đồ án nhóm bộ môn khoa học dữ liệu
Hình 11. Phân bố nhóm khách hàng không trung thành theo Product number (Trang 21)
Hình 12. Phân bố nhóm khách hàng không trung thành theo thẻ tín dụng - đồ án nhóm bộ môn khoa học dữ liệu
Hình 12. Phân bố nhóm khách hàng không trung thành theo thẻ tín dụng (Trang 22)
Hình 13. Phân bố nhóm khách hàng không trung thành theo active member - đồ án nhóm bộ môn khoa học dữ liệu
Hình 13. Phân bố nhóm khách hàng không trung thành theo active member (Trang 23)
Hình 14. Phân bố nhóm khách hàng không trung thành theo lương ước tính - đồ án nhóm bộ môn khoa học dữ liệu
Hình 14. Phân bố nhóm khách hàng không trung thành theo lương ước tính (Trang 24)
Hình 15. Kết quả của Feature Statistic - đồ án nhóm bộ môn khoa học dữ liệu
Hình 15. Kết quả của Feature Statistic (Trang 26)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w