Nghiên cứu và ứng dụng các phương pháp khai thác dữ liệu nhằm dự báo rủi ro khách hàng rời bỏ dịch vụ tại ngân hàng

51 0 0
Nghiên cứu và ứng dụng các phương pháp khai thác dữ liệu nhằm dự báo rủi ro khách hàng rời bỏ dịch vụ tại ngân hàng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BÁO CÁO D ÁNỰĐ I H C UEHẠ ỌĐỀ TÀI: NGHIÊN CỨU VÀ ỨNG DỤNG CÁCPHƯƠNG PHÁP KHAI THÁC DỮ LIỆU NHẰM DỰ BÁO RỦI RO KHÁCH HÀNG RỜI BỎ DỊCH VỤ... Mô hình phân lớp dự đoán rủi ro rời bỏ hoặc khô

Trang 1

BÁO CÁO D ÁNỰ

Đ I H C UEHẠ Ọ

ĐỀ TÀI: NGHIÊN CỨU VÀ ỨNG DỤNG CÁC

PHƯƠNG PHÁP KHAI THÁC DỮ LIỆU NHẰM DỰ BÁO RỦI RO KHÁCH HÀNG RỜI BỎ DỊCH VỤ

Trang 2

CHƯƠNG 2: QUY TRÌNH TH C HI N VÀ KÊẾT QUỰỆ Ả -10

2.1 Các phương pháp d đoán và quy trình c thự ụ ể -10

Trang 3

DANH M C HÌNH NHỤẢ

Hình 1 Mô hình tiền xử lý dữ liệu

Hình 2 Minh họa phương pháp Logistic Regression Hình 3 Minh họa phương pháp SVM

Hình 4 Minh họa phương pháp cây quyết định Hình 5 Minh họa thuật toán K-means

Hình 6 Minh họa Thuật toán Hierarchical Clustering

Hình 7 Mô hình phân lớp dự đoán rủi ro rời bỏ hoặc không rời bỏ dịch vụ của khách hàng.

Hình 8 Kết quả SVM

Hình 9 Kết quả Logistic Regression Hình 10 Kết quả Decision Tree

Hình 11 Kết quả dự báo rủi ro rời bỏ hoặc không rời bỏ dịch vụ của khách hàng tại ngân hàng.

Hình 12 Kết quả dự báo từ Tree Viewer

Hình 13 Xầy d ng mồ hìnhự phần c mụ trước khi ch n phọ ương pháp tồếi u nhầếtư Hình 14 Kết quả K-means

Hình 15 Mô tả phương pháp Hierarchical Clustering

Hình 16 Mô tả phương pháp Hierarchical Clusteringkhi chia thành 3 nhóm khách hàng Hình 17 Mô tả kết quả Silhouette Plot của phương pháp Hierarchical Clustering

Hình 18 Mô hình phân cụm cuối cùng

Hình 19 Phân bố của 3 cụm khách hàng rời bỏ dịch vụ ngân hàng Hình 20 Phân bố nhóm khách hàng rời đi theo Quốc gia cư trú Hình 21 Phân bố nhóm khách hàng rời đi theo Giới tính Hình 22 Phân bố nhóm khách hàng rời đi theo Thẻ tín dụng

Hình 23 Phân bố nhóm khách hàng rời đi theo Khách hàng thân thiết Hình 24 Phân bố nhóm khách hàng rời đi theo Điểm tín dụng

Trang 4

Hình 27 Phân bố nhóm khách hàng rời đi theo Số dư tài khoản

Hình 28 Phân bố nhóm khách hàng rời đi theo Số lượng sản phẩm đã sử dụng Hình 29 Phân bố nhóm khách hàng rời đi theo Khả năng tài chính

Hình 30 Kết quả của Feature Statistic

Biểu đồ 5 Thời gian sử dụng dịch vụ tại ngân hàng Biểu đồ 6 Số dư tài khoản

Biểu đồ 7 Số sản phẩm dịch vụ đã trải nghiệm Biểu đồ 8 Thẻ tín dụng

Biểu đồ 9 Khách hàng thân thiết Biểu đồ 10 Khả năng tài chính

Biểu đồ 11 Tỷ lệ không rời bỏ va rời bỏ dịch vụ tại ngân hàng

Biểu đồ 12 Biểu đồ phân bố 3 cụm khách hàng rời bỏ dịch vụ ngân hàng

DANH MỤC BẢNG

Bảng 1 Mô tả các thuộc tính của bộ dữ liệu Bảng 2 Chuyển đổi biến tiếng anh sang tiếng việt Bảng 3 Kết quả K-means phân cụm

Bảng 4 Kết quả Hierachical Clustering

Bảng 5 So sánh kết quả của hai phương pháp phân cụm K-means và Hierarchical Clustering

Bảng 6 Bảng tổng hợp kết quả phân bố khách hàng rời đi theo từng thuộc tính

Trang 5

L I C M NỜ Ả Ơ

L i đầầu tên nhóm 05 chúng em xin chần thành c m n thầầy Nguyêễn M nh Tuầấnờảơạvì đã t n tnh gi ng d y và truyêần đ t nh ng kiêấn th c m i cho chúng em trong th iậảạạữứớờgian v a qua v i b môn Khoa h c d li u, nh vào đó đã đóng góp m t phầần l n giúpừớộọữ ệờộớchúng em hoàn thành bài báo cáo cuôấi kì này.

Tuy nhiên do ch a có nhiêầu kinh nghi m cũng nh ch a có đầầy đ chuyên mônưệưưủnên chúng em vầễn còn rầất nhiêầu sai sót, nhóm chúng em hi v ng seễ đọược thầầy nh n xétậvà đóng góp thêm nhiêầu ý kiêấn đ có th hoàn thi n h n trong bài báo cáo này ểểệơ

M t lầần n a xin trần tr ng c m n thầầy và chúng em chúc thầầy s c kho , h nhộữọảơứẻạphúc và seễ g t hái đặược nhiêầu thành công h n n a trên con đơữường gi ng d y phíaảạtrước

Trang 6

CÁC BÀI TOÁN LIÊN QUAN ĐÊẾN CHUYÊN NGÀNH

Qu n tr r i ro là quá trình xác đ nh r i ro, phần tch chúng và đ a ra quyễết đ nhả ị ủ ị ủ ư ị d a trễn vi c chầếp nh n ho c gi m thi u chúng Đ c bi t trong lĩnh v c ngần hàng, hự ệ ậ ặ ả ể ặ ệ ự ệ thồếng ngần hàng đóng vai trò vồ cùng quan tr ng trong bầết kỳ nễồn kinh tễế quồếc gia vàọ toàn cầồu nễn h u qu c a qu n tr r i ro kém seễ rầết l n Dầễn ch ng rõ ràng nhầết đầyậ ả ủ ả ị ủ ớ ứ ở là trong Cu c kh ng ho ng tài chính 2007-2008, khi các chính ph ph i h p tác v iộ ủ ả ủ ả ợ ớ nhau đ gi i c u ngần hàng Nễếu b n làm vi c trong b ph n qu n tr r i ro, b n seễể ả ứ ạ ệ ộ ậ ả ị ủ ạ ch u trách nhi m xác đ nh, đánh giá, đo lị ệ ị ường, gi m thi u và báo cáo r i ro B n ph iả ể ủ ạ ả h p tác ch t cheễ v i các đồồng nghi p các b ph n khác c a ngần hàng đ xác đ nh,ợ ặ ớ ệ ở ộ ậ ủ ể ị đánh giá và phòng ng a r i ro băồng các cồng c phái sinh Chính vì lý do đó nhóm đãừ ủ ụ ch n đễồ tài “ Nghiễn c u và ng d ng các phọ ứ ứ ụ ương pháp khai thác d li u nhăồm d báoữ ệ ự r i ro khách hàng r i b d ch v t i ngần hàng” Nghiễn c u này có th đ a ra các h nủ ờ ỏ ị ụ ạ ứ ể ư ạ chễế cũng nh hư ướng đi tồết nhầết cho các nhà qu n tr r i ro ngần hàng Và nhóm đã sả ị ủ ử d ng cồng c Orange và Excel đ gi i quyễết 3 bài toán sau:ụ ụ ể ả

● Bài toán 1 (Liễn quan gầồn): Phát hi n các đ c đi m đ c thù liễn quan đễến sệ ặ ể ặ ự r i b ho c khồng r i b d ch v t i ngần hàng c a khách hàng d a vào cácờ ỏ ặ ờ ỏ ị ụ ạ ủ ự lược đồồ và cồng c thồếng kễ Đ gi i quyễết đụ ể ả ược bài toán này nhóm đã dùng Excel đ veễ các lể ược đồồ, t đó phần tch t ng đ c tnh liễn quan đễến biễến phừ ừ ặ ụ thu c và đ a ra nh ng đễồ xuầết, hộ ư ữ ướng gi i quyễết cho các nhà qu n tr r i ro.ả ả ị ủ Khi h c chuyễn ngành Qu n tr r i ro tài chính, vi c chúng ta có cái nhìn t ngọ ả ị ủ ệ ổ quát, s lơ ược và phần tch các đ c đi m liễn quan là rầết cầồn thiễết, đ t đóặ ể ể ừ chúng ta seễ có cho mình m t s am hi u h n vễồ cồng vi c c a m t nhà qu nộ ự ể ơ ệ ủ ộ ả tr r i ro cũng nh là cách gi m thi u nguy c ph i đồếi m t v i r i ro.ị ủ ư ả ể ơ ả ặ ớ ủ

● Bài toán 2 (Liễn quan gầồn): D đoán r i ro khách hàng seễ r i b d ch v t iự ủ ờ ỏ ị ụ ạ

Trang 7

chúng ta biễết khách hàng seễ r i b hay l i d a trễn các yễếu tồế nh hờ ỏ ở ạ ự ả ưởng (biễến đ c l p) Đ gi i quyễết độ ậ ể ả ược bài toán này chúng em đã ph i s d ng 3ả ử ụ phương pháp hồồi quy Logistc, SVM, cầy quyễết đ nh tễến hành phần lo i “r iị ạ ờ ho c khồng r i”, và sau các bặ ờ ước phần tch thì nhóm đã ch n phọ ương pháp hồồi quy Logistc là phương pháp tồết nhầết đ d báo và phần tch các yễếu tồế nhể ự ả hưởng đễến s l i ho c r i b c a khách hàng Qua bài toán này, vi c biễếtự ở ạ ặ ờ ỏ ủ ệ cách s d ng các phử ụ ương pháp hồồi quy đ xác đ nh các yễếu tồế nh hể ị ả ưởng đễến r i ro r i b c a khách hàng là vồ cùng quan tr ng đồếi v i chuyễn ngành Qu nủ ờ ỏ ủ ọ ớ ả tr r i ro tài chính, sinh viễn chúng em seễ đị ủ ược h c các kĩ năng s d ng phầồnọ ử ụ mễồm, kĩ năng đ c, phần tch sồế li u và xầy d ng mồ hình hồồi quy đ hồễ trọ ệ ự ể ợ trong vi c nghiễn c u các d án sau này và ph c v cho cồng vi c có liễn quan.ệ ứ ự ụ ụ ệ ● Bài toán 3 (Liễn quan gầồn): Phần lo i nhóm khách hàng l a ch n r i b d ch vạ ự ọ ờ ỏ ị ụ

t i ngần hàng bài toán này, nhóm seễ phần c m theoạ Ở ụ phương pháp tồếi uư nhầết Băồng vi c s d ng Orange giúp nhà qu n tr r i ro biễết đệ ử ụ ả ị ủ ược nhóm khách hàng có r i ro r i b d ch v , t đó cho ra nh ng chính sách phù h p v i kháchủ ờ ỏ ị ụ ừ ữ ợ ớ hàng h n Vi c thầếu hi u mong muồến c a khách hàng là rầết cầồn thiễết đ nhàơ ệ ể ủ ể qu n lý r i ro có th đ a ra các gi i pháp, kễế ho ch tồết nhầết cho nh ng biễếnả ủ ể ư ả ạ ữ đ ng trong tộ ương lai.

Có th thầếy răồng 3 bài toán trễn đễồu có liễn quan gầồn đễến vi c qu n tr r i ro tàiể ệ ả ị ủ chính và giúp nh ng nhà qu n lý có th phần tch, gi m thi u đữ ả ể ả ể ược các r i ro r i bủ ờ ỏ c a khách hàng, t o đ tn c y c a khách hàng đồếi v i d ch v t i ngần hàng Đầy làủ ạ ộ ậ ủ ớ ị ụ ạ m t trong nh ng yễếu tồế quan tr ng đ t o nễn thộ ữ ọ ể ạ ương hi u cũng nh quyễết đ nhệ ư ị được s thành cồng hay thầết b i c a m t ngần hàng b i có tác đ ng tr c tễếp đễến sự ạ ủ ộ ở ộ ự ự găến bó và tn tưởng c a khách hàng.ủ

Trang 8

CHƯƠNG 1: T NG QUANỔ

1.1.Lý do ch n đêề tàiọ

Th i gian qua, chúng ta ch ng kiễến s p đ c a hàng lo t các ngần hàng l n trễnờ ứ ụ ổ ủ ạ ớ toàn thễế gi i nh Silvergate Bank, Silicon Valley Bank, Credit Suisse, First Republicớ ư Bank, M t trong nh ng lý do gầy nễn chuồễi s ki n trầồm tr ng này là do các kháchộ ữ ự ệ ọ hàng đồồng lo t r i b d ch v t i ngần hàng gầy nễn kh ng ho ng thanh kho n Đ h nạ ờ ỏ ị ụ ạ ủ ả ả ể ạ chễế được nồễi lo này, ngần hàng có th s d ng các thu t toán đ d báo r i ro kháchể ử ụ ậ ể ự ủ hàng rồồi b d ch v c a mình.ỏ ị ụ ủ

Tình tr ng khách hàng r i b d ch v đang tr thành m t vầến đễồ l n đồếi v iạ ờ ỏ ị ụ ở ộ ớ ớ ngành ngần hàng S c nh tranh ngày càng tăng và khách hàng có nhiễồu l a ch n h n,ự ạ ự ọ ơ do đó ngần hàng cầồn ph i có nh ng gi i pháp hi u qu đ gi chần khách hàng, tăngả ữ ả ệ ả ể ữ doanh sồế và c i thi n chầết lả ệ ượng d ch v ị ụ

Các phương pháp khai thác d li u là m t lĩnh v c phát tri n nhanh trong khoaữ ệ ộ ự ể h c máy tnh và cồng ngh thồng tn Vi c áp d ng các phọ ệ ệ ụ ương pháp này đ d báo r iể ự ủ ro khách hàng r i b d ch v seễ giúp chúng ta có th tm ra các mầễu d li u n và đ aờ ỏ ị ụ ể ữ ệ ẩ ư ra nh ng quyễết đ nh d a trễn d li u.ữ ị ự ữ ệ

Khách hàng là m t phầồn quan tr ng c a ngần hàng, và vi c gi chần khách hàngộ ọ ủ ệ ữ đang s d ng d ch v c a ngần hàng là m t u tễn hàng đầồu Vi c nghiễn c u và dử ụ ị ụ ủ ộ ư ệ ứ ự báo r i ro khách hàng r i b d ch v seễ giúp ngần hàng hi u h n vễồ nhu cầồu và s thíchủ ờ ỏ ị ụ ể ơ ở c a khách hàng, t đó c i thi n d ch v và đ a ra nh ng chính sách hầếp dầễn đ gi cácủ ừ ả ệ ị ụ ư ữ ể ữ khách hàng s d ng d ch v c a mình.ử ụ ị ụ ủ

Vi c d báo vễồ kh năng r i b c a các hàng cũng giúp tăng cệ ự ả ờ ỏ ủ ường s c m nhứ ạ c nh tranh c a ngần hàng Th trạ ủ ị ường ngần hàng đang ngày càng c nh tranh, vì v y,ạ ậ vi c gi chần khách hàng là rầết quan tr ng đ ngần hàng có th tăng cệ ữ ọ ể ể ường s c c nhứ ạ tranh và tăng doanh thu D báo r i ro khách hàng r i b d ch v giúp ngần hàng hi uự ủ ờ ỏ ị ụ ể

Trang 9

rõ h n vễồ th trơ ị ường và khách hàng, đ a ra các chính sách hầếp dầễn và gi m thi u r iư ả ể ủ ro.

khía c nh phát tri n cồng ngh đồếi v i ngần hàng, cồng ngh ngần hàng đang

phát tri n nhanh chóng, đem l i nh ng l i ích và t n ích cho khách hàng Tuy nhiễn,ể ạ ữ ợ ệ nó cũng có th gầy ra r i ro cho ngần hàng nễếu khồng để ủ ược áp d ng và qu n lý đúngụ ả cách D báo r i ro khách hàng r i b d ch v giúp ngần hàng đ a ra các gi i pháp đự ủ ờ ỏ ị ụ ư ả ể gi m thi u r i ro và đ m b o an toàn thồng tn cho khách hàng.ả ể ủ ả ả

Vi c nghiễn c u đễồ tài này khồng ch giúp ngần hàng tăng cệ ứ ỉ ường s c c nh tranhứ ạ mà còn đóng góp cho s phát tri n c a khoa h c và cồng ngh ự ể ủ ọ ệ

V i các lý do k trễn, đễồ tài Nghiễn c u và ng d ng các phớ ể ứ ứ ụ ương pháp khai thác d li u nhăồm d báo r i ro khách hàng r i b d ch v t i ngần hàng là m t đễồ tài h aữ ệ ự ủ ờ ỏ ị ụ ạ ộ ứ h n mang l i nhiễồu giá tr cho ngành ngần hàng, gi m thi u các r i ro gầy ra b i s r iẹ ạ ị ả ể ủ ở ự ờ bao gồồm thồng tn cá nhần, l ch s giao d ch, hành vi s d ng d ch v , v.v Sau đó sị ử ị ử ụ ị ụ ử d ng các phụ ương pháp khai thác d li u đ tm ra các mầễu và xu hữ ệ ể ướng trong d li u,ữ ệ t đó đ a ra d báo vễồ kh năng khách hàng r i b d ch v trong từ ư ự ả ờ ỏ ị ụ ương lai.T các dừ ự báo thu được, đễồ xuầết các gi i pháp h p lý nhăồm gi m thi u t l khách hàng r i bả ợ ả ể ỷ ệ ờ ỏ d ch v , bao gồồm c i thi n chầết lị ụ ả ệ ượng d ch v , tăng cị ụ ường tương tác và hồễ tr kháchợ hàng, tồếi u hóa chính sách và chư ương trình khuyễến mãi, v.v Đánh giá hi u qu c a cácệ ả ủ

Trang 10

gi i pháp đễồ xuầết thồng qua vi c so sánh t l khách hàng r i b d ch v trả ệ ỷ ệ ờ ỏ ị ụ ước và sau khi tri n khai các gi i pháp đó.ể ả

T ng th , m c tễu c a đễồ tài là áp d ng các phổ ể ụ ủ ụ ương pháp khai thác d li u đữ ệ ể phần tch và d báo r i ro khách hàng r i b d ch v t i ngần hàng, t đó đ a ra cácự ủ ờ ỏ ị ụ ạ ừ ư gi i pháp nhăồm c i thi n h thồếng d ch v và gi chần khách hàng.ả ả ệ ệ ị ụ ữ

1.2.2 Các m c têu c thụụể

S d ng phầồn mễồm orange đ x lý d li u và gi i quyễết các bài toán sau:ử ụ ể ử ữ ệ ả

Bài toán 1 (Liễn quan gầồn): Phát hi n các đ c đi m đ c thù liễn quan đễến s r iệ ặ ể ặ ự ờ b ho c khồng r i b d ch v t i ngần hàng c a khách hàng d a vào các lỏ ặ ờ ỏ ị ụ ạ ủ ự ược đồồ và cồng c thồếng kễ.ụ

Bài toán 2 (Liễn quan gầồn): D đoán r i ro khách hàng seễ r i b d ch v t i ngầnự ủ ờ ỏ ị ụ ạ hàng hay khồng (bài toán phần l p d li u).ớ ữ ệ

Bài toán 3 (Liễn quan gầồn): Phần lo i nhóm khách hàng l a ch n r i b d ch v t iạ ự ọ ờ ỏ ị ụ ạ ngần hàng.

1.3 Đốối tượng nghiên c uứ

Đồồ án này seễ t p trung nghiễn c u hành vi và thồng tn c a khách hàng s d ng ậ ứ ủ ử ụ d ch v ngần hàng đa quồếc gia ABC đị ụ ược lầếy thồng tn, d li u cũng nh sồế li u t i ữ ệ ư ệ ạ Kaggle.

1.4 Mố t d li u và cấốu trúc d li uả ữ ệữ ệ

1.4.1 Mô t d li uả ữ ệ

Nguồồn d li u đữ ệ ược lầếy t Kaggle Đầy là b d li u khách hàng c a các ch tài ừ ộ ữ ệ ủ ủ kho n t i Ngần hàng Đa quồếc gia ABC và m c đích c a d li u này seễ là d đoán t l ả ạ ụ ủ ữ ệ ự ỷ ệ khách hàng r i b d ch v ngần hàng ờ ỏ ị ụ

Trang 12

Trong t p d li u này tác gi đã x lý các d li u b thiễếu, d li u b nhiễễu và dậ ữ ệ ả ử ữ ệ ị ữ ệ ị ữ li u khồng nhầết quán vì thễế nhóm seễ b qua cồng đo n x lý lồễi d li uệ ỏ ạ ử ữ ệ

Đ thồng tn để ược dễễ hi u h n, nhóm đã s d ng cồng c Edit Domain đ chuy nể ơ ử ụ ụ ể ể đ i tễn c a các thu c tnh t tễếng anh sang tễếng vi t ổ ủ ộ ừ ệ

Biến tiếng anhBiến tiếng việt

Trang 13

T fle d li u gồếc đừ ữ ệ ượ ả ừ ữ ệc t i t d li u gồếc (sau khi chuy n đ i tễn biễến sang tễếng ể ổ vi t), nhóm đã s d ng ch c năng Data Sample đ tách d li u thành 2 fle riễng bi t ệ ử ụ ứ ể ữ ệ ệ nh sau: ư

- 70% d li u dùng đ huầến luy n mồ hình phần l p L u d li u dữ ệ ể ệ ớ ư ữ ệ ướ ại d ng fle Excel đ t tễn là Churn_Trainingặ

- 30% d li u còn l i dùng đ làm d li u báo cáo cho mồ hình L u d li u dữ ệ ạ ể ữ ệ ư ữ ệ ưới d ng fle Excel đ t tễn là Churn_Forecast.ạ ặ

Hình 1 Mô hình tiêền x lý d li uửữ ệ

Trang 15

CHƯƠNG 2: QUY TRÌNH TH C HI N VÀ KÊẾT QUỰỆẢ

2.1 Các phương pháp d đoán và quy trình c th ựụ ể

2.1.1 Phân l p d li uớữ ệ

Phần l p d li u là quá trình phần d li u vào m t hay nhiễồu l p đ dễễ dàng truyớ ữ ệ ữ ệ ộ ớ ể xuầết, săếp xễếp và l u tr trong tư ữ ương lai.

Phương pháp hốềi quy Logistc (Logistc Regression)

Phần tch hồồi quy tuyễến tnh được s d ng đ d đoán giá tr c a m t biễến d aử ụ ể ự ị ủ ộ ự trễn giá tr c a m t biễến khác Biễến b n muồến d đoán đị ủ ộ ạ ự ược g i là biễến ph thu c.ọ ụ ộ Biễến b n đang s d ng đ d đoán giá tr c a biễến khác đạ ử ụ ể ự ị ủ ược g i là biễến đ c l p.ọ ộ ậ

Hình 2 Minh h a phọương pháp Logistc Regression

Phương pháp SVM (Support Vector Machine)

Là m t kyễ thu t h c máy phần tách khồng gian thu c tnh băồng m t siễu ph ng,ộ ậ ọ ộ ộ ẳ do đó tồếi đa hóa lễồ gi a các phiễn b n c a các l p ho c giá tr l p khác nhau.ữ ả ủ ớ ặ ị ớ

Trang 16

Hình 3 Minh h a phọương pháp SVM

Phương pháp cấy quyêốt đ nh (Tree) ị

Là phương pháp mồ t , phần lo i và t ng quan hoá t p d li u cho trả ạ ổ ậ ữ ệ ước

Hình 4 Minh h a phọương pháp cây quyêết đ nhị

Các bước quy trình c a 3 phủương pháp phấn l p:ớ

Trang 17

Bước 1: Ch n nguồồn d li u ( biễến khồng tham gia vào quá trình và biễến phọ ữ ệ ụ thu c)ộ

Bước 2: D đoán băồng 3 phự ương pháp hồồi quy Logistc regression, Tree và SVM Bước 3: So sánh c 3 cái và l a ch n d đoán nào tồết nhầếtả ự ọ ự

Bước 4: Nồếi Test and Score v i Confusion đ xem kễết qu Ma tr n nhầồm lầễnớ ể ả ậ

Các bước xấy d ng mố hình d báo tốốt nhấốt:ựự

Bước 1: Sau khi ch n đọ ược phương pháp d báo tồết nhầết, nồếi d li u vàoự ữ ệ phương pháp tồết nhầết: SVM, Tree ho c LR Đồồng th i nh p d li u dùng đ d báo vàoặ ờ ậ ữ ệ ể ự orange.

Bước 2: Liễn kễết phương pháp đã ch n và d li u d báo v i cồng c Predictonsọ ữ ệ ự ớ ụ đ đánh giá và phần lo i d li u đầồu vào.ể ạ ữ ệ

Bước 3: Xuầết kễết qu d báo vào Data Table ả ự

2.1.2 Phân c m d li u ụữ ệ

Là 1 kyễ thu t mà nhóm l i c m/nhóm các đồếi tậ ạ ụ ượng/d li u có đ c đi m giồếngữ ệ ặ ể nhau vào các c m/nhóm tụ ương ng.ứ

Đ c đi m:ặ ể

- Tìm ra và phần tch, đo lường s khác bi t gi a các đồếi tự ệ ữ ượng d li u ữ ệ

- Phần c m thu c nhóm h c khồng giám sát vì khồng biễết rõ sồế lụ ộ ọ ượng c a nhóm ủ - Phương pháp tồết là phương pháp t o ra các c m có chầết lạ ụ ượng cao:

● Đ tộ ương đồồng bễn trong c m caoụ

● Đ tộ ương t gi a các c m thầếp (khác bi t cao)ự ữ ụ ệ

Thu t toán K-meansậ

K-means là m t thu t toán phần c m d li u d a trễn phần ho ch, năồm trongộ ậ ụ ữ ệ ự ạ danh sách các phương pháp phần c m đụ ược s d ng ph biễến trong lĩnh v c khai pháử ụ ổ ự d li u.ữ ệ

Trang 18

Hình 5 Minh h a thu t toán K-meansọậ

Các bước quy trình c a K- means: ủ

Bước 1: T o k đi m ngầễu nhiễn làm trung tầm ban đầồu c a k c m ạ ể ủ ụ

Bước 2: Phần mồễi đi m d li u vào c m có trung tầm gầồn nó nhầết Nễếu các đi mể ữ ệ ụ ể d li u t ng c m v a đữ ệ ở ừ ụ ừ ược phần chia khồng thay đ i so v i kễết qu c a lầồn phầnổ ớ ả ủ chia trước nó thì ta d ng thu t toán.ừ ậ

Bước 3: C p nh t l i trung tầm cho t ng c m băồng cách lầếy trung bình c ng c aậ ậ ạ ừ ụ ộ ủ tầết các các đi m d li u đã để ữ ệ ược gán vào c m đó sau khi phần chia bụ ở ước 2.

Bước 4: Quay l i bạ ước 2

Thu t toán ậHierarchical Clustering

Trong Hierarchical Clustering, b n khồng cầồn ph i xác đ nh trạ ả ị ước sồế lượng c m.ụ Thay vào đó, thu t toán tm cách xã đ nh s khác bi t gi a các c m băồng cách so sánhậ ị ự ệ ữ ụ t ng c p quan sát trong hai c m và đo lừ ặ ụ ường m c đ khác bi t gi a chúng.ứ ộ ệ ữ

Trang 19

Hình 6 Minh h a Thu t toán ọậHierarchical Clustering

Trang 20

Bi u đôề ể1 Đi m tn d ngểụ

Có s tự ương đồồng các m c đi m tn d ng đó chính là lở ứ ể ụ ượng khồng r i b cồngờ ỏ ty thường l n sồế lớ ượng r i b Các nhần viễn có đi m tn d ng đ t m c 570-679 là r iờ ỏ ể ụ ạ ứ ờ đi nhiễồu nhầết b i v i m c tn d ng này, h có th g p khó khăn trong vi c gi i h n tnở ớ ứ ụ ọ ể ặ ệ ớ ạ d ng Điễồu này có th làm h n chễế kh năng s d ng các d ch v ngần hàng và t o raụ ể ạ ả ử ụ ị ụ ạ s bầết t n trong vi c nh n đự ệ ệ ậ ược vvay tễồn hhay các d ch v tài chính khác Ngoài ra v iị ụ ớ m c đi m nh v y thì ngần hàng có th áp d ng các phí và lãi suầết cao H c m thầếyứ ể ư ậ ể ụ ọ ả d ch v h nh n đị ụ ọ ậ ược khồng cung cầếp l i ích h p lý ợ ợ

 Quốốc gia:

Bi u đôề ể2 Quôếc gia

Tương t nh m c đi m tn d ng, thì đầết nự ư ở ụ ể ụ ở ước Pháp, Đ c và Tầy Ban Nhaứ

Trang 21

tễế phát tri n cho nễn có nhiễồu cồng ty l n Cũng t đó, cho nễn d ch v ngần hàngể ớ ừ ị ụ phát tri n và đ t để ạ ược đ tn c y cho các khách hàng ộ ậ

 Gi i tnh:ớ

Bi u đôề ể3 Gi i tnhớ

Qua bi u đồồ nhóm nh n thầếy răồng N t l r i b cao h n Nam Chăếc có leễ vìể ậ ở ữ ỷ ệ ờ ỏ ơ N gi i thữ ớ ường có xu hướng tn tưởng và hài lòng thầếp h n đồếi v i d ch v ngần hàngơ ớ ị ụ so v i nam gi i Điễồu này có th do các tr i nghi m xầếu trong quá kh , s thiễếu tnớ ớ ể ả ệ ứ ự tưởng vào s qu n lý tài chính c a ngần hầồng, ho c c m giác khồng nh n đự ả ủ ặ ả ậ ược s đồếiự x cồng băồng trong giao d ch tài chính Khi g p ph i nh ng tnh huồếng này, ph n cóử ị ặ ả ữ ụ ữ th seễ quyễết đ nh chuy n sang m t d ch v ngần hàng khác ho c s d ng các phể ị ể ộ ị ụ ặ ử ụ ương th c tài chính khác.ứ

 Đ tu i:ộ ổ

Trang 22

Bi u đôề ể4 Đ tu iộổ

Khách hàng đ tu i t 21 đễến 40 có l a ch n khồng r i b là nhiễồu nhầết b i ở ộ ổ ừ ự ọ ờ ỏ ở ở đ tu i này, ngộ ổ ười ta thường đang tễến vào giai đo n cu c sồếng đ c l p, có s ph ạ ộ ộ ậ ự ụ thu c ít h n vào gia đình H có th đồếi m t v i nhu cầồu tài chính ph c t p h n, bao ộ ơ ọ ể ặ ớ ứ ạ ơ gồồm vi c qu n lý chi tễu, thanh toán hóa đ n, tễết ki m, đầồu t , mua săếm, Và d ch v ệ ả ơ ệ ư ị ụ ngần hàng có th đáp ng đ m i nhu cầồu đó ể ứ ủ ọ

đ tu i 41-60 có t l r i b nhiễồu nhầết vì th ng nh ng ng i trong đ tu i

này trung bình đã hoàn thành các m c tễu tài chính chính nh tr n nhà, g i tễết ụ ư ả ợ ử ki m cho tu i h u trí ho c đầồu t cho con cái H có th khồng cầồn s d ng các d ch vệ ổ ư ặ ư ọ ể ử ụ ị ụ ngần hàng ph c t p và chuy n sang vi c qu n lý tài chính m t cách đ n gi n h n Thễế ứ ạ ể ệ ả ộ ơ ả ơ gi i seễ càng ngày càng phát tri n đ c bi t vễồ m t cồng ngh , cho nễn v i đ tu i này ớ ể ặ ệ ặ ệ ớ ộ ổ m t phầồn nào đó đã có s khó khăn khi ph i làm quen v i cái m i H a thích truyễồn ộ ự ả ớ ớ ọ ư thồếng h n nễn l a ch n r i b Ngoài ra, đ tu i này h đã thay đ i suy nghĩ H biễếtơ ự ọ ờ ỏ ở ộ ổ ọ ổ ọ cái gì là u tễn trong lúc này Thay vì s d ng d ch v ngần hàng h có th đầồu t vào ư ử ụ ị ụ ọ ể ư bầết đ ng s n, mua vàng tr , ộ ả ữ

Trang 23

Bi u đôề ể5 Th i gian s d ng d ch v t i ngân hàngờử ụịụ ạ

Nh ng khách hàng có th i gian s d ng d ch v t i ngần hàng dữ ờ ử ụ ị ụ ạ ưới 5 năm có t ỷ l l a ch n r i b d ch v ngần hàng cao h n có th là vì trong kho ng 5 năm sệ ự ọ ờ ỏ ị ụ ơ ể ả ử d ng h c m thầếy ngần hàng khồgn phù h p, khồng đáp ng đ nhu cầồu c a hụ ọ ả ợ ứ ủ ủ ọ ho c có th trong kho ng th i gian đó, h đã ph i tr i qua các thay đ i quan ặ ể ả ờ ọ ả ả ổ tr ng trong cu c sồếng nh thay đ i cồng vi c, đ a đi m sồếng, hồn nhần ho c ọ ộ ư ổ ệ ị ể ặ

Trang 24

Bi u đôề ể6 Sôế d tài kho nưả

Khách hàng có sồế d tài kho n t 0-50000 có l a ch n khồng r i b ngần hàng làư ả ừ ự ọ ờ ỏ nhiễồu nhầết vì h c m thầếy thần thu c v i ngần hàng, ngoài ra Khách hàng có th đangọ ả ộ ớ ể g p khó khăn tài chính và khồng muồến mầết th i gian và tễồn b c đ chuy n sang ngầnặ ờ ạ ể ể hàng khác

m c sồế d tài kho n t 100001 – 150000 l a ch n r i b d ch v ngần hàng

cao nhầết có th là vì h thay đ i nhu cầồu tài chính c a h H muồến tm m t ngần hàngể ọ ổ ủ ọ ọ ộ cung cầếp đ nhu cầồu c a h h n.ủ ủ ọ ơ ngần hàng đ tễếp t c để ụ ược hưởng nh ng l i ích này Ngoài ra khách hàng c m thầếy ữ ợ ả hài lòng v i d ch v c a ngần hàng, h có th khồng muồến chuy n sang m t ngần hàngớ ị ụ ủ ọ ể ể ộ khác và ph i h c cách s d ng m t b cồng c m i.ả ọ ử ụ ộ ộ ụ ớ

Trang 25

Đồếi v i nhóm khách hàng l a ch n r i đi nhiễồu nhầết là m c s d ng 1 s n ớ ự ọ ờ ở ứ ử ụ ả ph m Có th b i vì khi h tr i nghi m th 1 s n ph m d ch v và h c m thầếy ngần ẩ ể ở ọ ả ệ ử ả ẩ ị ụ ọ ả duy trì quan h này đ gi đệ ể ữ ược m c đ tn c y Khách hàng có th c m thầếy an toàn ứ ộ ậ ể ả h n khi s d ng các d ch v ngần hàng c a mình, vì h đã quen thu c v i các quy trìnhơ ử ụ ị ụ ủ ọ ộ ớ và biễết rõ vễồ chính sách b o m t c a ngần hàng.ả ậ ủ

 Khách hàng thấn thiêốt

Bi u đôề ể9 Khách hàng thân thiêết

Ngày đăng: 08/04/2024, 08:03

Tài liệu cùng người dùng

Tài liệu liên quan