HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ KHÓA LUẬN TỐT NGHIỆP TÊN ĐỀ TÀI NGHIÊN CỨU ỨNG DỤNG KHAI PHÁ DỮ LIỆU PHÂN CỤM TRONG PHÂN ĐOẠN KHÁCH HÀNG TẠI NGÂN HÀNG NÔNG NGHIỆP VÀ PHÁT TRIỂN NÔNG THÔN CHI NHÁNH TRỰC NINH NAM ĐỊNH TRẦN VÂN ANH HÀ NỘI, 2015 HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THƠNG TIN QUẢN LÝ KHĨA LUẬN TỐT NGHIỆP TÊN ĐỀ TÀI NGHIÊN CỨU ỨNG DỤNG KHAI PHÁ DỮ LIỆU PHÂN CỤM TRONG PHÂN ĐOẠN KHÁCH HÀNG TẠI NGÂN HÀNG NÔNG NGHIỆP VÀ PHÁT TRIỂN NÔNG THÔN CHI NHÁNH TRỰC NINH NAM ĐỊNH Giáo viên hướng dân ThS Nguyên Thị Thùy Anh Sinh viên thực Trần Vân Anh Lớp HTTTA - K14 Khóa 2011 - 2015 Hệ Đại học qui Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định Hà Nội, tháng năm 2015 NHẬN XÉT (Của giáo viên hướng dẫn) Tính cấp thiết đề tài: vấn đề khai phá liệu quan tâm có nhiều ứng dụng thực tế Đề tài nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng ngân hàng nông nghiệp phát triển nông thôn chi nhánh Trực Ninh Nam Ninh - nghiên cứu việc phân chia khách hàng thành nhóm có nhu cầu thị hiếu gần giống để thiết kế sản phẩm phù hợp quan trọng có ý nghĩa bối cảnh cạnh tranh ngày gay gắt ngân hàng Kết đạt được: đề tài tìm hiểu tốn, vận dụng lý thuyết vào tốn thực tế cụ thể ứng dụng khai phá liệu phân cụm phân đoạn khách hàng ngân hàng nông nghiệp phát triển nông thôn chi nhánh Trực Ninh Nam Ninh Đề tài cài đặt chạy thử nghiệm thuật toán K-means công cụ WEKA liệu ngân hàng, từ đưa kết luận, khuyến nghị việc áp dụng kết khai phá liệu Đánh giá chung: sinh viên tích cực học hỏi, tìm hiểu vấn đề, phương pháp, vận dụng tốt lý thuyết để xử lý toán Ngân hàng, chấp hành tiến độ thực hiện, khắc phục nhiều khó khăn để hồn thành khóa luận Tuy nhiên đề tài cần có hướng mở rộng nghiên cứu, tăng cường phân tích kết khuyến cáo người sử dụng Kết luận : Căn vào tiêu chuẩn, yêu cầu khóa luận kết ứng dụng, đồng ý để sinh viên bảo vệ khóa luận trước Hội đồng Hà Nội, ngày tháng năm 2015 Giáo viên hướng dẫn (Ký tên) Trần Vân Anh- K14HTTTA Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định LỜI CÁM ƠN Để hồn thành khóa luận này, em xin tỏ lòng biết ơn sâu sắc tới cô Nguyễn Thị Thùy Anh anh chị Ngân hàng Nông nghiệp phát triển Nông thôn chi nhánh Nam Định tận tình hướng dẫn em q trình viết khóa luận Em xin gửi lời cảm ơn chân thành tới quý thầy cô trường Học viện Ngân DANH MỤC CÁC CHỮ VIẾT TẮT hàng nói chung, thầy khoa Hệ thống thơng tin quản lý nói riêng tận tình truyền đạt khơng kiến thức học tập mà kiến thức sống Tất thứ hành trang quý báu cho chúng em, giúp chúng em tự tin hơn, bước bước vững đơi chân Em xin gửi lời cảm ơn tới gia đình, bạn bè ln người ủng hộ, động viên giúp đỡ em để em hồn thành tốt việc học tập nhiệm vụ tập thể giao Em cố gắng hồn thiện tốt khóa luận, nhiên thiếu kinh nghiệm hạn chế thời gian chắn khóa luận khơng tránh khỏi thiếu sót Vì vậy, em mong nhận quan tâm, ý kiến đóng góp thầy bạn để khóa luận hồn thiện Cuối cùng, em xin kính chúc q thầy gia đình ln dồi sức khỏe thành cơng sống Chữ viết tắt Chữ đầy đủ KPDL Khai phá liệu CNTT Công nghệ thông tin KH Khách hàng PCDL Phân cụm liệu NHTM Ngân hàng thương mại CSDL Cơ sở liệu NHNo&PTNT Ngân hàng nông nghiệp phát triển nông thôn Trần Vân Anh- K14HTTTA Trần Vân Anh- K14HTTTA Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định Trần Vân Anh- K14HTTTA Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định DANH MỤC HÌNH ẢNH Hình Quy trình khai phá tri thức Hình Các giai đoạn khai phá liệu .5 Hình Mô PCDL 23 Hình Dữ liệu nguyên thủy 23 Hình Quá trình phân cụm 24 Hình Quá trình phân cụm 24 Hình Kết trình phân cụm 25 Hình Mơ hình mơ tả cấu trúc liệu lưới 27 Hình Phân cụm phân cấp Top-down Bottom-up 32 Hình 10 Tính trọng tâm cụm 34 Hình 11 Giao diện phần mềm Weka 41 Hình 12 Các chức Weka Explorer 41 Hình 13 Nguồn liệu 43 Hình 14 Trình lập liệu .45 Hình 15 Thuộc tính thống kê thuộc tính 46 Hình 16 Lựa chọn chức Remove 47 Hình 17 Loại bỏ thuộc tính "ID" 48 Hình 18 Sau loại bỏ thuộc tính "ID" 50 Hình 19 Nội dung file "dlbank1.arff" 51 Hình 20 Lựa chọn thuật tốn phân cụm K-Means 52 Hình 21 Kết thử nghiệm dạng text 53 Trần Vân Anh- K14HTTTA Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định DANH MỤC BẢNG Bảng Phân tích SWOT 19 Bảng Giá trị thuộc tính liệu khai phá 44 Trần Vân Anh- K14HTTTA Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định Trần Vân Anh- K14HTTTA Khóa luận tot nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định Filtering samples: Lọc mẫu liệu cho mơ hình • Transformation: Chuyển đổi kiểu liệu cho phù hợp • Discretization: Rời rạc hóa liệu Cụ thể, nguồn liệu bank1.csv: Loại bỏ thuộc tính ID thuộc tính khơng dùng mơ hình ❖ Bước 1: nạp liệu vào Weka: chọn tab “Preprocess”-> Open file Hình 14 Trình lập liệu Trần Vân Anh- K14HTTTA 45 Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định k Bước 2: Sau nạp liệu lên, panel bên trái thể thuộc tính file liệu, panel bên phải thể thống kê tương ứng với thuộc tính bên trái Hình 15 Thuộc tính thống kê thuộc tính Trần Vân Anh- K14HTTTA 46 Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định Sau nạp liệu lên, ta tiến hàng lọc liệu Trong file dlbank.csv ta cần loại bỏ thuộc tính ID cách: Trong panel filter->Choose->filters->unsupervised>attribute->remove: Hình 16 Lựa chọn chức Remove ❖ Bước 3: bấm vào textbox bên phải nút “Choose” gõ vào “1” index thuộc tính ID file liệu Trần Vân Anh- K14HTTTA 47 Khóa luận tơt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định Hình 17 Loại bỏ thuộc tính "ID" Trần Vân Anh- K14HTTTA 48 Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định Bước 4: Bấm “Apply” để tạo liệu với 11 thuộc tính sau loại bỏ thuộc tính Trần Vân Anh- K14HTTTA 49 Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định Hình 18 Sau loại bỏ thuộc tính "ID" Trần Vân Anh- K14HTTTA 50 Khóa luận tot nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định Bây lưu lại liệu sau loại bỏ ID dạng file arff với tên “dlbankl.arff” Nội dung file“dlbank1.arff”: ©relatíon dibaπk-weka filters Unsupervi sed attrlbute Remove-Rl ©attr1 bute Vung {NOI-THANH ,THI-TRAN,NONG-THON , NGOAI-THANH} ©attribute TUOI numeric ©attribute Glol-tinh {NU,NAM} ©attribute Thunhap numeric ©attribute κet-hon {YES} ©attribute SO-CO∏ numeric ©attribute 0-t0 {NO,YEΞ} ©attribute τκτhaπh-toaπ {NO,YES} ©attribute 'Tkτ1et-k1em f {NO,YEΞ} ©attribute The-Chap {YEE,NO} ©attribute Ke_hoacn {YES} ©data NOI-THANH,54,NU,15,YEE,4, NO , NO , NO ,YEE,YEE THI-TRAN, 29 ,NAM,7.8,YES,2, NO ,YES,YES,YES,YES NOI-THANH,5Ó,NU,20,YEE,3, NO ,YEE,YEE, NO ,YEE THI-TRAN,26,NU,13.5,YEE,2, NO , NO , NO , NO,YES NONG-THON,30,NU,20,YES,2,YES, NO ,YES,YES,YES THI-TRAN,38,NU,9.6,YES,1,NO,YES,NO,NO,YEE NONG-THON,31,NAM,6.1,YEE,2, NO , NO , NO ,YEE,YEE THI-TRAN,22,NAM,10.3, YES, O , NO ,YES,YES, NO ,YES NGOAI-THANH,25,NU,6.6, YEE,1, NO , NO ,YEE,YEE,YEE THI-TRAN, 28 ,NAM,11,YES,1, NO , NO ,YES, NO ,YES THI-TRAN,6 5^ NU,7,YES,3, NO , NO , NO ,YES,YES NOI-THANH,52,NU,30,YEE,2,YEE,YEE,YEE,YEE,YEE THI-TRAN,27,NU,7.8,YEsjl, NO ,YES, NO , NO ,YES THI-TRAN,27^ NU,21,YEE,2,YEE,YEE,YEE,YEE,YEE NONG-THON,32,NAM,14.6,YES,2,NO,NO,NO,NO,YES NOI-THANHj 60,NU,36,YES,4,YES,YES,YES,YES,YES THI-TRAN,28,NU,10,YEE,2, NO,NO , NO , NO ,YEE NGOAI-THANH,45,NU,6 9,YES,2, NO , NO , NO ,YES,YES NOI-THANH,5 5,NU,21,YES ,3,YES , NO ,YES ,YES ,YES Hình 19 Nội dung file "dlbank1.arff" Khi thuộc tính ID bị loại tất giá trị trường ID ghi bị loại 3.3.3 Khai phá liệu với thuật toán K-Means ❖ Bước 1: Chọn menu Process để vào panel lấy nguồn thử nghiệm ❖ Bước 2: Click Open file để đến vị trí nguồn liệu chọn file dlbank1.arff Trước tiến hành phân cụm, ta phải lựa chọn chế độ kiểm thử để xây dựng tập kiểm thử tập huấn luyện Weka hỗ trợ chế độ kiểm thử: • • • Sử dụng tập huấn luyện (Use training set): Các cụm học kiểm tra tập học Tập hỗ trợ kiểm thử (Supplied test set): sử dụng tập liệu khác để kiểm tra cụm học Đánh giá độ xác phân cụm (Classes to clusters evaluation): So sánh độ xác cụm học lớp định Trần Vân Anh- K14HTTTA 51 Khóa luận tot nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định • Tách theo tỉ lệ (Percentage split): Chỉ định tỷ lệ phân chia tập liệu ban đầu cho việc xây dựng tập kiểm tra ❖ Bước 3: Sử dụng chế độ kiểm thử “Use training set” Chọn Cluster->Choose>SimpleKMeans Sau ấn vào bên phải nút Choose, Thiết lập tham số cho thuật toán K-Means số cụm Theo kết nghiên cứu “BAI Research Study: The New Dynamics of Consumer Banking Relationships” Bank Administration Institute để đảm bảo quy mô phân khúc tạo ra, thị trường bán lẻ ngân hàng nên phân thành đến phân đoạn Vì lựa chọn tham số k=5 -> Start Khóa luận tốt nghiệp phân đoạn khách hàng Cluster centroids: tạ Nghiên cứu ứng dụng khai phá liệu phân cụm Hình 20 Lựa chọn thuật tốn phân cụm K-Means i NHNo& PTNT Trực Ninh Nam Định Ket thu được: Cluster# Attribute Vung Iuci • Dạng text: Full Data (6ữC) (72) (138) (139) (83) (168) NOI THANH 38.5767 NONG THON 27.0972 THIjrEAN 32.1739 NOI THANH 46.482 THI TEAN 34.1446 NOI THANH 44.4048 N NU Sicí_tinh NU Ihunhap 15.0698 Y Ket_hon 3o_ccn E3 o_tc IKThanh_toan IlĩTiet_k’iem Ihe_chap Ke_hoach 2.035 U S 10.0319 YE 12.229 1.875 N 1.942 YES NO Y O YE ES Y S NO N ES Y O YES N ES Y O YE YES YES ES S Trần Vân Anh- K14HTTTA YES NA NU 18.7741 YE 11.0337 2.1439 N 1.988 O NC YES YE S NC YES N C NC YES N O YE NC YES YES YES M S S YES NAM 18.4917 YES 2.1131 52 Iime taken to build JJKHiel {full training data) : 0.11 3eccnd≡ === Model and evaluation on training set === Clustered Instances 72 { 12⅝) 138{ 23⅞) 139( 23⅝) 83 ( 14⅝) 160( 28⅝) Hình 21 Kết thử nghiệm dạng text 3.3.4 Đọc diễn giải kết chương trình Ket cho biết: Có 72 mẫu cụm chiếm 12%, 138 mẫu cụm chiếm 23%, 139 mẫu cụm chiếm 23%, 83 mẫu cụm cụm chiếm 14%, 168 mẫu cụm chiếm 28% Giá trị thuộc tính cụm cho biết giá trị trung bình (đối với thuộc tính có kiểu định lượng) mode (đối với thuộc tính có kiểu định danh, nominal) thuộc tính cụm Dựa vào kết thấy, tuổi trung bình khách hàng vay 38.5767, giới tính thường nữ, khu vực nội thành, thu nhập trung bình 15.0698 triệu đồng, kết hơn, số trung bình 2.035, khơng có xe, có sử dụng tài khoản tiết kiệm ngân hàng, có sử dụng tài khoản tốn ngân hàng, có tài sản chấp, có kế hoạch trả nợ - Phân khúc 1, phân khúc có khả khai thác Trần Vân Anh- K14HTTTA 53 Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định - Đặc điểm phân khúc 4: chiếm tỉ trọng lớn với 168 mẫu đối tượng, đoạn khách hàng mục tiêu ngân hàng, có độ tuổi trung bình 44.4048, giới tính nam, khu vực nội thành, thu nhập trung bình 18.4917 triệu đồng/tháng, kết hơn, số trung bình 2.1131, có xe, có tài khoản tiết kiệm ngân hàng, có sử dụng tài khoản tốn ngân hàng, có tài sản chấp, có kế hoạch trả nợ ngân hàng - Đặc điểm phân khúc 1: với 138 mẫu đối tượng, đoạn khách hàng tiềm ngân hàng, trung niên có độ tuổi trung bình 32.1739, giới tính nữ, khu vực thị trấn, thu nhập trung bình 12.229 triệu đồng/tháng, kết hơn, số trung bình 1.942, có xe, có tài khoản tiết kiệm ngân hàng, khơng sử dụng tài khoản tốn ngân hàng, có tài sản chấp, có kế hoạch trả nợ ngân hàng - Đặc điểm phân khúc 2: với 139 mẫu đối tượng, đoạn khách hàng tiềm ngân hàng, độ tuổi trung bình 46.482, giới tính nam, khu vực nội thành, thu nhập trung bình 18.7741 triệu đồng, kết hơn, số trung bình 2.1439, khơng có xe, khơng sử dụng tài khoản tiết kiệm ngân hàng, có sử dụng tài khoản tốn ngân hàng, khơng có tài sản chấp, có kế hoạch trả nợ ngân hàng - Với danh sách khách hàng vay, ngân hàng định hướng đoạn khách hàng mục tiêu cho hoạt động dịch vụ Quan trọng khả quản lý rủi ro cho nhóm khách hàng vay Điều giúp ngân hàng phân bổ nguồn lực hiệu quả, khai thác đầu tư đắn nhằm tránh rủi ro Từ kết ngân hàng xác định phân khúc số 1, phân khúc tiềm Các đoạn khách hàng phù hợp với quy mô khả tăng trưởng, mục tiêu đạt khả đáp ứng ngân hàng Đây phân khúc lớn chiếm tỉ trọng cao nên quy mô phát triển cuả phân khúc lớn phân khúc lại Hầu hết khách hàng hàng tham gia sử dụng dịch vụ ngân hàng thuộc phân khúc nên khả tăng trưởng đoạn khách hàng đáp ứng mong muốn ngân hàng Trần Vân Anh- K14HTTTA 54 Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định Ket phân đoạn khách hàng sử dụng cho số phận nhà quản lý: Thực tế có hai loại phân đoạn khách hàng ngân hàng: phân đoạn chiến lược phân đoạn tiếp thị Phân đoạn chiến lược việc phân chia thị trường tổng thể theo tiêu thức đó, từ lựa chọn phân khúc thị trường tiềm phù hợp với mục tiêu khả nội ngân hàng Kết phân đoạn chiến lược thường sử dụng cho lãnh đạo cấp cao tổng giám đốc điều hành, chủ tịch hội đồng quản trị, Phân đoạn tiếp thị việc phân chia thị trường mục tiêu theo tiêu thức, nhằm phân nhỏ thị trường mục tiêu để phục vụ tốt Kết phân đoạn tiếp thị thường áp dụng cho lãnh đạo tầm trung giám đốc marketing, giám đốc thiết kế sáng tạo sản phẩm mới, giám đốc phận quan hệ chăm sóc khách hàng - Giám đốc điều hành: Kết phân đoạn khách hàng chiến lược giám đốc điều hành sử dụng để phát lựa chọn phân đoạn thị trường tiềm mà ngân hàng xâm nhập sớm để giành lợi cạnh tranh so với đối thủ Ngân hàng tập trung vào phân khúc cụ thể hấp dẫn để hoạt động có hội tốt cho tăng trưởng - Giám đốc marketing phận marketing: Kết phân đoạn khách hàng sử dụng cho giám đốc marketing để hoạch định chiến lược marketing cho phân khúc Các nhân viên phòng marketing sử dụng kết phân đoạn khách hàng để xây dựng gói sản phẩm, tận dụng hội cho tăng trưởng doanh thu thông qua bán chéo (cross sell) bán kèm (up sell) Để làm việc đòi hỏi hiểu biết sâu sắc giá trị mà khách hàng cần, muốn, hy vọng tổ chức tài - Bộ phận thiết kế sáng tạo sản phẩm mới: Phân đoạn khách hàng xác định đặc điểm nhân học sở thích đối tượng thuộc phân khúc, đem lại hội cho ngân hàng khác biệt hóa sản phẩm, dịch vụ dựa sở thích Trần Vân Anh- K14HTTTA 55 Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định Sau số khuyến nghị công tác phân đoạn khách hàng áp dụng kết phân đoạn khách hàng : - Phân đoạn chiến lược thường tiến hành tiêu thức: khả sinh lời, mức độ rủi ro Mức độ dịch vụ khác phân khúc chiến lược, với phân khúc chiến lược cần xây dựng mức độ dịch vụ phù hợp - Các tiêu thức phân đoạn tiếp thị không bị ràng buộc phân đoạn chiến lược - Các hệ thống thông tin tiên tiến, cho phép giám sát quản lý quan hệ khách hàng điều kiện tiên cần thiết để xác định trì quản lý thay đổi phân đoạn khách hàng cách hiệu - Ngoài yếu tố nhân học tuổi, thu nhập thái độ tiêu chí phân khúc có giá trị Khi khách hàng đến sử dụng dịch vụ ngân hàng ngân hàng xét xem khách hàng thuộc phân khúc Sau từ giả định này, bạn ghi nhận vào hồ sơ khách hàng thái độ mà nhóm thường hiển thị Trên sở hiểu biết khách hàng, ngân hàng tùy chỉnh tương tác với khách hàng khiến khách hàng muốn sử dụng nhiều sản phẩm, dịch vụ chí mức nhu cầu trung bình họ, khuyến khích khách hàng phần thưởng quyền sử dụng sản phẩm dịch vụ ưu việt - Mặc dù tập trung đổi phân đoạn khách hàng, tổ chức tài thực chiến lược phân đoạn khách hàng cách chuyên nghiệp Phần lớn tổ chức dừng lại mức thiết kế chương trình tiếp thị đơn giản Phương pháp tiếp cận phân đoạn phải tuyên truyền để đảm bảo thông điệp mục tiêu chiến lược phân đoạn khách hàng tất nhân viên hiểu rõ hành động theo Từ hiểu biết đầy đủ phân đoạn tận dụng quản lý kênh, tiếp thị bán hàng Những hiểu biết phân tích sử dụng hướng dẫn để tiếp cận phân khúc tổ chức tài Trần Vân Anh- K14HTTTA 56 Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định KẾT LUẬN Với số dân khoảng 90 triệu người mức thu nhập trình độ dân trí người dân ngày cao, Việt Nam đánh giá thị trường tiềm dành cho dịch vụ ngân hàng bán lẻ Tuy nhiên, thị trường bán lẻ có đặc điểm khách hàng đa dạng, từ người trẻ đến người già, từ lao động phổ thông đến lao động trí óc, Sự đa dạng đối tượng khách hàng dẫn đến đa dạng nhu cầu thị trường bán lẻ, ngân hàng khó làm hài lòng tất đối tượng khách hàng Vì cơng tác phân đoạn khách hàng bán lẻ để tìm phân đoạn khách hàng mục tiêu quan trọng Chính lý em lựa chọn giải pháp khai phá liệu phân cụm để hỗ trợ công tác phân đoạn khách hàng bán lẻ ngân hàng thương mại Việt Nam nói chung ngân hàng NoNN&PTNT Trực Ninh Nam Định nói riêng Trong chương khóa luận trình bày tổng quan phân đoạn khách hàng nói chung phân đoạn khách hàng ngân hàng nói riêng Trong chương trình bày thực trạng vấn đề gặp phải hoạt động phân đoạn khách hàng Trần Vân Anh- K14HTTTA 57 Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định NHTM Việt Nam Cuối chương trình bày khả áp dụng giải pháp phân đoạn khách hàng kỹ thuật khai phá liệu phân cụm NHTM Việt Nam thông qua phân tích SWOT Khi nghiên cứu lý thuyết phân đoạn khách hàng, nhận thấy nên sử dụng kết hợp nhiều nhóm tiêu thức phân đoạn Theo truyền thống, phân khúc thị trường thường xác định dựa đặc điểm nhân học tuổi tác, giới tính, thu nhập, Ưu điểm phân đoạn nhân học dễ áp dụng tính sẵn có sở liệu khách hàng, phân đoạn thực có ý nghĩa người có đặc điểm nhân học giống thường có hành vi mua hàng giống Tuy nhiên, nghiên cứu gần đặc điểm nhân học không đủ để đặc trưng cho phân đoạn khách hàng, phát triển xã hội, trình độ học vấn, tính cá nhân người ngày cao Vì vậy, ngồi yếu tố nhân học đặc trưng, để phân đoạn khách hàng hiệu cần dựa số phản ánh nhu cầu khách hàng lợi ích, thái độ, hành vi Với cách phân đoạn khách hàng truyền thống khó làm điều này, với hỗ trợ kỹ thuật khai phá liệu liệu lớn, ngân hàng phân đoạn khách hàng dựa kết hợp nhiều nhóm tiêu thức Trong khn khổ đề tài, khóa luận lựa chọn kết hợp tiêu thức sau để phân đoạn khách hàng bán lẻ ngân hàng Việt Nam: - Phân đoạn theo lợi: Loại sản phẩm, dịch vụ mà khách hàng sử dụng, khách hàng khách hàng ngân hàng - Phân đoạn theo địa lý: Đặc điểm vùng miền có ảnh hưởng lớn tới hành vi khách hàng - Phân đoạn khách hàng theo nhân học: toán sử dụng yếu tố dân số - xã hội tuổi tác, học vấn, nghề nghiệp, thu nhập bình quân làm tiêu thức để phân đoạn khách hàng Trong chương trình bày tổng quan phương pháp phân cụm thuật toán phân cụm K-means Khi nghiên cứu so sánh số phương pháp phân cụm, nhận thấy thuật tốn phân cụm K-Means có ưu điểm thời gian thực hiện, phù hợp với tốn có lượng liệu lớn toán phân đoạn khách hàng bán lẻ NHTM nói chung NHNo&PTNT Trực Ninh nói riêng Vì khóa luận lựa chọn thuật tốn K-Means để giải tốn phân đoạn Nội dung chương trình bày tốn phân đoạn khách hàng bán lẻ NHTM Trực Ninh quy trình khai phá liệu nói chung khai phá liệu phân cụm toán phân đoạn khách hàng nói riêng Cũng chương giới thiệu cơng cụ khai phá liệu WEKA ứng dụng công cụ liệu ngân hàng Trực Ninh Cơ sở liệu thử nghiệm gồm 600 ghi, 11 thuộc tính mơ tả đặc điểm nhân học, địa lý sản phẩm, dịch vụ sử dụng khách hàng ngân hàng Cuối cùng, khóa luận đưa số khuyến nghị ứng dụng giải pháp khai phá liệu phân cụm phân đoạn khách hàng số khuyến nghị việc áp dụng kết phân đoạn Trần Vân Anh- K14HTTTA 58 Khóa luận tốt nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Định TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nguyễn Hoàng Tú Anh Giáo trình “Khai thác liệu ứng dụng” 2009 (Đại học KHTN Tp Hồ Chí Minh) [2] An Hồng Sơn Luận văn thạc sĩ “Nghiên cứu số phương pháp phân cụm mờ ứng dụng” 2008 (Đại học Thái Nguyên) [3] Vũ Lan Phương “Nghiên cứu cài đặt số giải thuật phân cụm phân Tiếng Anh [4] Andrew Moore: “K-means and Hierarchical Clustering - Tutorial Slides” Nov 2001 http://www.autonlab.org/tutorials/kmeans.html [5] Dr Osmar R.Zaiane “Principles of knowledge discovery in databases” Fall 2001 (University of Alberta) [6] Patrick André Pantel “Clustering by Committee” Thesis Doctor of Philosophy, Spring 2003 (University of Alberta), 15 - 25p [7] Jiawei Han and Micheline Kamber “Data Mining Concepts and Techniques” 2007 Chapter & Chapter (Intelligent Database Systems Research Lab School of Computing Science Simon Fraser University, Trần Vân Anh- K14HTTTA 60 59 ... cứu ứng ứng dụng dụng khai khai phá phá dữ liệu liệu phân phân cụm cụm trong phân phân đoạn đoạn khách khách hàng hàng tại NHNo& NHNo& PTNT PTNT Trực Trực Ninh Ninh Nam Nam Đ? ?nh Đ? ?nh Bước Khởi... đề khai phá liệu quan tâm có nhiều ứng dụng thực tế Đề tài nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng ngân hàng nông nghiệp phát triển nông thôn chi nh? ?nh Trực Ninh Nam Ninh. .. nghiệp Nghiên cứu ứng dụng khai phá liệu phân cụm phân đoạn khách hàng NHNo& PTNT Trực Ninh Nam Đ? ?nh Hiện nay, phương pháp phân cụm phát triển áp dụng nhiều l? ?nh vực khác có số nh? ?nh nghiên cứu