CRM giúp cho doanh nghiệp thiết lập mối quan hệ tốt đẹp với khách hàngvới rất nhiều lợi ích như i giúp doanh nghiệp phân loại khách hàng; ii giúpthúc đẩy lòng trung thành của khách hàng;
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI ĐÀO CƠNG ÂN ĐÀO CƠNG ÂN TỐN TIN MƠ HÌNH DỰ BÁO CHURN CHO KHÁCH HÀNG BẰNG PHƯƠNG PHÁP HỌC MÁY SUY DIỄN PHƯƠNG SAI LUẬN VĂN THẠC SĨ KHOA HỌC Tốn tin KHỐ 2015B Hà Nội – Năm 2018 Tai ngay!!! Ban co the xoa dong chu nay!!! 17057204915681000000 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI ĐÀO CƠNG ÂN MƠ HÌNH DỰ BÁO CHURN CHO KHÁCH HÀNG BẰNG PHƯƠNG PHÁP MÁY HỌC SUY DIỄN PHƯƠNG SAI LUẬN VĂN THẠC SĨ KHOA HỌC Toán tin NGƯỜI HƯỚNG DẪN KHOA HỌC : TS Nguyễn Thị Ngọc Anh Hà Nội – Năm 2018 CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ Họ tên tác giả luận văn : Đào Cơng Ân Đề tài luận văn: Mơ hình dự báo Churn cho khách hàng phương pháp máy học suy diễn Phương sai Chuyên ngành: Toán tin Mã số SV: CB150076 Tác giả, Người hướng dẫn khoa học Hội đồng chấm luận văn xác nhận tác giả sửa chữa, bổ sung luận văn theo biên họp Hội đồng ngày 19/10/2018 với nội dung sau: - Mô tả các biến phần phụ lục đưa lên phần mô tả liệu - Bổ xung bước thực xử lý liệu đặc biệt làm online tiền xử lý liệu - Các phần mềm để chạy, tham số chi tiết chạy thuật toán - Đo thời gian chạy thuật toán Ngày tháng 10 năm 2018 Giáo viên hướng dẫn Nguyễn Thị Ngọc Anh CHỦ TỊCH HỘI ĐỒNG Tác giả luận văn Đào Công Ân LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu riêng hướng dẫn khoa học TS Nguyễn Thị Ngọc Anh Các nội dung nghiên cứu, số liệu, kết nêu Luận văn trung thực rõ nguồn trích dẫn Kết nghiên cứu chưa công bố cơng trình khác Tơi xin chịu trách nhiệm cơng trình nghiên cứu riêng ! Hà Nội, Ngày 28 tháng 09 năm 2018 Tác giả luận văn Đào Công Ân Mục lục Danh sách bảng Danh sách hình vẽ Lời mở đầu Giới thiệu chung 1.1 Giới thiệu toán Churn 10 1.2 Các cơng trình nghiên cứu liên quan 12 1.3 Mục tiêu nghiên cứu luận văn 13 1.4 Học máy, ứng dụng vào dự báo Churn ngân hàng 13 1.5 Cấu trúc luận văn 15 Áp dụng học máy toán dự báo Churn 16 2.1 Phương pháp phân tích dự báo Churn 16 2.2 Áp dụng định (Decision Tree) cho dự báo Churn 19 2.3 2.2.1 Khái niệm định (Decision tree) 19 2.2.2 Thuật toán xây dựng định 20 2.2.3 Ứng dụng định cho dự báo Churn 23 Áp dụng mạng Nơron (Artificial Neural Network - ANN) cho dự báo Churn 23 2.3.1 Perceptron learning algorithm (PLA) 28 2.3.2 Mơ hình Logistic regression 31 LUẬN VĂN 2.3.3 2.4 Đào Công Ân Áp dụng mạng Nơron cho dự báo Churn 34 Áp dụng suy diễn phương sai trực tuyến cho phân phối Gaussian đa biến (VIGO) cho dự báo Churn 35 2.4.1 Phương pháp học trực tuyến 35 2.4.2 Phương pháp suy diễn xấp xỉ 37 2.4.3 Suy diễn phương sai cho ước lượng Bayes nhiều biến 41 2.4.4 Suy diễn phương sai trực tuyến cho ước lượng Bayes nhiều biến 45 Ứng dụng toán dự báo Churn vào lĩnh vực ngân hàng 48 3.1 Mô tả liệu 48 3.2 Tiền xử lý liệu 50 3.3 Các kết phân tích tốn Churn 51 3.4 Một số tiêu chí đánh giá mơ hình học 56 3.5 Chọn model thực training cho toán dự báo Churn 58 3.6 Kết cho toán dự báo Churn 59 3.6.1 Cây định (Decision Tree) 59 3.6.2 Mạng Nơron (ANN) 61 3.6.3 Suy diễn phương sai trực tuyến cho ước lượng Bayes nhiều biến (VIGO) 63 3.6.4 Ưu nhược điểm kỹ thuật học máy 65 Kết luận 65 66 Tài liệu tham khảo 67 A Một số kết chạy toán dự báo Churn 70 Trang Danh sách bảng 3.2 Tỷ lệ phân loại sai dự báo Churn sử dụng kỹ thuật định 60 3.3 Tỷ lệ phân loại sai dự báo Churn sử dụng kỹ thuật mạng Nơron 62 3.4 Độ xác ba phương pháp 63 3.5 Tỷ lệ phân loại sai dự báo Churn dựa mean var 64 3.6 Ưu nhược điểm kỹ thuật học máy 65 Danh sách hình vẽ 1.1.1 Mơ hình dịng chảy khách hàng 11 2.1 Kết hợp mơ hình dự báo Churn với kỹ thuật học máy 17 2.2.1 Mơ hình cấu trúc định 19 2.2.2 Sơ đồ thuật toán định cho dự báo Churn 24 2.3.1 Kiến trúc một ANN 25 2.3.2 Q trình xử lý thơng tin ANN 26 2.3.3 Đồ thị hàm sigmoid (bên trái) hàm (bên phải) 27 2.3.4 Mơ hình mơ tả thuật toán Perceptron learning algorithm [20] 30 2.3.5 Sơ đồ thuật toán mạng Nơron cho dự báo Churn 34 2.4.1 Mơ hình tổng qt cho phân loại trực tuyến [5] 36 3.3.1 Ma trận tương quan thuộc tính (feature) liệu 51 3.3.2 Biểu đồ số lượng khách hàng Churn Non-churn 52 3.3.3 Mơ tả liệu thuộc tính theo nhóm Churn Non-Churn 52 3.3.4 Phân phối theo thuộc tính tỉ lệ ghi nợ quý T (X81) 53 3.3.5 Biểu đồ phân phối theo thuộc tính tuổi 53 3.3.6 Phân phối theo thuộc tính Day-of-open 54 3.3.7 Phân phối theo thuộc tính số dư 54 3.3.8 Phân phối tỷ lệ Churn theo thuộc tính tuổi 55 3.3.9 Phân phối tỷ lệ Churn theo thuộc tính Day-of-open 56 3.6.1 Biểu đồ dự báo Churn với kỹ thuật Cây định 60 LUẬN VĂN Đào Công Ân 3.6.2 Receiver operating characteristic of decision tree 61 3.6.3 Mô hình dự báo Churn với kỹ thuật mạng Nơron 62 3.6.4 Receiver operating characteristic of atifical neural network 63 3.6.5 Biểu đồ Mean Var 64 A.0.1Mơ hình định xây dựng từ liệu ngân hàng 70 A.0.2Kết mơ hình mạng Nơron từ liệu ngân hàng 71 Trang Lời mở đầu Nhà bác học tiếng người Mỹ John Naisbitt nói: Thế giới đói khát tri thức chết chìm thông tin Theo nghiên cứu IBM: năm 2003 người tạo năm exabyte - tỷ gigabyte thông tin Vào năm 2011, lượng thông tin ngày tạo lên tới 2,5 tỷ gigabyte Mặt khác, phát triển internet đánh dấu bước tiến quan trọng bùng nổ thông tin, liệu trao đổi qua internet năm 1993 100 gigabyte ngày, vào năm 1997 100 gigabyte giờ, năm 2002 giây, đến năm 2013 28 875 gigabyte giây, đến năm 2018 lên đến 50 000 gigabyte giây [12] Đặc biệt, 90% liệu giới tạo năm lại Dữ liệu đến từ nơi ví dụ như: từ cảm biến sử dụng để thu thập thông tin, từ trang web, mạng xã hội, hình ảnh kỹ thuật số video, giao dịch điện tử tín hiệu định vị toàn cầu (global positioning system) điện thoại di động Sự bùng nổ thơng tin tồn cầu lượng tri thức mà thấy được, khai thác lại hạn chế Nguyên nhân cấu trúc thơng tin thường có tính đặc thù, đa dạng cấu trúc 80 − 90% liệu dạng phi cấu trúc nên việc khai thác, trích rút tri thức gặp nhiều khó khăn Vì vậy, u cầu đặt cần nghiên cứu phương pháp để khai thác, trích rút tri thức, phân loại tri thức tốt hơn, xác Sự phát triển bùng nổ công nghệ thông tin làm thay đổi giới,