(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động(Luận văn thạc sĩ) Xây dựng mô hình dự đoán khách hàng tiềm năng cho các gói cước trong mạng di động
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐỒN VĂN TÂM XÂY DỰNG MƠ HÌNH DỰ ĐỐN KHÁCH HÀNG TIỀM NĂNG CHO CÁC GÓI CƯỚC TRONG MẠNG DI ĐỘNG Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã Số: 8480104.01 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC TS TRẦN TRỌNG HIẾU Hà nội – 12/2019 MỤC LỤC LỜI CẢM ƠN ii LỜI CAM ĐOAN iii DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT iv DANH MỤC HÌNH VẼ v DANH MỤC BẢNG vi Chương 1: Giới thiệu khai phá liệu lĩnh vực viễn thông 1.1 1.2 1.3 1.4 Giới thiệu Khai phá liệu lĩnh vực viễn thông Nhóm tốn quản lý trải nghiệm khách hàng Lựa chọn toán 11 Chương 2: Bài toán dự đoán khách hàng tiềm 12 2.1 2.2 2.3 2.4 2.5 2.6 Phát biểu toán dự đoán khách hàng tiềm 12 Phương pháp định 13 Phương pháp SVM 15 Phương pháp kNN (k người láng giếng gần nhất) 17 Phương pháp ghép nối mơ hình học máy 17 Phương pháp đánh giá 18 Chương 3: Mơ hình đề xuất 20 3.1 Mơ hình đề xuất 20 3.2 Tập liệu tiền xử lý liệu 21 3.3 Tiền xử lý trích xuất đặc trưng 27 Chương 4: Thực nghiệm đánh giá 33 4.1 Môi trường công cụ thực nghiệm 33 4.2 Kịch thực nghiệm 34 4.3 Kết thực nghiệm đánh giá 34 KẾT LUẬN 40 TÀI LIỆU THAM KHẢO 41 i LỜI CẢM ƠN Trước tiên xin dành lời cảm ơn chân thành sâu sắc đến thầy giáo TS Trần Trọng Hiếu – người hướng dẫn, khuyến khích, bảo tạo cho tơi điều kiện tốt từ bắt đầu hoàn thành cơng việc Tơi xin dành lời cảm ơn chân thành tới thầy cô giáo khoa Công nghệ thông tin, trường Đại học Công nghệ, ĐHQGHN tận tình đào tạo, cung cấp cho tơi kiến thức vô quý giá cho điều kiện tốt suốt trình học tập, nghiên cứu trường Cuối cùng, xin cảm ơn tất người thân u gia đình tồn thể bạn bè, đồng nghiệp người giúp đỡ, động viên học tập nghiên cứu chương trình thạc sĩ Đại học Cơng nghệ, ĐHQGHN Luận văn tài trợ đề tài cấp ĐHQGHN mã số QG19.23 ii LỜI CAM ĐOAN Tôi xin cam đoan luận văn thạc sĩ Công nghệ thông tin “Xây dựng mơ hình dự đốn khách hàng tiềm cho gói cước mạng di động” cơng trình nghiên cứu riêng tơi, khơng chép lại người khác Trong toàn nội dung luận văn, điều trình bày cá nhân tơi tổng hợp từ nhiều nguồn tài liệu Tất nguồn tài liệu tham khảo có xuất xứ rõ ràng hợp pháp Tơi xin hồn tồn chịu trách nhiệm chịu hình thức kỷ luật theo quy định cho lời cam đoan Hà Nội, ngày … tháng 12 năm 2019 iii DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Chữ viết tắt Ý nghĩa KPDL Khai phá liệu CSDL Cơ sở liệu VLR Tập đồn Cơng nghiệp – Viễn thông Quân đội Viettel Tổng đài ghi nhận đăng nhập mạng thuê bao di động (Visitor Location Register) GSM Mạng thông tin di động (Global System for Mobile Communications) CDR Lịch sử gọi (Call Data Record) ARPU Doanh thu trung bình khách hàng (Average revenue per user) SMS Tin nhắn ngắn (Short Message Services) Viettel Telesale CEM Bán hàng qua điện thoại Quản lý trải nghiệm khách hàng iv DANH MỤC HÌNH VẼ Hình 1: Số liệu thuê bao di động theo nhà mạng tháng 01-04/2019 Hình 2: Thị phần di động nhà mạng Hình 3: Ví dụ mơ tả định 13 Hình 4: Siêu phẳng H chia liệu huấn luyện thành lớp với khoảng cách biên lớn (Các điểm gần H nằm H1 H2 vector hỗ trợ) 16 Hình 5: Quy tắc k-NN không gian đặc trưng 2-chiều với k=5 17 Hình 6: Mơ hình dự đốn khách hàng tiềm cho gói cước 20 Hình 7: Phân bố gói cước tập liệu 23 Hình 8: Lược đồ xử lý liệu trích xuất đặc trưng 30 Hình 6: Giao diện cơng cụ khai phá liệu Knime 33 v DANH MỤC BẢNG Bảng 1: Thuật toán xây dựng định 14 Bảng 2: Mô tả trường tập liệu thuê bao 21 Bảng 3: Mô tả gói cước nhãn dự báo 23 Bảng 4: Bảng danh sách trường thông tin tổng hợp kết 27 Bảng 5: Bảng danh sách nhóm đặc trưng trích xuất 31 Bảng 6: Các công cụ thực nghiệm 33 Bảng 7: Môi trường thực nghiệm 34 Bảng 8: Kết thực nghiệm sử dụng thuật toán kNN 34 Bảng 9: Kết thực nghiệm sử dụng thuật toán SVM 35 Bảng 10: Kết thực nghiệm sử dụng thuật toán định 37 Bảng 11: Kết thực nghiệm sử dụng kết hợp mơ hình 38 vi Chương 1: Giới thiệu khai phá liệu lĩnh vực viễn thông 1.1 Giới thiệu Hiện nay, thị trường dịch vụ viễn thông di động Việt Nam đạt mức bão hòa cạnh tranh nhà mạng bước qua giai đoạn mới: cạnh tranh chất lượng chương trình khuyến mại, chất lượng dịch vụ chăm sóc khách hàng, chất lượng mạng vùng phủ sóng Do đó, yếu tố quan trọng cạnh tranh giai đoạn này, nhà mạng việc tập trung giữ chân thuê bao cũ, giảm lượng khách hàng rời mạng khuyến khích khách hàng tăng lượng sử dụng dịch vụ, phát triển chất lượng dịch vụ, cải tiến cung cấp thêm nhiều dịch vụ giá trị gia tăng đáp ứng nhu cầu ngày lớn khách hàng, cần phải phân tích so sánh với đối thủ cạnh tranh để tung thị trường sản phẩm/dịch vụ theo nhu cầu Một chiến lược hàng đầu nhà mạng ứng dụng kỹ thuật khai phá liệu tảng liệu lớn vào hoạt động sản xuất kinh doanh Hình 1: Số liệu thuê bao di động theo nhà mạng tháng 01-04/2019 (nguồn: Nội bộ) Hình 2: Thị phần di động nhà mạng (nguồn: Nội bộ) Tại Việt Nam, nhà mạng lớn Viettel, MobiFone, VinaPhone ứng dụng khai phá liệu vào hoạt động kinh doanh phân tích liệu thuê bao, cụ thể giải pháp Viettel Customer 3601, vRTAP2, DataMon, Viettel BI nhà mạng Viettel giúp phân tích hành vi chân dung khách hàng phục vụ công tác điều hành kinh doanh liệu; giải pháp IVRS3 nhà mạng MobiFone sử dụng công nghệ khai phá liệu tảng liệu lớn phục vụ truyền thông trúng mục tiêu Hầu hết giải pháp http://kenh14.vn/muc-tieu-cung-nam-2020-va-tuong-lai-nam-2025-cua-viettel-telecom-ra-sao20191023171327738.chn https://vietteldanang.com.vn/viettel-va-qualcomm-ky-thoa-thuan-su-dung-ban-quyen-cong-nghe-3g4g/ http://www.vinasa.org.vn/Default.aspx?sname=vinasa&sid=4&pageid=3076&catid=4213&id=11676 ứng dụng mang lại hiệu mặt kinh tế tối ưu chi phí vận hành nhà mạng Việt Nam 1.2 Khai phá liệu lĩnh vực viễn thông Các nhà mạng viễn thông sở hữu lượng liệu vô lớn thông tin người dùng (thuê bao) từ thông tin nhân học đến thông tin hành vi sử dụng dịch vụ viễn thông, tất liệu lữu trữ cách chi tiết phục vụ hoạt động kinh doanh vận hành hàng ngày Lượng liệu lưu trữ tiềm ẩn tri thức quí báu thị trường, khách hàng, sản phẩm… Sử dụng kỹ thuật phân tích, khai phá liệu các thuật tốn mơ hình toán học máy cho phép nhà mạng đưa định hiệu kịp thời Có nhiều tốn phân tích (use case) lĩnh vực viễn thông phục vụ cho hoạt động điều hành kinh doanh [16,24] Qua khảo sát tài liệu liên quan, luận văn đưa nhóm tốn khai phá lĩnh vực viễn thơng: - Quản lý trải nghiệm khách hàng (CEM): Quản lý trải nghiệm khách hàng trình quản lý tất điểm tiếp xúc với khách hàng nhằm đảm bảo mối quan hệ tích cực khách hàng với thương hiệu CEM hiểu việc “chủ động thiết kế quản trị tất trải nghiệm khách hàng từ trải nghiệm thương hiệu, trải nghiệm mua sản phẩm dịch vụ, trải nghiệm sử dụng sản phẩm dịch vụ đến trải nghiệm dịch vụ sau bán hàng tất kênh, điểm tiếp xúc để đáp ứng kỳ vọng khách hàng nhằm gia tăng hài lòng, trung thành ủng hộ khách hàng” - Tối ưu mạng lưới (Network optimization): Các phương pháp tiếp cận phân tích liệu lớn bắt đầu xuất lĩnh vực mạng viễn thông để giải thách thức ảo hóa (NFV Network Function Visualization) điện tốn đám mây (Cloud Computing) Sự phức tạp gia tăng ứng dụng mạng viễn thông thúc đẩy nhu cầu tự động hóa mạng lưới Các tảng tự động hóa mạng lưới dựa phân tích liệu lớn kết hợp kỹ thuật khai phá liệu để hỗ trợ hoạt động quản lý hiệu quả, kịp thời đáng tin cậy Ví dụ ứng dụng tập trung vào mạng lưới bao gồm: ... nhóm khách hàng Ví dụ: Những khách hàng sử dụng tổng tiêu dùng tháng 200.000đ, sử dụng 100 phút gọi nội mạng, 50 phút gọi ngoại mạng 1GB data, xây dựng đề xuất cho khách hàng gói cước di động. .. với k=5 17 Hình 6: Mơ hình dự đốn khách hàng tiềm cho gói cước 20 Hình 7: Phân bố gói cước tập liệu 23 Hình 8: Lược đồ xử lý liệu trích xuất đặc trưng 30 Hình 6: Giao di? ??n công cụ... Mơ hình phân tích thực mơ hình hóa liệu xử lý từ bước trước để xây dựng mơ hình liệu, cắt lớp khách hàng khác Mục đích: - Từ liệu khách hàng sử dụng dịch vụ, xây dựng kinh kinh doanh khác cho