1. Trang chủ
  2. » Luận Văn - Báo Cáo

2020 httt tranthanhnguyen ttlv 2596

34 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 34
Dung lượng 1,33 MB

Nội dung

HỌCVIỆNCƠNGNGHỆ BƯU CHÍNH VIỄN THƠNG - Trần Thành Nguyên XÁC ĐỊNH SỐ CỤM TỐI ƯU VÀO BÀI TOÁN PHÂN KHÚC KHÁCH HÀNG SỬ DỤNG DỊCH VỤ DI ĐỘNG TẠI VNPT TÂY NINH Chuyên ngành: Hệ Thống thông tin Mã số: 8.48.01.04 TÓM TẮT LUẬN VĂN THẠC SĨ (Theo định hướng ứng dụng) THÀNH PHỐ HỒ CHÍ MINH - NĂM 2022 i Luận văn hồn thành tại: HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG Người hướng dẫn khoa học: PGS TS Nguyễn Đình Thuân Phản biện 1: ………………………………………… Phản biện 2: ………………………………………… Luận văn bảo vệ trước Hội đồng chấm luận văn thạc sĩ Học viện Công nghệ Bưu Viễn thơng Vào lúc: ngày tháng năm Có thể tìm hiểu luận văn tại: - Thư viện Học viện Cơng nghệ Bưu Viễn thơng MỞ ĐẦU Với bùng nổ cơng nghệ nay, có nhiều giải pháp công nghệ nghiên cứu triển khai nhằm phục vụ nhu cầu cá nhân doanh nghiệp Trong Data Mining (Khai phá liệu - KPDL) lĩnh vực quan trọng cơng nghệ KPDL q trình chọn lọc, xử lý liệu thô, xếp, phân loại tập hợp liệu lớn qua để xác định mẫu xây dựng mối quan hệ liệu để giải vấn đề cách phân tích liệu Việc ứng dụng KPDL cho phép đơn vị, doanh nghiệp dự đốn trước xu hướng tương lai Vấn đề đặt nhóm khách hàng cụ thể, doanh nghiệp viễn thơng cần có chế, sách, chiến lược kinh doanh khác để giữ chân, đáp ứng nhu cầu sử dụng dịch vụ nhóm khách hàng để mang lại chất lượng phục vụ tốt cho nhóm khách hàng Là người công tác lĩnh vực viễn thông, để hỗ trợ cho cơng việc tại, để giúp công ty xác định rõ phân khúc khách hàng sử dụng dịch vụ di động Vinaphone Tây Ninh Nên xin đề xuất đề tài nghiên cứu “Xác định số cụm tối ưu vào toán phân khúc khách hàng sử dụng dịch vụ di động VNPT Tây Ninh” Do mục tiêu luận tìm hiểu thuật tốn phân cụm, phương pháp xác định số cụm tối ưu sau ứng dụng vào tốn phân khúc khách hàng sử dụng dịch vụ di động VNPT Tây Ninh Các nội dung cụ thể đề tài bao gồm - Nghiên cứu báo toán phân cụm - Nghiên cứu tài liệu thuật toán phân cụm: Kmeans, K-medoids - Nghiên cứu toán lựa chọn số cụm tối ưu: Elbow method, Average silhouette method; - Nghiên cứu báo, thuật toán phương pháp đánh giá số lượng cụm: Độ đo bóng (Silhouette), Độ đo Davies – Bouldin, Độ đo Dunn - Ứng dụng thuật toán vào tập liệu khách hàng sử dụng dịch vụ di động Vinaphone Tây Ninh, tiến hành đánh giá chọn phân khúc khách hàng tối ưu - Tổng kết kết nghiên cứu liên quan trước sau đánh giá hiệu phương pháp Tiến hành áp dụng thực tế để kiểm tra đánh giá kết Luận văn trình bày thành chương: Chương Tổng quan: Giới thiệu Bài toán phân khúc khách hàng dựa hành vi sử dụng dịch vụ di động Xác định mục tiêu, nội dung phương pháp nghiên cứu đề tài Chương 2: Cơ sở lý luận Chương giới thiệu kiến thức nội dung, khái niệm khám phá tri thức KPDL Đây kiến thức tảng để phục vụ cho việc tìm hiểu xây dựng hệ thống KPDL Chương 3: Áp dụng thuật toán xác định số cụm tối ưu vào toán phân khúc khách hàng sử dụng dịch vụ di động VNPT Tây Ninh Trong chương tiến hành thu thập liệu mơ tả liệu liên quan đến tình hình sử dụng dịch vụ di động khách hàng Chương 4: Kết luận khuyến nghị: Đánh giá kết đạt hướng phát triển đề tài Chương TỔNG QUAN 1.1 Bài toán phân khúc khách hàng dựa hành vi sử dụng dịch vụ di động VNPT Tập đồn Bưu Viễn thơng hàng đầu Việt Nam thành lập vào năm 1996, Công ty Dịch vụ Viễn thông công ty trực thuộc Tập đồn Bưu Viễn thơng Việt Nam (VNPT) hoạt động lĩnh vực thông tin di động, cung cấp dịch vụ GSM, 3G, 4G, nhắn tin, có tên cho mảng dịch vụ di động Vinaphone Kể từ Viettel bắt đầu tham gia cung cấp dịch vụ thơng tin di động vào năm 2004 bùng nổ thị trường thông tin di động Việt Nam bắt đầu diễn Kết việc cạnh tranh nhà mạng giúp cho Việt Nam trở thành nước có mức cước thuộc hàng rẻ giới, mạng lại lợi ích cho người tiêu dùng Để giữ chân khách hàng, doanh nghiệp viễn thơng cần phải nhanh chóng ứng dụng giải pháp mới, khai phá liệu tập hành vi sử dụng dịch vụ di động khách hàng để hoạch định rõ chiến lược kinh doanh khác tập khách hàng Một cơng cụ sử dụng phân khúc khách hàng Và “Phân khúc khách hàng” coi cơng cụ marketing mang tính “khác biệt” Nó cho phép tổ chức hiểu khách hàng xây dựng chiến lược marketing, sales “khác biệt” theo đặc điểm, tính chất, hành vi khách hàng Ngành viễn thơng khơng có đủ thơng tin khách hàng cá nhân hay liệu nhân học dồi Vì thế, luận văn tập trung vào phân khúc theo vi sử dụng dịch vụ, phân khúc theo giá trị lần sử dụng dịch vụ khách hàng Để có kết phân khúc khách hàng nhanh xác việc ứng dụng công nghệ mới, đặc biệt khai phá liệu phương án tối ưu Trong phân cụm liệu phương pháp để phân khúc khách hàng nhanh mạnh mẽ Vì thế, luận văn sử dụng thuật toán phân cụm để tiến hành phân khúc khách hàng Song song với đó, việc tìm số lượng cụm tối ưu vấn đề quan trọng Vì vậy, luận văn trình bày ứng dụng thuật toán xác định số cụm tối ưu vào toán phân khúc khách hàng 1.2 Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu: - Tập liệu khách hàng sử dụng dịch vụ di động, - Các toán phân cụm - Các toán xác định số cụm tối ưu Phạm vi nghiên cứu: - Đề tài thực phạm vi tập liệu khách hàng sử dụng dịch vụ di động Vinaphone Tây Ninh - Các giải thuật phân cụm khai phá liệu - Các thuật toán xác định số cụm tối ưu 1.3 Phương pháp nghiên cứu Nghiên cứu tài liệu, ứng dụng mơ hình lý thuyết chứng minh thực nghiệm: - Nghiên cứu báo toán phân cụm - Nghiên cứu tài liệu thuật toán phân cụm: Kmeans[3], K-medoids[4] - Nghiên cứu toán lựa chọn số cụm tối ưu: Elbow method[5], Average silhouette method; - Nghiên cứu học thuật, báo, luận văn phương pháp đánh giá số lượng cụm: Độ đo bóng (Silhouette), Độ đo Davies – Bouldin, Độ đo Dunn - Ứng dụng thuật toán vào tập liệu khách hàng sử dụng dịch vụ di động Vinaphone Tây Ninh, tiến hành đánh giá chọn phân khúc khách hàng tối ưu Tổng kết kết nghiên cứu liên quan trước đánh giá hiệu phương pháp Tiến hành thực nghiệm để kiểm tra đánh giá kết Chương 2: CƠ SỞ LÝ LUẬN 2.1 Tổng quan khai phá liệu Trong hai thập kỷ qua, số lượng liệu lưu trữ CSDL số lượng ứng dụng CSDL lĩnh vực kinh doanh khoa học tăng lên nhiều lần Sự bùng nổ số lượng liệu lưu trữ nhờ thành cơng mơ hình liệu quan hệ với phát triển hồn thiện cơng cụ truy xuất thao tác liệu Dữ liệu lưu trữ CSDL phần nhỏ 'tảng băng thông tin' Ẩn chứa liệu kiến thức số khía cạnh hoạt động kinh doanh họ chờ khai thác sử dụng để hỗ trợ định kinh doanh hiệu Việc trích xuất kiến thức từ tập liệu lớn gọi Khai phá liệu Khám phá tri thức Cơ sở liệu định nghĩa việc trích xuất thơng tin tiềm ẩn, chưa biết trước hữu ích từ liệu Những thuật ngữ dùng có ý nghĩa với KPDL Knowledge extraction (chắt lọc tri thức),data dredging (nạo vét liệu), data/pattern analysis (phân tích liệu/mẫu), Knowledge Mining (khai phá tri thức), data archaeology (khảo cổ liệu), … 2.2 Quá trình khám phá tri thức, khai phá liệu 2.2.1 Khám phá tri thức[6] Quá trình khám phá tri thức, gồm bước: Bước Phát triển hiểu ứng dụng Bước Lựa chọn liệu mục tiêu Bước Làm tiền xử lý liệu Bước Giảm chiếu liệu Bước Lựa chọn thuật toán khai thác liệu Bước Khai phá liệu(Data mining) Bước Đánh giá biểu diễn tri thức KPTT phải xây dựng dựa giải thuật mới, định hướng theo nhu cầu doanh nghiệp để giải tốn kinh doanh cho doanh nghiệp Một số kỹ thuật nghiên cứu sử dụng để KPDL như: phân lớp liệu, phân cụm liệu, định… 2.2.2 Quá trình khai phá liệu KPDL bước quan trọng q trình KPTT Cơng việc giai đoạn thực áp dụng kỹ thuật khai phá, sau trích chọn mẫu thông tin(pattern), mối liên hệ với liệu Và giai đoạn qui trình để tìm thông tin - Mô tả liệu cơng việc tóm tắt văn biểu diễn cách trực quan dễ hiểu đặc điểm chung thuộc tính liệu mà người dễ dàng hiểu - Dự đoán dựa kiện có để từ ta đốn quy luật từ mối liên hệ thuộc tính liệu, ta rút pattern(mẫu) Dự đoán giá trị mà ta chưa biết giá trị khứ giá trị tương lai liệu Quá trình KPDL gồm bước: - Bước 1: Xác định nhiệm vụ - Bước 2: Xác định liệu, kiện liên quan - Bước 3: Thu thập tiền xử lý liệu - Bước 4: Tiến hành khai phá thuật tốn KPDL 2.2 Q trình khám phá tri thức, khai phá liệu Nếu theo quan điểm học máy (Machine Learning), kỹ thuật khai phá liệu, bao gồm: - Học có giám sát (Supervised learning): nhóm thuật tốn sử dụng liệu gán nhãn nhằm mơ hình hóa mối quan hệ biến đầu vào (x) biến đầu (y) Hai nhóm tốn học có giám sát classification (phân loại) regression (hồi quy) - Học khơng có giám sát (Unsupervised learning): nhóm thuật tốn sử dụng liệu khơng có nhãn Các thuật tốn theo cách tiếp cận hướng đến việc mơ hình hóa cấu trúc hay thông tin ẩn liệu - Học nửa giám sát (Semi - Supervised learning): Học nửa giám sát cách tiếp cận học máy kết hợp lượng nhỏ liệu gắn nhãn với lượng lớn liệu khơng gắn nhãn q trình đào tạo Nếu vào lớp toán cần giải quyết, khai phá liệu bao gồm kỹ thuật áp dụng sau: - Phân lớp dự đoán (classification and prediction): Phân lớp xác định danh mục nhãn tập liệu huấn luyện Trong Phân lớp, liệu chưa gắn nhãn cung cấp cho mơ hình, tìm nhãn cho liệu đó, mục tiêu toán - Luật kết hợp (association rules): thủ tục nhằm tìm kiếm mẫu, mối tương quan, liên kết cấu trúc nguyên nhân - kết từ tập liệu loại sở liệu khác sở liệu quan hệ, sở liệu giao dịch dạng liệu khác - Phân cụm (clustering/ segmentation): Phân cụm Thuật toán dựa Học máy khơng giám sát bao gồm nhóm điểm liệu thành cụm để đối 18 - Ngồi ta đánh giá việc phân cụm cách so sánh với kết phân cụm khác sinh thuật toán với giá trị tham số đầu vào khác 2.8.3 Các độ đo đánh giá kết qua phân cụm a Độ đo Silhouette Chỉ số Silhouette Index số đánh giá kết phân cụm phổ biến sử dụng nhiều Phân tích số Silhouette mục đích để đo lường mức độ tối ưu quan sát, điểm liệu phân vào cluster Độ đo hình bóng tính với cơng thức sau: �(�) = �(�) − �(�) ���{�(�), �(�)} Trong đó: a(i) khoảng cách từ điểm i cụm A đến điểm trung tâm cụm A b(i) khoảng cách từ điểm i cụm A đến điểm trung tâm cụm B Cụm tương ứng với b(i) gọi cụm hàng xóm i Khi đó: => s(i) nằm đoạn [-1,1] s(i) gần node i phù hợp với cụm mà phân vào s(i) = khơng thể xác định i nên thuộc cụm cụm cụm hàng xóm s(i) gần -1 chứng tỏ i bị phân sai cụm, nên thuộc cụm hàng xóm khơng phải cụm b Độ đo Davies – Bouldin Để tính số DB, phải đo lường mức độ phân tán tương đồng cụm Độ đo Davies-Bouldin tính theo cơng thức: 19 � �� = � � �=� ����≠� ( �� + �� ) �(�� , �� ) n: số cụm �� : trọng tâm cụm x �� : trung bình khoảng cách tất phần tử cụm x tới trọng tâm �(�� , �� ): khoảng cách hai trọng tâm cụm i j => Giá trị DB nhỏ chất lượng phân cụm tốt c Độ đo Dunn Độ đo Dunn, phương pháp đánh giá cluster phổ biến khác sử dụng thông tin bên tập liệu Độ đo Dunn phương pháp đơn giản Cách đánh giá dựa việc so sánh kích thước (size) cluster với khoảng cách cluster với Các cụm xa nhau, so với kích thước chúng, số lớn kết phân cụm xác Độ đo Dunn tính theo công thức: �(�, �) � = ����≤�≤� ����≤�≤�,�≠� ����≤�≤� �'(�) d(i, j) khoảng cách hai cụm i j, thường tính khoảng cách hai tâm cụm i j d’(k) khoảng cách trung bình bên cụm k n số cụm 20 Chương 3: ÁP DỤNG CÁC THUẬT TOÁN XÁC ĐỊNH SỐ CỤM TỐI ƯU VÀO BÀI TOÁN PHÂN KHÚC KHÁCH HÀNG SỬ DỤNG DỊCH VỤ DI ĐỘNG TẠI VNPT TÂY NINH 3.1 Giới thiệu Để giải toán yêu cầu, xây dựng mã nguồn code với đặc điểm sau: - CSDL: file csv trích xuất từ liệu khách hàng - Ngơn ngữ lập trình: Python Các phần mềm hỗ trợ: - Phần mềm Weka phiên 3.8.6 3.2 Các thử nghiệm - Thực phân cụm khách hàng thành cụm khác cho 19 chu kỳ giải thuật xác định số cụm tối ưu với phương pháp phân cụm k-means - Dùng phương pháp thực nghiệm để đánh giá tìm số cụm tối ưu So sánh giải thuật xác định cụm tối ưu tiêu chí khác 3.3 Thu thập liệu hành vi sử dụng dịch vụ di động khách hàng tháng gần Giai đoạn thu thập xử lý liệu ban đầu giai đoạn quan trọng quy trình khai phá liệu Dữ liệu hai thành phần phân lớp liệu Truy cập liệu thực việc trích xuất thu thập liệu cần thiết cho mơ hình phân cụm khách hàng Thông tin khách hàng cần thiết để phân cụm khách hàng gồm: quản lý liệu khách hàng thuê bao, chi tiết liệu sử dụng dịch vụ thuê bao, toán 21 khuyến mại thuê bao Từ liệu khác nhau, ta tiến hành phân cụm dựa tiêu chí chọn Dữ liệu thu thập sau lọc loại bỏ thơng tin khơng xác, khơng cần thiết gồm thơng tin: - Dữ liệu quản lý khách hàng: loại thuê bao, bưu cục thu, thời gian hoạt động - Dữ liệu toán: tiền phát sinh cho gọi, tiền phát sinh SMS, tiền phát sinh liệu di động, tiền phát sinh dịch vụ gia tăng khác, tổng tiền phát sinh từ tài khoản chính, tổng số tiền phát sinh, số tiền khuyến mãi, tổng tiền lại tài khoản 3.4 Mơ tả liệu thu thập Dữ liệu tổng hợp từ hệ thống thông tin doanh nghiệp, liệu cước phát sinh xử lý nhiễu số biện pháp nghiệp vụ đặc thù như: băm, trùng, chờm, chẻ, áp giá, tính tốn khuyến mãi, … Từ liệu tiến hành làm liệu cách loại bỏ dịng liệu có trường trống null, trường liệu xuất nhiều giá trị có ảnh hưởng đến q trình chạy mơ hình Loại bỏ số trường mang tính bảo mật người dùng: họ tên, địa chỉ, số điện thoại Tiến hành chuyển đổi kiểu liệu từ dạng chữ (chuỗi) sang dạng số cách mã hóa kí tự số Số dòng liệu: 709,820 dòng Số trường liệu: 14 Bảng 3.1: Mô tả trường liệu Tên trường Mô tả Kiểu ST liệu T Số điện thoại SUBSCRIB Ký tự ER_ID 22 PROVINCE _CODE_DD TOTAL_CA LL TOTAL_SM S TOTAL_DA TA TOTAL_VA S TOTAL_OT HER TOTAL_TK C TOTAL_CO RE_BALAN CE 10 TKC_CALL 11 TKC_SMS 12 TKC_DATA 13 TKC_VAS 14 MA_CSHT Mã tỉnh Ký tự Tổng chi phí thực gọi Tổng chi phí thực gửi tin nhắn SMS Tổng chi phí sử dụng liệu di động Tổng chi phí sử dụng DV Giá trị gia tăng Tổng chi phí khác Tổng chi phí sử dụng tài khoản Tổng tiền cịn lại Tổng tiền sử dụng để thực gọi Tổng tiền sử dụng để thực gửi tin SMS Tổng tiền sử dụng cho liệu di động Tổng tiền sử dụng DV Giá trị gia tăng Mã khách hàng tỉnh TKC TKC nhắn TKC TKC Số thực Số thực Số thực Số thực Số thực Số thực Số thực Số thực Số thực Số thực Số thực Ký tự 23 3.5.1 Kết qua xác định số cụm tối uu sử dụng Phuong pháp khủy tay(Elbow method) tập liệu Hình 3.2: Biêu đồ hiên thị kết qua xác định số cụm tối uu phuong pháp khủy tay Bảng 3.3: Kết xác định số cụm tối ưu sử dụng Phương pháp khủy tay ST T Tên trường Số dòng liệu Số cụm tối ưu với phương thức Elbow Thực phân cụm trường liệu TOTAL_CALL TOTAL_SMS TOTAL_DATA 709,820 709,820 709,820 3 24 TOTAL_VAS TOTAL_OTHER TOTAL_TKC TOTAL_CORE_BALANCE 709,820 709,820 709,820 709,820 3 Thực phân cụm kết hợp trường liệu 'TOTAL_CALL', 'TOTAL_SMS', 'TOTAL_DATA', 'TOTAL_VAS', 'TOTAL_OTHER' 'TOTAL_CALL', 'TOTAL_SMS', 'TOTAL_DATA' 709,820 709,820 3.5.2 Kết qua xác định số cụm tối uu sử dụng phuong pháp điêm hình bóng(Silhouette Score) tập liệu Bảng 3.4: Kết xác định số cụm tối ưu sử dụng Phương pháp điểm hình bóng(Silhouette Score) ST T Số cụm tối ưu với phương thức Số dịng Tên trường điểm hình liệu bóng(Silhouette Score) Thực phân cụm trường liệu TOTAL_CALL 709,820 TOTAL_SMS 709,820 TOTAL_DATA 709,820 19 TOTAL_VAS 709,820 TOTAL_OTHER 709,820 TOTAL_TKC 709,820 TOTAL_CORE_BALANC E 709,820 Thực phân cụm kết hợp trường liệu 'TOTAL_CALL', 709,820 'TOTAL_SMS', 25 'TOTAL_DATA', 'TOTAL_VAS', 'TOTAL_OTHER' 'TOTAL_CALL', 'TOTAL_SMS', 'TOTAL_DATA' 709,820 3.5.3 So sánh kết qua lựa chọn cụm tối uu hai phuong pháp Khủy tay phuong pháp tính điêm Silhouette Số cụm tối ưu Số cụm tối ưu S với cách tính với phương T Tên trường điểm thức Khủy T Silhouette(độ tay đo Euclidean) Thực phân cụm trường liệu TOTAL_CALL 3 TOTAL_SMS 3 TOTAL_DATA 19 TOTAL_VAS 3 TOTAL_OTHER TOTAL_TKC TOTAL_CORE_B ALANCE 3 Thực phân cụm kết hợp trường liệu 'TOTAL_CALL', 'TOTAL_SMS', 11 'TOTAL_DATA', 'TOTAL_VAS', 'TOTAL_OTHER' 'TOTAL_CALL', 12 'TOTAL_SMS', 'TOTAL_DATA' 3.5.4 Tiến hành phân cụm vơi số luợng cụm tối uu thu thập đuợc vơi áp dụng thuật toán K-Means++ đê khởi tạo tâm cụm phân cụm 26 a Phân cụm với thuộc tính TOTAL_CALL Số lượng cụm: Thuật toán: K-Means++ Bảng 3.6: Phân khúc với thuộc tính TOTAL_CALL(đơn vị tính: VNĐ) Thuộc tính TKC_CALL Phân khúc (628,717 thuê bao) 16,338 +/-20,127 Phân khúc (5,972 thuê bao) 509,455 +/-247,249 Phân khúc (75,132 thuê bao) 137,184 +/-56,841 b Phân cụm với thuộc tính TOTAL_SMS Số lượng cụm: Thuật tốn: K-Means++ Bảng 3.7: Phân khúc với thuộc tính TOTAL_SMS(đơn vị tính: VNĐ) Thuộc tính TKC_SMS Phân khúc (700,563 thuê bao) 1,370 +/-40,96 Phân khúc (8,110 thuê bao) 82,328 +/-38,833 Phân khúc (1,148 thuê bao) 318,333 +/-146,213 c Phân cụm với thuộc tính TOTAL_DATA Số lượng cụm: Thuật tốn: K-Means++ Bảng 3.8: Phân khúc với thuộc tính TOTAL_DATA(đơn vị tính: VNĐ) Thuộc tính TKC_DATA Phân khúc (566,482 thuê bao) 2,186 +/-6,873 Phân khúc (10,864 thuê bao) 255,210 +/-97,347 Phân khúc (132,475 thuê bao) 78,312 +/-26,979 27 d Phân cụm với thuộc tính TOTAL_CALL, TOTAL_SMS, TOTAL_DATA Số lượng cụm: Thuật toán: K-Means++ Bảng 3.9: Phân khúc với thuộc tính TOTAL_CALL, TOTAL_SMS, TOTAL_DATA(đơn vị tính: VNĐ) Thuộc tính TKC_CALL TKC_SMS TKC_DATA Phân khúc (522,646 thuê bao) 13,502 +/-19,165 999 +/-5,472 3,757 +/-10,649 Phân khúc (5,342 thuê bao) 527,403 +/255,232 29,186 +/-86,251 36,150 +/-67,776 Phân khúc (119,915 thuê bao) 43,151 +/-44,015 Phân khúc (61,918 thuê bao) 138,455 +/-61,024 4,438 +/-16,817 99,466 +/-61,396 12,635 +/-43,003 4,864 +/-13,237 Số lượng cụm: Thuật toán: K-Means++ Bảng 3.9: Phân khúc với thuộc tính TOTAL_CALL, TOTAL_SMS, TOTAL_DATA(đơn vị tính: VNĐ) Thu ộc tính TKC _CA LL TKC _SM S Phân khúc (501,45 thuê bao) 13,134 +/18,710 1,040 +/-5693 Phân khúc (5,342 thuê bao) 520,751 +/256,049 15,511 +/32,203 Phân khúc (5,310 thuê bao) 68,430 +/91,888 6,832 +/21,316 Phân khúc (128,98 thuê bao) 37,995 +/38,002 3,264 +/8,698 Phân khúc (2,251 thuê bao) 112,624 +/126,998 236,618 +/133,043 Phân khúc (60,591 thuê bao) 137,763 +/58,788 5,919 +/14533 28 TKC _DA TA 2,148 +/-6,802 28,905 +/49,872 251,469 +/97,285 77,965 +/26,480 24,502 +/47,550 3,593 +/10,771 3.6 Đánh giá kết qua phân khúc khách hàng Theo kết đạt chương ta rút số kết sau: + Ở tất trường hợp phân khúc trên, lượng khách hàng khơng sử dụng sử dụng dịch vụ có phát sinh chi phí chiếm tỉ lệ cao nhất(>70%) Chi phí phát sinh hàng tháng nhóm

Ngày đăng: 07/08/2023, 07:45

w