1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây Ninh

25 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Nghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây Ninh

Trang 1

-

Nguyễn Trọng Thảo

NGHIÊN CỨU XÂY DỰNG MÔ HÌNH ENSEMBLE LEARNING ĐỂ DỰ BÁO KHÁCH HÀNG RỜI

MẠNG TẠI VNPT TÂY NINH

Chuyên ngành: Hệ Thống thông tin

Mã số: 8.48.01.04

TÓM TẮT ĐỀ ÁN TỐT NGHIỆP THẠC SĨ

THÀNH PHỐ HỒ CHÍ MINH – NĂM 2024

Trang 2

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Người hướng dẫn khoa học: TS Huỳnh Trọng Thưa

Phản biện 1: ………

Phản biện 2: ………

Đề án tốt nghiệp sẽ được bảo vệ trước Hội đồng chấm đề án tốt nghiệp thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông

Vào lúc: giờ ngày tháng năm

Có thể tìm hiểu đề án tốt nghiệp tại:

- Thư viện của Học viện Công nghệ Bưu chính Viễn thông

Trang 3

MỞ ĐẦU

Nghiên cứu này tập trung vào ứng dụng Mô hình học kết hợp để dự báo hành vi rời mạng của khách hàng tại VNPT Tây Ninh trong bối cảnh cạnh tranh gay gắt và sự chuyển đổi số của ngành viễn thông Việc này nhằm tăng cường hiệu quả và chính xác trong dự báo so với phương pháp thủ công truyền thống, giúp doanh nghiệp duy trì và giữ chân khách hàng một cách hiệu quả hơn

Chương 1: Tổng quan đề tài

Chương 2: Các công trình liên quan Chương 3: Tập dữ liệu nghiên cứu

Chương 4: Mô hình học và kết hợp đề xuất Chương 5: Xây dựng ứng dụng dự báo khách hàng rời mạng với tập dữ liệu ở VNPT Tây Ninh

Trang 4

CHƯƠNG 1: TỔNG QUAN ĐỀ TÀI 1.1 Tổng quan về mạng viễn thông và thuê bao

Mạng viễn thông là hệ thống kết nối điện tử cho phép trao đổi dữ liệu giữa nhiều người dùng thông qua các công tắc và kênh truyền thông Việt Nam có một ngành viễn thông phát triển nhanh chóng, với các công ty lớn như Viettel, Mobifone, VNPT, FPT, SPT và HanoiTelecom Sự phổ biến của mạng viễn thông ở Việt Nam được thể hiện qua số lượng lớn thuê bao di động, internet và truyền hình Các công ty này không chỉ cung cấp dịch vụ đa dạng mà còn đóng góp vào nâng cao chất lượng cuộc sống và phát triển kinh tế, giáo dục và y tế của đất nước Mặc dù thị trường có dấu hiệu bão hòa và lợi nhuận giảm, nhưng vẫn tồn tại tiềm năng đầu tư từ doanh nghiệp trong và ngoài nước

1.2 Tổng quan về hiện trạng thuê bao rời mạng viễn thông

VNPT, một trong những "gã khổng lồ" trong ngành viễn thông tại Việt Nam, đối mặt với thách thức từ việc mất khách hàng do cạnh tranh gay gắt và chi phí đầu tư lớn để thu hút khách hàng mới

Trang 5

Hình 1.1: Tỉ trọng số lượng thuê bao chuyển mạng giữa các nhà mạng tháng 10 năm 2022, nguồn Bộ TT & TT [3]

Hình 1.2: Số lượng thuê bao chuyển mạng giữa các nhà mạng tháng 11 năm 2022, nguồn Bộ TT & TT

Hình 1.3: Số lượng thuê bao từ chối chuyển mạng giữa các nhà mạng tháng 11 năm 2022, nguồn Bộ TT & TT

Trang 6

1.3 Tổng quan dữ liệu lớn về khách hàng mạng viễn thông

Với sự tăng trưởng ấn tượng trong số lượng người dùng smartphone và thương mại điện tử, cùng với dự đoán về số lượng thuê bao 5G tăng cao, ngành viễn thông ở Việt Nam đang trải qua giai đoạn phát triển đáng kể và đầy triển vọng

1.4 Tổng quan về mô hình dự báo học kết hợp

Stacking là một phương pháp trong học máy giúp cải thiện chất lượng dự đoán bằng cách kết hợp dự báo từ nhiều mô hình cơ sở thông qua hai cấp: các mô hình cơ sở và một mô hình "meta", từ đó tối ưu hóa việc tổng hợp thông tin và tăng độ chính xác của dự đoán

Hình 1.4: Mô hình học kết hợp [7]

Trang 7

CHƯƠNG 2: CÁC CÔNG TRÌNH LIÊN QUAN

2.1 Các công trình liên quan trên thế giới

Theo các nghiên cứu của Liu và Chen, học sâu được áp dụng thành công trong dự báo lưu lượng hành khách và đo lường trải nghiệm người dùng trên mạng viễn thông, mang lại kết quả ấn tượng

Nghiên cứu của nhiều tác giả đã đề xuất các phương pháp dự báo và dự đoán trong lĩnh vực viễn thông, bao gồm mô hình MLP cho thông lượng dữ liệu di động, hệ thống dự báo tỷ lệ rời bỏ khách hàng sử dụng các kỹ thuật học máy, khung tính toán hiệu quả cho dự báo phụ tải ngắn hạn và mô hình STC-N để cải thiện dự đoán lưu lượng di động 5G/B5G, mang lại những kết quả đáng chú ý

2.2 Các công trình liên quan ở Việt Nam

Nghiên cứu của Dương Thị Hòa Bình và Quang Hung Do, cùng với nhóm tác giả Vũ Văn Hiệu, đều tập trung vào áp dụng mô hình học sâu và kỹ thuật học kết hợp vào dự báo trong các lĩnh vực như xu hướng giá chứng khoán và lưu lượng dữ liệu trong mạng viễn thông, mang lại kết quả hiệu quả và phù hợp cho các bài toán thực tế

Trang 8

CHƯƠNG 3: TẬP DỮ LIỆU NGHIÊN CỨU

3.1 Giới thiệu về tập dữ liệu khách hàng rời mạng viễn thông

Bộ dữ liệu thu thập được là thông tin thuê bao mạng có cáp quang của VNPT tỉnh Tây Ninh từ 2010 đến 2023 Bộ dữ liệu bao gồm 114.177 quan sát với 29 trường dữ liệu

3.2 Phân tích tập dữ liệu khách hàng rời mạng viễn thông

Phân bố ngành nghề kinh doanh của khách hàng viễn thông, với các ngành chủ đạo như khai khoáng và xăng dầu chiếm tỷ lệ lớn Phần lớn khách hàng không phải là doanh nghiệp, gợi ý về việc dịch vụ viễn thông chủ yếu được sử dụng bởi cá nhân và hộ gia đình Công ty tập trung vào thu hút và giữ chân khách hàng mới hơn là chuyển đổi từ các đối thủ cạnh tranh Khách hàng có doanh thu thấp, ngụ ý về cần phát triển chiến lược để thu hút khách hàng có doanh thu cao hơn Thể hiện sự đa dạng trong cách thanh toán và trạng thái thuê bao, với hầu hết khách hàng duy trì hoạt động bình thường Sự phân chia gần đều giữa việc sử dụng và không sử dụng dịch vụ tích hợp, đề xuất một đa dạng trong nhu cầu và ưu tiên của khách hàng

Hình 3 5: Phân bố giá cước trong tập dữ liệu

Trang 9

Hình 3 6: Phân bố tuổi của thuê bao (tháng) trong tập dữ liệu

Hình 3 7: Phân bố số dịch vụ khác trong tập dữ liệu

Hình 3 8: Phân bố nợ cước 2 tháng trong tập dữ liệu

Trang 10

3.3 Tiền xử lý tập dữ liệu khách hàng rời mạng viễn thông

Để tiền xử lý dữ liệu trong tập dữ liệu khách hàng rời mạng viễn thông, chúng ta sẽ thực hiện các bước sau:

- Loại bỏ các ngoại lệ (outliers) - Tạo ra giá trị giả (dummies) - In danh sách cột phân loại và số Ta sẽ thu được bộ dữ liệu mới

Để xử lý các ngoại lệ trong tập dữ liệu khách hàng rời mạng viễn thông và điền giá trị thiếu vào chúng, chúng ta có thể sử dụng phương pháp MICE (Multiple Imputation by Chained Equations) Quá trình bao gồm xác định và thay thế các giá trị ngoại lệ bằng np.nan, sau đó sử dụng gói MICE trong Python để điền các giá trị thiếu dựa trên các mô hình hồi quy riêng biệt cho mỗi biến Cuối cùng, các tập dữ liệu hoàn chỉnh được kết hợp để sử dụng cho phân tích và mô hình hóa

Hình 3 12: Ma trận tương quan các tham số của bộ dữ liệu sau xử lý

Trang 11

Hình 3 13: Ma trận Scatter các tham số của bộ dữ liệu sau xử lý

Quá trình này giúp ta hiểu rõ hơn về mối quan hệ giữa các biến trong tập dữ liệu sau khi đã tiền xử lý và chuẩn bị cho các bước phân tích và mô hình hóa tiếp theo.

Trang 12

CHƯƠNG 4: MƠ HÌNH HỌC KẾT HỢP ĐỀ XUẤT

4.1 Mơi trường mơ phỏng thực nghiệm

Đề án sử dụng Google Colaboratory, Python và SKLearn để xây dựng các mơ hình Ensemble Learning Quá trình bao gồm chia dữ liệu thành tập train và test, huấn luyện mơ hình học máy, và đánh giá hiệu suất của mơ hình trên các chỉ số như Training Score, Test Score, Accuracy, Precision Score, Recall Score, và F1 Score Quá trình này giúp hiểu rõ về khả năng dự đốn của mơ hình và tối ưu hĩa mơ hình tổng quát

4.2 Thực nghiệm huấn luyện mơ hình học kết hợp

Bài nghiên cứu này xây dựng một mơ hình học kết hợp bằng cách phát triển từ các mơ hình cơ bản đến các mơ hình phức tạp Các nhĩm mơ hình bao gồm mơ hình Baseline, Logistic Regression, kNN, Nạve Bayes, Decision Tree Classifier, Bagging, AdaBoost, Gradient Boosting, và Random Forest Classifier Mục tiêu là xác định một mơ hình học kết hợp hiệu quả nhất cho bài tốn phân loại khách hàng rời mạng viễn thơng

4.2.1 Mơ hình Baseline

Hình 4 1: Cấu hình mơ hình Baseline

Trang 13

Mơ hình Dummies Baseline cĩ hiệu suất tốt nhưng khơng dự đốn được trạng thái "thanh lý" do mất cân bằng dữ liệu, cần cải thiện để áp dụng trong thực tế

4.2.2 Nhĩm mơ hình Logistic Regression, kNN và Nạve Bayes

Hình 4 2: Cấu hình mơ hình Logistic Regression thơng thường

Mơ hình Logistic Regression và Dummies Baseline đều cĩ hiệu suất cao nhưng cần cải thiện đối với trạng thái "thanh lý", phản ánh sự mất cân bằng trong dữ liệu

Hình 4 3: Cấu hình mơ hình Logistic Regression hiệu chỉnh tham số

Mơ hình Logistic Regression sau khi được điều chỉnh tham số vẫn cĩ hiệu suất kém đối với trạng thái "thanh lý" và cần được cải thiện để đạt được hiệu suất cân bằng hơn

Hình 4 4: Cấu hình mơ hình k-Nearest Neighbor Classifier thơng thường

Trang 14

Mô hình k-Nearest Neighbor Classifier có hiệu suất khá tốt đối với trạng thái "thanh lý", nhưng cần được cải thiện để đạt được hiệu suất cân bằng hơn đối với cả hai trạng thái

Hình 4 5: Error Rate vs K-Value theo UNIFORM của mô hình kNN thông thường

Hình 4 6: Error Rate vs K Value theo DISTANCE của mô hình kNN thông thường

Trang 15

Hình 4 7: Cấu hình mô hình k-Nearest Neighbor Classifier

có hiệu chỉnh tham số

Mô hình k-Nearest Neighbor Classifier sau khi được hiệu chỉnh tham số vẫn giữ nguyên hiệu suất tương tự và không có sự cải thiện đáng kể so với phiên bản không được hiệu chỉnh

Hình 4 8: Cấu hình mô hình Naive Bayes Classifier

Hình 4 9: Cấu hình mô hình Naive Bayes kết hợp Oversampling

Hình 4 10: Cấu hình mô hình Logistic Regression

kết hợp Oversampling

Trang 16

Mô hình Logistic Regression kết hợp Oversampling và có hiệu chỉnh tham số đã cải thiện đáng kể hiệu suất dự đoán đối với cả trạng thái "thanh lý" và "chưa thanh lý", nhưng vẫn cần được tiếp tục cải thiện để đạt được hiệu suất tốt nhất

4.2.3 Mô hình học kết hợp Decision Tree Classifier

Mô hình Decision Tree Classifier, được cấu hình như sau:

Hình 4 11: Cấu hình mô hình Decision Tree Classifier

Mô hình Decision Tree Classifier có độ chính xác cao và khả năng dự đoán tốt cả hai trạng thái "thanh lý" và "chưa thanh lý", cho thấy hiệu suất tốt trong việc dự đoán việc rời mạng

Hình 4 12: Cấu hình mô hình Decision Tree hiệu chỉnh chiều cao

Mô hình Decision Tree Classifier sau khi giảm chiều cao đã cải thiện đáng kể về độ chính xác và hiệu suất dự đoán trạng thái "thanh lý" và "chưa thanh lý", cho thấy khả năng dự đoán tốt trong việc phân loại khách hàng rời mạng

Trang 17

Hình 4 13: Mô hình Decision Tree sau khi giảm chiều cao4.2.4 Mô hình học kết hợp Bagging, AdaBoost và GB

Hình 4 14: Cấu hình mô hình Bagging Classifier

Mô hình Bagging Classifier có hiệu suất tốt và khả năng dự đoán chính xác cao đối với cả trạng thái "thanh lý" và "chưa thanh lý", đồng thời giữ nguyên độ chính xác ở mức cao khi so sánh với mô hình Decision Tree Classifier sau khi giảm chiều cao

Hình 4 15: Cấu hình mô hình AdaBoost Classifier

Trang 18

Hình 4 16: Cấu hình mô hình Gradient Boosting Classifier

Hình 4 17: Cấu hình mô hình AdaBoost kết hợp Oversampling

Mặc dù mô hình AdaBoost kết hợp Oversampling có cải thiện về Precision và Recall, nhưng cần cân nhắc thêm về độ chính xác và khả năng tổng quát hóa của mô hình

4.2.5 Mô hình học kết hợp Random Forest Classifier

Hình 4 18: Cấu hình mô hình Random Forest Classifier

Mô hình Random Forest Classifier có hiệu suất tốt trong việc dự đoán việc rời mạng, nhưng cần được cân nhắc và tinh chỉnh để cải thiện Precision và Recall cho cả hai trạng thái

Hình 4 19: Cấu hình mô hình Random Forest có hiệu chỉnh tham số

Mô hình Random Forest Classifier sau khi được hiệu chỉnh vẫn giữ độ chính xác cao nhưng cần cải thiện đáng kể

Trang 19

Precision và Recall cho cả hai trạng thái để trở nên hữu ích trong thực tế

Hình 4 20: Cấu hình mô hình Random Forest kết hợp oversample

Mô hình Random Forest kết hợp oversampling cải thiện Precision và Recall, nhưng vẫn cần xem xét thêm về độ chính xác và khả năng tổng quát hóa

Hình 4 21: Cấu hình mô hình Random Forest kết hợp oversample và giảm chiều cao

Mô hình Random Forest kết hợp oversample và giảm chiều cao thể hiện sự giảm đáng kể về độ chính xác và hiệu suất so với mô hình Random Forest kết hợp oversample, cần xem xét lại tinh chỉnh tham số hoặc kỹ thuật khác để cải thiện hiệu suất

Trang 20

Hình 4 22: Mô hình Random Forest sau khi giảm chiều cao kết hợp với Oversampling

4.3 Đánh giá kết quả huấn luyện mô hình học kết hợp

4.3.1 Kết quả các mô hình học kết hợp

Hình 4 23: Ma trận Heatmap thể hiện các chỉ số của mô hình kết hợp

Cả Bagging, AdaBoost và Gradient Boosting Classifier đều đạt hiệu suất cao với độ chính xác tốt và khả năng dự đoán đáng tin cậy cho cả hai trạng thái, tuy nhiên việc lựa chọn mô hình học kết hợp cần dựa trên yêu cầu cụ thể của bài toán và được đánh giá kỹ lưỡng

Trang 21

4.3.2 So sánh với kết quả Telco Customer Churn

Cả hai cách tiếp cận đều mang lại sự đa dạng trong cấu trúc dữ liệu và mô hình, tuy nhiên, cách tiếp cận 2 có một lợi thế lớn hơn với số lượng dữ liệu lớn hơn và việc sử dụng một loạt các metrics đa dạng để đánh giá hiệu suất mô hình, giúp cung cấp cái nhìn tổng thể và chi tiết hơn về hiệu suất và tính đa dạng của mô hình

4.4 Mô hình học kết hợp đề xuất Meta-Model

Hình 4 31: Xây dựng mô hình kết hợp Meta-Model đề xuất

Hình 4 32: Mô hình kết hợp Meta-Model đề xuất

Đề án đề xuất xây dựng mô hình học kết hợp meta dựa trên 04 nhóm mô hình khác nhau để tối ưu hóa hiệu suất phân loại khách hàng dựa trên doanh thu, bằng cách sử

Trang 22

dụng majority voting và điều chỉnh siêu tham số để đảm bảo tính tổng quát và hiệu suất của mô hình

Trang 23

CHƯƠNG 5: XÂY DỰNG ỨNG DỤNG DỰ BÁO KHÁCH HÀNG RỜI MẠNG VỚI TẬP DỮ LIỆU Ở VNPT TÂY NINH

5.1 Thiết kế và phát triển ứng dụng

VNPT Churn Predictor là ứng dụng dự báo và phân tích khách hàng rời mạng dựa trên các mô hình học máy, giúp VNPT nhận biết sớm khách hàng có nguy cơ rời mạng và tối ưu hóa chiến lược giữ chân để giảm tỷ lệ mất mát khách hàng và tăng hiệu quả tiếp thị

Ứng dụng cung cấp tính năng dự báo, phân tích, gợi ý chiến lược giữ chân, và quản lý khách hàng, đồng thời hướng tới việc mở rộng tính năng và tối ưu hóa mô hình để nâng cao trải nghiệm khách hàng và tăng cường cạnh tranh trên thị trường

5.2 Phân tích tập dữ liệu khách hàng sử dụng dịch vụ viễn thông ở VNPT Tây Ninh

Tác giả trong đề án này có thể sử dụng Python và Scikit-learn để xử lý và phân tích dữ liệu, cùng với Flask để xây dựng API cho việc tích hợp mô hình dự báo vào ứng dụng web VNPT Churn Predictor

5.3 Minh họa các chức năng chính của ứng dụng

Trang 24

Hình 5 5: Màn hình thông tin chi tiết khách hàng

Hình 5 6: Màn hình thông tin chi tiết người dùng

Trang 25

KẾT LUẬN

1 Kết quả nghiên cứu của đề tài

Trong quá trình đánh giá mô hình, cần xem xét các thước đo như precision và recall để đánh giá hiệu suất phân loại trong trường hợp mất cân bằng dữ liệu Mô hình Ensemble như AdaBoost và Random Forest thường cho hiệu suất tốt hơn trên các tập dữ liệu đa dạng

2 Hạn chế đề tài

Dữ liệu không cân bằng và thiếu, cùng với giả định về phân phối và giới hạn của các mô hình, là những hạn chế quan trọng cần được xem xét và giải quyết trong đề tài về dự báo khách hàng rời mạng viễn thông

3 Vấn đề kiến nghị và hướng đi tiếp theo của nghiên cứu

Kiến nghị nghiên cứu tiếp theo bao gồm thu thập dữ liệu cân bằng, tối ưu hóa mô hình và phân tích đặc trưng quan trọng để cải thiện hiệu suất của mô hình dự đoán khách hàng rời mạng viễn thông

Nghiên cứu cũng cần tập trung vào phát triển các giải pháp và chiến lược giữ chân khách hàng để tăng cường sự

hài lòng và trung thành của họ

Ngày đăng: 01/07/2024, 08:59

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w