Nghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây NinhNghiên cứu xây dựng mô hình Ensemble Learning để dự báo khách hàng rời mạng tại VNPT Tây Ninh
Trang 1-
Nguyễn Trọng Thảo
NGHIÊN CỨU XÂY DỰNG MÔ HÌNH ENSEMBLE LEARNING ĐỂ DỰ BÁO KHÁCH HÀNG RỜI
MẠNG TẠI VNPT TÂY NINH
Chuyên ngành: Hệ Thống thông tin
Mã số: 8.48.01.04
TÓM TẮT ĐỀ ÁN TỐT NGHIỆP THẠC SĨ
THÀNH PHỐ HỒ CHÍ MINH – NĂM 2024
Trang 2HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: TS Huỳnh Trọng Thưa
Phản biện 1: ………
Phản biện 2: ………
Đề án tốt nghiệp sẽ được bảo vệ trước Hội đồng chấm đề án tốt nghiệp thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông
Vào lúc: giờ ngày tháng năm
Có thể tìm hiểu đề án tốt nghiệp tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
Trang 3MỞ ĐẦU
Nghiên cứu này tập trung vào ứng dụng Mô hình học kết hợp để dự báo hành vi rời mạng của khách hàng tại VNPT Tây Ninh trong bối cảnh cạnh tranh gay gắt và sự chuyển đổi số của ngành viễn thông Việc này nhằm tăng cường hiệu quả và chính xác trong dự báo so với phương pháp thủ công truyền thống, giúp doanh nghiệp duy trì và giữ chân khách hàng một cách hiệu quả hơn
Chương 1: Tổng quan đề tài
Chương 2: Các công trình liên quan
Chương 3: Tập dữ liệu nghiên cứu
Chương 4: Mô hình học và kết hợp đề xuất Chương 5: Xây dựng ứng dụng dự báo khách hàng rời mạng với tập dữ liệu ở VNPT Tây Ninh
Trang 4CHƯƠNG 1: TỔNG QUAN ĐỀ TÀI 1.1 Tổng quan về mạng viễn thông và thuê bao
Mạng viễn thông là hệ thống kết nối điện tử cho phép trao đổi dữ liệu giữa nhiều người dùng thông qua các công tắc và kênh truyền thông Việt Nam có một ngành viễn thông phát triển nhanh chóng, với các công ty lớn như Viettel, Mobifone, VNPT, FPT, SPT và HanoiTelecom Sự phổ biến của mạng viễn thông ở Việt Nam được thể hiện qua số lượng lớn thuê bao di động, internet và truyền hình Các công ty này không chỉ cung cấp dịch vụ đa dạng mà còn đóng góp vào nâng cao chất lượng cuộc sống và phát triển kinh tế, giáo dục và y tế của đất nước Mặc dù thị trường có dấu hiệu bão hòa và lợi nhuận giảm, nhưng vẫn tồn tại tiềm năng đầu tư từ doanh nghiệp trong và ngoài nước
1.2 Tổng quan về hiện trạng thuê bao rời mạng viễn thông
VNPT, một trong những "gã khổng lồ" trong ngành viễn thông tại Việt Nam, đối mặt với thách thức từ việc mất khách hàng do cạnh tranh gay gắt và chi phí đầu tư lớn để thu hút khách hàng mới
Trang 5Hình 1.1: Tỉ trọng số lượng thuê bao chuyển mạng giữa các nhà mạng tháng 10 năm 2022, nguồn Bộ TT & TT [3]
Hình 1.2: Số lượng thuê bao chuyển mạng giữa các nhà mạng tháng 11 năm 2022, nguồn Bộ TT & TT
Hình 1.3: Số lượng thuê bao từ chối chuyển mạng giữa các nhà mạng tháng 11 năm 2022, nguồn Bộ TT & TT
Trang 61.3 Tổng quan dữ liệu lớn về khách hàng mạng viễn thông
Với sự tăng trưởng ấn tượng trong số lượng người dùng smartphone và thương mại điện tử, cùng với dự đoán
về số lượng thuê bao 5G tăng cao, ngành viễn thông ở Việt Nam đang trải qua giai đoạn phát triển đáng kể và đầy triển vọng
1.4 Tổng quan về mô hình dự báo học kết hợp
Stacking là một phương pháp trong học máy giúp cải thiện chất lượng dự đoán bằng cách kết hợp dự báo từ nhiều
mô hình cơ sở thông qua hai cấp: các mô hình cơ sở và một
mô hình "meta", từ đó tối ưu hóa việc tổng hợp thông tin và tăng độ chính xác của dự đoán
Hình 1.4: Mô hình học kết hợp [7]
Trang 7CHƯƠNG 2: CÁC CÔNG TRÌNH LIÊN
QUAN
2.1 Các công trình liên quan trên thế giới
Theo các nghiên cứu của Liu và Chen, học sâu được
áp dụng thành công trong dự báo lưu lượng hành khách và
đo lường trải nghiệm người dùng trên mạng viễn thông, mang lại kết quả ấn tượng
Nghiên cứu của nhiều tác giả đã đề xuất các phương pháp dự báo và dự đoán trong lĩnh vực viễn thông, bao gồm
mô hình MLP cho thông lượng dữ liệu di động, hệ thống
dự báo tỷ lệ rời bỏ khách hàng sử dụng các kỹ thuật học máy, khung tính toán hiệu quả cho dự báo phụ tải ngắn hạn
và mô hình STC-N để cải thiện dự đoán lưu lượng di động 5G/B5G, mang lại những kết quả đáng chú ý
2.2 Các công trình liên quan ở Việt Nam
Nghiên cứu của Dương Thị Hòa Bình và Quang Hung Do, cùng với nhóm tác giả Vũ Văn Hiệu, đều tập trung vào áp dụng mô hình học sâu và kỹ thuật học kết hợp vào dự báo trong các lĩnh vực như xu hướng giá chứng khoán và lưu lượng dữ liệu trong mạng viễn thông, mang lại kết quả hiệu quả và phù hợp cho các bài toán thực tế
Trang 8CHƯƠNG 3: TẬP DỮ LIỆU NGHIÊN CỨU
3.1 Giới thiệu về tập dữ liệu khách hàng rời mạng viễn thông
Bộ dữ liệu thu thập được là thông tin thuê bao mạng
có cáp quang của VNPT tỉnh Tây Ninh từ 2010 đến 2023
Bộ dữ liệu bao gồm 114.177 quan sát với 29 trường dữ liệu
3.2 Phân tích tập dữ liệu khách hàng rời mạng viễn thông
Phân bố ngành nghề kinh doanh của khách hàng viễn thông, với các ngành chủ đạo như khai khoáng và xăng dầu chiếm tỷ lệ lớn Phần lớn khách hàng không phải là doanh nghiệp, gợi ý về việc dịch vụ viễn thông chủ yếu được sử dụng bởi cá nhân và hộ gia đình Công ty tập trung vào thu hút và giữ chân khách hàng mới hơn là chuyển đổi từ các đối thủ cạnh tranh Khách hàng có doanh thu thấp, ngụ ý về cần phát triển chiến lược để thu hút khách hàng có doanh thu cao hơn Thể hiện sự đa dạng trong cách thanh toán và trạng thái thuê bao, với hầu hết khách hàng duy trì hoạt động bình thường Sự phân chia gần đều giữa việc sử dụng
và không sử dụng dịch vụ tích hợp, đề xuất một đa dạng trong nhu cầu và ưu tiên của khách hàng
Hình 3 5: Phân bố giá cước trong tập dữ liệu
Trang 9Hình 3 6: Phân bố tuổi của thuê bao (tháng) trong tập dữ liệu
Hình 3 7: Phân bố số dịch vụ khác trong tập dữ liệu
Hình 3 8: Phân bố nợ cước 2 tháng trong tập dữ liệu
Trang 103.3 Tiền xử lý tập dữ liệu khách hàng rời mạng viễn thông
Để tiền xử lý dữ liệu trong tập dữ liệu khách hàng rời mạng viễn thông, chúng ta sẽ thực hiện các bước sau:
- Loại bỏ các ngoại lệ (outliers)
- Tạo ra giá trị giả (dummies)
- In danh sách cột phân loại và số
Ta sẽ thu được bộ dữ liệu mới
Để xử lý các ngoại lệ trong tập dữ liệu khách hàng rời mạng viễn thông và điền giá trị thiếu vào chúng, chúng ta có thể
sử dụng phương pháp MICE (Multiple Imputation by Chained Equations) Quá trình bao gồm xác định và thay thế các giá trị ngoại lệ bằng np.nan, sau đó sử dụng gói MICE trong Python để điền các giá trị thiếu dựa trên các mô hình hồi quy riêng biệt cho mỗi biến Cuối cùng, các tập dữ liệu hoàn chỉnh được kết hợp để
sử dụng cho phân tích và mô hình hóa
Hình 3 12: Ma trận tương quan các tham số
của bộ dữ liệu sau xử lý
Trang 11Hình 3 13: Ma trận Scatter các tham số của bộ dữ liệu sau xử lý
Quá trình này giúp ta hiểu rõ hơn về mối quan hệ giữa các biến trong tập dữ liệu sau khi đã tiền xử lý và chuẩn
bị cho các bước phân tích và mô hình hóa tiếp theo
Trang 12CHƯƠNG 4: MƠ HÌNH HỌC KẾT HỢP ĐỀ
XUẤT
4.1 Mơi trường mơ phỏng thực nghiệm
Đề án sử dụng Google Colaboratory, Python và SKLearn để xây dựng các mơ hình Ensemble Learning Quá trình bao gồm chia dữ liệu thành tập train và test, huấn luyện mơ hình học máy, và đánh giá hiệu suất của mơ hình trên các chỉ số như Training Score, Test Score, Accuracy, Precision Score, Recall Score, và F1 Score Quá trình này giúp hiểu rõ về khả năng dự đốn của mơ hình và tối ưu hĩa
mơ hình tổng quát
4.2 Thực nghiệm huấn luyện mơ hình học kết hợp
Bài nghiên cứu này xây dựng một mơ hình học kết hợp bằng cách phát triển từ các mơ hình cơ bản đến các mơ hình phức tạp Các nhĩm mơ hình bao gồm mơ hình Baseline, Logistic Regression, kNN, Nạve Bayes, Decision Tree Classifier, Bagging, AdaBoost, Gradient Boosting, và Random Forest Classifier Mục tiêu là xác định một mơ hình học kết hợp hiệu quả nhất cho bài tốn phân loại khách hàng rời mạng viễn thơng
4.2.1 Mơ hình Baseline
Hình 4 1: Cấu hình mơ hình Baseline
Trang 13Mơ hình Dummies Baseline cĩ hiệu suất tốt nhưng khơng dự đốn được trạng thái "thanh lý" do mất cân bằng
dữ liệu, cần cải thiện để áp dụng trong thực tế
4.2.2 Nhĩm mơ hình Logistic Regression, kNN và Nạve Bayes
Hình 4 2: Cấu hình mơ hình Logistic Regression thơng thường
Mơ hình Logistic Regression và Dummies Baseline đều cĩ hiệu suất cao nhưng cần cải thiện đối với trạng thái
"thanh lý", phản ánh sự mất cân bằng trong dữ liệu
Hình 4 3: Cấu hình mơ hình Logistic Regression
Trang 14Mô hình k-Nearest Neighbor Classifier có hiệu suất khá tốt đối với trạng thái "thanh lý", nhưng cần được cải thiện để đạt được hiệu suất cân bằng hơn đối với cả hai trạng thái
Hình 4 5: Error Rate vs K-Value theo UNIFORM của mô hình kNN
thông thường
Hình 4 6: Error Rate vs K Value theo DISTANCE của mô hình kNN
thông thường
Trang 15Hình 4 7: Cấu hình mô hình k-Nearest Neighbor Classifier
có hiệu chỉnh tham số
Mô hình k-Nearest Neighbor Classifier sau khi được hiệu chỉnh tham số vẫn giữ nguyên hiệu suất tương tự và không có sự cải thiện đáng kể so với phiên bản không được hiệu chỉnh
Hình 4 8: Cấu hình mô hình Naive Bayes Classifier
Hình 4 9: Cấu hình mô hình Naive Bayes kết hợp Oversampling
Hình 4 10: Cấu hình mô hình Logistic Regression
kết hợp Oversampling
Trang 16Mô hình Logistic Regression kết hợp Oversampling và có hiệu chỉnh tham số đã cải thiện đáng kể hiệu suất dự đoán đối với cả trạng thái "thanh lý" và "chưa thanh lý", nhưng vẫn cần được tiếp tục cải thiện để đạt được hiệu suất tốt nhất
4.2.3 Mô hình học kết hợp Decision Tree Classifier
Mô hình Decision Tree Classifier, được cấu hình như sau:
Hình 4 11: Cấu hình mô hình Decision Tree Classifier
Mô hình Decision Tree Classifier có độ chính xác cao và khả năng dự đoán tốt cả hai trạng thái "thanh lý" và
"chưa thanh lý", cho thấy hiệu suất tốt trong việc dự đoán việc rời mạng
Hình 4 12: Cấu hình mô hình Decision Tree hiệu chỉnh chiều cao
Mô hình Decision Tree Classifier sau khi giảm chiều cao đã cải thiện đáng kể về độ chính xác và hiệu suất dự đoán trạng thái "thanh lý" và "chưa thanh lý", cho thấy khả năng dự đoán tốt trong việc phân loại khách hàng rời mạng
Trang 17Hình 4 13: Mô hình Decision Tree sau khi giảm chiều cao4.2.4 Mô hình học kết hợp Bagging, AdaBoost và
GB
Hình 4 14: Cấu hình mô hình Bagging Classifier
Mô hình Bagging Classifier có hiệu suất tốt và khả năng dự đoán chính xác cao đối với cả trạng thái "thanh lý"
và "chưa thanh lý", đồng thời giữ nguyên độ chính xác ở mức cao khi so sánh với mô hình Decision Tree Classifier sau khi giảm chiều cao
Hình 4 15: Cấu hình mô hình AdaBoost Classifier
Trang 18Hình 4 16: Cấu hình mô hình Gradient Boosting Classifier
Hình 4 17: Cấu hình mô hình AdaBoost kết hợp Oversampling
Mặc dù mô hình AdaBoost kết hợp Oversampling có cải thiện về Precision và Recall, nhưng cần cân nhắc thêm
về độ chính xác và khả năng tổng quát hóa của mô hình
4.2.5 Mô hình học kết hợp Random Forest Classifier
Hình 4 18: Cấu hình mô hình Random Forest Classifier
Mô hình Random Forest Classifier có hiệu suất tốt trong việc dự đoán việc rời mạng, nhưng cần được cân nhắc
và tinh chỉnh để cải thiện Precision và Recall cho cả hai trạng thái
Hình 4 19: Cấu hình mô hình Random Forest có hiệu chỉnh tham số
Mô hình Random Forest Classifier sau khi được hiệu chỉnh vẫn giữ độ chính xác cao nhưng cần cải thiện đáng kể
Trang 19Precision và Recall cho cả hai trạng thái để trở nên hữu ích trong thực tế
Hình 4 20: Cấu hình mô hình Random Forest kết hợp oversample
Mô hình Random Forest kết hợp oversampling cải thiện Precision và Recall, nhưng vẫn cần xem xét thêm về
độ chính xác và khả năng tổng quát hóa
Hình 4 21: Cấu hình mô hình Random Forest kết hợp oversample và
giảm chiều cao
Mô hình Random Forest kết hợp oversample và giảm chiều cao thể hiện sự giảm đáng kể về độ chính xác
và hiệu suất so với mô hình Random Forest kết hợp oversample, cần xem xét lại tinh chỉnh tham số hoặc kỹ thuật khác để cải thiện hiệu suất
Trang 20Hình 4 22: Mô hình Random Forest sau khi giảm chiều cao
kết hợp với Oversampling 4.3 Đánh giá kết quả huấn luyện mô hình học kết hợp
4.3.1 Kết quả các mô hình học kết hợp
Hình 4 23: Ma trận Heatmap thể hiện các chỉ số của mô hình kết hợp
Cả Bagging, AdaBoost và Gradient Boosting Classifier đều đạt hiệu suất cao với độ chính xác tốt và khả năng dự đoán đáng tin cậy cho cả hai trạng thái, tuy nhiên việc lựa chọn mô hình học kết hợp cần dựa trên yêu cầu cụ thể của bài toán và được đánh giá kỹ lưỡng
Trang 214.3.2 So sánh với kết quả Telco Customer Churn
Cả hai cách tiếp cận đều mang lại sự đa dạng trong cấu trúc dữ liệu và mô hình, tuy nhiên, cách tiếp cận 2 có một lợi thế lớn hơn với số lượng dữ liệu lớn hơn và việc sử dụng một loạt các metrics đa dạng để đánh giá hiệu suất mô hình, giúp cung cấp cái nhìn tổng thể và chi tiết hơn về hiệu suất và tính đa dạng của mô hình
4.4 Mô hình học kết hợp đề xuất Meta-Model
Hình 4 31: Xây dựng mô hình kết hợp Meta-Model đề xuất
Hình 4 32: Mô hình kết hợp Meta-Model đề xuất
Đề án đề xuất xây dựng mô hình học kết hợp meta dựa trên 04 nhóm mô hình khác nhau để tối ưu hóa hiệu suất phân loại khách hàng dựa trên doanh thu, bằng cách sử
Trang 22dụng majority voting và điều chỉnh siêu tham số để đảm bảo tính tổng quát và hiệu suất của mô hình
Trang 23CHƯƠNG 5: XÂY DỰNG ỨNG DỤNG DỰ BÁO KHÁCH HÀNG RỜI MẠNG VỚI TẬP
DỮ LIỆU Ở VNPT TÂY NINH
5.1 Thiết kế và phát triển ứng dụng
VNPT Churn Predictor là ứng dụng dự báo và phân tích khách hàng rời mạng dựa trên các mô hình học máy, giúp VNPT nhận biết sớm khách hàng có nguy cơ rời mạng
và tối ưu hóa chiến lược giữ chân để giảm tỷ lệ mất mát khách hàng và tăng hiệu quả tiếp thị
Ứng dụng cung cấp tính năng dự báo, phân tích, gợi ý chiến lược giữ chân, và quản lý khách hàng, đồng thời hướng tới việc mở rộng tính năng và tối ưu hóa mô hình để nâng cao trải nghiệm khách hàng và tăng cường cạnh tranh trên thị trường
5.2 Phân tích tập dữ liệu khách hàng sử dụng dịch
vụ viễn thông ở VNPT Tây Ninh
Tác giả trong đề án này có thể sử dụng Python và Scikit-learn để xử lý và phân tích dữ liệu, cùng với Flask để xây dựng API cho việc tích hợp mô hình dự báo vào ứng dụng web VNPT Churn Predictor
5.3 Minh họa các chức năng chính của ứng dụng
Trang 24Hình 5 5: Màn hình thông tin chi tiết khách hàng
Hình 5 6: Màn hình thông tin chi tiết người dùng
Trang 25KẾT LUẬN
1 Kết quả nghiên cứu của đề tài
Trong quá trình đánh giá mô hình, cần xem xét các thước đo như precision và recall để đánh giá hiệu suất phân loại trong trường hợp mất cân bằng dữ liệu Mô hình Ensemble như AdaBoost và Random Forest thường cho hiệu suất tốt hơn trên các tập dữ liệu đa dạng
2 Hạn chế đề tài
Dữ liệu không cân bằng và thiếu, cùng với giả định
về phân phối và giới hạn của các mô hình, là những hạn chế quan trọng cần được xem xét và giải quyết trong đề tài về
dự báo khách hàng rời mạng viễn thông
3 Vấn đề kiến nghị và hướng đi tiếp theo của nghiên cứu
Kiến nghị nghiên cứu tiếp theo bao gồm thu thập dữ liệu cân bằng, tối ưu hóa mô hình và phân tích đặc trưng quan trọng để cải thiện hiệu suất của mô hình dự đoán khách hàng rời mạng viễn thông
Nghiên cứu cũng cần tập trung vào phát triển các giải pháp và chiến lược giữ chân khách hàng để tăng cường sự
hài lòng và trung thành của họ