Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 65 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
65
Dung lượng
2,16 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN NGỌC TUÂN ÁP DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU DỰ BÁO THUÊ BAO RỜI MẠNG TRONG MẠNG DI ĐỘNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội - 2016 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN NGỌC TUÂN ÁP DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU DỰ BÁO THUÊ BAO RỜI MẠNG TRONG MẠNG DI ĐỘNG Ngành: Công nghệ Thông tin Chuyên ngành: Hệ thống Thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN HÀ NAM Hà Nội - 2016 LỜI CẢM ƠN Tôi xin gửi lời cảm ơn sâu sắc tới PGS.TS.Nguyễn Hà Nam, Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội, người thầy dành nhiều thời gian tận tình bảo, hướng dẫn, giúp đỡ tơi suốt q trình tìm hiểu, nghiên cứu Thầy người định hướng đưa nhiều góp ý q báu q trình tơi thực luận văn Tôi xin chân thành cảm ơn thầy, cô khoa Công nghệ thông tin – Trường Đại học Công nghệ - ĐHQGHN cung cấp cho kiến thức tạo cho điều kiện thuận lợi suốt q trình tơi học tập trường Tơi bày tỏ lòng biết ơn sư giúp đỡ lãnh đạo quan, đồng nghiệp cung cấp liệu, tài liệu cho lời khuyên quý báu Tôi xin cảm ơn gia đình, người thân, bạn bè thành viên nhóm nghiên cứu ln động viên tạo điều kiện tốt cho Tôi xin chân thành cảm ơn! Hà Nội, tháng năm 2016 Họ tên Nguyễn Ngọc Tuân LỜI CAM ĐOAN Tôi xin cam đoan đề tài nghiên cứu riêng tôi, thực sư hướng dẫn PGS.TS Nguyễn Hà Nam Các kết nêu luận văn trung thực chưa công bố cơng trình khác Hà Nội, tháng năm 2016 Họ tên Nguyễn Ngọc Tuân MỤC LỤC LỜI CẢM ƠN LỜI CAM ĐOAN DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ LỜI MỞ ĐẦU Chương Giới thiệu tổng quan mạng di động kiến thức sở liên quan 1.1 Giới thiệu mạng di động 1.2 Sơ lược tình hình nghiên cứu giới 1.3 Phát biểu toán 11 1.3.1 Chu trình thuê bao di động 11 1.3.2 Phát biểu toán 13 1.4 Kết luận chương 13 Chương 2.1 Khai phá liệu kỹ thuật phân tích dư báo 14 Khai phá liệu 14 2.1.1 Khái niệm KPDL 14 2.1.2 Những nhóm tốn KPDL 15 2.1.3 Các bước xây dựng giải pháp KPDL 16 2.1.4 Ứng dụng KPDL viễn thông 17 2.2 Một số kỹ thuật KPDL phân lớp, dư báo 18 2.2.1 Cây định 18 2.2.2 Phân lớp Naïve Bayes 22 2.2.3 Mạng nơ ron nhân tạo 23 2.2.4 Luật kết hợp 24 2.2.5 Đánh giá độ xác thuật tốn 27 2.3 Giới thiệu công cụ weka 28 2.4 Kết luận chương 28 Chương Giải pháp phát thuê bao di động có khả rời mạng 29 3.1 Giải pháp chung: 29 3.2 Giải pháp mạng MobiFone 29 3.3 Giải pháp đề xuất 30 3.3.1 Giải pháp đề xuất dùng kỹ thuật khai phá liệu 30 3.3.2 Giải pháp đề xuất sau cải tiến 30 3.4 Mơ hình đề xuất áp dụng thực tế 31 Chương Thực nghiệm đánh giá kết 33 4.1 Chuẩn bị liệu 33 4.2 Mô tả liệu thực nghiệm 34 4.3 Kết thưc nghiệm theo phương pháp 35 4.4 Kết thưc nghiệm dựa khai phá liệu 37 4.4.1 Kết thưc nghiệm dựa giải pháp khai phá liệu 37 4.4.2 Kết thưc nghiệm dựa khai phá liệu cải tiến 41 4.5 So sánh đánh giá kết 47 4.6 Kết luận chương 49 KẾT LUẬN 50 Phụ lục THÔNG TIN BỘ DỮ LIỆU 52 PHỤ LỤC PHÂN TÍCH ĐĂC TRƯNG BỘ DỮ LIỆU THỰC NGHIỆM 55 Nhóm 55 Nhóm 55 Nhóm 56 Nhóm 57 Nhóm 58 Phụ lục Đặc trưng phân lớp giải pháp MobiFone áp dụng 59 Nhóm 59 Nhóm 2: 59 Nhóm 3: 59 Nhóm 4: 59 Nhóm 5: 60 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Chữ viết K C O nl Mobi T Fone ổn Vi sit or L C 3K3 hỉ D_V tiê Lu Gl ob al S C all Gi trị vò DANH MỤC CÁC BẢNG Bảng 2-1 Các độ đo xác 27 Bảng 4-1 Nhóm thuê bao theo đặc trưng 34 Bảng 4-2 Các nhóm liệu mẫu 35 Bảng 4-3 Tổng hợp kết phương pháp 37 Bảng 4-4 Bảng tổng hợp kết theo giải pháp khai phá liệu 41 Bảng 4-5 Tổng hợp độ xác giải pháp đề xuất 47 DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ Biểu đồ 4-1 So sánh độ đo Accuracy ba giải pháp 48 Biểu đồ 4-2 So sánh thời gian xây dựng mơ hình giải pháp đề xuất đề xuất cải tiến 48 Biểu đồ 4-3 So sánh thời gian dư báo 49 Hình 1-1 Thị phần thuê bao di động tính đến 2013 [2] Hình 1-2 Vòng đời thuê bao 12 Hình 2-1 Các bước xây dựng hệ thống KPDL [1] 14 Hình 2-2 Biểu diễn định 18 Hình 2-3 Cây định cho việc chơi Tennis .19 Hình 2-4 Mơ hình mạng nơron nhiều lớp 23 Hình 2-5 Tiến trình học 24 Hình 3-1 Giải pháp chung cho toán dư báo thuê bao rời mạng .29 Hình 3-2 Giải pháp MobiFone áp dụng 30 Hình 3-3 Giải pháp đề xuất dùng kỹ thuật khai phá liệu 30 Hình 3-4 Giải pháp đề xuất cải tiến .30 Hình 3-5 Mơ hình đề xuất áp dụng thực tế 31 Hình 4-1 Kết nhóm giải pháp đề xuất 38 Hình 4-2 Kết nhóm giải pháp đề xuất 39 Hình 4-3 Kết nhóm giải pháp đề xuất 39 Hình 4-4 Kết nhóm giải pháp đề xuất 40 Hình 4-5 Kết nhóm giải pháp đề xuất 40 Hình 4-6 Kết nhóm giải pháp đề xuất cải tiến thử nghiệm 42 Hình 4-7 Kết nhóm giải pháp đề xuất cải tiến sau tối ưu 43 Hình 4-8 Kết nhóm giải pháp đề xuất cải tiến 44 Hình 4-9 Kết nhóm giải pháp đề xuất cải tiến 45 Hình 4-10 Kết nhóm giải pháp đề xuất sau cải tiến 46 Hình 4-11 Kết nhóm giải pháp đề xuất cải tiến 47 LỜI MỞ ĐẦU Thuê bao rời mạng vấn đề “đau đầu” nhà mạng nước giới lẽ khách hàng (thuê bao) người mang lại doanh thu trì hoạt động nhà mạng Để trì phát triển hoạt động kinh doanh mình, nhà mạng phải tìm cách để phát triển thuê bao đồng thời phải tìm cách để trì hoạt động thuê bao hữu Theo nghiên cứu thực tế triển khai nhà mạng cho thấy, tổng chi phí để phát triển thuê bao cao nhiều so với việc trì thuê bao hữu Trong đó, doanh thu từ thuê bao hữu (đặc biệt thuê năm) cao nhiều so với doanh thu thuê bao (theo thống kê MobiFone thuê năm có doanh thu trung bình cao 48% so th bao mới) Chính lý trên, nhà mạng giới khơng ngừng tìm kiếm giải pháp nghiên cứu phát triển ứng dụng để xác định, dư đốn sớm th bao có khả rời mạng để có biện pháp kịp thời tác động nhằm trì th bao hoạt động Xuất phát từ yêu cầu đặt đơn vị mình, tơi thực đề tài luận văn “ÁP DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU DỰ BÁO THUÊ BAO RỜI MẠNG TRONG MẠNG DI ĐỘNG” Luận văn sâu vào việc áp dụng kỹ thuật khai phá liệu từ hành vi sử dụng thuê bao di động từ dư báo thuê bao có khả rời mạng Luận văn gồm có phần mở đầu, kết luận 04 chương, cụ thể sau: Chương 1: Giới thiệu tổng quan mạng di động vấn đề liên quan Chương trình bày tổng quan mạng di động, thuê bao rời mạng Phát biểu toán nghiên cứu liên quan Chương 2: Khai phá liệu kỹ thuật phân tích dự báo Nghiên cứu sở lý thuyết KPDL, vấn đề liên quan đến KPDL tốn dư báo th bao rời mạng Tìm hiểu kỹ thuật khai phá liệu sử dụng toán phân lớp, dư báo (chuẩn bị liệu, lựa chọn thuộc tính, phân tích đặc trưng, định, …) áp dụng kỹ thuật KPDL ứng dụng WEKA Chương 3: Giải pháp phát thuê bao di động có khả rời mạng Các phương pháp để phát thuê bao di động có khả rời mạng bao gồm kỹ thuật dựa vào đặc trưng thuê bao, phương pháp ứng dụng kỹ thuật khai phá liệu Chương 4: Thực nghiệm đánh giá kết Nội dung chủ yếu áp dụng mơ hình tìm hiểu vào việc dư báo thuê bao rời mạng Trước tiên áp dụng kỹ thuật toàn liệu chuẩn bị với mơ hình phân tích đặc trưng, định đánh giá Tiếp theo sử dụng kỹ thuật lựa chọn thuộc tính để cải tiến tốc độ xử lý đánh giá độ xác mơ hình dư báo Cuối tiến hành đánh giá kết dư báo mơ hình đưa mơ hình dư báo khuyến nghị để áp dụng vào tốn thực tế Hình 4-10 Kết nhóm giải pháp đề xuất sau cải tiến 4.4.2.5 Nhóm 5: Tập liệu: 156.000 TB, đó: 20.000 TB rời mạng, 136.000 TB không rời mạng Kết với trích chọn thuộc tính 46 Hình 4-11 Kết nhóm giải pháp đề xuất cải tiến 4.4.2.6 Đánh giá mơ hình Từ kết kiểm nghiệm mục 3.3, ta tính tốn độ xác dư đốn nhóm th bao dựa vào công thức đưa sau: ời Tên N độ h9 Accu 09 Erro r_Ra 69 Preci sion7 g i T h NN N h9 h9 h9 18 81 90 9 89 9 9 N h9 81 69 0 0 Bảng 4-5 Tổng hợp độ xác giải pháp đề xuất cải tiến 4.5 So sánh đánh giá kết Để đánh giá kết thực nghiệm ta so sánh độ xác (độ đo Accuracy) giải pháp thực sau: 47 So sánh độ xác 100% 080% 060% 040% 020% 000% nhóm nhóm Phương pháp Nhóm Giải pháp đề xuất Nhóm Nhóm Giải pháp đề xuất cải tiến Biểu đồ 4-1 So sánh độ đo Accuracy ba giải pháp Nhận xét: giải pháp MobiFone sử dụng có độ xác thấp nhất, nhóm độ xác nhỏ gần tương đương với độ xác giải pháp dùng thuật toán khai phá liệu, nhóm 1,2 độ xác thấp đáng kể so với giải pháp dùng khai phá liệu đặc biệt nhóm thấp nhiều (78,4% so với 98,8%) Qua việc so sánh độ xác giải pháp ta nhận thấy đặc trưng nhóm thuê bao nhóm 3,4 nhóm nhận định thuê bao rời mạng, nhóm nhận định nhóm mục tiêu để dư báo kết giải pháp MobiFone chưa cao giải pháp đề xuất cho kết cao Độ xác giải pháp đề xuất giải pháp đề xuất sau cải tiến tương đương Để đánh giá tiếp giải pháp trước sau cải tiến ta tiếp tục đánh giá thời gian xây dựng mơ hình thời gian dư báo hai giải pháp kết biểu đồ dưới: So sánh thời gian xây dựng mô hình (giây) 120 100 96 86 80 68 60 44 40 20 16 16 nhóm nhóm Giải pháp đề xuất Nhóm Nhóm Nhóm Giải pháp đề xuất cải tiến Biểu đồ 4-2 So sánh thời gian xây dưng mơ hình giải pháp đề xuất đề xuất cải tiến 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 nhóm nhóm Giải pháp đề xuất Nhóm Nhóm Nhóm Giải pháp đề xuất cải tiến Biểu đồ 4-3 So sánh thời gian dư báo Qua biểu đồ ta thấy rõ thời gian xây dựng mô hình thời gian dư báo giải pháp sau cải tiến nhiều so với giải pháp trước cải tiến Do giải pháp đề xuất cải tiến đạt mục tiêu đề ban đầu đưa giải pháp với độ gần tương đương (có thể giảm) nhiên thời gian xây dựng mơ hình thời gian dư báo nhanh 4.6 Kết luận chương Chương trình bày kết thực nghiệm dựa phương pháp thực chương Qua thực nghiệm ta có nhận xét sau: Kết dùng thuật toán khai phá liệu cao so với phương pháp thực KẾT LUẬN Từ việc nghiên cứu yêu cầu cấp thiết đặt công tác trì phát triển thuê bao mạng di động, luận văn đạt số kết sau đây: - Xây dựng mơ hình dư báo áp dụng kỹ thuật khai phá liệu để phát nhanh xác thuê bao di động có khả rời mạng từ áp dụng giải pháp để trì thuê bao - Triển khai mơ hình đề xuất, áp dụng liệu thực tế, so sánh với giải pháp sử dụng áp dụng Các kết đạt cho thấy tiềm áp dụng phương pháp đề xuất vào thực tiễn Trong thời gian tới nghiên cứu tích hợp kỹ thuật vào chương trình hỗ trợ kinh doanh MobiFone đồng thời cải tiến thời gian dư báo kết dư báo Trong thời gian tới tiếp tục cập nhật mơ hình với liệu MobiFone để kết dư đoán cải thiện TÀI LIỆU THAM KHẢO Tiếng Việt [1] [2] [3] Phan Xuân Hiếu (2013),Bài giảng môn học KPDL kho liệu, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Bộ Thông tin Truyền thông (2014),Sách Trắng Công nghệ thông tin Truyền thông (CNTT-TT) Việt Nam 2014, Nhà xuất Thông tin Truyền thông, Hà nội Hà Quang Thụy (2010),Bài giảng môn học Kho liệu KPDL, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Tiếng Anh [4] [5] [6] [7] [8] [9] [10] [11] Leo Breiman, Jerome Friedmen, and Charles J Stone (1984),Classification and Regression Trees, Wadsworth International Group M Chandar, Laha, A., & Krishna, P (2006),Modeling churn behavior of bank customers using predictive data mining techniques, National conference on soft computing techniques for engineering applications Jiawei Han and Micheline Kamber (2012),Data Mining Concepts and Techniques, Third Edition ed Elsevier Inc John Ross Quinlan (1993),C4.5: Programs for Machine Learning, Morgan Kaufmann Publishers John Ross Quinlan, Induction of decision trees, in Machine Learning 1986 p 81-106 J Burez, & Van den Poel, D (2009), Handling class imbalance in customer churn prediction, Expert System with Applications,36, 4626-4636 S Olafsson, Li, X., & Wu, S (2008), Operations research and data mining, European Journal of Operational Research,187, 2592-1448 Weka - Data Mining with Open Source Machine Learning Software in Java Available from: http://www.cs.waikato.ac.nz/ml/weka/ Phụ lục THÔNG TIN BỘ DỮ LIỆU Thông tin trường liệu ST T1 Tê n G RA ST A_ C US ST IS _ RA NK AR EA AR EA AR EA DT KC TK 1K DT TK DT TK DT TK DT TK DT TK DT TK DT TK DT TK DT TK DT TK DT KC TK 3K DT TK DT TK DT TK DT TK DT TK Ý ng M ãNg ày Lo ại Tr M ã Hạ ng Kh u Kh u Kh Do u an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an 2DT 3DT DT TK DT TK DT TK DT KC TK 5K DT TK DT TK DT TK DT TK DT TK DT TK DT TK DT TK DT TK DT TK RE 4M RE 4M 8N O SU U SU M 1N M 5U N 5U N 5U SU 5M SU 5M N 7N U 8N U SU U 0M m ạn Do an h Do an h D o Do an h D o Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Do an h Số tiề Số tiề Th án Số lư Số lư số lư Số lư Số lư Số lư Số lư số lư Số lư Số lư Số lư Số lư 53 SU 6M N 2N U SC U SC R_ SC R_ 6 R_ 6SC số lư Số lư Số lư Số tiề Số lư Số tiề Số SC R_ SC R_ DE 0M BI DE O BI 7M Số tiề Số lư Nợ tiề Số th Nợ tiề Số DE 4M BI 7O N 7U N 7U N U 7N Nợ tiề Số th Số ng Số ng Số ng Số 8N 0N U PH U PR O 8O PR O 8PR Số ng Số ng Nh ãn Số ch Số ch Số R Tr M ườ 54 PHỤ LỤC PHÂN TÍCH ĐĂC TRƯNG BỘ DỮ LIỆU THỰC NGHIỆM Nhóm MobiFone đưa tiêu chí thuê bao 3k3d_vlr để nhằm thống kê thuê bao sử dụng thật thuê bao ảo (thuê bao nằm kênh phân phối, thuê bao khách hàng mua dùng để nhắn tin rác, …) Theo đó, thuê bao đạt chuẩn 3k3d_vlr thuê bao thỏa mãn đồng thời tiêu chí sau: (1) tiêu dùng tối thiểu 3.000đ từ tài khoản (2) cập nhật vlr (mở máy) tối thiểu ngày Do vậy, mốc tiêu dùng 3.000đ từ tài khoản mốc cập nhật vlr ngày mốc quan trọng để đánh giá thuê bao Trong phần này, nhóm chuyên gia thực phân tích nhóm th bao khơng phát sinh cước tháng 8/2015 có tiêu dùng tài khoản khơng đạt 3k3d_vlr tháng trước (tháng 7/2015) Nhóm gồm thuê bao thỏa mãn điều kiện sau: - Tiêu dùng tài khoản 3.000đ tháng 7/2015 Hoặc: - Tiêu dùng tài khoản từ 3.000đ trở lên cập nhật VLR ngày tháng 7/2015 Sau phân tích nhóm rút đặc điểm đặc trưng tập thuê bao trước rời mạng (không phát sinh cước) sau: - Tiêu dùng tài khoản 3.000đ tháng trước - Chỉ đạt 3k3d_vlr đến lần tháng liên tục - Không phát sinh giao dịch phát sinh đến giao dịch thoại chiều tháng trước - Không phát sinh giao dịch thoại chiều đến tháng trước - Có xu hướng giảm dần số lượng giao dịch thoại chiều đến tháng liên tục giảm sản lượng thoại chiều đến tháng liên tục - Hầu không phát sinh giao dịch nạp thẻ tháng liền trước - Có xu hướng giảm tần suất nạp thẻ tháng liên tiếp Nhóm Nhóm có 67.565 thuê bao, chiếm tỷ trọng cao MobiQ (51,07%), MobiCard (26,84%), Zone+ (9,55%) Trong cấu thuê bao MobiFone tại, MobiQ chiếm khoảng 49%, MobiCard chiếm khoảng 12%, Zone+ chiếm khoảng 12% 55 Như vậy, rõ ràng nhóm thuê bao MobiCard có tỉ lệ rời mạng cao nhóm khác Sau phân tích nhóm chun gia rút đặc điểm đặc trưng tập thuê bao trước rời mạng (không phát sinh cước) sau: - Tiêu dùng TKC ≥ 3.000đ tiêu dùng TKKM < 3.000đ tháng trước - Có mức tiêu dùng TKKM giảm dần tháng liên tục - Không phát sinh giao dịch phát sinh đến giao dịch thoại chiều tháng trước - Không phát sinh giao dịch phát sinh đến giao dịch sms chiều tháng trước - Không phát sinh giao dịch thoại chiều đến tháng trước - Có xu hướng giảm dần số lượng giao dịch thoại chiều tháng liên tục - Có xu hướng giảm dần số lượng giao dịch sms chiều tháng liên tục - Có xu hướng giảm dần số lượng giao dịch thoại chiều đến tháng liên tục - Hầu không phát sinh giao dịch nạp thẻ tháng liền trước có tần suất nạp thẻ giảm dần tháng liên tục - Có xu hướng giảm dần số ngày cập nhật VLR tháng liên tục Nhóm Nhóm gồm 219.993 thuê bao, MobiQ chiếm tỷ trọng cao với 82,16% MobiQ loại thuê bao có ngày sử dụng linh hoạt, dễ dàng cho khách hàng trì số thuê bao mà không cần tiêu dùng đến TKC Sau phân tích nhóm chun gia rút phần lớn thuê bao thuộc nhóm nằm kênh nằm ngăn kéo (KH mua không sử dụng nữa) Đặc điểm nhóm sau: - Chủ yếu loại hình th bao MobiQ - Hầu không đạt 3k3d_vlr nhiều tháng liên tục (chỉ có 7,5% thuê bao thuộc nhóm có đạt 3k3d_vlr lần tháng liên tiếp) - Hầu không tiêu dùng tài khoản tháng liên tục (tỉ lệ đạt 90%) 56 - Có mức tiêu dùng TKKM thấp < 3.000đ/tháng tháng liên tục (tỉ lệ đạt 90%) - Hầu không phát sinh giao dịch thoại chiều phát sinh giao dịch (chiếm 95% tháng liên tiếp) - Hầu không phát sinh giao dịch sms chiều phát sinh giao dịch (chiếm 94% tháng liên tiếp) - Hầu không phát sinh giao dịch thoại chiều đến (chiếm 96% tháng liên tiếp) - Hầu không phát sinh phát sinh sms chiều đến (chiếm 91% tháng liên tiếp) - Theo xu hướng giảm sản lượng thoại đến tháng liên tiếp (khoảng 97%) - Chỉ mở máy ngày (chiếm 91% tháng liên tiếp) - Hầu không nạp thẻ tháng trước rời mạng (chỉ có 0,44% nạp thẻ) - Theo xu hướng giảm tần suất nạp thẻ tháng liên tiếp (khoảng 98% thuê bao thể xu hướng này) Nhóm Bản chất nhóm rời mạng (khơng phát sinh cước) từ tháng 7/2015 Nhóm gồm có 1.067.414 thuê bao, chiếm tỉ trọng cao MobiCard (37,69%), MobiQ (27,30%) Mobi365 (21,02%) Trong đó, xét tỉ trọng thuê bao PSC tháng 8/2015 toàn mạng, MobiCard chiếm 12,23%, Mobi365 chiếm 2,64% MobiQ chiếm tới 48,81% Sau phân tích nhóm chuyên gia có nhận xét đặc điểm nhận dạng nhóm thuê bao sau: - Tiêu dùng TKC (dưới 3000đ) tháng liên tiếp - Tiêu dùng TKKM (dưới 3000đ) tháng liên tiếp - Có xu hướng tiêu dùng TKC TKKM giảm dần tháng liên tiếp (95% thuê bao thể rõ xu hướng này) - Không phát sinh phát sinh giao dịch thoại chiều tháng liên tiếp - Không phát sinh phát sinh giao dịch sms chiều tháng liên tiếp 57 - Có xu hướng giảm dần số lượng giao dịch thoại chiều tháng liên tiếp (93,26% thuê bao thể xu hướng này) - Có xu hướng giảm dần số lượng giao dịch sms chiều tháng liên tiếp (93,9% thể xu hướng này) - Có xu hướng giảm dần số lượng giao dịch sms chiều đến tháng liên tiếp (91,41% thuê bao thể xu hướng này) - Có xu hướng giảm dần số lượng giao dịch thoại chiều đến tháng liên tiếp (91,41% thuê bao thể xu hướng này) - Có xu hướng giảm dần số ngày cập nhật VLR tháng liên tiếp (88,94% thể xu hướng này) - Hầu không nạp thẻ vào tháng liền trước có xu hướng giảm tần suất nạp thẻ tháng liên tiếp Nhóm Nhóm gồm 105.703 thuê bao, chiếm tỷ trọng cao MobiQ (56,68%), MobiCard (15,32%) Zone+ (10,87%) Trong số này, 10,17% thuê bao hội viên chương trình Kết nối dài lâu Sau phân tích nhóm chun gia có nhận xét đặc điểm nhận dạng nhóm thuê bao sau: - Nhóm thuê bao hoạt động bình thường mạng: Vẫn nạp thẻ, phát sinh giao dịch thoại đi/đến với tỉ lệ cao, số ngày cập nhật VLR nhiều (≥3 ngày) - Số tiền lại TKC thấp (trên 60% thuê bao có số tiền TKC 3.000đ) - Doanh thu TKC từ dịch vụ sms (nội mạng liên mạng) thấp (dưới 3.000đ/tháng) - Doanh thu TKKM từ dịch vụ sms (nội mạng liên mạng) thấp (dưới 3.000đ/tháng) 58 Phụ lục Đặc trưng phân lớp giải pháp MobiFone áp dụng Nhóm - Tiêu chí phân lớp: Th bao trả trước thỏa mãn đồng thời tiêu chí sau: o Tiêu dùng tài khoản 3.000đ tháng trước o Phát sinh giao dịch thoại chiều tháng trước o Giảm dần số lượng giao dịch thoại chiều đến tháng liên tục liền trước (số giao dịch tháng sau nhỏ số giao dịch tháng trước) o Giảm dần số lượng giao dịch thoại chiều đến tháng liên tục liền trước Nhóm 2: - Tiêu chí phân lớp: o Tiêu dùng TKC ≥ 3.000đ tháng trước o Cập nhật VLR < ngày tháng trước o Phát sinh giao dịch thoại chiều tháng trước o Không phát sinh giao dịch thoại chiều đến tháng trước Nhóm 3: - Tiêu chí phân lớp: o Khơng tiêu dùng TKC tháng trước (Tiêu dùng TKC= 0) o Tiêu dùng TKKM > tháng trước o Không nạp thẻ tháng trước o Có tần suất nạp thẻ giảm dần tháng liên tục liền trước (số lần nạp thẻ tháng sau nhỏ số lần nạp thẻ tháng trước) o Có xu hướng giảm dần số lượng giao dịch thoại chiều đến (hoặc giảm dần sản lượng gọi chiều đến) tháng liên tục liền trước Nhóm 4: - Tiêu chí phân lớp: o Không tiêu dùng TKC tháng trước (Tiêu dùng TKC= 0) 59 o Không tiêu dùng TKKM tháng trước (Tiêu dùng TKKM= 0) o Có số ngày cập nhật VLR giảm dần tháng liên tiếp liền trước (số ngày cập nhật VLR tháng sau nhỏ số ngày cập nhật tháng trước) o Khơng nạp thẻ tháng trước o Có tần suất nạp thẻ giảm dần tháng liên tục liền trước (số lần nạp thẻ tháng sau nhỏ số lần nạp thẻ tháng trước) Nhóm 5: - Tiêu chí phân lớp: o Tiêu dùng TKC ≥ 3.000đ tháng trước o Cập nhật VLR ≥ ngày tháng trước o Có số tiền lại TKC thời điểm cuối tháng trước < 5.000đ o Tiêu dùng TKC < 3.000đ cho dịch vụ sms (nội mạng liên mạng) tháng trước o Tiêu dùng TKKM < 3.000đ cho dịch vụ sms (nội mạng liên mạng) tháng trước 60 ... Giải pháp phát thuê bao di động có khả rời mạng Các phương pháp để phát thuê bao di động có khả rời mạng bao gồm kỹ thuật dựa vào đặc trưng thuê bao, phương pháp ứng dụng kỹ thuật khai phá liệu. .. trì thuê bao hoạt động Xuất phát từ yêu cầu đặt đơn vị mình, tơi thực đề tài luận văn ÁP DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU DỰ BÁO THUÊ BAO RỜI MẠNG TRONG MẠNG DI ĐỘNG” Luận văn sâu vào việc áp dụng. .. hàng rời mạng 1.3 Phát biểu tốn 1.3.1 Chu trình thuê bao di động Rời mạng thường phân thành loại: rời mạng chủ động rời mạng bị động Rời mạng chủ động trường hợp khách hàng chọn để rời mạng,