Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 14 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
14
Dung lượng
1,54 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN NGỌC TUÂN ÁPDỤNGKỸTHUẬTKHAIPHÁDỮLIỆUDỰBÁOTHUÊBAORỜIMẠNGTRONGMẠNGDIĐỘNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội - 2016 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN NGỌC TUÂN ÁPDỤNGKỸTHUẬTKHAIPHÁDỮLIỆUDỰBÁOTHUÊBAORỜIMẠNGTRONGMẠNGDIĐỘNG Ngành: Công nghệ Thông tin Chuyên ngành: Hệ thống Thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN HÀ NAM Hà Nội - 2016 LỜI CẢM ƠN Tôi xin gửi lời cảm ơn sâu sắc tới PGS.TS.Nguyễn Hà Nam, Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội, người thầy dành nhiều thời gian tận tình bảo, hướng dẫn, giúp đỡ suốt trình tìm hiểu, nghiên cứu Thầy người định hướng đưa nhiều góp ý quý báu trình thực luận văn Tôi xin chân thành cảm ơn thầy, cô khoa Công nghệ thông tin – Trường Đại học Công nghệ - ĐHQGHN cung cấp cho kiến thức tạo cho điều kiện thuận lợi suốt trình học tập trường Tôi bày tỏ lòng biết ơn sự giúp đỡ lãnh đạo quan, đồng nghiệp cung cấp liệu, tài liệu cho lời khuyên quý báu Tôi xin cảm ơn gia đình, người thân, bạn bè thành viên nhóm nghiên cứu động viên tạo điều kiện tốt cho Tôi xin chân thành cảm ơn! Hà Nội, tháng năm 2016 Họ tên Nguyễn Ngọc Tuân LỜI CAM ĐOAN Tôi xin cam đoan đề tài nghiên cứu riêng tôi, thực sự hướng dẫn PGS.TS Nguyễn Hà Nam Các kết nêu luận văn trung thực chưa công bố công trình khác Hà Nội, tháng năm 2016 Họ tên Nguyễn Ngọc Tuân MỤC LỤC LỜI CẢM ƠN LỜI CAM ĐOAN DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ LỜI MỞ ĐẦU Chương Giới thiệu tổng quan mạngdiđộng kiến thức sở liên quan 1.1 Giới thiệu mạngdiđộng 1.2 Sơ lược tình hình nghiên cứu giới 1.3 Phát biểu toán 11 1.3.1 Chu trình thuêbaodiđộng 11 1.3.2 Phát biểu toán 13 1.4 Kết luận chương 13 Chương 2.1 Khaipháliệukỹthuật phân tích dự báo 14 Khaipháliệu 14 2.1.1 Khái niệm KPDL 14 2.1.2 Những nhóm toán KPDL 15 2.1.3 Các bước xây dựng giải pháp KPDL 16 2.1.4 Ứng dụng KPDL viễn thông 17 2.2 Một số kỹthuật KPDL phân lớp, dự báo 18 2.2.1 Cây định 18 2.2.2 Phân lớp Naïve Bayes 22 2.2.3 Mạng nơ ron nhân tạo 23 2.2.4 Luật kết hợp 24 2.2.5 Đánh giá độ xác thuật toán 27 2.3 Giới thiệu công cụ weka 28 2.4 Kết luận chương 28 Chương Giải pháp phát thuêbaodiđộng có khả rờimạng 29 3.1 Giải pháp chung: 29 3.2 Giải pháp mạng MobiFone 29 3.3 Giải pháp đề xuất 30 3.3.1 Giải pháp đề xuất dùngkỹthuậtkhaipháliệu 30 3.3.2 Giải pháp đề xuất sau cải tiến 30 3.4 Mô hình đề xuất ápdụng thực tế 31 Chương Thực nghiệm đánh giá kết 33 4.1 Chuẩn bị liệu 33 4.2 Mô tả liệu thực nghiệm 34 4.3 Kết thực nghiệm theo phương pháp 35 4.4 Kết thực nghiệm dựa khaipháliệu 37 4.4.1 Kết thực nghiệm dựa giải pháp khaipháliệu 37 4.4.2 Kết thực nghiệm dựa khaipháliệu cải tiến 41 4.5 So sánh đánh giá kết 47 4.6 Kết luận chương 49 KẾT LUẬN 50 Phụ lục THÔNG TIN BỘ DỮLIỆU 52 PHỤ LỤC PHÂN TÍCH ĐĂC TRƯNG BỘ DỮLIỆU THỰC NGHIỆM 55 Nhóm 55 Nhóm 55 Nhóm 56 Nhóm 57 Nhóm 58 Phụ lục Đặc trưng phân lớp giải pháp MobiFone ápdụng 59 Nhóm 59 Nhóm 2: 59 Nhóm 3: 59 Nhóm 4: 59 Nhóm 5: 60 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Chữ viết tắt Ý nghĩa KPDL Khaipháliệu CSDL Cơ sở liệu OLAP Online analytical processing MobiFone Tổng công ty Viễn thông MobiFone VLR Visitor Location Register Tổng đài ghi nhận đăng nhập mạngthuêbaodiđộng 3K3D_VLR Chỉ tiêu xác định thuêbao tháng có > ngày nhập mạng VLR phát sinh doanh thu >3000 GSM Global System for Mobile Communications Mạng thông tin diđộng CDR Call Data Record CLV Giá trị vòng đời khách hàng (custommer lifecycle value) DANH MỤC CÁC BẢNG Bảng 2-1 Các độ đo xác 27 Bảng 4-1 Nhóm thuêbao theo đặc trưng 34 Bảng 4-2 Các nhóm liệu mẫu 35 Bảng 4-3 Tổng hợp kết phương pháp 37 Bảng 4-4 Bảng tổng hợp kết theo giải pháp khaipháliệu 41 Bảng 4-5 Tổng hợp độ xác giải pháp đề xuất 47 DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ Biểu đồ 4-1 So sánh độ đo Accuracy ba giải pháp 48 Biểu đồ 4-2 So sánh thời gian xây dựng mô hình giải pháp đề xuất đề xuất cải tiến 48 Biểu đồ 4-3 So sánh thời gian dự báo 49 Hình 1-1 Thị phần thuêbaodiđộng tính đến 2013 [2] Hình 1-2 Vòng đời thuêbao 12 Hình 2-1 Các bước xây dựng hệ thống KPDL [1] 14 Hình 2-2 Biểu diễn định 18 Hình 2-3 Cây định cho việc chơi Tennis 19 Hình 2-4 Mô hình mạng nơron nhiều lớp 23 Hình 2-5 Tiến trình học 24 Hình 3-1 Giải pháp chung cho toán dự báothuêbaorờimạng 29 Hình 3-2 Giải pháp MobiFone ápdụng 30 Hình 3-3 Giải pháp đề xuất dùngkỹthuậtkhaipháliệu 30 Hình 3-4 Giải pháp đề xuất cải tiến .30 Hình 3-5 Mô hình đề xuất ápdụng thực tế 31 Hình 4-1 Kết nhóm giải pháp đề xuất 38 Hình 4-2 Kết nhóm giải pháp đề xuất 39 Hình 4-3 Kết nhóm giải pháp đề xuất 39 Hình 4-4 Kết nhóm giải pháp đề xuất 40 Hình 4-5 Kết nhóm giải pháp đề xuất 40 Hình 4-6 Kết nhóm giải pháp đề xuất cải tiến thử nghiệm 42 Hình 4-7 Kết nhóm giải pháp đề xuất cải tiến sau tối ưu 43 Hình 4-8 Kết nhóm giải pháp đề xuất cải tiến 44 Hình 4-9 Kết nhóm giải pháp đề xuất cải tiến 45 Hình 4-10 Kết nhóm giải pháp đề xuất sau cải tiến 46 Hình 4-11 Kết nhóm giải pháp đề xuất cải tiến 47 LỜI MỞ ĐẦU Thuêbaorờimạng vấn đề “đau đầu” nhà mạng nước giới lẽ khách hàng (thuê bao) người mang lại doanh thu trì hoạt động nhà mạng Để trì phát triển hoạt động kinh doanh mình, nhà mạng phải tìm cách để phát triển thuêbaođồng thời phải tìm cách để trì hoạt độngthuêbao hữu Theo nghiên cứu thực tế triển khai nhà mạng cho thấy, tổng chi phí để phát triển thuêbao cao nhiều so với việc trì thuêbao hữu Trong đó, doanh thu từ thuêbao hữu (đặc biệt thuê năm) cao nhiều so với doanh thu thuêbao (theo thống kê MobiFone thuê năm có doanh thu trung bình cao 48% so thuêbao mới) Chính lý trên, nhà mạng giới không ngừng tìm kiếm giải pháp nghiên cứu phát triển ứng dụng để xác định, dự đoán sớm thuêbao có khả rờimạng để có biện pháp kịp thời tác động nhằm trì thuêbao hoạt động Xuất phát từ yêu cầu đặt đơn vị mình, thực đề tài luận văn “ÁP DỤNGKỸTHUẬTKHAIPHÁDỮLIỆUDỰBÁOTHUÊBAORỜIMẠNGTRONGMẠNGDI ĐỘNG” Luận văn sâu vào việc ápdụngkỹthuậtkhaipháliệu từ hành vi sử dụngthuêbaodiđộng từ dự báothuêbao có khả rờimạng Luận văn gồm có phần mở đầu, kết luận 04 chương, cụ thể sau: Chương 1: Giới thiệu tổng quan mạngdiđộng vấn đề liên quan Chương trình bày tổng quan mạngdi động, thuêbaorờimạng Phát biểu toán nghiên cứu liên quan Chương 2: Khaipháliệukỹthuật phân tích dựbáo Nghiên cứu sở lý thuyết KPDL, vấn đề liên quan đến KPDL toán dự báothuêbaorờimạng Tìm hiểu kỹthuậtkhaipháliệu sử dụng toán phân lớp, dự báo (chuẩn bị liệu, lựa chọn thuộc tính, phân tích đặc trưng, định, …) ápdụngkỹthuật KPDL ứng dụng WEKA Chương 3: Giải pháp phát thuêbaodiđộng có khả rờimạng Các phương pháp để phát thuêbaodiđộng có khả rờimạngbao gồm kỹthuật dựa vào đặc trưng thuê bao, phương pháp ứng dụngkỹthuậtkhaipháliệu Chương 4: Thực nghiệm đánh giá kết Nội dung chủ yếu ápdụng mô hình tìm hiểu vào việc dự báothuêbaorờimạng Trước tiên ápdụngkỹthuật toàn liệu chuẩn bị với mô hình phân tích đặc trưng, định đánh giá Tiếp theo sử dụngkỹthuật lựa chọn thuộc tính để cải tiến tốc độ xử lý đánh giá độ xác mô hình dự báo Cuối tiến hành đánh giá kết dự báo mô hình đưa mô hình dự báo khuyến nghị để ápdụng vào toán thực tế Chương Giới thiệu tổng quan mạngdiđộng kiến thức sở liên quan 1.1 Giới thiệu mạngdiđộng Hai mươi năm qua ghi nhận thời gian dài phát triển sôi động, vượt bậc ngành công nghiệp viễn thông nói chung thông tin diđộng nói riêng Được thành lập từ năm 1993, sau 22 năm phát triển, Tổng Công ty Viễn thông MobiFone (tiền thân Công ty Thông tin di động), từ doanh nghiệp cỡ vừa nhỏ, phát triển trở thành doanh nghiệp lớn, hàng đầu Việt Nam, có doanh thu lên tới 40.000 tỷ, lợi nhuận 6.000 tỷ VNĐ hàng năm cung cấp dịch vụ viễn thông diđộng cho 20 triệu khách hàng sử dụng thường xuyên Thương hiệu MobiFone trở thành thương hiệu có uy tín hàng đầu Bước sang năm đầu thập kỷ mới, với sự bão hòa số lượng thuêbao toàn thị trường, thách thức dần trở nên thực tế hơn, đòi hỏi MobiFone phải có sự theo dõi sát với tình hình kinh doanh Trong giai đoạn bùng nổ thập niên đầu kỷ 21, việc phát triển thuêbao dễ dàng gần bổ sung thêm trạm có thêm thuê bao, đến năm đầu thập kỷ thứ hai, số lượng thuêbao toàn thị trường trở nên bão hòa, mạng lưới phủ sóng gần khắp quốc gia, khách hàng tiềm có hay nhiều thuê bao, việc phát triển thuêbao trở nên khó khăn hết Các nhà cung cấp dịch vụ viễn thông cạnh tranh với gay gắt, liệt, giành giật thuê bao, bao gồm thuêbao sử dụng dịch vụ mạng đối thủ Chính vậy, không việc phát triển thuêbao mà việc giữ thuêbao trở nên cấp bách Hình 1-1 Thị phần thuêbaodiđộng tính đến 2013 [2] 1.2 Sơ lược tình hình nghiên cứu giới Xu hướng khách hàng ngừng sử dụng sản phẩm/dịch vụ công ty khoảng thời gian định định nghĩa khách hàng rờimạng Chandar, Laha, &Krishna [5] Các công ty muốn có thêm nhiều khách hàng tốt Mặc dù vậy, qua thời gian, tỷ lệ khách hàng / khách hàng rờimạng có xu hướng tiến tới Vì vậy, tác độngrờimạng ngày trở nên mạnh mẽ cần quan tâm Việc rờimạng thường gắn liền với vòng đời ngành, ngành giai đoạn phát triển, việc bán hàng tăng trưởng bùng nổ, số khách hàng vượt xa số khách hàng rời mạng, giai đoạn bão hòa, công ty tập trung vào việc giảm tỉ lệ rờimạng Thời điểm khách hàng rờimạng cho biết khách hàng gắn bó với công ty bao lâu, giá trị vòng đời khách hàng (CLV) công ty CLV tính tổng doanh thu mà Công ty thu từ khách hàng suốt vòng đời khách hàng trừ tổng chi phí thu hút khách hàng, bán hàng, dịch vụ khách hàng (quy tiền) Các nghiên cứu trước đưa khái niệm khách hàng rờimạng từ nhiều quan điểm khác Theo Olafsson, Li, Wu[10], có loại rờimạng khác Loại thứ rờimạng chủ động (nghĩa khách hàng chủ động chọn dừng sử dụng dịch vụ) Loại thứ hai rờimạng bị động (nghĩa khách hàng không khách hàng tốt công ty lựa chọn dừng mối quan hệ này) Burez Van den Poel [9] chia rờimạng chủ động thành nhóm: Rờimạng vấn đề thương mại rờimạng vấn đề tài Rờimạng vấn đề thương mại trường hợp khách hàng không gia hạn hợp đồng có thời hạn cố định họ hợp đồng hết hạn Rờimạng vấn đề tài trường hợp khách hàng ngừng toán trình thực hợp đồng mà họ bị ràng buộc Ngày nay, khách hàng rờimạng trở thành vấn đề quan tâm công ty tất lĩnh vực công ty buộc phải hành động để xử lý vấn đề Xem xét tỷ lệ rờimạng ngành khác nhau, nhận thấy ngành viễn thông ngành có tỉ lệ rờimạng cao với tỉ lệ rờimạng trung bình hàng năm từ 20% đến 40% Khách hàng rờimạng lĩnh vực viễn thông hiểu khách hàng chuyển từ nhà cung cấp sang nhà cung cấp khác Có cách tiếp cận việc quản lý rờimạng Cách tiếp cận thứ tiếp cận mục tiêu dựa vào sản phẩm trội truyền thông rộng rãi để tăng lòng trung thành trì khách hàng Cách tiếp cận thứ hai tiếp cận có mục tiêu dựa vào việc xác định khách hàng có khả rời mạng, sau cung cấp cho họ giá trị khuyến khích trực tiếp (khuyến mại) tạo gói dịch vụ phù hợp cho khách hàng để giữ họ lại 10 Cách tiếp cận có mục tiêu gồm loại: bị động chủ động Với cách tiếp cận bị động, công ty chờ khách hàng liên hệ với công ty để hủy dịch vụ, công ty sau đưa cho khách hàng sách khuyến khích, ví dụ khuyến mại giảm giá, để giữ khách hàng lại Với cách tiếp cận chủ động, công ty cố gắng xác định khách hàng có khả rờimạng thời gian ngắn Sau đó, công ty thực chương trình sách đặc biệt để giữ cho khách hàng không rờimạng Cách tiếp cận chủ động có lợi ích chi phí khuyến khích thấp (bởi phần khuyến khích không cần thiết phải cao thời điểm khách hàng định rờimạng rồi) khách hàng không chuẩn bị sẵn để thương lượng có mức khuyến khích tốt với lý rờimạng Tuy nhiên, cách tiếp cận gây lãng phí việc dự đoán rờimạng không xác, sau công ty phải lãng phí lượng lớn chi phí để khuyến khích khách hàng thực tế lại với mạng Để giải vấn đề này, nhiều nỗ lực thực để có nhìn xác rờimạng Nhìn chung, nghiên cứu lĩnh vực tập trung mục đích sau: tìm nhân tố ảnh hưởng đến khách hàng rời mạng, xây dựng mô hình cho việc dự đoán khách hàng rờimạng 1.3 Phát biểu toán 1.3.1 Chu trình thuêbaodiđộngRờimạng thường phân thành loại: rờimạng chủ độngrờimạng bị độngRờimạng chủ động trường hợp khách hàng chọn để rời mạng, việc rờimạng lựa chọn khách hàng Ví dụ, khách hàng chuyển sang mạng đối thủ chuyển đổi sang hợp đồngthuêbao trả sau Rờimạng bị động trường hợp khách hàng bị nhà cung cấp ngừng cung cấp dịch vụ, thường lý gian lận nợ cước Rờimạng lý gian lận dường xảy Rờimạng nợ cước xảy với thuêbao trả sau Như đề cập trên, nghiên cứu này, tập trung vào vấn đề rờimạngthuêbao trả trước Vì vậy, rờimạng bị động xảy khách hàng không nạp lại tiền khoảng thời gian đủ dài theo quy định Một vấn đề quan trọngthuêbao trả trước thiếu định nghĩa đủ rõ ràng Khi xem xét rờimạngthuêbao trả sau, ngày thuêbao bị khóa chiều (ngày thuêbao ngừng kết nối với mạng) ngày rời mạng, ngày thuêbao thực sự ngừng sử dụng dịch vụ nhà cung cấp Tuy nhiên, trường hợp thuêbao trả trước, ngày khóa chiều không thực sự ngày rờimạng Điều có 11 TÀI LIỆU THAM KHẢO Tiếng Việt [1] [2] [3] Phan Xuân Hiếu (2013),Bài giảng môn học KPDL kho liệu, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Bộ Thông tin Truyền thông (2014),Sách Trắng Công nghệ thông tin Truyền thông (CNTT-TT) Việt Nam 2014, Nhà xuất Thông tin Truyền thông, Hà nội Hà Quang Thụy (2010),Bài giảng môn học Kho liệu KPDL, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Tiếng Anh [4] [5] [6] [7] [8] [9] [10] [11] Leo Breiman, Jerome Friedmen, and Charles J Stone (1984),Classification and Regression Trees, Wadsworth International Group M Chandar, Laha, A., & Krishna, P (2006),Modeling churn behavior of bank customers using predictive data mining techniques, National conference on soft computing techniques for engineering applications Jiawei Han and Micheline Kamber (2012),Data Mining Concepts and Techniques, Third Edition ed Elsevier Inc John Ross Quinlan (1993),C4.5: Programs for Machine Learning, Morgan Kaufmann Publishers John Ross Quinlan, Induction of decision trees, in Machine Learning 1986 p 81-106 J Burez, & Van den Poel, D (2009), Handling class imbalance in customer churn prediction, Expert System with Applications,36, 4626-4636 S Olafsson, Li, X., & Wu, S (2008), Operations research and data mining, European Journal of Operational Research,187, 2592-1448 Weka - Data Mining with Open Source Machine Learning Software in Java Available from: http://www.cs.waikato.ac.nz/ml/weka/ 51 ... Giải pháp phát thuê bao di động có khả rời mạng Các phương pháp để phát thuê bao di động có khả rời mạng bao gồm kỹ thuật dựa vào đặc trưng thuê bao, phương pháp ứng dụng kỹ thuật khai phá liệu. .. thuê bao hoạt động Xuất phát từ yêu cầu đặt đơn vị mình, thực đề tài luận văn ÁP DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU DỰ BÁO THUÊ BAO RỜI MẠNG TRONG MẠNG DI ĐỘNG” Luận văn sâu vào việc áp dụng kỹ. .. hàng rời mạng 1.3 Phát biểu toán 1.3.1 Chu trình thuê bao di động Rời mạng thường phân thành loại: rời mạng chủ động rời mạng bị động Rời mạng chủ động trường hợp khách hàng chọn để rời mạng,