Kết hợp k MEANS và SVM dự báo khách hàng chuyển mạng tại VNPT bình định

64 9 0
Kết hợp k MEANS và SVM dự báo khách hàng chuyển mạng tại VNPT bình định

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN TRẦN THANH LIÊM KẾT HỢP K-MEANS VÀ SVM DỰ BÁO KHÁCH HÀNG •• CHUYỂN MẠNG TẠI VNPT BÌNH ĐỊNH ••• Chuyên ngành: Khoa học máy tính Mã số : 8480101 Người hướng dẫn: TS Lê Xuân Vinh LỜI CẢM ƠN Trước tiên xin gửi đến lời cảm ơn chân thành sâu sắc đến thầy TS Lê Xuân Vinh - nhiệt tình hướng dẫn, bảo suốt thời gian bắt đầu thực hồn thành luận văn Tơi xin cảm ơn thầy cô khoa CNTT - Trường Đại học Quy Nhơn truyền đạt cho kiến thức chun sâu chun ngành để tơi có tảng kiến thức giúp tơi hồn thành luận văn thạc sĩ Cuối cùng, xin cảm ơn đến người thân u gia đình tồn thể bạn bè, đồng nghiệp người hỗ trợ giúp đỡ, khuyến khích, động viên tơi thời gian học tập nghiên cứu Trường Đại Học Quy Nhơn Xin chân thành cảm ơn! LỜI CAM ĐOAN Tôi xin cam đoan luận văn thạc sĩ Khoa học máy tính “KẾT HỢP KMEANS VÀ SVM DỰ BÁO KHÁCH HÀNG CHUYỂN MẠNG TẠI VNPT BÌNH ĐỊNH” cơng trình nghiên cứu riêng với giúp đỡ tận tình giáo viên hướng dẫn TS Lê Xuân Vinh Trong toàn nội dung luận văn, điều trình bày cá nhân tổng hợp từ nhiều nguồn tài liệu Tất nguồn tài liệu tham khảo có xuất xứ rõ ràng hợp pháp Tơi xin hồn tồn chịu trách nhiệm chịu hình thức kỷ luật theo quy định cho lời cam đoan Bình Định, ngày tháng năm 2020 MỤC LỤC MỞ ĐẦU 1 LÝ DO CHỌN ĐỀ TÀI MỤC ĐÍCH VÀ NHIỆM VỤ NGHIÊN CỨU 2.1 Mục đích nghiên cứu 2.2 Nhiệ m vụ nghiên cứu .3 ĐỐI TƯỢNG NGHIÊN CỨU PHƯƠNG PHÁP NGHIÊN CỨU CHƯƠNG I: TỔNG QUAN VỀ HỌC MÁY VÀ BÀI TỐN DỰ BÁO KHÁCH HÀNG VIỄN THƠNG CHUYỂN MẠNG 1.1 GIỚI THIỆU HỌC MÁY 1.1.1 Khái niệm 1.1.2 Một số tốn học máy 1.2 PHÂN LỚP DỮ LIỆU - MỘT SỐ BÀI TỐN CHÍNH TRONG HỌC MÁY 1.2.1 Phân cụm liệu 1.2.2 Phân lớp liệu 11 1.2.2.1 Bài toán phân lớp 11 1.2.2.2 Quá trình phân lớp liệu 14 1.2.3 Một số thuật toán phân lớp tiêu biểu 15 1.3 BÀI TOÁN DỰ BÁO KHÁCH HÀNG VIỄN THƠNG CHUYỂN MẠNG 17 1.3.1 Thị trường viễn thơng Việt Nam .17 .Phát biểu toán 21 1.3.2.1 Chu trình th bao viễn thơng 21 1.3.2.2 Phát biểu toán 23 1.4 TIẾP CẬN HỌC MÁY CHO BÀI TOÁN DỰ BÁO KHÁCH HÀNG VIỄN THÔNG CHUYỂN MẠNG 24 1.5 KẾT LUẬN CHƯƠNG 27 CHƯƠNG II: KẾT HỢP THUẬT TOÁN K-MEANS VÀ SVM GIẢI BÀI TOÁN PHÂN LỚP 28 2.1 THUẬT TOÁN PHÂN CỤM K-MEANS 28 2.1.1 Phân cụm liệu 28 2.1.2 Thuật toán Kmeans .29 2.1.3 Nhận xét, đánh giá thuật toán K-mean .33 2.2.THUẬT TOÁN SVM (SUPPORT VECTOR MACHINE) .34 2.2.1 Cơ sở lý thuyết 34 2.2.2 Thuật toán SVM phân lớp .38 2.3 KẾT HỢP THUẬT TOÁN KMEAN VÀ SVM DỰ BÁO CHUYỂN MẠNG 42 2.4 KẾT LUẬN CHƯƠNG 43 CHƯƠNG ỨNG DỤNG DỰ BÁO KHÁCH HÀNG CHUYỂN MẠNG VIỄN THÔNG 44 3.1 GIỚI THIỆU BÀI TOÁN .44 3.2 MƠ TẢ DỮ LIỆU BÀI TỐN 44 3.3.SƠ ĐỒ CÁC BƯỚC CỦA MƠ HÌNH KẾT HỢP KMEAN VÀ SVM 46 3.4 THỬ NGHIỆM VÀ ĐÁNH GIÁ 47 3.5 ĐÁNH GIÁ VÀ KẾT LUẬN CHƯƠNG 53 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN .55 NHỮNG KẾT QUẢ MÀ LUẬN VĂN ĐÃ ĐẠT ĐƯỢC 55 HƯỚNG PHÁT TRIỂN TIẾP THEO 55 TÀI LIỆU THAM KHẢO .57 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT •• AI Trí tuệ nhân tạo (Artificial Intelligence) SVM Máy vector hỗ trợ (Support Vector Machine) VNPT Tập đồn Bưu Viễn thơng Việt Nam ARP U Doanh thu trung bình khách hàng (Average Revenue Per User) DANH MỤC BẢNG BIỂU Bảng 1.1 Tình hình phát triển di động Việt Nam đến năm 2017 [1] 18 Bảng 3.1 Bảng mô tả trường liệu theo báo cáo thống kê hàng tháng VNPT Bình Định 44 Bảng 3.2 Bảng mô tả trường liệu lựa chọn để đưa vào mẫu học .47 DANH MỤC HÌNH ẢNH Hình 1.1 Hình 1.2 Hình 1.3 Hình 1.4 Hình 1.5 Hình 1.6 Hình 1.7 Hình 1.8 Hình 2.1 Hình 2.2 Hình 2.3 Hình 2.4 Hình 2.5 Hình 2.6 Hình 2.7 Hình 2.8 Hình 2.9 Hình 3.1 Hình 3.2 Hình 3.3 Hình 3.4 Hình 3.5 Hình 3.6 Sơ đồ trình phân cụm liệu Ví dụ phân cụm .9 Phân lớp nhị phân phân lớp đa lớp 12 Bài toán phân lớp xác định email spam 13 Doanh thu di động Việt Nam đến năm 2017 [1] 19 Thị phần thuê bao di động Việt Nam đến năm 2017 [1] 20 Thị phần doanh thu di động Việt Nam đến năm 2017 [1] .21 Vòng đời thuê bao di động 23 Xác lập ranh giới cụm ban đầu .29 Tính toán trọng tâm cụm 30 Một số dạng cụm liệu áp dụng thuật toán K-means 32 Phân lớp tuyến tính 34 Lề SVM 36 Minh họa xác định lề 36 Ví dụ hai nhóm mẫu phân tách nhiều đường khác 39 Đường thẳng phân tách hai nhóm mẫu với biên độ phân tách lớn 40 Phân nhiều lớp với SVM .42 Lưu đồ mô hình kết hợp Kmeans-SVM .46 Dữ liệu đầu vào 48 Danh sách tâm cụm sau phân cụm K-mean .49 Các mẫu chọn gần tâm cụm 50 Mô tả kết sau thực thử nghiệm SVM học 51 Minh họa thử nghiệm mơ hình SVM học với mẫu nhập vào 52 Bước 1: Chọn mẫu chuyển mạng Bước 2: Thực thuật toán gom cụm K-means Bước 3: Từ cụm, chọn mẫu Bước 4: Các mẫu chọn kết hợp thêm số mẫu không chuyển mạng để tạo tập diệu đào tạo cho SVM Bước 5: Đánh giá kết mơ hình 2.4 KẾT LUẬN CHƯƠNG Chương trình bày sở lý thuyết thuật toán K-means thuật toán SVM sở phân tích đánh giá thuật tốn Ngồi ra, luận văn đề xuất mơ hình kết hợp thuật tốn K-means thuật tốn SVM phân tích dự báo khách hàng chuyển mạng viễn thơng Mơ hình kết hợp đề xuất loại bỏ trường hợp liệu giống Cách kết hợp thử nghiệm đánh giá chương 3, nhằm tăng hiệu phân lớp dự báo CHƯƠNG ỨNG DỤNG Dự BÁO KHÁCH HÀNG CHUYỂN MẠNG VIỄN THÔNG 3.1 GIỚI THIỆU BÀI TOÁN Để minh họa cho nội dung nghiên cứu chương 2, luận văn tiến hành thử nghiệm cho tốn ứng dụng cụ thể Đó dự báo khách hàng chuyển mạng VNPT Bình Định dựa liệu khách hàng lựa chọn 3.2 MƠ TẢ DỮ LIỆU BÀI TỐN Các báo cáo thông tin sử dụng khách hàng VNPT Bình Định tổng kết theo tháng Dữ liệu thử nghiệm lựa chọn sử dụng dựa báo cáo thống kê Sau mô tả nội dung thông tin mô tả báo cáo Bảng 3.1 Bảng mô tả trường liệu theo báo cáo thống kê hàng tháng VNPT Bình Định STT Mơ tả Số thuê bao người dùng Ngày/tháng/năm hoà mạng sử dụng dịch vụ di động Loại SIM (SINHVIEN: dành cho đối tượng Sinh viên; MyZone: dành cho đối tượng ưu đãi gọi nội vùng ) Số tiền nạp thẻ tháng Số lần nạp thẻ tháng Tiền Tài khoản gọi Tiền tài khoản khuyến mại gọi (KM, KM1 ) Tiền tài khoản nhắn tin Tiền tài khoản khuyến mại nhắn tin 10 Tiền tài khoản đăng ký sử dụng data (số tiền gói, lưu lương) 11 Dịch vụ GTGT cộng thêm 12 Tiền tài khoản ứng tiền trước (trường hợp Tiền tài khoản hết tiền) 13 Tổng tiền thực gọi từ tài khoản tháng 14 Tổng tiền thực gọi từ tài khoản khuyến mại tháng 15 Ngày cuối tháng tổng kết Trên sở liệu cung cấp chương trình thực phân tích kỹ thuật gom cụm K-means giải thuật phân lớp SVM mơ hình kết hợp trình bày chương Về mặt ngữ nghĩa có nhiều trường liệu không thực liên quan đến khả chuyển mạng khách hàng, ví dụ số thuê bao Do thực nghiệm ta thực lựa chọn số trường liệu cụ thể để tạo tập mẫu học Các trường hợp chuyển mạng đưa vào xử lý K-means để chọn mẫu positive đưa vào tập liệu học Trên sở ta chọn thêm mẫu negative trường hợp khách hàng khơng chuyển mạng để hồn thành tập liệu học cho bước phân lớp kỹ thuật SVM 3.3 SƠ ĐỒ CÁC BƯỚC CỦA MÔ HÌNH KẾT HỢP KMEAN VÀ SVM Hình 3.1 Lưu đồ mơ hình kết hợp Kmeans-SVM 3.4 THỬ NGHIỆM VÀ ĐÁNH GIÁ Chương trình thử nghiệm xây dựng dựa sơ đồ hệ thống nêu Chương trình phát triển tảng Visual C++ 2015 Trong ứng dụng liệu để dự báo khách hàng chuyển mạng, trường liệu sau lựa chọn để xây dựng mẫu vector đặc trưng: Bảng 3.2 Bảng mô tả trường liệu lựa chọn để đưa vào mẫu học C7 STT C7 • • • • Mô tả Số tiền nạp thẻ tháng Tiền Tài khoản gọi Tiền tài khoản nhắn tin Tiền tài khoản đăng ký sử dụng data (số tiền gói, lưu lương) Dịch vụ GTGT cộng thêm Tiền tài khoản ứng tiền trước (trường hợp Tiền tài khoản hết tiền) Tổng tiền thực gọi từ tài khoản tháng Nội dung minh họa bước thuật toán chạy Trong ứng dụng liệu để dự báo khách hàng chuyển mạng, liệu đầu vào lưu file dulieu.csv Đây liệu sử dụng để áp dụng thuật toán xây dựng Bước trình xử lý đọc liệu vào Dữ liệu gồm có tập X vector đặc trưng tập Y nhãn Tổng cộng có 9999 mẫu liệu, vector đặc trưng sử dụng có chiều Nhãn đầu giá trị thể có chuyển mạng khơng, tất liệu lưu lại file data_set.xml Mơ tả liệu đầu vào hình 3.2 : [-0.19170277, -0.35009393, -0.12929061, -0.26945978, -0.15044123, -0.0642571, -0.48645794] : [1.3558571, 1.8052853, -0.19759834, -0.24754605, 1.2362143, 0.051024366, 1.4366261] • : [-0.49846467, 0.80014199, -0.12342063, -0.2364248, -0.26190692, -0.013992598, 0.31283316] : [0.24314782, 1.0080332, -0.12478585, -0.33030242, 0.18334469, -0.027776439, 0.57126653] : [1.8901013, 0.99696404, 0.50650811, -0.052840155, 2.7941835, 0.023451542, 1.5988919] : [0.069444008, -0.25870541, -0.1344759, -0.2537168, 0.95580518, 0.012656128, -0.023856308] : [-0.33539703, -0.38122967, -0.10564708, -0.20112036, -0.15733775, 0.0152601, -0.40422615] : [0.26198438, -0.23523167, -0.099986121, 0.27564487, -0.23673007, -0.00061628467, -0.093881443] : [-0.60419798, -0.044987071, -0.16589673, -0.28809085, -0.25346598, -0.077544093, -0.21626611] : [-0.13917738, -0.47216657, -0.058666017, 0.62616265, -0.13645701, -0.029109744, -0.12444366] Hình 3.2 Dữ liệu đầu vào Hình ảnh mơ tả nội dung thử nghiệm thuật tốn K-means Cụ thể thử với tham số với k=100 với cụm sau thực chọn mẫu để đưa vào tập học Các kết gom cụm lưu vào file kmeans_results.xml : [-0.52638948, -0.48298684, -0.20895794, -0.26007015, -0.15677929, -0.061989285, -0.59604526] : [-0.6125198, -0.56405115, -0.13251062, -0.29204363, -0.17809097, 0.0015660599, -0.64117265] : [-0.5931567, -0.58908248, -0.15233889, -0.32482085, -0.153805, 0.013452592, -0.52695405] : [-0.51319015, -0.62011766, -0.16599777, -0.26289061, -0.15757038, -0.093360327, -0.61495399] : [-0.48212546, -0.55578709, -0.19324458, -0.30798694, -0.18418698, 0.043764368, -0.571859] : [-0.55046362, -0.58052528, -0.23631309, -0.23359895, -0.17234324, 0.0032041406, -0.60646802] : [-0.60871923, -0.50921404, -0.21088941, -0.27767256, -0.16250411, -0.076142795, -0.52759266] : [-0.58358467, -0.51064909, -0.11955085, -0.20150067, -0.2138638, -0.094242349, -0.54163849] : [-0.52901226, -0.56397808, -0.099803612, -0.24980389, -0.23499884, 0.044894785, -0.5136171] : [-0.57199168, -0.58837819, -0.2350778, -0.31119308, -0.21526019, -0.070860729, -0.5259558] Hình 3.3 Danh sách tâm cụm sau phân cụm K-means Hình 3.3 mô tả liệu tâm cụm sau thực thuật toán phân cụm Kmeans Tập liệu học cho phân lớp SVM chọn từ mẫu gần tâm cụm, tức mẫu có chuyển mạng, với số mẫu không chuyển mạng khác Mơ hình SVM học dự báo mẫu có chuyển mạng hay khơng : [-0.52304304, -0.47385642, -0.19357233, -0.2633439, -0.15596397, -0.075695299, -0.60645187] : [-0.52973592, -0.49211726, -0.22434357, -0.25679642, -0.15759461, -0.048283275, -0.58563858] : [-0.6245721, -0.56077212, -0.14213389, -0.3074154, -0.18712576, -0.012344099, -0.65187871] : [-0.6004675, -0.56733012, -0.12288735, -0.27667186, -0.16905619, 0.015476218, -0.63046652] : [-0.60771203, -0.58326983, -0.13816591, -0.32632411, -0.15830769, -0.013505792, -0.52122712] : [-0.57860136, -0.59489506, -0.16651189, -0.32331759, -0.14930232, 0.040410977, -0.53268105] : [-0.51319015, -0.62011766, -0.16599777, -0.26289061, -0.15757038, -0.093360327, -0.61495399] : [-0.5341177, -0.57999885, -0.13547614, -0.23803335, -0.16553901, -0.070143171, -0.59951377] : [-0.47927272, -0.55460864, -0.19365571, -0.30622217, -0.18994203, 0.040407147, -0.56002319] : [-0.49194086, -0.57954502, -0.20087388, -0.30374616, -0.17887419, 0.046941575, -0.58837301] : [-0.56184793, -0.58678699, -0.2554042, -0.24155945, -0.16717756, -0.00082750194, -0.60632795] : [-0.538073, -0.56195736, -0.24981965, -0.22380318, -0.18407612, 0.0022820332, -0.63300657] : [-0.60871923, -0.50921404, -0.21088941, -0.27767256, -0.16250411, -0.076142795, -0.52759266] : [-0.62571973, -0.53942937, -0.24009278, -0.31029943, -0.15208176, -0.06046034, -0.49995703] : [-0.57323796, -0.50285059, -0.11057215, -0.20587648, -0.22091645, -0.084365211, -0.56852186] : [-0.59393138, -0.51844758, -0.12852955, -0.19712485, -0.20681116, -0.10411949, -0.51475513] : [-0.52901226, -0.56397808, -0.099803612, -0.24980389, -0.23499884, 0.044894785, -0.5136171] : [-0.53121722, -0.57872903, -0.12041318, -0.29420832, -0.23846821, 0.044602409, -0.54152912] : [-0.58477139, -0.57698816, -0.22571516, -0.32296017, -0.20043445, -0.076264992, -0.52906215] : [-0.55921191, -0.59976828, -0.24444042, -0.29942599, -0.23008594, -0.065456457, -0.52284938] Hình 3.4 Các mẫu chọn gần tâm cụm Hình 3.4 danh sách mẫu có chuyển mạng lựa chọn gần tâm cụm kết bước Kmeans Các mẫu đưa vào làm liệu học cho mơ hình SVM Mơ hình SVM sau học thực thử nghiệm đánh giá tập liệu thử nghiệm [-0.57217056, -0.53045845, -0.1141606, -0.22524199, -0.15738, 0.032481421, -0.54330343] 0 [-0.44866675, -0.24352737, -0.19081706, -0.23312235, -0.21982783, 0.047099955, -0.39624563] 0 [-0.3262943, -0.36515391, -0.089092836, -0.32158563, -0.13042541, -0.054207962, -0.52022427] 0 [-0.41243458, -0.066192016, -0.25508851, -0.21633242, 0.36580116, 0.045399539, - 0.017136235] 0 [-0.28459746, 0.076395191, -0.12605309, -0.31341648, -0.20730877, 0.0093154823, - 0.25872222] 0 [-0.066345811, -0.27092418, -0.10440114, -0.26998729, 0.9267804, -0.062659316, 0.018469704] 0 [0.12966631, -0.089522816, 1.5812522, -0.31374913, -0.14335276, -0.062957481, -0.06986963] 0 [-0.11783089, -0.55353618, -0.098295525, -0.31016079, 0.85015696, 0.0055895355, - 0.19225009] 0 [1.8690808, 1.1501327, 0.11020772, -0.28468046, -0.20647055, -0.09283375, 0.53371769] 0 [0.28726649, 0.37614727, -0.024494817, -0.22547044, 0.41431662, 0.03166797, 0.20738585] 0 [-0.17381954, 0.63343984, -0.1930488, -0.2315349, -0.15793872, 0.044941455, 0.18886542] 0 [-0.47264379, 1.1090844, -0.19410992, -0.33761626, -0.22224064, -0.063435286, 0.56015748] 0 [0.26763186, -0.26293516, -0.18612781, -0.33482417, 1.9295489, -0.02602526, 0.40084249] 0 [2.282057, 2.1851077, 0.74119657, 1.0310143, -0.27418882, -0.10173611, 1.9247345] 0 [-0.11553898, -0.28049341, -0.22501077, -0.28201744, -0.26378953, -0.056387864, -0.46702677] 0 [0.30604145, 0.67633247, 0.36953226, -0.33789328, -0.19217218, -0.081432968, 0.31268224] 0 [-0.49847776, -0.29176086, -0.14108621, -0.22921434, -0.14639658, 0.037721511, -0.46372172] 0 [1.7578646, 0.63195503, 0.89568847, 2.8267696, 0.051760189, -0.082639225, 1.8298432] [-0.50064278, -0.49918774, -0.15629569, -0.27532053, -0.1300202, -0.018556112, -0.49067929] 0 [-0.46071786, -0.21017317, -0.13523732, -0.26474616, -0.19093639, -0.00027645883, - 0.48368219] 0 [0.014781713, -0.60207492, -0.18878806, -0.15890741, 1.1060684, 0.0054056644, -0.035147749] 0 [-0.30870008, 0.082668401, -0.054508898, -0.24069695, -0.16504879, -0.054043122, - 0.13333404] Hình 3.5 Mơ tả kết sau thực thử nghiệm SVM học Hình 3.5 mơ tả kết thực nghiệm mơ hình SVM học Cột giá trị SVM tính ra, cột liệu đánh dấu tập ban đầu, “1” kí hiệu cho chuyển mạng, “0” kí hiệu cho khơng chuyển mạng” Ngồi ta thử nghiệm xem mẫu có chuyển mạng hay không dựa kết dự báo SVM Kết minh họa hình 3.6 Nhap index mau thu (0-9998):10 Ket qua: Khong chuyen mang Nhap index mau thu (0-9998):23 Ket qua: Khong chuyen mang Nhap index mau thu (0-9998):46 Ket qua: Khong chuyen mang Nhap index mau thu (0-9998):78 Ket qua: Co chuyen mang Nhap index mau thu (0-9998):2999 Ket qua: Co chuyen mang Nhap index mau thu (0-9998):299 Ket qua: Khong chuyen mang Nhap index mau thu (0-9998):-1 mau nhap ko hop le Hình 3.6 Minh họa thử nghiệm mơ hình SVM học với mẫu nhập vào Luận văn thực thử nghiệm với quy trình sơ đồ với liệu đánh giá 9799 mẫu, kết 7967 mẫu cho kết 1832 mẫu cho kết sai, độ xác xấp xỉ 81,31 Như độ xác mơ hình thuật tốn Kmean SVM phân lớp dự báo khách hàng chuyển mạng viễn thông thực nghiệm liệu gần 10.000 mẫu cho độ xác dự báo 80% Lý Kmean phân cụm liệu kết hợp cách hiệu xử lý thuộc tính liệu số thuộc tính liệu phân loại cách khác Bên cạnh đó, phương pháp chiến lược tính tốn khác áp dụng để thực tính tốn hợp lý thuộc tính khác Do đó, hiệu ứng cụm tốt thu độ xác thuật tốn mơ hình kết hợp cải thiện Tuy nhiên, thuật toán cụm K-means thuật tốn cụm SVM khơng coi khác biệt thuộc tính liệu Kết thực nghiệm cho thấy, mơ hình kết hợp thuật toán Kmean SVM phân lớp dự báo khách hàng chuyển mạng viễn thông thực nghiệm liệu gần 10.000 mẫu cho độ xác dự báo 80% Lý Kmean phân cụm liệu kết hợp cách hiệu xử lý thuộc tính liệu số thuộc tính liệu phân loại cách khác Bên cạnh đó, phương pháp chiến lược tính tốn khác áp dụng để thực tính tốn hợp lý thuộc tính khác Do đó, hiệu ứng cụm tốt thu độ xác thuật tốn mơ hình kết hợp cải thiện Tuy nhiên, thuật tốn cụm K-means thuật tốn cụm SVM khơng coi khác biệt thuộc tính liệu 3.5 ĐÁNH GIÁ VÀ KẾT LUẬN CHƯƠNG Theo nguyên tắc Pareto, tác động người dùng giá trị cao cao nhiều so với người dùng bình thường ảnh hưởng sách giữ chân người dùng giá trị cao việc ngăn chặn người dùng chuyển mạng rõ ràng Do đó, nghiên cứu chủ yếu tập trung vào chuyển mạng người dùng di động có giá trị cao Dựa vấn đề dự đoán thuộc tính hỗn hợp tồn liệu tiêu thụ người dùng, mơ hình kết hợp thuật tốn Kmean thuật toán SVM thiết kế để dự đoán người dùng chuyển mạng giải vấn đề dự đốn liệu quy mơ lớn kết hợp Trong mơ hình này, thuật tốn Kmean sử dụng để phân cụm thuộc tính hỗn hợp cách hiệu thông qua việc thực phép tính khác thuộc tính số thuộc tính phân loại Trong kết cụm, mẫu gần trung tâm cụm chọn làm đầu vào SVM Bằng cách này, vấn đề độ xác phân loại SVM mẫu quy mơ lớn giải để có kết phân loại tốt Theo ứng dụng dự đốn chuyển mạng, thuộc tính tập liệu gốc mở rộng để phản ánh rõ ràng thay đổi hành vi tiêu dùng người dùng Ngoài ra, nhiều số đánh giá sử dụng để đánh giá hiệu suất mơ hình kết hợp thuật toán Kmean thuật toán SVM So sánh mơ hình kết hợp đề xuất với mơ hình khác từ khía cạnh độ xác Kmean-SVM có hiệu tốt việc xử lý liệu quy mơ lớn kết hợp dự đốn xác xu hướng người dùng KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN NHỮNG KẾT QUẢ MÀ LUẬN VĂN ĐÃ ĐẠT ĐƯỢC Về mặt lý thuyết Tìm hiểu thành phần kiểu kiến trúc học máy toán phân lớp, phân biệt số phương pháp học máy số toán phân lớp Nắm ý nghĩa việc học hay tích luỹ, có vai trị to lớn quy tắc học, mơ hình học thuật tốn học nhiều khả ứng dụng khác Phương pháp Kmean SVM, cách thức kết hợp thuật toán Kmean SVM, để giải toán ứng dụng thực tế Nắm quy trình chung xây dựng hệ thống phân lớp dự báo Về mặt thực tiễn Đưa mơ hình kết hợp thuật tốn Kmean thuật toán SVM hiệu toán phân lớp dự báo khách hàng chuyển mạng viễn thông, thực liệu thực tế VNPT Bình Định Xây dựng chương trình minh họa Tuy biết điều thu nhận phần nhỏ ngành nghiên cứu lớn, tự nhận thấy gặt hái thành công định giai đoạn nghiên cứu HƯỚNG PHÁT TRIỂN TIẾP THEO Bên cạnh kết đạt được, cịn có vấn đề chưa luận văn giải hay đề cập tới Trong thời gian tới tơi tiếp tục nghiên cứu hồn thiện đề tài với mục tiêu đặt sau: - Nâng cao hiệu độ xác hệ thống dự báo khách hàng chuyển mạng để áp dụng hiệu công tác - Nghiên cứu mơ hình kết hợp khác nhằm nâng cao hiệu phân lớp dự báo cho toán dự báo khách hàng viễn thơng VNPT Bình Định TÀI LIỆU THAM KHẢO [1] Bộ Thông tin Truyền thông (2018), Sách Trắng Công nghệ thông tin Tr yền thông (CNTT-TT) Việt Nam 2018 Hà Nội: Nhà xuất Thơng tin Truyền thơng, tr.31-33 [2] Hồng Xn Huấn (2015), Giáo trình Học Máy, Nhà xuất Đại học Quốc gia Hà Nội [3] S Wu et al (2008), “Operations Research and Data Mining,” in European Journal of Operational Research Vol 187, pp 2592-1448 [4] J Burez and D.Van den Poel (2009), “Handling Class Imbalance in Customer Churn Prediction,” in Expert System with Applications Vol 36, pp 4626-4636 [5] V D’Orazio et al (2014), “Separating the wheat from the chaff: applications of automated document classification using Support Vector Machines,” in Political Analysis Vol 22, pp 224-242 [6] E Pasolli et al (2014), “SVM active learning approach for image classification using spatial information,” in IEEE Transactions on Geoscience and Remote Sensing Vol 52, pp 2217-2233 [7] Craft, Ralph C., and C Leake "The Pareto principle in organizational decision making." Management Decision volume 40.8(2002):729-733 [8] Hadden, John, et al (2008) "Churn prediction using complaints data."Enformatika [9] Ying, Wei Yun, et al (2007) "Support Vector Machine and Its Application in Customer Churn Prediction." Systems EngineeringTheory & Practice27.7:105110 [10] Xia, Guo En, and W D Jin "Model of Customer Churn Prediction on Support Vector Machine." Systems Engineering - Theory & Practice28.1(2008):71-77 [11] Sato T, Huang B Q, Huang Y, et al (2010) Using PCA to Predict Customer Churn in Telecommunication Dataset[C]// Advanced Data Mining and Applications -, International Conference, Adma 2010, Chongqing, China, November 19-21, Proceedings DBLP, 2010:326335 [12] Owczarczuk, Marcin (2010), "Churn models for prepaid customers in the cellular telecommunication industry using large data marts." Expert Systems with Applications 37.6(2010):4710-4712 [13] Hồng Xn Huấn (2012), “Giáo trình nhận dạng mẫu”, NXB Đại học Quốc gia Hà Nội [14] Huang, Bingquan, M T Kechadi, and B Buckley (2012), "Customer churn prediction in telecommunications." Expert Systems with Applications 39.1:1414-1425 [15] Tsai, Chih Fong, and Y H Lu (2009), "Customer churn prediction by hybrid neural networks." Expert Systems with Applications 36.10:1254712553 [16] Pendharkar, Parag C (2009) "Genetic algorithm based neural network approaches for predicting churn in cellular wireless network services ☆." Expert Systems with Applications 36.3:6714-6720 [17] Wojewnik, Piotr, et al (2011) "Social-Network Influence on Telecommunication Customer Attrition." Kes International Conference on Agent and Multi-Agent Systems: Technologies and Applications SpringerVerlag, 2011:64-73 [18] Yue, H E., H E Zheng-Lin, and X Y Zhou (2012), "Combined Early Warning of Major Customer Lose in Wireline Telecom Based on Data Mining." Soft Science (2012) [19] Lu, Ning, et al "A Customer Churn Prediction Model in Telecom Industry Using Boosting." IEEE Transactions on Industrial Informatics 10.2(2014):1659-1665 [20] Idris, Adnan, and A Khan "Churn Pdiction System for Telecom using Filter-Wrapper and Ensemble Classification." Computer Journal (2016):bxv123 [21] Fa-Gui LIU, Zhi-Jie ZHANG*, Xin YANG, “Using Combined Model Approach for Churn Prediction in Telecommunication”, Advances in Engineering Research (AER), volume 131 3rd Annual International Conference on Electronics, Electrical Engineering and Information Science (EEEIS 2017) [22] Vũ Thị Thu Huyền (2013), “Kỹ th ật SVM nhận diện phiế điểm”, Luận văn cao học ... dụng cụ thể Đó dự báo khách hàng chuyển mạng VNPT Bình Định dựa liệu khách hàng lựa chọn 3.2 MÔ TẢ DỮ LIỆU BÀI TỐN Các báo cáo thơng tin sử dụng khách hàng VNPT Bình Định tổng k? ??t theo tháng... lớp K > Chúng ta xây dựng việc phân K- lớp dựa việc k? ??t hợp số đường phân lớp (hình 2.9) 2.3 K? ??T HỢP THUẬT TOÁN KMEAN VÀ SVM DỰ BÁO CHUYỂN MẠNG Để giải vấn đề dự báo liệu k? ??t hợp thông tin tiêu... văn đề xuất mơ hình k? ??t hợp thuật tốn K- means thuật tốn SVM phân tích dự báo khách hàng chuyển mạng viễn thơng Mơ hình k? ??t hợp đề xuất loại bỏ trường hợp liệu giống Cách k? ??t hợp thử nghiệm đánh

Ngày đăng: 16/08/2021, 11:16

Mục lục

    DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

    DANH MỤC BẢNG BIỂU

    DANH MỤC HÌNH ẢNH

    1. LÝ DO CHỌN ĐỀ TÀI

    2.1. Mục đích nghiên cứu

    2.2. Nhiệm vụ nghiên cứu

    3. ĐỐI TƯỢNG NGHIÊN CỨU

    4. PHƯƠNG PHÁP NGHIÊN CỨU

    CHƯƠNG 1: TỔNG QUAN VỀ HỌC MÁY VÀ BÀI TOÁN DỰ BÁO KHÁCH HÀNG VIỄN THÔNG CHUYỂN MẠNG

    Bước 1: Chuẩn bị tập dữ liệu huấn luyện (dataset) và rút trích đặc trưng (feature extraction)

Tài liệu cùng người dùng

Tài liệu liên quan