BO THONG TIN VA TRUYEN THONG HỌC VIEN CONG NGHỆ BƯU CHÍNH VIEN THONG ONHVAN1HIALSv TOTNKGHHOIAEPLUDAAINHOC `X4 DE TAI: “UNG DUNG PHAN TICH HANH VI KHACH HANG VIEN THONG” dol Người hướng dẫn : Nguyễn Văn Thuỷ Sinh viên thực hiện: Nguyễn Khánh Nam Lớp: E17CN01 Hệ: Đại học chính quy HÀ NỘI - 2021 BO THONG TIN VÀ TRUYEN THONG KHOA LUAN TOT NGHIỆP DAI HỌC DE TAI: “UNG DUNG PHAN TÍCH HANH VI KHÁCH HÀNG VIÊN THONG” Người hướng dẫn : Nguyễn Văn Thuỷ Sinh viên thực hiện: Nguyễn Khánh Nam Lớp: E17CN01 Hệ: Đại học chính quy NHAN XET, DANH GIA, CHO DIEM (Của giảng viên hướng dan) Điểm: (bang chữ: ) Đồng ý/ Không đồngý cho sinh viên bảo vệ trước hội đồng chấm tốt nghiệp ¬ ,ngày tháng năm 202] CÁN BỘ - GIẢNG VIÊN HƯỚNG DẪN NHAN XÉT, DANH GIÁ, CHO DIEM (Cua Giang vién phan bién) Điểm: (Bằng chữ: ) Hà Nội, ngày thang năm 2019 CÁN BỘ - GIẢNG VIÊN PHẢN BIỆN (Ký, họ tên) Khoá luận tốt nghiệp đại học Lời cảm ơn LỜI CẢM ƠN Đề có thể hoàn thành đề tài khóa luận tốt nghiệp một cách hoàn chỉnh, bên cạnh sự nỗ lực cố gắng của bản thân còn có sự hướng dẫn nhiệt tình của quý Thầy Cô, cũng như sự động viên ủng hộ của gia đình và bạn bè trong suốt thời gian học tập nghiên cứu và thực hiện khóa luận tốt nghiệp Em xin gửi lời cảm ơn sâu sắc đến thầy giáo TS Nguyễn Văn Thủy, là người đã trực tiếp hướng dẫn, định hướng và giúp đỡ em trong suốt quá trình làm khóa luận tốt nghiệp Em cũng xin gửi lời cảm ơn sâu sắc đến toàn thé thầy cô giáo của Học Viện Công Nghệ Bưu Chính Viễn Thông đã mang tâm huyết cũng như kinh nghiệm của mình đề dạy dỗ, chỉ bảo, hướng dẫn em tròn suốt thời gian học tập tại trường Em cũng xin cảm ơn gia đình, bạn bẻ đã luôn ủng hộ, động viên tôi trong suốt quá trình học tập tại Học Viện Công Nghệ Bưu Chính Viễn Thông Do kiến thức và kinh nghiệm nghiên cứu còn hạn chế nên khóa luận không thể tránh khỏi sai sót, mong các Thay, Cô góp ý dé em hoàn thiện hơn Em xin chân thành cảm ơn Nguyễn Khánh Nam_E17CNO1 i Khoá luận tốt nghiệp đại học Mục lục MỤC LỤC LOI CAM 090 i MUC LUC oun — ii DANH MỤC CÁC KY HIEU VÀ CHU VIET TẮTT ccccceccxccee ii DANH MỤC CAC BẢNG 55+ 22.v t .r - e iii DANH MỤC CAC HINH VE u sesssseessssseccssseecssseecssseesssneecssneecssneessnneeesnneessnees iv 90.1000 1 CHUONG 1: GIỚI THIEU BÀI TOÁN . ccc¿+ccvvvrrtrrrverrrrrrrrrrrrre 2 1.1 Phan tich mat d6 str dung Internet tai thanh phố Thuong Hải 2 1.1.1 Giới thiệu bài fOán - 5.5.s.13.9 T TH.H.H H.H g.u.nh n-h2 1.1.2 Bộ dữ liệu sử dụng - s 1.1 .HH n g k-g 2 1.2 Phân tích hành vi rời khỏi dich vụ sau 1 khoảng thời gian 3 1.2.1 GiGi thidu bai OA oo 3 1.2.2 Bộ dữ liệu sử dụng . . .- s.1 1 H.H ng ng ng n-g - 4 1.3 Kết luận chương .22.+.¿©2.+©E+.+Ex.+£E.E£2.EEE.EEE.E71.1221.211.271.227-121-1 2-1 r2e -cre.4 CHƯƠNG 2: NGHIÊN CUU CÁC PHƯƠNG PHAP PHAN TÍCH DU LIEU DE XÁC ĐỊNH HANH VI KHACH HÀNG -.G.à S H H.H HH H.ư.n-ưệt 6 2.1 Tổng quan về Machine learning .+ 2 2.x+.x+.E2.£E+.Ex.ez.xrz-xe-rr-ser-xe-ee 6 2.1.1 D)ioiii oi 6 2.1.2 Phân loại Machine Ïearn1ng -.- -. + + +.+**.+ *+.vvE.ee.ers.ee.ers.es.eer.ee.re 6 2.2 Phân tích mật độ sử dụng Internet tại thành phố Thuong Hải 7 2.2.1 Tổng quan về học không giám sát .2 2.£.+s.+£.x+.£+.+.£+-z+-zz-+z2se-2 7 2.2.2 Thuật toán K-means -. -. .55 5S.2.33.333.33.E.39 S.92.3 35.55.55.53.15.111 r e7 2.2.3 Thuật toán bậc hai số nguyên tố hỗn hợp (MIQP) - 13 2.2.4 Các công việc EN Quan -.- G.5 2c.1.321.11.311.83.91.11.11.1.1 v.ườ-n22 2.2.5 Định nghĩa mô hình hệ thống và các vấn đề :5-224 2.2.6 Phương pháp giải qUyẾt 2.-5.2.+S.++E.E‡.EE2.EEE.EE.EEE.EE.CEE.rr.ker-ke-rke-ee 27 2.2.7 Đánh giá hiệu Suất .2.-2.2 +¿2.2E2.EE.£EE.ESE.EE.EEE.EEE.EE.EEr-krr-rr-erk-rrr-ei 29 2.2.8 Kết luận 22.22.tt.t.t t r i 37 2.3 Phân tích hành vi rời khỏi dich vụ sau | khoảng thời gian 38 2.3.1 Tổng quan về Thuật toán Ensemble learning .-. :-s-238 Khoá luận tốt nghiệp đại học Mục lục 2.3.2 Lightgbm 22 E2.E.2 E27.112.71 127.121.17 112.112-11- 111:11.-1©12x2c-re.43 2.4 Kết luận chương 2.-2-.5 ©S£.+SE.+EE.£EE.CEE.EEE.EEE.E2E.211.211.211.717.1121.1 2-11-21- 53 CHƯƠNG 3: PHAN TICH CHỨC NANG VA THIET KE HỆ THONG 55 3.1 Mô tả hệ thống bằng ngôn ngữ tự nhiên ¿- 5¿5sz©z++cxz+cxe2 55 3.2 Phan tich hé thong 008 Ả 55 3.2.1 Biểu đồ UseCase c.cccccccsessssssessessesssessessessesssssessesssssssessessessesssesseesess 55 3.2.2 Kịch bản Chuan c.ccsccccsessessssssecsessssssssessessssusssessessssusssessessessessseeseesess 56 3.3 Kết luận chương ¿.5 +tS.E+S.ESEE.E 2.112.11 217.11.171.21.111-1 7-11-11-11-1.-cre.57 CHƯƠNG4 : CAI DAT HE THỒNG 2.-2 2+.+.EE.+£E.eE.Ec.zEr.Ex.er-xer2re-ee 58 4.1 Giới thiệu về Django cescceccecsessesssessessesssssessessessesssessessessusssessessessessueeseeses 58 4.2 Giới thiệu về IBM CPLEX 2-.2: 5£ ©5£.+S£.£EE.£EE.EEE.EEE.EEE.EEE.rEe.rrr.rrk-err-ee 58 4.3 Giới thiệu về LightŒbm .2-.2.2.£ ©+.£+E.E£+.EE£.2EE.£EE.EEE.EEE.EEC.EEE.EEk.err.krr.rrr-ee 58 4.4 Một số giao kết quả đầu ra của hệ thống 2.-2 2 +s.>x.+£.xe-rx-rr-sz-re-z 59 9000/9002 :::: Ö Œ 1 62 DANH MỤC TAI LIEU THAM KHẢO 2.-.2.5.¿©2.+¿.2£2.2E.+2.£xz.2£.x+.zxe.sr.xs 63 11 Khoá luận tốt nghiệp đại học DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIÉT TẮT IoT Internet of things Internet van vat MIQP Mixed-Interger quadaric programing Lập trình bậc hai số nguyên hỗn hợp MILP Mixed-Integer Linear Programming Lập trình tuyến tính số nguyên hỗn hợp MINLP Mixed-Integer NonlinearProgramming Lập trình phi tuyến tính số nguyên NP Nondeterministic polynomial-time hon hợp QP Quadratic Programming Thời gian đa thức không xác định GO Global Optimization OA Outer Approximation Lập trình bậc 2 NLP Nonlinear Programming CPLEX — IBM ILOG CPLEX Optimization Tối ưu toàn cục Xap xỉ ngoài Studio Lap trinh phi tuyén tinh Gói phan mềm tối ưu của IBM MIQCP Mixed-Integer quadaric-Contrained Lập trình bậc hai số nguyên hỗn hợp Programming giới hạn LigthGB Light Gradient Boosting Machine May tang d6 déc nhe M Cây quyết định tăng cường Gradient GBDT Gradient boosting decision tree Lay mẫu một phía dựa trên Gradient GOSS Gradient-based One-Side Sampling Gói tinh năng độc quyền EFB Exclusive Feature Bundling Tăng cường độ dốc Stochastic SGB Stochastic gradient boosting Diện tích dưới đường cong AUC The Area Under the Curve Thu nhập tích lũy chiết khấu được NDCG Normalized Discounted Cumulative chuân hóa Gain Hoc dé xép hang LETOR LEarning TO Rank Hết bộ nhớ OOM Out of memory Mau view MTV model-template—views Tổ chức phần mềm Django DSF Django Software Foundation Trí tuệ nhân tạo AI Artificial Intelligence Các thuộc tính chính KDE Key data element il Khoá luận tốt nghiệp đại học DANH MỤC CÁC BÁNG Bảng 1.1 Bảng miêu tả bộ dữ liệu của thành phố Thượng Hải 3 Bảng 1.2 Bảng miêu tả bộ dữ liệu Churn 5 5 5 S.5 **.+*.££+.*e.ex.se.es.ee-er-ss 4 Bảng 2.1 Các kí hiệu và CHU BI1ải .c.1 33.111.3 111.9 11.81.11.1.11.1 k.rr-re 25 Bảng 2.2 Thông tin của một phan các trạm gốc 2 + +£-s+-z-s+-zs-zs-z 30 Bang 2.3 Các tông mục tiêu giá trị của từng phương pháp tiếp cận vị trí đám mây cạnh tranh với các khối lượng cạnh tranh . .- +.c 1 *.3 vs i.rrr.rre.rrr.ee31 Bảng 2.4 Các giá trị mục tiêu tổng thé của từng phương pháp tiếp cận vi trí dam mây cạnh đối với số lượng các đám mây cạnh ¿.+ +.++x.+2.x+-+z.x++.zx-zz-xe-ez 33 11 Khoá luận tốt nghiệp đại học DANH MỤC CÁC HÌNH VE Hình 1.1 Sự phân bố của các trạm gỐc 2.+ x++.+++.x+-+£+-+zx-er-xez-xxe-rx-erx¿ee 3 Hình 1.2 Sự phân bố mức độ sử dung Internet tại 2/7/2014 +++-