Với sự phát triển dịch vụ di động nhanh, các nhà cung cấp viễn thông cần áp dụng công cụ khoa học kỹ thuật như mô hình máy học để thống kê và dự đoán tương đối chính xác sự tăng trưởng, dự đoán dung lượng của nhà cung cấp viễn thông đáp ứng để có kế hoạch phát triển mạng lưới di động phù hợp để vừa đảm bảo chất lượng, không để nghẽn cục bộ, đầu tư hạ tầng được hiệu quả và đáp ứng được chất lượng dịch vụ cho khách hàng với chi phí thấp nhất và hiệu q
iii DANH SÁCH HÌNH VẼ Hình 1.1 Kiến trúc mơ hình phân tích liệu lớn mạng vơ tuyến [5] .5 Hình 2.1 Sơ đồ biểu diễn thuật tốn RF 16 Hình 2.2 Sơ đồ biểu diễn ý tưởng thuật tốn K-means 17 Hình 2.3 Các thành phần chuỗi thời gian .22 Hình 2.4 Dự báo chuỗi thời gian khơng có yếu tố bên ngồi 25 Hình 2.5 Dự báo chuỗi thời gian với yếu tố bên ngồi 27 Hình 3.1 Mô-đun lặp lại LSTM chứa bốn lớp tương tác 39 Hình 3.2 Kiến trúc khối LSTM vani điển hình 40 Hình 3.3 Các bước thực nghiệm cho mơ hình 42 Hình 4.1 Khung thời gian 48h với offset 24 46 Hình 4.2: Khung thời gian 6h với offset 46 Hình 4.3 Mơ hình tập liệu nhãn A với độ đo MAE 47 Hình 4.4: Mơ hình tập liệu nhãn A với độ đo MSLE 48 Hình 4.5 Biểu đồ so sánh độ đo mát tập liệu A 49 Hình 4.6 Mơ hình tập liệu nhãn B với độ đo MSLE 49 Hình 4.7 Mơ hình tập liệu nhãn C với độ đo MSLE 50 iv DANH SÁCH BẢNG Bảng 4.1 So sánh độ đo mát tập A .48 v DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT Từ viết tắt Tiếng Anh ML Machine Learning AI Artificial Intelligence RNN Recurrent Neural Network LTE Long Term Evolution Code-division multiple access CDMA Time-division multiple access TDMA The Global System for Mobile GSM Communications Multilayer perceptron MLP Time delay neural network TDNN Long Short Term Memory LSTM Consumer Electronics Control CEC vi MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii DANH SÁCH HÌNH VẼ iii DANH SÁCH BẢNG iv DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT v MỤC LỤC vi MỞ ĐẦU Tính cấp thiết đề tài Tổng quan vấn đề nghiên cứu .1 Mục đích nghiên cứu .2 Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Bố cục luận văn CHƯƠNG TỔNG QUAN VỀ ỨNG DỤNG HỌC MÁY PHÂN TÍCH LƯU LƯỢNG MẠNG DI ĐỘNG 1.1 Lưu lượng mạng di động .3 1.1.1 Chất lượng dịch vụ (Quality of Service – QoS) 1.1.2 Dung lượng lưu lượng kích thước cell 1.1.3 Dung lượng lưu lượng so với vùng phủ sóng 1.1.4 Thời gian giữ kênh 1.2 Ứng dụng học máy phân tích lưu lượng .5 1.3 Kết luận chương CHƯƠNG CƠ SỞ LÝ THUYẾT VÀ CÁC CƠNG TRÌNH LIÊN QUAN .7 2.1 Cơ sở lý thuyết học máy 2.1.1 Giới thiệu học máy .7 vii 2.1.1.1 Học có giám sát (Supervised learning) 2.1.1.2 Học không giám sát (Unsupervised learning) 2.1.1.3 Học bán giám sát (Semi-supervised learning) 2.1.1.4 Học tăng cường (Reinforcement learning) 2.1.2 Các thuật toán học máy 2.1.2.1 Hồi quy (Linear Regression) .9 2.1.2.2 Cây định (Decision Tree) 15 2.1.2.3 Rừng ngẫu nhiên (Random Forest) 16 2.1.2.4 Support Vector Machine (SVM) .16 2.1.2.5 KNN (k nearest neighbors) 17 2.1.2.6 K-Means 17 2.1.2.7 Mạng thần kinh nhân tạo (Neural Networks) 18 2.2 Kỹ thuật phân tích dự báo theo chuỗi thời gian 18 2.2.1 Phân loại loại chuỗi thời gian 19 2.2.2 Mục tiêu Phân tích Chuỗi thời gian .20 2.2.3 Các thành phần chuỗi thời gian 20 2.2.4 Dự báo chuỗi thời gian .22 2.2.5 Các trường hợp sử dụng phân tích chuỗi thời gian 27 2.3 Các tiêu chuẩn đánh giá .28 2.4 Một số cơng trình nghiên cứu liên quan 30 2.5 Kết luận chương 36 CHƯƠNG NGHIÊN CỨU MÔ HÌNH HỌC MÁY CHO DỰ BÁO LƯU LƯỢNG TRONG MẠNG DI ĐỘNG 37 3.1 Phương pháp Time Series 37 3.2 Thuật toán LSTM 38 3.3 Áp dụng LSTM vào dự báo lưu lượng mạng di động 42 viii 3.4 Kết luận chương 42 CHƯƠNG MƠ PHỎNG CHƯƠNG TRÌNH VÀ ĐÁNH GIÁ KẾT QUẢ .44 4.1 Môi trường liệu thực nghiệm 44 4.1.1 Môi trường thực nghiệm 44 4.1.2 Dữ liệu thực nghiệm 44 4.2 Thực nghiệm kết thực nghiệm mơ hình 45 KẾT LUẬN .51 Kết nghiên cứu đề tài 51 Hạn chế luận văn .51 Hướng phát triển luận văn .51 TÀI LIỆU THAM KHẢO .52 BẢNG CAM ĐOAN .54 MỞ ĐẦU Tính cấp thiết đề tài Tên đề tài: Nghiên cứu mơ hình học máy cho dự báo lưu lượng mạng di động Việt Nam nỗ lực để đại hóa mở rộng mạng lưới viễn thông Trong nước, việc liên lạc tỉnh thành số hóa kết nối với 63/63 tỉnh thành, 705/705 quận/huyện/thị xã, 10.599/10.599 xã/phường/thị trấn thông qua mạng cáp quang sóng vơ tuyến chuyển tiếp Các đường dây tăng lên đáng kể việc sử dụng điện thoại di động phát triển nhanh chóng Tính đến tháng năm 2020, Việt Nam có 126,95 triệu thuê bao điện thoại di động, xếp hạng toàn giới Tại Tây Ninh, nhà cung cấp dịch vụ viễn thông lớn Viettel, mobifone, vinaphone phát sóng 1154 trạm LTE, phủ sóng đến 9/9 thành phố/thị xã/huyện, 95/95 xã/phường/thị trấn góp phần thúc đẩy kết nối chia sẻ liệu, phát triển xã hội số Hiện dịch bệnh covid-19 nguy hiểm, số thời điểm giãn cách xã hội, làm thúc đẩy tăng trưởng lưu lượng (traffic) liệu di động Với phát triển dịch vụ di động nhanh, nhà cung cấp viễn thông cần áp dụng công cụ khoa học kỹ thuật mơ hình máy học để thống kê dự đốn tương đối xác tăng trưởng, dự đốn dung lượng nhà cung cấp viễn thơng đáp ứng để có kế hoạch phát triển mạng lưới di động phù hợp để vừa đảm bảo chất lượng, không để nghẽn cục bộ, đầu tư hạ tầng hiệu đáp ứng chất lượng dịch vụ cho khách hàng với chi phí thấp hiệu Tổng quan vấn đề nghiên cứu Máy học lĩnh vực rộng lớn, khơng có ngơn ngữ lập trình thực việc, nghiên cứu chủ yếu mơ hình LSTM tảng sử dụng Python để ứng dụng dịch vụ mạng di động Nghiên cứu mơ hình LSTM cho việc phân loại chuỗi liệu theo thời gian ứng dụng phân tích liệu mạng di động LTE nhà cung cấp dịch vụ địa bàn tỉnh Tây Ninh Mục đích nghiên cứu Xây dựng, phát triển hệ thống phân tích, quản lý, giám sát hệ thống mạng access LTE dựa mơ hình LSTM dự đốn tăng trưởng lưu lượng mạng di động để đưa Phương án hành động đảm bảo tiến độ hiệu đầu tư cao, chi phí phù hợp Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu: Mơ hình LSTM, cơng cụ thu thập, phân tích log cảnh báo Phạm vi nghiên cứu: Xây dựng rule tăng trưởng mạng di động, công cụ hỗ trợ phân tích log cảnh báo hiệu cho mạng di động LTE Phương pháp nghiên cứu Phương pháp luận: Dựa sở lý thuyết mơ hình máy học để xây dựng mối quan hệ mơ hình LSTM Phương pháp đánh giá dựa sở toán học: Trên sở lý thuyết mơ hình học máy, đề xuất thuật toán để dự báo lưu lượng mạng di động Chứng minh thuật toán đánh giá hiệu thuật tốn Phương pháp đánh giá mơ thực nghiệm: Xây dựng mơ hình mơ thực nghiệm thuật toán đề xuất Bố cục luận văn Ngoài phần mở đầu, mục lục, kết luận tài liệu tham khảo, nội dung luận án chia thành chương, cụ thể sau: Chương trình bày tổng quan mạng di động Chương trình bày sở lý thuyết cơng trình liên quan tới đề tài luận văn Chương trình bày đề xuất, nghiên cứu mơ hình học sâu cho dự báo lưu lượng mạng di động Chương trình bày mơ chương trình đánh giá kết thực nghiệm CHƯƠNG TỔNG QUAN VỀ ỨNG DỤNG HỌC MÁY PHÂN TÍCH LƯU LƯỢNG MẠNG DI ĐỘNG 1.1 Lưu lượng mạng di động Mạng điện thoại di động tạo thành từ số lượng lớn khu vực địa lý gọi cell (tạm dịch tế bào) Các cell xếp để cung cấp vùng phủ sóng di động rộng lớn Trong cell trạm gốc di động gửi nhận tín hiệu vơ tuyến đến từ thiết bị cầm tay di động đặt cell phép người dùng họ kết nối với internet thực gọi Tất trạm gốc liên kết thông qua mạng truyền dẫn trở lại mạng lõi nhà cung cấp dịch vụ di động, mạng quản lý kết nối khách hàng người dùng di động khác khách hàng với internet Các yếu tố quan trọng lưu lượng di động bao gồm: chất lượng dịch vụ, dung lượng lưu lượng kích thước cell, hiệu suất phổ phân vùng, dung lượng lưu lượng so với vùng phủ sóng phân tích thời gian giữ kênh 1.1.1 Chất lượng dịch vụ (Quality of Service – QoS) Tại thời điểm mà ô hệ thống vô tuyến thiết kế, mục tiêu Chất lượng Dịch vụ (QoS) đặt ra, cho: tắc nghẽn chặn giao thơng, vùng phủ sóng chi phối, C / I, xác suất ngừng hoạt động, tỷ lệ chuyển giao thất bại, tỷ lệ gọi thành công tổng thể, tốc độ liệu, độ trễ 1.1.2 Dung lượng lưu lượng kích thước cell Càng tạo nhiều lưu lượng, cần nhiều trạm gốc để phục vụ khách hàng Số lượng trạm gốc mạng di động đơn giản số lượng cell Kỹ sư giao thông đạt mục tiêu đáp ứng số lượng khách hàng ngày tăng cách tăng số lượng cell khu vực liên quan, đó, điều làm tăng số lượng trạm sở Phương pháp gọi tách tế bào (và kết hợp với sectorization) cách để cung cấp dịch vụ cho dân số phát triển Điều đơn giản hoạt động cách chia cell có sẵn thành kích thước nhỏ tăng dung lượng lưu lượng Việc giảm bán kính cell cho phép cell chứa thêm lưu lượng truy cập Chi phí thiết bị cắt giảm cách giảm số lượng trạm gốc thông qua việc thiết lập ba cell lân cận, với cell phục vụ ba cung 120 ° với nhóm kênh khác Mạng vơ tuyến di động vận hành với tài nguyên hữu hạn, hạn chế (phổ tần số có sẵn) Các tài nguyên phải sử dụng cách hiệu để đảm bảo tất người dùng nhận dịch vụ, tức chất lượng dịch vụ trì cách quán Điều cần phải sử dụng cách cẩn thận phổ tần hạn chế, mang lại phát triển tế bào mạng di động, cho phép tái sử dụng tần số cụm tế bào liên tiếp Các hệ thống sử dụng hiệu phổ có sẵn phát triển, ví dụ: hệ thống GSM Bernhard Walke định nghĩa hiệu suất phổ đơn vị dung lượng lưu lượng chia cho tích phần tử băng thơng diện tích bề mặt, phụ thuộc vào số kênh vô tuyến cell kích thước cụm (số cell nhóm cell) 1.1.3 Dung lượng lưu lượng so với vùng phủ sóng Hệ thống di động sử dụng nhiều bốn kỹ thuật truy cập khác (TDMA, FDMA, CDMA, SDMA) Xem khái niệm Di động Giả sử trường hợp Đa truy nhập phân chia theo mã xem xét cho mối quan hệ dung lượng lưu lượng vùng phủ sóng (khu vực bao phủ ô) Hệ thống di động CDMA cho phép tăng dung lượng lưu lượng với chi phí chất lượng dịch vụ 1.1.4 Thời gian giữ kênh Các thông số quan trọng tỷ lệ sóng nhiễu (C / I), hiệu suất phổ khoảng cách tái sử dụng xác định chất lượng dịch vụ mạng di động Thời gian giữ kênh tham số khác ảnh hưởng đến chất lượng dịch vụ mạng di động, xem xét lập kế hoạch mạng Tuy nhiên, việc tính tốn thời gian giữ kênh điều dễ dàng (Đây thời gian Trạm di động (MS) trong gọi) Do đó, thời gian giữ kênh nhỏ thời gian giữ gọi MS di chuyển nhiều q trình chuyển giao diễn MS từ bỏ kênh Trên thực tế, khơng thể xác định xác thời gian giữ kênh Do đó, tồn mơ hình khác cho phân phối thời gian giữ kênh Trong ngành công nghiệp, ước lượng tốt thời gian giữ kênh thường đủ để xác định khả lưu lượng mạng