Nghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5GNghiên cứu dữ liệu không gian phát triển trạm BTS 5G
Trang 2HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: TS Huỳnh Trọng Thưa
Phản biện 1: ……… Phản biện 2: ……… Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông
Vào lúc: giờ ngày tháng năm
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
Trang 3MỞ ĐẦU
1 Tính cấp thiết của đề tài
Hiện nay, việc quản lý và phát triển trạm BTS là rất quan trọng trong hệ thống thông tin di động Công nghệ thông tin, đặc biệt là hệ thống thông tin địa lý GIS, đã được ứng dụng để tổng hợp, quản lý và báo cáo thông tin về trạm BTS Đồng thời, việc dự đoán vùng không gian phù hợp cho trạm BTS cũng hỗ trợ cho quy hoạch và quản lý chiến lược phát triển Nhu cầu truy cập Internet và khối lượng dữ liệu ngày càng gia tăng, cần nâng cấp cơ sở hạ tầng di động để đáp ứng tải thông tin lớn Công nghệ 5G có tiềm năng biến đổi nền kinh tế và cuộc sống của mọi người, từ thanh toán toàn cầu đến giáo dục từ xa và lực lượng lao động linh động Viettel đã triển khai dịch vụ di động 5G tại nhiều tỉnh thành, đồng thời việc phát triển và quy hoạch trạm BTS 5G cần được chú trọng để đảm bảo phủ sóng và cung cấp dịch vụ tốt hơn cho người dùng Đề tài như sau:
Tên tiếng Việt: NGHIÊN CỨU DỮ LIỆU KHÔNG GIAN PHÁT TRIỂN TRẠM BTS 5G
Tên tiếng Anh: RESEARCH ON SPATIAL DATA TO DEVELOP 5G BASE TRANCIEVER STATIONS.
Trang 42 Tình hình nghiên cứu liên quan đến đề tài
Các nghiên cứu hiện tại xoay quanh việc sử dụng dữ liệu không gian để nâng cao hiệu suất và khả năng phục vụ của mạng 5G và các trạm BTS Các phương pháp phân tích không gian và ứng dụng trí tuệ nhân tạo giúp tối ưu hóa vị trí trạm BTS, dự đoán nhu cầu sử dụng mạng và quản lý thông lượng Dữ liệu không gian cung cấp thông tin quan trọng để đầu tư vào hạ tầng mới và cải thiện chất lượng mạng hiện có
3 Mục tiêu, ý nghĩa khoa học và thực tiễn
Nghiên cứu tập trung vào mục tiêu tối ưu hoá quy hoạch và quản lý trạm BTS, giảm thiểu sự phụ thuộc vào nguồn nhân công và tăng cường nâng cấp hạ tầng viễn thông Các mục tiêu cụ thể bao gồm sử dụng máy học và dữ liệu không gian để dự báo và đánh giá phát triển trạm 5G
4 Đối tượng và phạm vi nghiên cứu
4.1 Đối tượng nghiên cứu
Nghiên cứu tập trung vào dữ liệu không gian của trạm BTS và áp dụng thuật toán dự báo và máy học để xây dựng mô hình Công cụ như Rstudio, Google Colab và MatLab sẽ được sử dụng để đánh giá kết quả dự báo và độ chính xác của mô hình
Trang 54.2 Phạm vi nghiên cứu
Phạm vi nghiên cứu:
Tập dữ liệu không gian trạm BTS tại Viettel Tây Ninh đã được thông qua ý kiến của lãnh đạo Viettel Tây Ninh cấp duyệt
learning phù hợp với bộ spatial data thu thập được
5 Phương pháp nghiên cứu
5.1 Phương pháp nghiên cứu lý thuyết
Tìm tài liệu, sách về dữ liệu không gian, mô hình dự đoán dữ liệu không gian, GIS, phân bố trạm BTS 5G, số lượng người dùng và các thuật toán dự báo; cũng như tìm tham khảo từ hội thảo, công trình, đề tài, luận văn trong và ngoài nước, và tài liệu về học sâu và dữ liệu lớn như Python NoteBook, Google Colab, Rstudio, MatLab
5.2 Phương pháp nghiên cứu thực nghiệm
- Sau khi nghiên cứu lý thuyết, các bài toán, đề xuất mô hình; xây dựng và phát triển ứng dụng dựa trên mô hình đề xuất; cài đặt thử nghiệm chương trình, đánh giá các kết quả đạt được; công bố kết quả nghiên cứu
Trang 66 Bố cục đề án
Bên cạnh phần mở đầu, phần kết luận và phần tài liệu tham khào, phần nội dung chính của bài nghiên cứu được chia thành 4 chương chính như sau:
Chương 1: Tổng quan đề tài
Chương 2: Các công trình liên quan Chương 3: Thuật toán đề xuất
Chương 4: Kết quả mô phỏng thực nghiệm
Trang 7GIỚI THIỆU TỔNG QUAN VỀ TRẠM BTS 5G VÀ KHÔNG GIAN PHÁT TRIỂN
1.1 Tổng quan về trạm BTS 5G
1.1.1. Tổng quan về trạm BTS 5G tại Việt Nam
Công nghệ 5G sử dụng các trạm sóng di động và công nghệ OFDM để truyền dữ liệu qua sóng vô tuyến, giúp cung cấp tốc độ cao, kết nối ổn định hơn và dung lượng tăng cường Ngoài ra, 5G cũng sử dụng các máy phát nhỏ hơn và phân chia mạng để hỗ trợ nhiều thiết bị và cung cấp dịch vụ linh hoạt và tùy chỉnh cho từng trường hợp sử dụng và mô hình kinh doanh khác nhau
1.1.2. Tình hình 5G tại Việt Nam [5]
Việt Nam đã trở thành nước thứ 5 trên thế giới sở hữu và phát triển thiết bị 5G, nhờ sự hợp tác giữa Viettel và Vingroup theo chuẩn mở Open RAN, với Vingroup chịu trách nhiệm về phần cứng và Viettel tập trung vào phần mềm và tích hợp sản phẩm thương mại
Trang 8Hình 1.1:Các mốc thời gian lộ trình phát triển 5G tại Việt Nam
1.2 Tổng quan về dữ liệu không gian (Spatial Data)
Dữ liệu không gian tham chiếu đến vị trí địa lý và có thể chứa thông tin về các biến số khác Có hai loại dữ liệu không gian chính là dữ liệu hình học (điểm, đường, đa giác) và dữ liệu địa lý Dữ liệu vectơ được sử dụng để biểu diễn các đối tượng và tính năng trên bề mặt Trái đất, thường được lưu trữ dưới định dạng shapefile (.shp)
Hình 1.2:Ví dụ về ảnh vector
Trang 9Raster: Dữ liệu raster là dữ liệu được trình bày
dưới dạng lưới pixel, mỗi pixel mang giá trị để truyền đạt thông tin về phần tử Raster thường liên quan đến hình ảnh, bao gồm cả hình ảnh trực giao từ vệ tinh Chất lượng dữ liệu raster phụ thuộc vào độ phân giải và mục đích sử dụng
Hình 1.3:Ví dụ về ảnh raster
Attributes: Dữ liệu không gian chứa thông tin vị trí
và các thuộc tính bổ sung liên quan đến đối tượng, ví dụ như bản đồ các tòa nhà với các thuộc tính như loại hình sử dụng, năm xây dựng và số tầng
Hệ tọa độ địa lý (Geographic Coordinate System:
Hệ tọa độ địa lý sử dụng các đường vĩ độ và kinh độ để xác định vị trí trên bề mặt Trái đất, trong đó các đơn vị đo được biểu thị bằng độ
1.3 Tổng quan về học máy với dữ liệu không gian
Học máy sử dụng dữ liệu để xây dựng mô hình và dự đoán giá trị mục tiêu, trong khi phân tích dữ liệu không
Trang 10gian trong GIS bao gồm thu thập, quản lý, phân tích và biểu diễn thông tin không gian dưới dạng dữ liệu vectơ (điểm, đường, đa giác) và dữ liệu raster (hình ảnh pixel)
Hình 1.4:Ví dụ về phân tích dữ liệu không gian và trực quan hóa chúng
Trong dữ liệu không gian, mỗi quan sát có mối quan hệ không gian với các quan sát khác, cho phép thực hiện phân tích không gian và thao tác hình học như clip, xóa, đệm, hợp nhất, nội suy, v.v
Học máy áp dụng vào phân tích dữ liệu không gian: Các thuật toán học máy như hồi quy, phân loại và
phân cụm có thể được áp dụng để xử lý dữ liệu không gian, và phép nội suy như Empirical Bayesian Kriging (EBK), Ordinary Least Squares (OLS) và Geographically Weighted Regression (GWR) giúp dự đoán các giá trị chưa biết trong không gian dựa trên các biến phụ thuộc và quy tắc Bayes
Trang 11Hình 1.5:Ví dụ về ứng dụng học máy để tách lớp
Học máy để nội suy: Hồi quy và phân loại trong
học máy có thể được sử dụng để dự đoán biến mục tiêu và phân loại các đối tượng trong không gian, nhưng phép nội suy không gian và phân loại lớp phủ đất từ hình ảnh vệ tinh là các nhiệm vụ phổ biến trong xử lý dữ liệu không gian
Hình 1.6:Ví dụ về sử dụng SVM để phân lớp ảnh raster
Trang 12Hình 1.7:Ví dụ về phân cụm theo không gian
CHƯƠNG 2 CÁC CÔNG TRÌNH LIÊN QUAN
2.1 Các công trình liên quan trên thế giới
Trong nghiên cứu, sử dụng Hệ thống thông tin địa lý (GIS) và công cụ dự đoán lan truyền tín hiệu dựa trên dò tia kết hợp với thông tin địa lý 3D để tối ưu hóa vùng phủ sóng mạng di động tại một khu vực đô thị ở Kenya, giúp tiết kiệm chi phí và cung cấp vùng phủ sóng hiệu quả
Sử dụng Hệ thống thông tin địa lý (GIS) và phân tích không gian, một phương pháp được đề xuất để đánh giá sự phù hợp của vị trí Trạm gốc của mạng di động BSNL ở Uttarakhand, Ấn Độ, nhằm tối ưu hóa và tự động hóa quy trình lập kế hoạch mạng, với việc sử dụng dữ liệu địa lý và mô hình dự đoán lan truyền
Trang 13Quản lý thông tin và công nghệ phụ thuộc vào lượng thông tin thời gian thực, và việc phân phối thông tin hiệu quả và tăng cường cơ sở hạ tầng truyền thông là quan trọng để đáp ứng nhu cầu ngày càng tăng của dịch vụ di động Ứng dụng Machine learning và dữ liệu không gian trong các nghiên cứu đang trở nên quan trọng, với tiềm năng của các phương pháp học máy không phân cấp và mạng nơ-ron trong phân tích dữ liệu không gian địa lý và các ứng dụng dân sự
Công bố đầu tiên của Xiangping Gu và đồng nghiệp tìm hiểu về mạng 5G IoT và áp dụng nén cảm biến để cải thiện hiệu suất truyền dữ liệu cảm biến trong môi trường 5G Công bố thứ hai của Gupta và đồng nghiệp so sánh các phương pháp phân loại máy học trên dữ liệu RSSI và tìm ra rằng Gaussian Process là phân loại hiệu quả nhất Bài viết của Akansha Gupta và đồng nghiệp nghiên cứu về phân loại máy học dựa trên dữ liệu RSSI để dự đoán mất mát truyền thông trong kế hoạch mạng 5G, và kết quả cho thấy Gaussian Process là phương pháp có hiệu suất tốt nhất so với các phương pháp
Trang 14khác Bài báo của Vadlamudi và đồng nghiệp trình bày một thiết kế anten độc đáo cho Trạm phát sóng cơ sở (BTS) 5G dưới 6 GHz, với chế độ kép phân cực và cách ly cao, giúp cải thiện hiệu suất và khả năng cách ly của anten MIMO
2.2 Các công trình liên quan ở Việt Nam
Phạm Ngô Việt Cường nghiên cứu về việc quản lý và phát triển trạm BTS trong khu vực đông dân cư, trung tâm huyện - thành phố, và đề xuất giải pháp hỗ trợ công tác quy hoạch và quản lý hệ thống BTS tỉnh Quảng Nam nhằm đáp ứng nhu cầu thông tin liên lạc ngày càng tăng và giúp phát triển kinh tế - xã hội địa phương
CHƯƠNG 3 MÔ HÌNH ĐỀ XUẤT DỰ BÁO KHÔNG GIAN PHÁT TRIỂN TRẠM
BTS THEO LƯU LƯỢNG 3.1 Thiết kế mô hình
Đề án sử dụng mô hình học máy kết hợp Linear Regression, Decision Tree Regressor và Random Forest Regressor để dự báo không gian phát triển trạm BTS 5G dựa trên lưu lượng sử dụng và các đặc trưng địa lý, nhằm cung cấp dự báo chính xác về không gian mạng BTS 5G
Trang 153.2 Bộ dữ liệu của bài toán
Bộ dữ liệu thu thập được từ 600 trạm BTS tại Tây Ninh và quan sát trong 6 giờ 1 buổi sáng, thu thập lại các dữ liệu liên quan đến lưu lượng Bộ dữ liệu như sau:
RangeIndex: 600 entries, 0 to 599 Data columns (total 17 columns): # Column Non-Null Count Dtype
- - - -
0 STT 600 non-null int64
1 National_Code 600 non-null object
2 BTS_Code 600 non-null object
3 District 599 non-null object
4 Ward 599 non-null object
5 Long 600 non-null float64
6 Lat 600 non-null float64
7 Total_Traffic 600 non-null float64
Trang 168 User_throughput 600 non-null float64
9 Percent_Rank1 600 non-null float64
10 CDR 600 non-null float64
11 HO_PREP_IN_ATT 600 non-null int64
12 AVG_CQI 600 non-null float64
13 2G 600 non-null int64
14 3G 600 non-null int64
15 4G 600 non-null int64
16 5G 600 non-null int64
Trang 17- User_throughput là thông lượng người dùng
(tốc độ trung bình người dùng download / upload) đo lường qua trạm trong 6 giờ
- Percent_Rank1 là phần trăm các thuê bao
Trang 18Hình 3.1:Biểu đồ heatmap Hệ số tương quan Pearson
Ngoài ra, ta có thông số thống kê mô tả cho các giá trị đo lường được tại các trạm BTS trong bộ dữ liệu được tóm tắt như sau:
Hình 3 2:Thống kê mô tả các dữ liệu kiểu số
Trang 19Dữ liệu tọa độ và các thông số liên quan đến lưu lượng, hiệu suất và phân phối công nghệ trong mạng BTS 5G cho thấy mô hình không gian và tính chất của hệ thống mạng di động
Ta có biểu đồ tương quan giữa các biến liên tục như sau:
Hình 3 3:Biểu đồ phân bổ theo các biến
Hình 3.4:Biểu đồ phân bổ các trạm BTS theo huyện
Trang 20Dựa vào biểu đồ cột thể hiện phần trăm số lượng trạm BTS theo huyện, ta có thể nhận xét rằng Thành phố Tây Ninh và Tân Châu là hai huyện có số lượng trạm BTS đáng kể, trong khi các huyện khác có số lượng trạm BTS tương đối đồng đều và thấp hơn
Hình 3.5:Biểu đồ phân bổ các trạm BTS theo xã/phường
Dựa vào biểu đồ cột thể hiện phần trăm số lượng trạm BTS theo xã/phường, ta nhận thấy sự đa dạng về tỷ lệ trạm BTS giữa các xã/phường, từ 9.0% đến 22.0% Có một số xã/phường có số lượng trạm BTS lớn, trong khi hầu hết các xã/phường có số lượng trạm BTS thấp
Trang 21Hình 3.6:Biểu đồ cột các trường dữ liệu kiểu số
Hình 3.7:Biểu đồ phân bố thiết bị 3G
Hình 3.8, biểu đồ histogram về phân bổ thiết bị 3G cho thấy số lượng thiết bị 3G qua các trạm không cao, tập trung khoảng từ 0-40 thiết bị trên 1 trạm BTS Và rất ít trạm BTS có số lượng thiết bị 3G lên đến 100
Hình 3.8:Biểu đồ phân bố thiết bị 4G
Hình 3.9, biểu đồ histogram về phân bổ thiết bị 4G cho thấy số lượng thiết bị 4G qua các trạm khá cao, tập trung
Trang 22khoảng từ 0-2000 thiết bị trên 1 trạm BTS Và rất ít trạm BTS có số lượng thiết bị 4G lên đến 5000
3.3 Phương pháp đánh giá
MSE, R-squared và RMSE được sử dụng để đánh giá độ chính xác, tin cậy và khác biệt giữa giá trị dự đoán và quan sát trong mô hình Trong đề án này, RMSE được sử dụng để đo hiệu quả của 3 mô hình dự báo, và giá trị ước lượng càng tốt khi RMSE càng nhỏ
CHƯƠNG 4 THỰC NGHIỆM VÀ ĐÁNH GIÁ
4.1 Phân tích dữ liệu với GIS
Ta có không gian tỉnh Tây Ninh như sau:
Hình 4 1 Bản đồ tỉnh Tây Ninh theo hành chánh Huyện
Trang 23Với 9 huyện và thành phố trực thuộc tỉnh: Bến Cầu, Châu Thành, Dương Minh Châu, Gò Dầu, Hòa Thành, Tân Biên, Tân Châu, Tây Ninh, Trảng Bàng
Hình 4 2 Bản đồ tỉnh Tây Ninh theo hành chánh phường xã
Với 95 phường / xã / thị xã trực thuộc 9 huyện: An Thạch, Bến Cầu, Lợi Thuận, Long Chữ, Long Giang, Long Khánh, Long Phước, Long Thuận, Tiên Thuận, Đồng Khởi, An Bình, An Cư, Biên Giới, Châu Thành, Hòa Hội, Hòa Thạnh, Hảo Đước, Long Vĩnh, Ninh Điền, Phước Vinh, Thành Long, Thái Bình, Thánh Điền, Trí Bình, Bàu Năng, Bến Củi, Cầu Khởi, Chà Là, Dương Minh Châu, Lộc Ninh, Phước Minh, Phước Ninh, Phan, Suối Đá, Truông Mít, Bàu Đồn, Cẩm Giàng, Gò Dầu, Hiệp Thạnh, Phước Đông, Phước Thạnh, Phước Trạch, Thánh Phước,
Trang 24Thạnh Đức, Hòa Thành, Hiệp Tân, Long Thành Bắc, Long Thành Nam, Long Thành Trung, Trường Đông, Trường Hòa, Trường Tây, Hòa Hiệp, Mỏ Công, Tân Bình, Tân Biên, Tân Lập, Tân Phong, Thạnh Bình, Thạnh Bắc, Thạnh Tây, Trà Vong, Suối Dây, Suối Ngô, Tân Đông, Tân Châu, Tân Hà, Tân Hội, Tân Hòa, Tân Hưng, Tân Hiệp, Tân Phú, Tân Thành, Thạnh Đông, 1, 2, 3, 4, Bình Minh, Hiệp Ninh, Ninh Sơn, Ninh Thạnh, Tân Bình, Thạnh Tân, Đôn Thuận, An Hòa, An Tịnh, Bình Thạnh, Gia Bình, Gia Lộc, Hng ThuËn, Lộc Hưng, Phước Chỉ, Phước Lưu, Trảng Bàng
Phân bổ lưu lượng đo lường được ở các trạm như sau:
Hình 4 3 Bản phân bổ các trạm BTS theo tổng lưu lượng
Trang 25Hình 4 4 Bản phân bổ các trạm BTS theo tổng lưu lượng với không gian phường xã
Hình 4 5 Bản đồ phân bổ các trạm BTS theo tổng lưu lượng theo vị trí khu vực