Dữliệu thử nghiệm

Một phần của tài liệu Nghiên cứu một số kĩ thuật khai phá dữ liệu không gian sử dụng cây quyết định (Trang 65 - 68)

Trong luận văn đã sử dụng các dữ liệu địa lý trong cơ sở dữ liệu nền địa lý tỉnh Vĩnh Phúc và dữ liệu quản lý viễn thông đang đƣợc tổ chức, quản lý tại Sở Thông tin và Truyền thông tỉnh Vĩnh Phúc.

Việt Nam hiện có 6 nhà mạng cung cấp dịch vụ thông tin di động mặt đất là: Vinaphone, Mobifone, Viettel, Gtel, Vietnamobile và Sfone. Tổng số các nhà mạng đang phục vụ khoản 119 triệu thuê bao di động. Với số lƣợng thuê bao lớn nhƣ vậy, các nhà mạng phải xây dựng các trạm BTS với mật độ cao để đảm bảo vùng phủ sóng và chất lƣợng dịch vụ. Gần đây, các nhà mạng tăng cƣờng đầu tƣ hạ tầng mạng thông tin di động để đáp ứng việc phát triển các dịch vụ trên nền 3G dẫn đến các BTS ngày càng dày đặc. Khoảng cách giữa các BTS trên cùng một mạng trƣớc đây đối với 2G ở vào khoảng 2 km thì nay rút ngắn còn 800m. Theo số liệu thống kê, cả nƣớc hiện có khoảng 59.000 trạm BTS.

Đặt trạm BTS tại vị trí nào, sử dụng công suất phát bao nhiêu để bán kính phủ sóng phù hợp, không bị chồng lấn phạm vi phủ sóng của các trạm BTS khác, đồng thời tiết kiệm chi phí điện năng tiêu thụ của thiết bị, đảm bảo yêu cầu cung cấp thông tin liên lạc cho các các cơ quan công sở, doanh nghiệp và các đơn vị trọng yếu trên địa bàn, tƣơng xứng với mật độ dân cƣ, trình độ dân trí vùng, tận dụng dùng chung các trạm BTS đang có của các doanh nghiệp khác nhằm đảm bảo đầu tƣ có thể thu về lợi nhuận là một bài toán đặt ra đối với mỗi doanh nghiệp.

Hình 3.1: Bản đồ các trạm BTS trên địa bàn tỉnh Vĩnh Phúc

Vị trí đặt trạm BTS có mối quan hệ khoảng cách với các trạm BTS hiện có, có mối quan hệ với các cơ quan nhƣ công sở, bệnh viện, trƣờng học, .... Vị trí đặt trạm BTS cũng có mối quan hệ với mật độ dân cƣ của các vùng định đặt trạm. Việc quyết định đặt trạm BTS có sự tác động nhiều từ một số thông tin thuộc tính của vùng nhƣ mật độ dân cƣ, khoảng cách đến trạm BTS gần nhất, khoảng cách đến một cơ quan gần nhất, thậm chí có liên quan đến trình độ dân trí của vùng dân cƣ, liên quan đến các

Số hóa bởi trung tâm học liệu http://www.lrc-tnu.edu.vn/ tuyến đƣờng giao thông, ... Từ các số liệu tính toán, doanh nghiệp cần biết, tại một vị trí nào đó trên bản đồ, có nên đặt trạm BTS hay không, đồng thời kết dựa trên quan hệ không gian với các BTS lân cận, doanh nghiệp có thể dự kiến công suất phát sóng của trạm BTS. Việc lựa chọn công suất phát hợp lý sẽ tiết kiệm đƣợc các chi phí nhƣ nguyên vật liệu thiết bị và đặc biệt là tiết kiệm đƣợc điện năng tiêu thụ của trạm BTS, giúp doanh nghiệp tiết kiệm đƣợc chi phí duy trì thƣờng xuyên.Việc đặt trạm BTS trong những vùng dân cƣ đông đúc, có trình độ dân trí cao sẽ có lƣợng khách hàng sử dụng nhiều, mang lại nhiều lợi nhuận cho doanh nghiệp.

Để có thể khai phá dữ liệu không gian hỗ trợ doanh nghiệp ra quyết định, cần thu thập dữ liệu từ nhiều bảng dữ liệu trong cơ sở dữ liệu GIS, từ đó hình thành nên một bảng dữ liệu đầu vào chứa tập dữ liệu huấn luyện là danh sách các điểm mục tiêu dự kiến đặt trạm BTS. Bảng dữ liệu huấn luyện có thể lấy các điểm BTS đã tồn tại, tính toán mối quan hệ không gian nhằm sinh ra các thuộc tính mô tả và độ đo không gian đƣa vào tập huấn luyện.

Hình 3.1 minh họa mối quan hệ giữa các trạm BTS hiện có trên địa bàn tỉnh với các ranh giới xã, phƣờng, thị trấn.

Hình 3.2: Khoảng cách đến trạm BTS gần nhất

Trong nội dung luận văn, có định nghĩa khoảng cách đến trạm BTS gần nhất. Ví dụ sau sẽ minh họa cho việc tính toán khoảng cách gần nhất này (xem Hình 3.2).

Nhƣ Hình 3.2, xét điểm đối tƣợng mục tiêu O cần xem xét đặt trạm BTS và các điểm A, B, C đã có các trạm BTS với bán kính phủ sóng giả sử r1 = 256m, khoảng cách OA=511m. Trong vùng bán kính phủ sóng, sóng tốt, đảm bảo cuộc gọi không bị sự cố truyền dữ liệu. Ta gọi khoảng cách từ O đến trạm BTS A là OA1 (không phải OA), OA1 = OA - r1 = 511 - 256 = 255 m. Tƣơng tự, tính đƣợc khoảng cách từ O đến trạm BTS B là OB1 = 398 và khoảng cách từ O đến trạm BTS3 là OC1 = 631m. Do đó, khoảng cách đến trạm BTS gần nhất là OA1, là giá trị nhỏ nhất của khoảng cách từ O đến tất các trạm BTS trong Layer BTS đang xét, ta gọi tắt là DBTSmin

Số hóa bởi trung tâm học liệu http://www.lrc-tnu.edu.vn/ Tuy nhiên thuật toán ID3 để thực hiện đƣợc phải thực hiện rời rạc hóa các giá trị số khoảng cách. Nếu các điện thoại di động nằm trong bán kính phủ sóng sẽ đảm bảo chất lƣợng cuộc gọi di động tốt. Nếu các điện thoại di động nằm ngoài vùng phủ sóng (giả sử khoảng 300 m) sẽ có sóng trạm BTS phủ tới nhƣng tín hiệu không đảm bảo, chất lƣợng phủ sóng kém. Ngoài bán kính phủ sóng 300m (giá trị 300m là một khoảng cách giả định trên khả năng phủ sóng thực tế của BTS), gần nhƣ không có sóng. Do đó, nếu ta quy định các giá trị nhƣ:

- Nếu DBTSmin<0, tƣơng ứng độ phủ sóng tại điểm đang xét có giá trịTốt (BTSCover = good)

- Nếu 0 ≤ DBTSmin< 300 m, tƣơng ứng độ phủ sóng tại điểm đang xét có giá trị Trung bình (BTSCover = medium)

- Nếu 300m ≤ DBTSmin, tƣơng ứng độ phủ sóng tại điểm đang xét có giá trị là kém (BTSCover = low).

Nhƣ vậy, để áp dụng thuật toán ID3, trƣớc tiên phải rời rạc hóa các giá trị khoảng cách đến các trạm BTS gần nhất theo ba giá trị: good, medium và bad.

Tƣơng tự, tính khoảng cách gần nhất đến các các Feature trong 01 Layer chứa các đối tƣợng (Bệnh viện, trƣờng học, công sở, ...gọi tắt là cơ quan). Trong nội dung luận văn, khoảng cách gần nhất giữa điểm mục tiêu và cơ quan là khoảng cách đƣờng nối giữa hai điểm Point To Point. Thực hiện rời rạc hóa giá trị khoảng cách đến các điểm này ví dụ thành: thấp (low), trung bình (medium) và cao (high).

Về mật độ dân cƣ, tốt nhất là bản độ có vẽ đủ các vùng mật độ dân cƣ, tuy nhiên thực tế có thể lấy mật độ dân cƣ của xã, phƣờng, thị trấn. Rời rạc hóa mật độ dân cƣ thành 03 mức: thấp (low), trung bình (medium) và cao (high).

Dƣới đây là ví dụ minh họa của bản đồ các trạm BTS và các điểm mục tiêu:

Số hóa bởi trung tâm học liệu http://www.lrc-tnu.edu.vn/ Tại vị trí các điểm mục tiêu, có thể đặt (Yes) hoặc không đặt (No) các trạm BTS. Tập hợp các điểm mục tiêu này tạo thành tập huấn luyện đầu vào cho thuật toán phân lớp dữ liệu sử dụng cây quyết định.

Một phần của tài liệu Nghiên cứu một số kĩ thuật khai phá dữ liệu không gian sử dụng cây quyết định (Trang 65 - 68)