5.1. Giới thiệu chung
Phân tích dữ liệu là rút ra những thông tin và kết luận từ việc nghiên cứu dữ liệu và là công việc của mỗi ngành nghề, mỗi nhà chuyên môn khi ứng dụng GIS. Phân tích dữ liệu và mơ hình hóa khơng gian được xem là phần cốt lõi, phần trọng tâm và là chức năng quan trọng nhất của GIS.
Phân tích dữ liệu khơng gian bao gồm việc sử dụng các phép toán để sắp xếp các dữ liệu đó cũng như các dữ liệu thuộc tính có liên quan. đa số các phân tích khơng gian thường được ứng dụng để giải quyết các vấn đề cụ thể, ví dụ như nhận biết các vùng có tính bất ổn về an ninh cao, hay đưa ra danh sách các đoạn đường cần sửa chữa lại, hay là chọn một vị trí tốt nhất cho hoạt động kinh doanh.
Các phép tốn khơng gian có thể được sử dụng liên tiếp nhau để giải quyết vấn đề nào đó. Mỗi phép tốn khơng gian sẽ tạo ra một sản phẩm đầu ra và sản phẩm đó có thể được sử dụng như dữ liệu đầu vào của các phép toán khác. Một phần thách thức của việc phân tích dữ liệu khơng gian đó là việc lựa chọn các phép tốn khơng gian thích hợp và ứng dụng chúng theo các trật tự thích hợp.
Hình 5.1: Chuỗi liên tục các phép tốn khơng gian thường được sử dụng để thu
được lớp dữ liệu cuối cùng mong muốn
Việc phân tích dữ liệu khơng gian thường sử dụng dữ liệu từ một hay nhiều lớp dữ liệu để tạo ra dữ liệu đầu ra. Phép phân tích có thể gồm có một phép toán đơn lẻ sử dụng cho một lớp dữ liệu hoặc nhiều phép tốn có khả năng kết hợp dữ liệu đầu vào từ nhiều lớp dữ liệu để tạo ra dữ liệu đầu ra mong muốn.
n
-
Một đầu vào - Nhiều đầu ra
Lớp dữ liệu không gian 1 Hàm 1 Hàm 3 n - Nhiều đầu vào - Một đầu ra
Lớp dữ liệu Lớp dữ liệu không gian 5 không gian 6
Hàm 2 Hàm 4
Lớp dữ liệu Lớp dữ liệu Lớp dữ liệu
không gian 2 Lớp dữ liệu không gian 4 không gian 7 khơng gian 3
Hình 5.2: Nhiều phép phân tích dữ liệu khơng gian có số lượng lớn các phép tốn
và hàm khơng gian
Như được minh họa trong hình 5.2, trong các phép phân tích dữ liệu khơng gian, có thể có một hay nhiều dữ liệu đầu vào hay đầu ra. Nhiều phép tốn chỉ địi hỏi một lớp dữ liệu đầu vào và tạo ra một lớp dữ liệu đầu ra; ví dụ như phép chuyển đổi dữ liệu vector sang raster. Cũng có các phép tốn tạo ra một vài lớp dữ liệu đầu ra từ một đầu vào hay đòi hỏi một số đầu vào để tạo ra một lớp dữ liệu đầu ra. Các hàm phân tích địa hình có thể sử dụng lưới raster về độ cao như là một lớp dữ liệu đầu vào và tạo ra cả dữ liệu độ dốc (mỗi pixel có độ dốc như thế nào) và dữ liệu về hướng địa hình (độ dốc ở một vị trí nào đó có hướng như thế nào). Lớp dữ liệu trung bình là một ví dụ của việc sử dụng nhiều lớp dữ liệu đầu vào để tạo nên một lớp dữ liệu đầu ra.
Trong GIS, việc phân tích hay khai thác dữ liệu có thể được thực hiện ở các mức độ sau:
Dữ liệu thuộc tính trong các bảng được sắp xếp lại để trình bày trong các báo cáo hay sử dụng ở các hệ máy tính khác.
Các thao tác được thực hiện trên các dữ liệu hình học hay ở chế độ tìm kiếm hay vì các mục đích tính tốn.
Các thao tác logic, số học và thống kê được thực hiện ở các bảng thuộc tính.
Hình học và bảng thuộc tính được dùng chung để lập các bộ dữ liệu mới dựa trên các thuộc tính gốc và phát sinh; hay lập bộ dữ liệu mới dựa trên các mối quan hệ địa lý.
Nói cách khác, phân tích dữ liệu bằng GIS có thể được xếp thành ba nhóm: hỏi đáp cơ sở dữ liệu, lập bản đồ phát sinh và mơ hình hóa q trình. Hỏi đáp cơ sở dữ liệu là đơn thuần lấy ra thơng tin có sẵn trong cơ sở dữ liệu. Lập bản đồ phát
sinh là quá trình tạo ra các lớp dữ liệu mới từ các lớp dữ liệu cũ bằng cách lấy thơng tin có sẵn và thêm vào đó thơng tin mới là sự hiểu biết về mối quan hệ giữa các yếu tố cơ sở dữ liệu. Ví dụ như ta có thể tạo ra bản đồ nguy cơ xói mịn đất từ bản đồ đất, bản đồ độ cao địa hình và bản đồ chế độ lượng mưa nếu ta biết quan hệ giữa các nhân tố đó. Mơ hình hóa q trình là một lĩnh vực mới của GIS dựa trên khái niệm là cơ sở dữ liệu không chỉ biểu diễn mơi trường thực mà chính nó cũng là một mơi trường, do đó, cơ sở dữ liệu GIS đóng vai trị như một phịng thí nghiệm để tìm hiểu các q trình.
5.2. Các phép phân tích dữ liệu cơ bản
5.2.1. Lựa chọn và phân loại
a. Lựa chọn
Phép lựa chọn bao gồm việc nhận biết các thực thể thỏa mãn một hay nhiều điều kiện hay tiêu chí nào đó. Các thuộc tính hay đặc điểm hình học của các thực thể được kiểm tra dựa vào các tiêu chí và chỉ những gì thỏa mãn các tiêu chí mới được lựa chọn. Các thực thể được lựa chọn đó có thể được ghi lại lên trên một lớp dữ liệu mới hoặc dữ liệu hình học hay thuộc tính của chúng được lưu lại theo một vài cách khác nhau.
Hình 5.3 minh họa một ví dụ của phép lựa chọn bao gồm cả phần thuộc tính của một bộ dữ liệu khơng gian. Hai điều kiện được sử dụng và các đối tượng thỏa mãn cả hai điều kiện đó được lựa chọn.