2.2.1 Định nghĩa
Hệ thống thông tin địa lý (GIS) là một hệ thống thông tin có khả năng xây dựng, cập nhật, lưu trữ, truy vấn, xử lý, phân tích và xuất ra các dữ liệu có liên quan tới vị trí địa lý, nhằm hỗ trợ ra quyết định trong các công tác quy hoạch và quản lý tài nguyên thiên nhiên và môi trường.
Các câu hỏi mà GIS có thể trả lời:
- Vị trí (location): Tìm ra cái gì tồn tại ở vị trí cụ thể. Vị trí được thể hiện bằng tên, mã bưu điện hay tọa độ địa lý (kinh/vĩ độ).
- Điều kiện (condition): Tìm ra vị trí thỏa mãn một số điều kiện (vùng không có rừng diện tích 2000m2 và xa đường quốc lộ 100m và loại đất phù hợp cho xây dựng nhà).
- Xu hướng (trends): Tìm ra sự khác biệt theo thời gian trong vùng.
- Mô hình (modeling): Câu hỏi này xác định cái gì xảy ra nếu có đường mới mở hay nếu chất độc thải vào nguồn nước... Để trả lời câu hỏi này đòi hỏi các thông tin địa lý và các thông tin khác.
2.2.2 Các thành phần chính của GIS
Nói một cách tổng quát, hệ GIS gồm có ba thành phần cơ bản là: Hệ thống phần cứng, phần mềm, dữ liệu, con người, phương pháp.
- Hệ thống phần cứng:
Phần cứng của một hệ GIS gồm máy vi tính, cấu hình và mạng công việc của máy tính, các thiết bị ngoại vi nhập xuất dữ liệu và lưu trữ dữ liệu. Ngày nay, phần mềm GIS có khả năng chạy trên rất nhiều dạng phần cứng, từ máy chủ trung tâm đến các máy trạm hoạt động độc lập hoặc liên kết mạng.
Hình 2.12: Sơ đồ hệ thống phần cứng của hệ GIS
- Hệ thống phần mềm:
Là tập hợp các câu lệnh, chỉ thị nhằm điều khiển phần cứng của máy tính thực hiện một nhiệm vụ xác định, phần mềm GIS có thể là một hoặc tổ hợp các phần mềm máy tính. Phần mềm được sử dụng trong kỹ thuật GIS phải bao gồm các tính năng cơ bản sau:
Nhập và kiểm tra dữ liệu (Data input):
Lưu trữ và quản lý cơ sở dữ liệu (Geographic database) Xuất dữ liệu (Display and reporting)
Biến đổi dữ liệu (Data transformation) Tương tác với người dùng (Query input) - Dữ liệu:
liệu địa lý và dữ liệu thuộc tính liên quan có thể được người sử dụng tự tập hợp hoặc mua từ nhà cung cấp dữ liệu thương mại. Hệ GIS sẽ kết hợp dữ liệu không gian với các nguồn dữ liệu khác, thậm chí có thể sử dụng DBMS để tổ chức lưu trữ và quản lý dữ liệu.
- Con người:
Bao gồm những tập thể, cá nhân trực tiếp thiết kế, xây dựng và vận hành hệ GIS. Chi phí cho việc đào tạo cán bộ, thuê chuyên gia… chiếm khoảng 10% chi phí xây dựng toàn hệ thống.
Rõ ràng, một hệ GIS có hiệu quả hay không phụ thuộc rất nhiều vào yếu tố con người.
- Phương pháp:
Mỗi dự án GIS chỉ thành công khi nó được quản lý tốt và người sử dụng hệ thống phải có kỹ năng tốt, nghĩa là phải có sự phối hợp tốt giữa công tác quản lý và công nghệ GIS.
2.2.3 Các chức năng cơ bản của GIS
Phần lớn các phần mềm về GIS đều có các chức năng mà có thể phân ra thành 5 đặc trưng sau:
- Nhập dữ liệu
- Lưu trữ và biên tập dữ liệu - Xử lý dữ liệu sơ bộ
- Tìm kiếm và phân tích không gian - Hiển thị và tương tác
2.2.3.1 Nhập dữ liệu
Nhập dữ liệu là việc thu nhận dữ liệu thực hoặc từ những văn bản hoặc bản đồ sẵn có để đưa vào hệ thống phần mềm GIS. Nhập dữ liệu là một quá trình đọc dữ liệu dưới khuôn dạng mà hệ phần mềm có thể xử lý được.
Hiện nay có rất nhiều loại dữ liệu không gian và có thể thu thập theo nhiều cách khác nhau như là: dữ liệu khảo sát trực tiếp ngoài thực địa, được nhập vào
dưới dạng sổ đo, dữ liệu ảnh hàng không dưới dạng tương tự sau đó được quét và chuyển sang dạng số, ảnh vệ tinh số, bản đồ giấy ở các tỷ lệ khác nhau rồi được quét hoặc vector hóa trực tiếp bằng bàn số hóa. Dữ liệu phi không gian cũng có thể được nhập trực tiếp từ các tài liệu có liên quan như các tài liệu thống kê, các bản đồ, và các số liệu điều tra thu thập.
2.2.3.2 Lưu trữ và biên tập dữ liệu
Chức năng của lưu trữ dữ liệu liên quan đến việc tạo ra cơ sở dữ liệu không gian. Trong thực tế nội dung của cơ sở dữ liệu này có thể bao gồm việc kết nối dữ liệu không gian vector và (hoặc ) dữ liệu không gian raster và cơ sở dữ liệu thuộc tính mà thuộc tính này chính là dữ liệu tham khảo của các đối tượng không gian được liên kết với chúng.
Biên tập dữ liệu:
Tất các các phân tích không gian phải được dựa trên dữ liệu có chất lượng tốt, đã được biên tập và đang được lưu trữ với một format thích hợp. Chúng ta cần phải chắc chắn rằng mỗi một điểm, đường, vùng phải được nhập vào một cách chính xác, không thì khi tìm kiểm đường đi sẽ không đi được đến đích, hoặc tìm một vùng nào đó mà lại không thấy… Đối với các dữ liệu thuộc tính thì phải đảm bảo rằng thuộc tính phải được gắn kết với thực thể một cách chính xác, để tiết kiệm thời gian cho người tìm kiếm không tìm phải những cái sai hoặc những đối tượng không tần tại…Với từng lớp đối tượng mà chúng ta tạo ra, nó đều có khả năng tồn tại lỗi. Vì vậy phải tìm kiếm và biên tập lỗi.
Đối với dữ liệu vector, có hai cách nhập vào là số hóa trực tiếp bằng bàn số hóa, hoặc vector hóa từ file ảnh quét. Cả hai phương pháp này đều để lại lỗi và chúng thường tồn tại ở các dạng sau đây: đường lơ lửng, các điểm nút giả và thiếu nút tại chỗ cắt nhau, Polygon không có nhãn,xung đột các nhãn trong một polygon, các đường số hóa bị trùng nhau tạo nên các polygon vụn.
Đối với lỗi thuộc tính thì thường xảy ra trường hợp mất thuộc tính. Lỗi này có thể tìm thấy mà không cần phải so sánh với dữ liệu nhập vào bằng cách tìm kiếm những đối tượng chưa có thuộc tính để từ đó ta có thể nhập thêm vào. Hoặc một loại lỗi nữa cũng có thể xảy ra đó là lỗi do người biên tập, lỗi này là nhập dữ liệu thuộc
tính bị sai, có thể là đánh máy sai hoặc là đọc sai rồi dẫn đến nhập sai dữ liệu. Lỗi này khó phát hiện hơn và hầu như chỉ phát hiện được khi người sử dụng làm các phép phân tích không gian.
2.2.3.3 Xử lý dữ liệu
Những công việc chính của xử lý dữ liệu bao gồm: - Tạo Topology cho các dữ liệu vector:
Về mặt tổng quát mối quan hệ Topology đại diện cho các đối tượng không gian (điểm, đường, vùng) và mối quan hệ của các đối tượng không gian đó với những đối tượng liền kề.
- Phân loại các đối tượng cho các loại ảnh viễn thám:
Việc phân loại thường dựa vào giá trị của từng pixcel sẽ được xếp vào loại đối tượng nào. Người ta sử dụng các thuật toán để tiến hành phân loại các đối tượng vào các lớp.
Hình 2.13: Phân lớp các đối tượng trên dữ liệu ảnh
- Chuyển đổi dữ liệu từ raster sang vector và ngược lại:
Hình 2.14: Chuyển đổi từ vector sang raster
Quá trình biến đổi mô hình dữ liệu vector sang dữ liệu raster, hay còn gọi là raster hoá . Raster hoá là tiến trình chia đường hay vùng thành các ô vuông (pixcel). Biến đổi vector sang raster là tìm tập hợp các pixel trong không gian raster trùng khớp với vị trí của điểm, đường, đường cong hay đa giác trong biểu diễn vector.
Hình 2.15: Chuyển đổi từ raster sang vector
- Nội suy mô hình số địa hình:
Là việc sử dụng những mô hình toán học để nội suy nên độ cao của bề mặt địa hình. Một trong những phương pháp đó có tên là “ lưới tam giác không đều” (Triangulated Irregular Network - TIN). Và một loại khác là lướiô vưông (grid).
- Chuyển đổi hệ quy chiếu
2.2.3.4 Tìm kiếm và phân tích không gian
Phần lớn các hệ thống phần mềm GIS đều có đủ các chức năng để phân tích không gian, chúng được khái quát bằng một số chức năng sau đây:
a. Tìm kiếm (Searching), truy vấn (Query)
- Trong tìm kiếm thì phép phân tích thường dùng nhất là tìm đường đi tối ưu sử dụng các luật quyết định. Luật quyết định thì giống như là dựa trên thời gian ngắn nhất hoặc khoảng cách ngắn nhất, sự kiện tương quan lớn nhất hoặc khả năng lớn nhất...
- Truy vấn dữ liệu: nhiều hệ thống sử dụng ngôn ngữ (Structure Query Language) SQL để hình thành truy vấn. Sử dụng các toán tử điều kiện để tổ hợp các điều kiện:
Các toán tử quan hệ: >, <, =, ≤, ≥ Các phép toán số học: +, -,× , :
Các phép toán logic: AND, OR, NOT, XOR
Mở rộng SQL để truy vấn không gian: một số hệ thống mở rộng toán tử không gian để truy vấn, thí dụ WITHIN. Tiêu chí tìm kiếm không gian bao gồm tìm kiếm trong bán kính của điểm, trong chữ nhật bao hay trong đa giác không đều...
b. Phân tích chồng xếp, chồng chập (Overlay)
Việc Chồng chậpcác bản đồ trong GIS là một khả năng ưu việt của GIS trong việc phân tích các số liệu thuộc về không gian, để có thể xây dựng thành một bản đồ mới mang các đặc tính hoàn toàn khác với bản đồ trước đây.
Chồng chập các dữ liệu raster:
Hai lớp có giá trị là P1 và P2 muốn chồng chập với nhau và chúng có trọng số là w1 và w2, thì sau khi chồng chập ta sẽ được một lớp mới với giá trị P.
P = w1 P1 + w2 P2 Trong đó w1 + w2 = 1.0
Phương pháp điểm trọng số thì chỉ sẵn có khi các thuộc tính ở dạng số mà nó có thể sử dụng các phép toán số học.
Chồng chập các dữ liệu vector:
Để chồng chập các dữ liệu vector thì trước tiên các dữ liệu này phải được chạy topology. Kết quả chồng chập sẽ tạo ra những đường mới hoặc những vùng polygon mới với việc thêm những nút, những điểm giao nhau mới và sẽ phải cần
- Chồng chập điểm vào polygon: Có nghĩa là các điểm sẽ được chồng chập vào polygon. Point topology sẽ lấy thuộc tính mới của polygon cho từng điểm.
- Chồng chập đường vào polygon: Đường được chồng chập vào polygon với các đối tượng đường được bẻ gãy. Thuộc tính line topology bao gồm thuộc tính cũ của đường và thuộc tính mới của vùng.
- Chồng chập vùng với vùng: Hai lớp đối tượng vùng chồng chập với nhau sẽ tạo ra một lớp đối tượng vùng mới với nhiều vùng hơn lớp gốc và sẽ tạo ra thêm những chỗ giao nhau mới thuộc tính polygon topology sẽ bao gồm cả hai thuộc tính gộp lại.
c. Phân tích liền kề - vùng đệm (Buffer zone)
Vùng đệm là tạo ra một vùng mà lấy lõi là một điểm, một đường hoặc một vùng, đường biên bên ngoài thường có khoảng cách nhất định so với lõi.
d. Nội suy không gian (Spatial Interpolation)
Trong tình huống thông tin có ít điểm, đường hay vùng lựa chọn thì phép nội được thực hiện để có nhiều thông tin hơn. Nghĩa là phải giải đoán giá trị hay tập giá trị mới, phần này mô tả nội suy hướng điểm, có nghĩa 1 hay nhiều điểm trong không gian được sử dụng để phát sinh giá trị mới cho vị trí khác nơi không đo dữ liệu được trực tiếp.
e. Thực hiện các phép toán với dữ liệu raster
Dữ liệu raster là tập hợp các ô lưới (cell), vì vậy việc xử lý raster còn được gọi là (grid processing). Một nhóm các ô lưới có cùng giá trị được mô tả như là một vùng. Một tập hợp các toán tử và hàm có thể áp dụng để tính toán để tạo ra một lớp raster mới từ một hoặc nhiều lớp raster gốc.
2.2.3.5 Hiển thị và tương tác
Sau khi đã xử lý dữ liệu, phân tích dữ liệu và lưu trữ chúng trong một thiết bị lưu trữ dữ liệu như ổ cứng, đĩa CD ROM, hoặc DVD ROM chúng ta có thể hiển thị các thành quả của GIS lên màn hình, hoặc đưa chúng ra máy in bằng những hệ thống phần mềm của GIS.
Đối với việc hiển thị bản đồ trên màn hình, các hệ thống phần mềm GIS rất linh hoạt, chúng có thể biểu diễn nhiều bản đồ khác nhau bằng việc lựa chọn các lớp bản đồ hiển thị.
2.2.4 Cấu trúc dữ liệu của GIS
Có thể coi thành phần quan trọng nhất trong một hệ GIS là dữ liệu. Dữ liệu được phân thành 2 loại: dữ kiệu không gian và dữ liệu phi không gian.
2.2.4.1 Dữ liệu không gian
Cơ sở dữ liệu không gian chứa đựng những thông tin định vị của các đối tượng. Chúng cho ta biết được vị trí, kích thước, hình dạng, sự phân bố… của các đối tượng. Có 3 loại đối tượng không gian cơ bản: đối tượng dạng điểm, đối tượng dạng đường và đối tượng dạng vùng. Trong cơ sở dữ liệu không gian, người ta sử dụng hai dạng mô hình dữ liệu là: dữ liệu raster và dữ liệu vector.
Cấu trúc dữ liệu dạng raster
Trong cấu trúc dữ liệu raster, thực thể không gian được biểu diễn thông qua các ô (cell) hay ô ảnh (pixel) của một lưới các ô. Trong máy tính, lưới các ô này được lưu trữ dưới dạng ma trận trong đó mỗi ô là giao điểm của một hàng và một cột trong ma trận. Mỗi pixel sẽ tương ứng với một diện tích vuông nào đó trên thực tế.
Trong cấu trúc này, có các yếu tố cơ bản được biểu diễn : - Yếu tố điểm: được xác định bởi một pixel.
- Yếu tố đường: được xác định bởi một chuỗi các ô pixel có cùng thuộc tính kề nhau có hướng nào đó.
- Yếu tố vùng:được xác định bởi một số các pixel cùng thuộc tính phủ trên một diện tích nào đó.
Hình 2.16: Cấu trúc dữ liệu dạng raster
Cấu trúc này thường được áp dụng để mô tả các đối tượng, hiện tượng phân bố liên tục trong không gian, dùng để lưu giữ thông tin dạng ảnh (ảnh mặt đất, hàng không, vũ trụ...). Một số dạng mô hình biểu diễn bề mặt như DEM (Digital Elevation Model), DTM (Digital Terrain Model), TIN (Triangulated Irregular Network) trong CSDL cũng thuộc dạng raster .
Ưu điểm của cấu trúc dữ liệu dạng raster là dễ thực hiện các chức năng xử lý và phân tích. Tốc độ tính toán nhanh, thực hiện các phép toán bản đồ dễ dàng. Dễ dàng liên kết với dữ liệu viễn thám. Cấu trúc raster có nhược điểm là kém chính xác về vị trí không gian của đối tượng. Khi độ phân giải càng thấp (kích thước pixel lớn) thì sự sai lệch này càng tăng.
Cấu trúc dữ liệu dạng Vector
Cấu trúc dữ liệu dạng Vector dựa trên tọa độ các điểm để biểu diễn các đối tượng qua ba yếu tố cơ bản là điểm, đường, vùng.
- Yếu tố điểm : điểm có cấu trúc dữ liệu được mô tả bởi cặp tọa độ x, y còn có chỉ số cụ thể mô tả đặc tính cơ bản của điểm.
- Yếu tố đường: được dùng để biểu diễn các đối tượng có dạng tuyến, được tạo nên từ hai hay nhiều hơn các cặp tọa độ (x, y) hoặc (x,y,z).
- Yếu tố vùng: là tập hợp vô số các điểm được giới hạn bởi một đường khép kín.
Hình 2.17: Cấu trúc dữ liệu dạng Vector
Cấu trúc vector có ưu điểm là vị trí của các đối tượng được định vị chính xác (nhất là các đối tượng điểm, đường và đường bao). Cấu trúc này giúp cho người sử dụng dễ dàng biên tập bản đồ, chỉnh sửa, in ấn. Tuy nhiên cấu trúc này có nhược điểm là phức tạp khi thực hiện các phép chồng xếp bản đồ.
2.2.4.2 Dữ liệu phi không gian (dữ liệu thuộc tính)
Cơ sở dữ liệu thuộc tính lưu trữ các số liệu mô tả các đặc trưng, tính chất, …