Cơ sở dữ liệu GIS là một tập hợp các thông tin (các tệp dữ liệu) ở dạng vector, raster và bảng số liệu với những cấu trúc chuẩn bảo đảm cho các bài toán chuyên đề có mức độ phức tạp khác nhau [23]. Cơ sở dữ liệu trong GIS bao gồm 2 loại đó là: cơ sở dữ liệu không gian và cơ sở dữ liệu thuộc tính.
2.4.3.1. Cơ sở dữ liệu không gian
Dữ liệu không gian dùng để mô tả vị trí, hình dạng và kích th−ớc của đối t−ợng trong không gian, chúng bao gồm toạ độ và các ký hiệu dùng để xác định các đối t−ợng trên bản đồ. Hệ thống thông tin địa lý dùng các số liệu không gian để tạo ra bản đồ hay hình ảnh bản đồ trên màn hình máy tính hoặc trên giấy thông qua thiết bị ngoại vi.
Dữ liệu không gian bao gồm 3 loại đối t−ợng: điểm (point), đ−ờng (polyline) và vùng (polygon). Các đối t−ợng không gian này đ−ợc l−u trữ ở 2 mô hình dữ liệu là vector và raster (hình 2.1).
- Mô hình dữ liệu raster: trong mô hình này, thực thể không gian đ−ợc biểu diễn thông qua các ô (cell) hoặc ô ảnh (pixel) của một l−ới các ô (hình 2.2). Trong máy tính, l−ới ô này đ−ợc l−u trữ ở dạng ma trận trong đó mỗi cell là giao điểm của một hàng hàng hay một cột trong ma trận. Trong cấu trúc này, điểm đ−ợc xác định bởi cell, đ−ờng đ−ợc xác định bởi một số các cell kề nhau theo một h−ớng và vùng đ−ợc xác định bởi một số các cell mà trên đó thực thể phủ lên. Mô hình raster còn đ−ợc xây dựng trên cơ sở hình học Ơcơlit. Mỗi một cell sẽ t−ơng ứng với một diện tích vuông trên thực tế. Độ lớn của cạnh ô vuông này còn đ−ợc gọi là độ phân giải của dữ liệu [7].
- 27 - 3333322111 3333322111 3333332211 3113333221 3111333222 3111113322 2111113331 2222212333 3322222222 3332222111
Hình 2 2: Biểu diễn raster dữ liệu theo dạng l−ới điểm
Đất nông nghiệp Rừng N−ớc
Hình vẽ 2.2 thể hiện bản đồ đất, mỗi vùng đ−ợc đánh dấu bằng các ô theo các giá trị khác nhau và ta có đ−ợc một l−ới các ô có giá trị khác nhau, trong đó n−ớc đ−ợc gán giá trị = 1, rừng = 2 và đất nông nghiệp = 3.
Nh− vậy, trong cấu trúc raster sự biểu diễn hai chiều của dữ liệu không gian là không liên tục nh−ng đ−ợc định l−ợng hoá để có thể dễ dàng tính toán đ−ợc chiều dài và diện tích của đối t−ợng không gian. Ngoài ra, dữ liệu địa lý dạng raster còn đ−ợc biểu diễn theo ph−ơng pháp ô chữ nhật phân cấp. Theo ph−ơng pháp này, ng−ời ta chia diện tích vùng dữ liệu ra thành các ô chữ nhật không đều nhau bằng cách lần l−ợt chia đôi các cell bắt đầu từ hình chữ nhật lớn, bao phủ diện tích dữ liệu. Quá trình chia cứ tiếp tục đến khi nào các cell đủ nhỏ để đạt đ−ợc độ chính xác cần thiết (hình 2.3).
- Mô hình dữ liệu vector: trong mô hình này, thực thể không gian đ−ợc biểu diễn thông qua các phần tử cơ bản là điểm, đ−ờng, vùng và các quan hệ
3 20 20 2 22 23 210 211 21 212 213 2 1 0 Nhà ở Th−ơng mại
Khu công nghiệp
Công viên
Nông thôn
a
Bản đồ hiện trạng sử dụng đ Biểu diễn ô chữ nhật phân cấp
b
ất
topo (khoảng cách, tính liên thông, tính kề nhau…) giữa các đối t−ợng với nhau. Vị trí không gian của các thực thể đ−ợc xác định bởi toạ độ chung trong một hệ thống toạ độ thống nhất toàn cầu. Điểm dùng cho tất cả các đối t−ợng không gian đ−ợc biểu diễn nh− một cặp toạ độ (X,Y). Ngoài giá trị toạ độ (X,Y), điểm còn thể hiện kiểu điểm, màu, hình dạng và dữ liệu thuộc tính đi kèm. Do đó, trên bản đồ điểm có thể đ−ợc biểu hiện bằng ký hiệu hoặc dạng text (dạng chữ). Đ−ờng dùng để biểu diễn tất cả các thực thể có dạng tuyến và đ−ợc tạo nên từ hai hoặc nhiều hơn 2 cặp toạ độ (X,Y). Vùng là một đối t−ợng hình học hai chiều, vùng có thể là một đa giác đơn giản hay hợp của nhiều đa giác đơn giản. Nh− vậy, mô hình dữ liệu vector sử dụng các đoạn thẳng hay điểm rời rạc để nhận biết các vị trí của thế giới thực. Việc đo diện tích và khoảng cách của các đối t−ợng đ−ợc thực hiện bằng cách tính toán hình học từ các toạ độ của các đối t−ợng thay vì việc đếm các cell trong mô hình raster [7]. Mô hình vector bao gồm 2 dạng cấu trúc sau:
+ Cấu trúc dữ liệu toàn đa giác: mỗi tầng trong cơ sở dữ liệu của cấu trúc toàn đa giác đ−ợc chia thành tập các đa giác. Mỗi đa giác đ−ợc mã hoá thành trật tự các vị trí hình thành đ−ờng biên của vùng khép kín theo hệ trục toạ độ nào đó (hình 2.4). Mỗi đa giác đ−ợc l−u trữ nh− đặc tr−ng độc lập. Trong cấu trúc này không có tham số để biết ngay các vùng kề nhau.
III III I III
Hình 2.4: Cấu trúc toàn đa giác
6 4 2 0 6 4 2 0
Đa giác 1 Đa giác 2 Đa giác 3
1,4 2,2 6,4 4,3 4,2 7,2 4,3 4,2 7,2 4,2 4,0 6,1 2,2 1,0 4,2 4,3
+ Cấu trúc cung - nút: một khía cạnh quan trọng của mô hình vector là cho khả năng tách biệt các thành phần để thực hiện đo đạc và để xác định các
quan hệ không gian giữa các thành phần. Quan hệ không gian của liên kết và gần kề là những thí dụ của quan hệ tôpô. Mô hình không gian GIS có chứa các quan hệ nói trên thì đ−ợc mô tả nh− cấu trúc topo. Trong tập dữ liệu có cấu trúc topo đầy đủ, mỗi khi đ−ờng hay vùng cắt nhau thì các giao điểm sẽ là nút và các vùng mới đ−ợc tạo ra. Mô hình dữ liệu vector có kiến trúc topo th−ờng đ−ợc mô tả bằng khái niệm đối t−ợng topo có số chiều topo, trong đó đối t−ợng topo n-cell sẽ có n chiều [12].
Hiện nay các dữ liệu bản đồ l−u trữ trong cơ sở dữ liệu th−ờng đ−ợc để d−ới cấu trúc vector. Các dữ liệu đ−ợc số hoá từ các bản đồ giấy cũng hay đ−ợc số hoá d−ới cấu trúc vector. Nguyên nhân chính của cách này là độ chính xác, cập nhật dễ dàng và chiếm ít không gian l−u trữ. Số hoá bản đồ trực tiếp từ bản đồ thành raster khó sửa chữa và phụ thuộc rất nhiều vào độ phân giải của dụng cụ. Do đó, nếu ng−ời sử dụng làm việc với GIS sử dụng mô hình dữ liệu raster thì các dữ liệu vector phải đ−ợc chuyển thành dữ liệu raster. Nh− vậy, quá trình chuyển đổi mô hình vector sang raster và ng−ợc lại (từ raster sang vector) là rất cần thiết khi xây dựng cơ sở dữ liệu không gian trong GIS.
+ Sự chuyển đổi từ vector sang raster (quá trình raster hoá): là tìm tập pixel trong không gian raster trùng khớp với vị trí của điểm, đ−ờng, đ−ờng cong hay đa giác trong biểu diễn vector, tức là toàn bộ thông tin cần đ−ợc chia nhỏ thành các ô raster. Trong quá trình raster hoá, các tham số quan trọng là kích th−ớc cell trong l−ới ô kết quả. Nếu chọn kích cỡ cell lớn thì tiết kiệm không gian l−u trữ dữ liệu nh−ng dữ liệu sẽ kém chính xác và nếu cần độ chính xác dữ liệu cao thì l−ới ô kết quả sẽ có dung l−ợng lớn (hình 2.5).
+ Sự chuyển đổi từ raster sang vector (quá trình vector hoá): là tạo ra các điểm, đ−ờng và vùng. Mục đích của chuyển đổi raster sang vector là phát sinh các đ−ờng biên bản đồ từ ảnh quét. Độ chính xác của sự chuyển đổi này phụ thuộc vào kích cỡ cell của hệ raster (hình 2.6).
Polygon
arc
Hình 2.6: Chuyển đổi mô hình raster sang vector
2.4.3.2. Cơ sở dữ liệu thuộc tính
Dữ liệu thuộc tính (dữ liệu phi không gian) là các thông tin đi kèm với các dữ liệu không gian, nó đ−ợc dùng để chỉ ra các tính chất đặc tr−ng cho mỗi đối t−ợng điểm, đ−ờng và vùng trên bản đồ. Thông th−ờng, dữ liệu thuộc tính đ−ợc tổ chức thành các bảng theo mô hình cơ sở dữ liệu quan hệ, phân cấp và mạng l−ới. Một đặc điểm khác biệt của các thông tin trong GIS so với các thông tin trong các hệ đồ hoạ máy tính khác là sự liên kết chặt chẽ, không thể tách rời giữa các thông tin thuộc tính với các đối t−ợng bản đồ (sơ đồ 2.6).
- 31 -
Cơ sở dữ liệu không gian
Mô hì h
Mô hì h Mô hì h Mô hì h Mô hì h
Cơ sở dữ liệu thuộc tính
Bản đồ số khác với bản đồ giấy thông th−ờng là nó không chỉ cho biết các thông tin hình hoạ về các đối t−ợng trên bản đồ mà còn có khả năng hiển thị kèm theo các thông tin thuộc tính về các tính chất và nội dung của chúng. Sự liên kết giữa hai dạng dữ liệu này chính là điểm mạnh của các hệ thống thông tin địa lý nhằm tạo ra các khả năng cho các quá trình phân tích và xử lý các số liệu. Các dữ liệu không gian và dữ liệu thuộc tính liên kết với nhau qua một cột thuộc tính với một khoá chung và theo mô hình dữ liệu dạng quan hệ.
Ví dụ: Cơ sở dữ liệu của bản đồ đơn vị đất đai (hình 2.7). Dữ liệu không gian Dữ liệu thuộc tính
Số thửa LMU Loại đất TP cơ giới Chế độ t−ới
1 1 Fluvisol Nhẹ Chủ động 2 2 Glaysols Trung bình T−ới hạn chế