Chương 1 CƠ SỞ LÝ LUẬN CHUNG
1.2.5. Cơ sở dữ liệu GIS
1.2.5.1. Khái niệm về CSDL
Cơ sở dữ liệu (CSDL) địa lý là sản phẩm được xây dựng từ dữ liệu của tập hợp các đối tượng địa lý dựa trên các tiêu chuẩn kỹ thuật nhất định (ví dụ:
OGC, W3C, ISO TC211,...), có khả năng mã hoá, cập nhật và trao đổi qua các dịch vụ truyền tin hiện đại. Định dạng mở, không phụ thuộc vào phần mềm gia công dữ liệu.
CSDL nền địa lý là CSDL địa lý mô tả thông tin thế giới thực ở mức cơ sở, có độ chi tiết và độ chính xác đảm bảo để làm “nền” cho các mục đích xây dựng các hệ thống thông tin địa lý chuyên đề khác nhau. Mỗi khu vực địa lý cần được mô tả bởi dữ liệu “nền” phù hợp sao cho mức khái lược và thu nhỏ mô hình thực địa là thích hợp nhất, cho phép đủ phục vụ đa mục đích. Theo đó, tùy thuộc vào mô hình quản lý, khai thác ứng dụng và cập nhật sản phẩm dữ liệu địa lý để định hướng cho công tác đo đạc xây dựng CSDL nền địa lý trên phạm vi cả nước hoặc theo khu vực địa lý phục vụ đa mục.
CSDL nền địa lý đảm bảo cho sự tra cứu, truy nhập thông tin được nhanh chóng, chính xác theo một phạm vi địa lý bất kỳ do người sử dụng yêu cầu, không chỉ theo phạm vi của từng mảnh bản đồ.
Cơ sở dữ liệu hiện nay được xây dựng theo các chuẩn, với từng ngành có những chuẩn cơ sở dữ liệu khác nhau. Chuẩn thông tin địa lý là hệ thống các tiêu chuẩn về cách thức, qui định cách mô tả, biểu thị, cách xây dựng cơ sở dữ liệu từ nhận thức thế giới thực đến cơ sở dữ liệu địa lý được lưu trữ theo cấu trúc, khuôn dạng nào đó.
Các thành phần trong cơ sở dữ liệu và các phần tử trong mô hình, tất cả các yếu tố này đều được qui định theo các chuẩn thống nhất. Chuẩn thông tin địa lý GIS được chia ra làm 2 loại:
- Chuẩn thông tin địa lý cơ sở - Chuẩn thông tin địa lý ứng dụng
Các chuẩn được thực hiện trong cơ sở dữ liệu (về cơ bản tuân theo chuẩn kỹ thuật quốc gia về thông tin địa lý do Bộ Tài nguyên và Môi trường ban hành):[1]
- Chuẩn thuật ngữ
- Chuẩn về tham chiếu không gian - Chuẩn về mô hình cấu trúc dữ liệu - Chuẩn về phân loại đối tượng - Chuẩn về thể hiện trình bày - Chuẩn về Metadata
- Chuẩn mã hóa và trao đổi dữ liệu
Mỗi mô hình cơ sở dữ liệu đều có cấu trúc và kiểu dữ liệu riêng tùy thuộc vào yêu cầu của mô hình. Cấu trúc dữ liệu: tập hợp các biến có thể thuộc một hoặc vài kiểu dữ liệu khác nhau được nối kết với nhau tạo thành những phần tử. Các phần tử này chính là thành phần cơ bản xây dựng nên cấu trúc dữ liệu. Kiểu dữ liệu (data type): kiểu dữ liệu của một biến là tập hợp các giá trị mà biến đó có thể nhận.
Như chúng ta đã biết, cơ sở dữ liệu chiếm khoảng 70% giá trị của hệ thông tin địa lý, hay nói cách khác cơ sở dữ liệu chính là “linh hồn” của hệ thông tin địa lý. Cơ sở dữ liệu của hệ thông tin địa lý là tập hợp dữ liệu có liên quan với nhau được lưu trữ dưới dạng số. Vì cơ sở dữ liệu của hệ thống có mối liên quan với các điểm đặc trưng trên bề mặt trái đất nên nó bao gồm hai nhóm là cơ sở dữ liệu không gian và cơ sở dữ liệu thuộc tính. Mỗi loại có
những đặc điểm riêng và chúng khác nhau về yêu cầu lưu trữ số liệu, hiệu quả, xử lý và hiển thị.
- Cơ sở dữ liệu không gian là cơ sở dữ liệu có chứa trong nó những thông tin về định vị của đối tượng. Nó là những dữ liệu phản ánh, thể hiện những đối tượng có kích thước vật lý nhất định. Nếu là những cơ sở dữ liệu không gian địa lý thì đó là những dữ liệu phản ánh những đối tượng có trên bề mặt hoặc ở trong vỏ quả đất.
- Cơ sở dữ liệu thuộc tính hay còn gọi là cơ sở dữ liệu phi không gian là cơ sở dữ liệu phản ánh tính chất của các đối tượng khác nhau. Dữ liệu thuộc tính được sắp xếp theo hàng và cột, mỗi hàng bao gồm nhiều loại thông tin về một đối tượng nào đó như tên, diện tích …. Mỗi loại thông tin khác nhau này gọi là một trường, mỗi trường được sắp xếp tương ứng với một cột.
1.2.5.2. Tổ chức cơ sở dữ liệu GIS.
Cơ sở dữ liệu là một gói dữ liệu được tổ chức dưới dạng các Layer. Các Layer có thể được tạo ra từ nhiều khuôn dạng dữ liệu khác nhau như: Shape files, personal geodatabase, ArcInfo cover datasets, CAD drawings, SDE databases, photo, image. Hiện nay, theo các chuẩn dữ liệu ISO-TC 211 và chuẩn dữ liệu của Bộ Tài Nguyên và Môi Trường, dữ liệu được tổ chức theo khuôn dạng chuẩn là GeoDatabase.
GeoDatabase: là một cơ sở dữ liệu được chứa trong một file. Khác với shape file, GeoDatabase cho phép lưu giữ topology của các đối tượng. Cấu trúc của GeoDatabase như sau:
Hình 1-1: Tổ chức cơ sở dữ liệu - GeoDatabase
Feature dataset là tập dữ liệu đối tượng nằm ở bên trong của geodatabase cá nhân và chứa các feature class có cùng phần mở rộng và cùng hệ tọa độ.
Feature class (nhóm đối tượng) là một trong các dữ liệu thường hay sử dụng nhất. Mỗi feature class bao gồm tập hợp nhiều đối tượng địa lý (geographic feature) có cùng kiểu hình học (point, line, polygon) và có cùng thuộc tính.
Các feature class chứa đặc trưng topology được xếp trong các feature dataset nhằm đảm bảo duy trì hệ tọa độ chung cho dữ liệu bên trong. Dưới feature class sẽ là các feature data.
Feature (đối tượng địa lý) là các spatial object (đối tượng không gian), có vị trí địa lý (tọa độ xác định) và có quan hệ không gian.
Attribute Table là thuộc tính của từng lớp đối tượng, được lưu giữ dưới dạng các bảng. Trong đó, các thuộc tính được thể hiện trong từng cột, mỗi đối tượng địa lý ở trong mỗi hàng.
Feature Dataset GeoDatabase
Feature Dataset Feature Dataset
Feature Class Feature Class Feature Class
Attribute Attribute Attribute