CHƯƠNG 2: CƠ SỞ DỮ LIỆU ĐỊA LÝ, KẾT CẤU ĐỊA CHÍNH
2.1. Cơ sở dữ liệu địa lý (Geodatabase)
2.1.1. Khái niệm
Geodatabase là một hoặc một bộ dữ liệu được tổ chức chặt chẽ, linh hoạt và được lưu trữ trong bộ nhớ thích hợp, là một kho chứa dữ liệu không gian và thuộc tính trong quản trị cơ sở dữ liệu (Database Management System – DBMS). Đây là một mô hình dữ liệu đối tượng có hướng mô tả các đối tượng địa lý, đối tượng thuộc tính và quan hệ giữa các đối tượng.
Geodatabase kết hợp “geo” (dữ liệu không gian) với “cơ sở dữ liệu” (kho dữ liệu) để tạo ra một kho dữ liệu trung tâm cho việc lưu trữ và quản lý dữ liệu không gian. Có thể coi Database như là bộ từ điển bách khoa toàn thư, nó có thể được lưu giữ trong máy tính để bàn, máy chủ hoặc điện thoại di động cho phép lưu trữ dữ liệu GIS ở vị trí trung tâm để dễ dàng truy cập và quản lý. Dữ liệu được lưu trữ theo mô hình này mang tính toàn vẹn dữ liệu cao.
Hệ thống thông tin địa lý GIS sử dụng Geodatabase làm dữ liệu của mình. Hình thể, vị trí không gian của các đối tượng cần quản lý, được miêu tả bằng các dữ liệu đồ họa. Trong khi đó, tính chất các đối tượng này được miêu tả bằng các dữ liệu thuộc tính.[10]
Mô hình cơ sở dữ liệu không gian không những quy định mô hình dữ liệu với các đối tượng đồ họa, đối tượng thuộc tính mà còn quy định liên kết giữa chúng thông qua mô hình quan hệ và định nghĩa hướng đối tượng bao gồm các tính chất như thừa kế (inherit), đóng gói (encapsulation) và đa hình (polymorphism).
Ngoài ra, cơ sở dữ liệu không gian hiện đại còn bao gồm các ràng buộc đối tượng đồ họa ngay trong cơ sở dữ liệu, được gọi là topology. Với nhiều thao tác trên dữ liệu địa lý, kết quả cuối cùng được hiển thị tốt nhất dưới dạng
bản đồ hoặc biểu đồ, trong đó bản đồ khá hiệu quả trong lưu giữ và trao đổi thông tin địa lý.
2.1.2. Các định dạng của Geodatabase
Hiện nay, trong phần cơ sở dữ liệu của hãng ESRI có ba dạng Geodatabase đó là : Personal Geodatabase, File Geodatabase và ArcSDE Geodatabase. Các định dạng này đều được quản lý và biên tập trong ArcGIS, tuy nhiên chúng khác nhau ở cách thức tổ chức và cơ chế quản lý.[10]
- Personal Geodatabase: Mô hình sử dụng hệ quản trị cơ sở dữ liệu Access để lưu trữ dữ liệu không gian và thuộc tính, nó chỉ hỗ trợ một người dùng và được cài đặt trên máy đơn. Dung lượng lưu trữ của mô hình này giới hạn do sự hạn chế về dung lượng lưu trữ của hệ quản trị cơ sở dữ liệu Access.
- File Geodatabase: Mô hình sử dụng hệ quản trị cơ sở dữ liệu nhều người dùng như Oracle, SQL Server, DB2, Postgres…để lưu trữ dữ liệu. File Geodatabase được quản lý ở dạng các thư mục chứa file hệ thống, nhằm cải thiện dung lượng, chất lượng truy vấn và hiển thị dữ liệu. Dữ liệu lưu trữ được quản lý thông qua ArcSDE, dung lượng lưu trữ của mô hình này thường không giới hạn do hệ quản trị mà nó sử dụng không giới hạn dung lượng lưu trữ.
- ArcSDE Geodatabase: Khi quản lý cơ sở dữ liệu ở khối lượng lớn và truy cập đa người dùng trên máy chủ có sử dụng ArcSDE cơ sở dữ liệu Geodatabase được gọi là ArcSDE Geodatabase chia làm ba loại, với các cấp độ quản lý khác nhau đó là:
+ ArcSDE Personal Geodatabase: CSDL này cho phép có ba người truy cập cùng lúc và chỉ một trong số đó có thể biên tập chỉnh sửa dữ liệu khi kết nối Database Server trong ArcCatalog.
+ ArcSDE Workgroup Geodatabase: Cơ sở dữ liệu ArcSDE Workgroup cho phép có 10 người đồng thời truy cập và biên tập thông qua kết nối Database Server trong ArtCatalog.
+ ArcSDE Enterprise Geodatabase: Cơ sở dữ liệu ArcSDE Enterprise cho phép quá nhiều người cùng truy cập và biên tập mà không giới hạn số lượng thông qua kết nối Database Connection trong ArtCatalog.
2.1.3. Thành phần của Geodatabase
Dữ liệu địa lý thể hiện vị trí trên trái đất, dữ liệu địa lý được nhóm thành hai loại là vector và raster. Cùng với dữ liệu không gian và dữ liệu thuộc tính, đây là thông tin bổ sung và luôn gắn chặt với dữ liệu không gian.
Một bộ tập hợp các tài liệu GIS được hiểu là Metadata.
Phần mềm GIS cao cấp cho phép xuất (Export) hoặc nhập (Import) dữ liệu không gian ở nhiều định dạng vector và raster khác nhau. Một số phần mềm cho phép chuyển đối raster sang vector và ngược lại. Các phần mềm này cũng cho phép hiển thị đồng thời dữ liệu vector và raster được xếp chồng lên nhau. Thông tin GIS được phân theo các lớp (layer) và xếp chồng lên nhau theo một thứ tự nhất định nhằm mô tả thế giới thực.
Nhìn chung, theo [13] cơ sở dữ liệu địa lý được trình bày theo hai dạng:
Dữ liệu không gian và phi không gian. Mỗi loại có những đặc điểm riêng và chung khác nhau về yêu cầu lưu giữ số liệu, hiệu quả, xử lý và hiển thị.
- Dữ liệu không gian: Là những mô tả số của hình ảnh bản đồ, chúng bao gồm tọa độ, quy luật và các ký hiệu dùng để xác định một hình ảnh bản đồ cụ thể trên từng bản đồ. Hệ thống thông tin địa lý dùng các số liệu không gian để tạo ra một bản đồ hay hình ảnh bản đồ trên màn hình hoặc trên giấy thông qua thiết bị ngoại vi,…Dữ liệu không gian bao gồm vị trí (Geometry) và hình dạng (Topology). Dữ liệu này được lưu trữ và thể hiện theo 2 dạng raster và vector (điểm, đường, vùng).
Cấu trúc dữ liệu Raster
Trong cấu trúc dữ liệu Raster, thực thể không gian được biểu diễn thông qua các ô (cell) hay ô ảnh (pixel) của một lưới các ô. Có nhiều dạng ô lưới có thể được sử dụng như: lưới lục giác, lưới tam giác, lưới ô vuông,…;
trong đó lưới ô vuông là thông dụng nhất. Trong máy tính, lưới các ô này được lưu trữ dưới dạng ma trận trong đó mỗi ô là giao điểm của một hàng và một cột trong ma trận.
Hình 2.1: Cấu trúc dữ liệu kiểu Raster
Trong cấu trúc dữ liệu Raster các yếu tố điểm, đường, vùng được xác định như sau:
Yếu tố điểm: Điểm được xác định tương ứng với một pixel độc lập.
Yếu tố đường: Đường được coi là các pixel liên tiếp nhau có cùng giá trị.
Yếu tố vùng: Vùng được xác định bởi một tập hợp các pixel có cùng giá trị liên tục nhau theo các hướng.
Cấu trúc dữ liệu Vector
Trong cấu trúc dữ liệu Vector, thực thể không gian được biểu diễn thông qua các phần tử cơ bản là điểm, đường, vùng và các quan hệ topology (khoảng cách, tính liên thông, tính kề nhau,…) giữa các đối tượng với nhau.
Vị trí không gian của thực thể không gian được xác định bởi toạ độ trong một hệ toạ độ thống nhất toàn cầu.
Hình 2.2: Cấu trúc dữ liệu kiểu Vector
Yếu tố điểm (point): Được dùng cho tất cả các đối tượng không gian mà được biểu diễn như một cặp toạ độ (X, Y). Ngoài giá trị toạ độ (X, Y), điểm còn được thể hiện kiểu điểm, màu, hình dạng và dữ liệu thuộc tính đi kèm. Do đó trên bản đồ điểm có thể được biểu hiện bằng ký hiệu Text.
Yếu tố đường (line, polyline, arc): Được dùng để biểu diễn tất cả các thực thể có dạng tuyến, được tạo nên từ hai hoặc nhiều hơn cặp toạ độ (X, Y). Ví dụ như: hệ thống đường giao thông, hệ thống ống thoát nước, hệ thống đường điện, các sông suối nhỏ … Ngoài tọa độ, đường còn có thể bao hàm cả góc quay tại đầu nút.
Yếu tố vùng (polygon): Là một đối tượng hình học hai chiều. Vùng có thể là một đa giác đơn giản hay hợp của nhiều đa giác đơn giản.
Số liệu định vị của yếu tố điểm được xác định bởi đường bao của chúng.
- Dữ liệu phi không gian (hay còn gọi là dữ liệu thuộc tính) là những diễn tả đặc tính, số lượng, mối quan hệ của các hình ảnh bản đồ với vị trí địa lý của chúng. Các dữ liệu phi không gian không liên quan đến vị trí địa lý hoặc các đối tượng không gian và liên kết chặt chẽ với chúng trong hệ thống
thông tin địa lý thông qua một cơ chế thống nhất chung. Trong lĩnh vực phân loại đất đai thì bao gồm: kiểu đất, màu đất, độ kiềm…
Hệ thống cơ sở dữ liệu được phân loại theo cấu trúc dữ liệu cơ bản. Bao gồm: [13]
- Mô hình dữ liệu thứ bậc (Hierarchical) - Mô hình dữ liệu theo mạng lưới (Network) - Mô hình dữ liệu theo dạng quan hệ (Relational).