2.4.1.1. Dữ liệu GIS
Dữ liệu địa lý là dữ liệu bao gồm dữ liệu không gian và dữ liệu thuộc tính được kết hợp với nhau một cách tương ứng. Dữ liệu địa lý có thể là các bản đồ số trên máy vi tính, các mô hình mô phỏng hình dáng bề mặt trái đất, các cơ sở dữ liệu ảnh bề mặt trái đất...Trong đó, bản đồ số là một loại dữ liệu địa lý rất phổ biến nhưng dữ liệu địa lý không chỉ có mỗi một loại dữ liệu bản đồ số. Đây là điều mà chúng ta cần phân biệt rõ.
Dữ liệu là trung tâm của hệ thống GIS, hệ thống GIS chứa càng nhiều thì chúng càng có ý nghĩa. Dữ liệu của hệ GIS được lưu trữ trong CSDL và chúng được thu thập thông qua các mô hình thế giới thực. Dữ liệu trong hệ GIS còn được gọi là thông tin không gian. Đặc trưng thông tin không gian là có khả năng mô tả “vật thể ở đâu” nhờ vị trí tham chiếu, đơn vị đo và quan hệ không gian. Chúng còn khả năng mô tả “ hình dạng hiện tượng” thông qua mô tả chất lượng, số lượng của hình dạng và cấu trúc. Cuối cùng, đặc trưng thông tin không gian mô tả “quan hệ và tương tác” giữa các hiện tượng tự nhiên. Mô hình không gian đặc biệt quan trọng vì cách thức thông tin sẽ ảnh hưởng đến khả năng thực hiện phân tích dữ liệu và khả năng hiển thị đồ họa của hệ thống.
Dữ liệu của GIS là dữ liệu địa lý vì vậy nhiều nơi người ta thường gọi dữ liệu địa lý là dữ liệu GIS.
Dữ liệu địa lý là dữ liệu lưu trữ thông tin của các đối tượng địa lý. Một đối tượng địa lý là một thực thể ngoài thế giới thực có liên quan đến một vị trí trên trái đất. Đối tượng địa lý bao gồm các thông tin sau:
- Thông tin về hình học (không gian): là thông tin mô tả vị trí của đối tượng địa lý thông qua tọa độ trong một hệ quy chiếu nhất định. Các đối tượng địa lý được mô hình hoá thành các kiểu đối tượng hình học cơ bản như điểm, đường và vùng. Một điểm được mô tả bởi một cặp toạ độ x, y. Đường được mô tả bằng một chuỗi các điểm. Vùng là một đường khép kín.
Hình 2.1: Ba kiểu hình học cơ bản
- Thông tin về thời gian: Là thông tin mô tả các tính chất thời gian của đối tượng địa lý. Chẳng hạn như đối tượng tồn tại từ khi nào, đối tượng có những thể hiện đặc biệt gì trong một khoảng thời gian nhất định…
- Thông tin thuộc tính chủ đề: Là tất cả các thuộc tính phi không gian, thời gian của đối tượng địa lý. Các thông tin này mô tả một số các đặc tính cụ thể của đối tượng theo một chủ đề nhất định.
- Thông tin quan hệ: Là quan hệ giữa các đối tượng địa lý với nhau, bao gồm các quan hệ về không gian, cũng như thời gian
- Các thao tác: Là các hành vi của đối tượng địa lý tại một số điều kiện nhất định.
2.4.1.2. Tổ chức CSDL GIS
Tổ chức hệ thống thông tin địa lý phải bắt đầu bằng nhiệm vụ đặt ra của hệ thống thông tin. Từ đó xác định được mức độ đòi hỏi của các loại thông tin cần thiết như thông tin thuộc tính tỷ lệ nào, phải có lớp thông tin nào, độ chính xác của thông tin và thông tin thuộc tính có dạng nào. Sau khi xác định được nhu cầu thông tin cần tìm xem thông tin này có được từ nguồn nào, có thể lấy được từ cơ sở dữ liệu quốc gia, cơ sở dữ liệu chuyên ngành mua trên thị trường thông tin. Nếu các nguồn khai thác thông tin đều chưa có hoặc có cần xác định tiếp sử dụng biện pháp nào để thu nhận các thông tin còn thiếu. Có thể được các công ty cung cấp thông tin hoặc tổ chức thu nhập hệ thống thông tin riêng cho số lượng dữ liệu cần có nên tổ chức quản lý dưới dạng tập trung hay phân tán cho nhu cầu và hoàn cảnh khai thác thông tin. Khi định dạng thông tin đã rõ mới thiết kế phần cứng và phần mềm phù hợp.
2.4.1.3. Hệ quản trị cơ sở dữ liệu
Hệ quản trị cơ sở dữ liệu là hệ thống quản lý, lưu trữ, bảo trì toàn bộ cơ sở dữ liệu. Hệ quản trị cơ sở dữ liệu cũng cung cấp các công cụ cho phép người dùng hỏi đáp, tra cứu và tác động vào cơ sở dữ liệu.
Hệ quản trị cơ sở dữ liệu là từ dịch trong tiếng Anh: Database Management System (DBMS). Có nghĩa ám chỉ các chương trình phần mềm có khả năng lưu trữ, sửa chữa, xóa và tìm kiếm một thông tin cho cơ sở dữ liệu (CSDL). Có rất nhiều hệ quản trị CSDL khác nhau như: các phần mềm nhỏ chạy trên máy tính cá nhân, các hệ quản trị lớn phức tạp chạy trên một hoặc nhiều máy tính có khả năng xử lý mạnh. Tuy nhiên tất cả các hệ quản trị CSDL đều có một đặc điểm chung là sử dụng ngôn ngữ truy vấn có cấu trúc gọi là “Structured Query Language” (SQL). Các hệ quản trị được biết đến nhiều như: Microsoft Access, SQL server, My SQL,
Oracle, PostgreSQL, DB2… Phần lớn các hệ quản trị CSDL kể trên hoạt động tốt trên nhiều hệ điều hành khác nhau như Linux, Unix và MacOS ngoại trừ SQL Server của Microsoft chỉ chạy trên hệ điều hành Windows.
2.4.1.4. Cơ sở dữ liệu GeoDatabase
Geodatabase là một mô hình dữ liệu không gian do ESRI đưa ra, được dùng cho việc lưu trữ, truy vấn và xử lý dữ liệu GIS.
Geodatabase là mô hình lưu trữ các đối tượng địa lý trong một cơ sở dữ liệu. Nó là một cấu trúc dữ liệu có ưu điểm nổi bật cung cấp tính năng lưu trữ cơ sở dữ liệu địa lý trong một không gian dữ liệu thể hiện dưới hình thức một bảng dữ liệu. Một Geodatabase là một cấu trúc lưu trữ các dữ liệu không gian và thuộc tính cụ thể lưu trữ các cấu trúc của đối tượng, tập hợp của các đối tượng, thuộc tính, các mối quan hệ giữa các thuộc tính, và mối quan hệ giữa các đối tượng với nhau.
Hình 2.2: Các đối tượng hình học trong Geodatabase
Về định nghĩa thì: Geodatabase là dữ liệu lưu trữ phổ biến và được quản lý trong phần mềm ArcGIS. Nó kết hợp "geo" (dữ liệu địa lý) với "database" (kho dữ liệu) để tạo ra một kho dữ liệu trung tâm phục vụ cho việc lưu trữ và quản lý dữ liệu không gian. Nó có thể được tạo ra trong máy tính để bàn, máy chủ hoặc các môi trường điện thoại di động và cho phép lưu trữ dữ liệu GIS ở vị trí trung tâm để dễ dàng truy cập và quản lý.
Geodatabase là một kho chứa dữ liệu không gian và thuộc tính trong hệ quản trị cơ sở dữ liệu (Database Management System - DBMS).
- Các thành phần của Geodatabase được lưu trữ trong hệ quản trị cơ sở dữ liệu DBMS.
- Mô hình Geodatabase có tính chất của mô hình dữ liệu hướng đối tượng. - Dữ liệu được lưu trữ theo mô hình này mang tính toàn vẹn dữ liệu cao. Có hai mô hình Geodatabase: Mô hình Geodatabase một người dùng (Personal Geodatabase) và mô hình Geodatabase nhiều người dùng (Enterprise Geodatabase).
- Personal Geodatabase: Mô hình sử dụng hệ quản trị cơ sở dữ liệu Access để lưu trữ dữ liệu không gian và thuộc tính, nó chỉ hỗ trợ một người dùng và được cài đặt trên máy đơn. Dung lượng lưu trữ của mô hình này giới hạn do sự hạn chế về dung lượng lưu trữ của hệ quản trị cơ sở dữ liệu Access.
- Enterprise Geodatabase: Mô hình sử dụng hệ quản trị cơ sở dữ liệu nhiều người dùng như Oracle, SQL Server, DB2, Postgres... để lưu trữ dữ liệu. Dữ liệu lưu trữ được quản lý thông qua ArcSDE, dung lượng lưu trữ của mô hình này thường không giới hạn do hệ quản trị mà nó sử dụng không giới hạn dung lượng lưu trữ.
Hình 2.3: Các định dạng Geodatabase
Phương pháp chọn lựa mô hình Geodatabase: - Sử dụng mô hình Personal Geodatabase khi:
+ Hệ thống chạy trên máy đơn. + Dữ liệu đơn giản
- Sử dụng mô hình Multiuser Geodatabase khi:
+ Nhiều người dùng truy vấn, hiệu chỉnh trên cùng một Geodatabase. + Hệ thống dùng mô hình client/server.
+ Dung lượng lưu trữ dữ liệu không giới hạn. + Dữ liệu được truy cập qua Internet,... Lợi ích của Geodatabase:
- Tính toàn vẹn dữ liệu. + Subtypes.
+ Domains.
+ Validation rules.
- Mô hình hóa, quản lý tốt hơn về mối quan hệ giữa các đối tượng. - Dữ liệu không gian và thuộc tính được lưu trữ tập trung và liên tục. - Linh động: Personal hoặc Multiuser Geodatabase.
- Hỗ trợ mô hình dữ liệu nhiều người dùng (Multiuser Geodatabase). - Toàn bộ dữ liệu được tập trung vào một cơ sở dữ liệu.
- Thừa kế được các tính năng ưu việt của hệ quản trị cơ sở dữ liệu mà nó sử dụng để lưu trữ dữ liệu.
Các dạng lưu trữ của Geodatabase:
- Personal Geodatabase (PGDB): sử dụng Microsof Accsess để lưu trữ dữ liệu, giới hạn dung lượng là 2GB, không lưu trữ được dữ liệu Raster.
- File Geodatabase (FGDB): được đề xuất trong phiên bản ArcGIS 9.2. Theo ESRI, có 3 lý do cơ bản cho sự ra đời của File Geodatabase (FGDB).
+ Tránh sự hạn chế về dung lượng của Personal Geodatabase (PGDB). Dung lượng tối đa cho PGDB là 2GB và trong thực tế PGDB hoạt động rất chậm sau khi đã lưu trữ khoảng 500MB dữ liệu.
+ Tránh sự hạn chế về môi trường hoạt động của PGDB. PGDB chỉ hoạt động trên hệ điều hành Windows.
Khác với PGDB sử dụng Microsoft Access để lưu trữ dữ liệu, FGDB lưu dữ liệu GIS dưới dạng một thư mục trong đó bao gồm nhiều file được nén và mã hóa. Tập hợp các file trong một FGDB được tổ chức nhằm hỗ trợ các khả năng quan trọng của một cơ sở dữ liệu không gian như: geometric network, raster dataset, subtype, domain,...
Do những tính năng ưu việt đó của File Geodatabase trong khuôn khổ luận văn tác giả sử dụng FGDB để lưu trữ CSDL GIS trong quản lý dữ liệu khống chế địa chính.
Bảng 2.1: Bảng so sánh các loại Geodatabase
Đặc điểm chính
File Geodatabase Personal Geodatabase
Mô tả
Một tập hợp các loại hình hệ thống dữ liệu GIS datasets được lưu trữ dưới dạng một hệ thống tập tin thư mục. Đây là định dạng dữ liệu gốc được cung cấp cho ArcGIS lưu trữ và quản lý trong một thư mục hệ thống tập tin.
Định dạng dữ liệu ban đầu cho ArcGIS geodatabases lưu trữ và quản lý trong Microsoft Access với các file dữ liệu. Đây là giới hạn về kích thước và hoạt động dưới hệ điều hành Windows. Số người sử dụng - Người dùng đơn lẻ và nhóm làm việc nhỏ. - Một số người sử dụng, người viết cho một phần dữ liệu thuộc tính, dữ liệu thuộc tính đơn lẻ lớp hoặc bảng.
- Đồng thời sử dụng bất kỳ tập tin cụ thể tối giản đưa đến người dùng cuối với lượng lớn người sử dụng.
- Người dùng đơn lẻ và nhóm làm việc với dữ liệu datasets nhỏ. - Một số người sử dụng.
- Đồng thời được sử dụng đưa đến người dùng cuối với lượng lớn người sử dụng.
Định dạng lưu
trữ
Mỗi số liệu là một tập tin riêng biệt trên đĩa. Một file geodatabase là một thư mục tập tin chứa các tập tin số liệu của nó.
Tất cả các nội dung trong từng personal geodatabase được tổ chức trong một tập tin Microsoft Access (*.mdb)…
Đặc điểm chính
File Geodatabase Personal Geodatabase
Giới hạn kích thước
Mỗi bộ dữ liệu, mỗi file geodata- base có thể chứa nhiều dữ liệu. Mỗi lớp thuộc tính có thể mở rộng lên đến hàng trăm triệu thuộc tính vector cho mỗi bộ dữ liệu.
Hai GB cho mỗi truy cập cơ sở dữ liệu. Có hiệu lực giới hạn trước khi thực hiện tối giản là thường khoảng từ 250 và 500 MB mỗi file cơ sở dữ liệu Access.
Hỗ trợ xác định phiên bản Không hỗ trợ Không hỗ trợ Các nền tảng
Đa nền tảng Chỉ chạy trên môi trường Windows
Bảo mật và Quyền
Điều hành hệ thống tập tin bảo mật.
Hệ thống bảo mật file của Windows
Công cụ quản lý cơ sở dữ
liệu
File hệ thống quản lý Quản lý tập tin của hệ điều hành Windows
Ghi chú
Cho phép ta tuỳ chọn lưu trữ dữ liệu trong một định dạng chỉ đọc nén để giảm dung lượng lưu trữ
Thường được sử dụng như dưới hình thức quản lý bảng thuộc tính (thông qua Microsoft Access). Người sử dụng giống như việc xử lý chuỗi cho thuộc tính văn bản