CƠ SỞ DỮ LIỆU KHƠNG GIAN GEODATABASE

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Mô hình dữ liệu không gian áp dụng cho mạng lưới cấp nước (Trang 43 - 97)

2.5.1 Đặc điểm và các loại Geodatabase

Khái niệm Geodatabase ra đời bởi Esri cùng với sự ra đời của họ phần mềm ArcInfo 8.x. Geodatabase là một cơ sở dữ liệu cho phép lưu trữ, truy vấn và xử lý dữ liệu địa lý được lưu trữ bởi các cấu trúc dữ liệu khác nhau. Hai cấu trúc dữ liệu thường được sử dụng là raster và vector. Ngồi ra Geodatabase cịn cĩ khả năng lưu trữ và quản lý các quan hệ khơng gian (Topololy, Network), ràng buộc dữ liệu (Domain, Subtype) và các giao tác dữ liệu. Như vậy để cĩ được một hệ thống Gis hồn chỉnh thì ta cần phải xây dựng Geodatabase vì những lợi ích mà nĩ mang lại.

Việc thiết kế cơ sở dữ liệu đĩng vai trị quan trọng và mang tính quyết định trong tiến trình xây dựng hệ thống GIS. Đây cũng là vấn đề địi hỏi nhiều cơng sức và thời gian. Với sự tiến bộ của cơng nghệ phần mềm hướng đối tượng đã cung cấp một số phương pháp và cơng cụ thiết kế Geodatabase khá hữu hiệu giúp cho việc thiết kế Geodatabase trở nên đơn giản hơn và ít sai sĩt.

Geodatabase cĩ các đặc điểm chức năng sau:

+ Lưu trữ một tập hợp đa dạng của dữ liệu khơng gian ở một nơi tập trung.

+ Áp dụng các quy tắc phức tạp và các mối quan hệ của dữ liệu.

+ Xác định các quan hệ khơng gian giữa các đối tượng địa lý (topologies, networks).

+ Duy trì tính tồn vẹn của dữ liệu khơng gian trong cơ sở dữ liệu.

+ Cung cấp mơi trường đa người dùng và cho phép truy cập, chỉnh sửa tích hợp dữ liệu khơng gian với cơ sở dữ liệu khác ngồi hệ thống.

+ Dễ dàng mở rộng giải pháp lưu trữ dữ liệu.

+ Hỗ trợ việc chỉnh sửa các thuộc tính và phương thức của đối tượng. + Khai thác các tiềm năng của dữ liệu khơng gian một cách hiệu quả.

Geodatabase được thiết kế cho những mục đích khác nhau của người sử dụng. Hai mơ hình Geodatabase được sử dụng là Single-User Geodatabase và Multiuser Geodatabase.

2.5.1.1 Single-User Geodatabase

Hình 2.22: Single-user Geodatabase

(nguồn: www.esri.com)

Single User Geodatabase thích hợp cho các ứng dụng Gis riêng lẻ trong mơi trường Desktop. Cơ sở dữ liệu được lưu trữ trong file cĩ cấu trúc đặc biệt (shapfile) hoặc trong một hệ quản trị CSDL Personal như Microsoft Access.

2.5.1.2 Multiuser Geodatabase

Hình 2.23: Multiuser Geodatabase

(nguồn: www.esri.com)

Multiuser Geodatabases sử dụng cơng nghệ ArcSDE của Esri thực hiện trên nền tảng của hệ quản trị cơ sở dữ liệu quan hệ (RDBMS) để:

+ Cung cấp cho người sử dụng cĩ một trung tâm lưu trữ dữ liệu và khả năng mở rộng hệ thống quản lý.

+ Cung cấp các cơng cụ bảo mật dữ liệu tốt hơn như kiểm sốt quyền truy cập cho các bộ dữ liệu riêng lẻ (datasets).

+ Duy trì tính tồn vẹn dữ liệu với các tính năng như sao lưu dữ liệu và phục hồi, rollback và dự phịng lỗi.

2.5.1.3 Tính năng đa người dùng trong Geodatabase Versioning Versioning

Hình 2.24: Versioning trong Geodatabase

(nguồn: www.esri.com)

Versioning là cơ chế cho phép Geodatabase quản lý và duy trì nhiều trạng thái trong khi vẫn bảo đảm tính tồn vẹn của cơ sở dữ liệu. Nĩ là cơ sở cho nhiều người dùng truy cập và chỉnh sửa dữ liệu cùng một lúc. Versions ghi lại một cách rõ ràng các trạng thái đối tượng của Geodatabase.

Hai cấp độ sử dụng của Versioning trong một geodatabase đa người dùng là Versioned Editing và Nonversioned Editing.

- Versioned Editing: Thường được sử dụng như là defaut của Geodatabase nhằm đảm bảo tính tồn vẹn và nhất quán của dữ liệu. Hỗ trợ đầy đủ các mơ hình Geodatabase.

- Khả năng quản lý giải quyết xung đột. - Hỗ trợ undo/redo.

- Hỗ trợ lưu trữ và sao chép geodatabase. - Hỗ trợ các long transactions.

- Ghi lại các thay đổi liên tục của dữ liệu.

- Nonversioned Editing: Thích hợp cho việc nhân bản Geodatabase.

- Cung cấp khả năng chỉnh sửa trực tiếp vào các nguồn dữ liệu. - Việc chỉnh sửa cĩ hiệu lực ngay lập tức, khơng cĩ khả năng

Geodatabase Replication

Nhân bản geodatabase cho phép dữ liệu GIS được chia sẻ giữa hai hoặc nhiều Geodatabases. Sự thay đổi của dữ liệu cĩ thể được thực hiện trong mỗi Geodatabase, sau đĩ đồng bộ lại với nhau.

Hình 2.25: Geodatabase Replication (nguồn: www.esri.com)

Việc nhân bản Geodatabase được xây dựng trên mơi trường Versioning cĩ các đặc điểm như:

- Hỗ trợ đầy đủ các mơ hình dữ liệu Geodatabase, bao gồm cấu trúc toplogy và mạng lưới hình học.

- Cĩ thể làm việc trong một mơ hình khơng đồng bộ để các Geodatabase nhân rộng cĩ thể làm việc độc lập.

- Khơng địi hỏi một hệ quản trị CSDL thống nhất giữa các bản sao Geodatabase.

- Làm việc trong một mơi trường kết nối hoặc ngắt kết nối CSDL. - Cĩ thể sử dụng kết nối Geodatabase cục bộ cũng như các dịch vụ dữ liệu địa lý (thơng qua ArcGIS cho Server) để truy cập vào Geodatabase qua đường truyền Internet.

Geodatabase Archiving

Geodatabase Archiving cho phép ghi lại và truy cập các sự thay đổi của tất cả hoặc một tập hợp các dữ liệu trong một Geodatabase. Sử dụng nĩ, ta cĩ thể nắm bắt, quản lý và phân tích những thay đổi của dữ liệu.

Hình 2.26: Geodatabase Archiving

(nguồn: www.esri.com)

Trong Multiuser Geodatabase, ArcGis cung cấp:

- Một framework để lưu trữ dữ liệu nắm bắt được của tất cả những thay đổi trong phiên bản mặc định của Geodatabase.

- Một lớp lưu trữ được thêm vào để bảo tồn lịch sử của các giao tác.

2.5.1.4 Lưu trữ trong một hệ quản trị cơ sở dữ liệu quan hệ (RDBMS)

Multiuser Geodatabase sử dụng một kiến trúc nhiều tầng để thực hiện các hành vi của đối tượng trong tầng ứng dụng (các phần mềm ArcGIS) bên trên của tầng lưu trữ (hệ quản trị cơ sở dữ liệu quan hệ RDBMS). Trách nhiệm quản lý dữ liệu địa lý trong một Geodatabase đa người dùng được chia sẻ giữa ArcGIS và phần mềm RDBMS.

Hệ quản trị cơ sở dữ liệu quan hệ cung cấp một cấu trúc hình thức dễ hiểu để lưu trữ và quản lý thơng tin trong các bảng (table). Việc lưu trữ và phục hồi dữ liệu được thực hiện với các bảng đơn. Geodatabase đa người dùng tận dụng các khả năng của RDBMS. Một số đặc điểm của quản lý dữ liệu địa lý như việc lưu trữ trên ổ đĩa vật lý, xác định các loại thuộc tính, xử lý truy vấn và xử lý giao dịch đa người dùng được ủy nhiệm cho RDBMS.

Hình 2.27: Sự kết hợp Geodatabase và RDBMS

Geodatabase đa người dùng kết hợp với RDBMS để quản lý dữ liệu sẽ cung cấp cho ta sự linh hoạt trong việc lựa chọn các hệ quản trị CSDL quen thuộc cũng như áp dụng các kiến thức, kinh nghiệm cĩ được từ trước khi sử dụng các RDBMS

ArcSDE Technology là cơng nghệ được sử dụng trong Geodatabase như là một cổng chính giữa các ứng dụng Gis và RDBMS. Nĩ cho phép lưu trữ, truy cập và quản lý dữ liệu khơng gian trong một RDBMS như: DB2, Informix, Oracle, PostgreSQL, SQL Server và SQL Server Express.

Geodatabase Application Logic

Trong khi các RDBMS quản lý các loại dữ liệu đơn và bảng biểu và cơng nghệ ArcSDE cho phép giao tiếp giữa GIS client và RDBMS, cần cĩ thêm một application logic để thực hiện những hành vi phức tạp hơn của các đối tượng địa lý và đảm bảo sự ràng buộc tồn vẹn. ArcObjects là một điển hình của application logic cho phép thực hiện các hành vi phức tạp trong một geodatabase. ArcObjects là một thư viện của các thành phần phần mềm tạo nên nền tảng của ArcGIS.

Spatial Types

Spatial Type là một loại đối tượng mơ tả và hỗ trợ dữ liệu khơng gian như điểm, đường và vùng. Các kiểu dữ liệu khơng gian cho phép tạo ra các cột cĩ khả năng lưu trữ dữ liệu khơng gian chẳng hạn như địa điểm một cột mốc, một con đường, hoặc một thửa đất.

Kiểu dữ liệu khơng gian:

- cung cấp chỉ số khơng gian hỗ trợ truy vấn khơng gian, các hàm và các predicates.

- Là một thành phần liên tục của các dữ liệu GIS.

- Cung cấp sự linh hoạt cho phép gửi các truy vấn SQL cấp khơng gian.

Bảng 2.2: Kiểu dữ liệu khơng gian trong các hệ quản trị CSDL

Hệ QTCSDL Kiểu dữ liệu khơng gian

Microsoft SQL Server - Geometry for SQL Server - Geography for SQL Server bắt đầu từ version 2008 Oracle - Esri for Oracle - Orracle Spatial bắt đầu từ version 11g

IBM DB2 - DB2 Spatial Extender

IBM Informix - Spatial DataBlade PostgreSQL - Esri for PostgreSQL

- PostGIS

(nguồn: www.esri.com)

2.5.2 Các đối tƣợng dữ liệu trong Geodatabase: Annotation (kí hiệu trong Geodatabase )

Là một lớp đặc biệt dùng để lưu trữ văn bản hoặc đồ họa cung cấp thơng tin về các đối tượng địa lý hoặc các khu vực tổng quát của bản đồ. Lớp Annotation được liên kết với một lớp đối tượng địa lý để chỉnh sửa các đặc điểm được phản ánh trong các chú thích tương ứng (ví dụ, chú thích tính năng liên kết).

Dimension (kí hiệu trong Geodatabase )

Một kiểu ghi chú đặc biệt của Geodatabase để hiển thị độ dài hoặc khoảng cách cụ thể trên một bản đồ. Chức năng Dimension cĩ thể chỉ ra chiều dài của một tịa nhà hoặc thửa đất, hoặc nĩ cĩ thể cho biết khoảng cách giữa hai đối tượng như giữa một vịi nước cứu hỏa và các gĩc của một tịa nhà.

Feature Class (kí hiệu trong Geodatabase )

Là một tập hợp các đối tượng địa lý cĩ cùng một kiểu biểu diễn hình học (ví dụ Point, Line, hoặc Polygon), cĩ các thuộc tính giống nhau và các tham chiếu khơng gian tương tự nhau. Các lớp Faeture cho phép các đặc điểm đồng nhất được nhĩm lại thành một đơn vị duy nhất để thuận lợi cho mục đích lưu trữ dữ liệu. Ví dụ đường cao tốc, đường giao thơng chính và đường ống nước cĩ thể được nhĩm lại thành một lớp line được đặt tên "đường." Các lớp Feature cũng cĩ thể lưu trữ các Annotation và Demension.

Feature Dataset (kí hiệu trong Geodatabase )

Một bộ bao gồm các lớp đối tượng địa lý được lưu trữ chung với nhau nhằm chia sẻ các tham chiếu khơng gian giống nhau. Các lớp đối tượng địa lý trong Feature Dataset cĩ cùng một hệ tọa độ và các đối tượng của nĩ nằm chung trong một khu vực địa lý. Feature Dataset được dùng để mơ hình hĩa mối quan hệ khơng gian giữa các lớp đối tượng địa lý.

Geometric Network (kí hiệu trong Geodatabase )

Edge (cạnh) và Junction (điểm nối) là các đối tượng đại diện cho một hệ thống mạng lưới cĩ hướng (directed-flow) chẳng hạn như hệ thống thủy văn, trong đĩ kết nối của các đối tượng dựa trên sự trùng hợp hình học của nĩ. Một mạng lưới hình học (Geometric Network) khơng chứa thơng tin về sự kết nối của các đối tượng, thơng tin này được lưu trữ trong một Logical network. Mạng lưới hình học thường được sử dụng để mơ hình hĩa mạng lưới cĩ hướng.

Locator (kí hiệu trong Geodatabase )

Một bộ dữ liệu để quản lý thơng tin địa chỉ của các đối tượng cho phép mã hĩa địa lý (Geocoding), đĩ là một quá trình chuyển đổi địa chỉ đến một vị trí địa lý để hiển thị trên bản đồ.

Mosaic Dataset (kí hiệu trong Geodatabase )

Một mơ hình dữ liệu mới trong Geodatabase cho phép các bộ sưu tập các hình ảnh và rasters được lưu trữ trong một danh mục với các tùy chọn để kết hợp siêu dữ liệu (metadata), dynamic mosiacking và xử lý hình ảnh on-the- fly. Nĩ cĩ thể truy cập như một raster dataset hoặc là một danh mục của metadata.

Network Dataset (kí hiệu trong Geodatabase )

Là một tập hợp các phần tử mạng kết nối topology với nhau cĩ nguồn gốc từ các mạng nguồn, thường được sử dụng để đại diện cho một hệ thống mạng vơ hướng (undirected-flow) như một con đường hay hệ thống tàu điện

ngầm. Mỗi phần tử mạng cĩ liên quan đến một tập hợp các thuộc tính mạng. Network dataset thường được sử dụng để mơ hình hĩa hệ thống mạng vơ hướng.

Parcel Fabric (kí hiệu trong Geodatabase )

Là một bộ dữ liệu phục vụ cho việc lưu trữ, bảo trì, và chỉnh sửa các thửa (đất xây dựng). Nĩ là một bề mặt liên tục của các đối tượng vùng, các đối tượng đường, và các đối tượng điểm được kết nối với nhau.

Raster Catalog (kí hiệu trong Geodatabase )

Một tập hợp các bộ dữ liệu raster được xác định trong một Table, trong đĩ các record xác định tập dữ liệu raster riêng biệt bao gồm trong danh mục. Raster catalog được sử dụng để hiển thị các raster datasets lân cận hoặc chồng lên nhau mà khơng cần phải nối chúng lại với nhau thành một file lớn.

Raster Dataset (kí hiệu trong Geodatabase )

Mọi định dạng raster hợp lệ được tổ chức thành một hoặc nhiều band. Mỗi band bao gồm một mảng điểm ảnh (cell) và mỗi điểm ảnh cĩ một giá trị (ví dụ, một hình ảnh vệ tinh Landsat). Raster datasets cĩ thể được lưu trữ trong nhiều định dạng khác nhau như TIFF, ERDAS Imagine, ESRI Grid, hay MrSID.

Relationship Class (kí hiệu trong Geodatabase )

Là một class tương tự như các mối quan hệ tồn tại trong một RDBMS. Các lớp Relationship quản lý sự kết hợp giữa các đối tượng trong cùng một lớp và các đối tượng trong những lớp khác nhau. Đối tượng ở hai đầu của mối quan hệ cĩ thể là các đối tượng dạng hình học hoặc các record trong một bảng.

Schematic Dataset (kí hiệu trong Geodatabase )

Một tập dữ liệu sử dụng cho đồ họa đại diện cho kết nối mạng. Nĩ cũng đại diện cho tập các mối quan hệ.

Table (kí hiệu trong Geodatabase )

Một tập hợp các thành phần dữ liệu được sắp xếp theo hàng và cột. Mỗi hàng đại diện cho một record. Mỗi cột đại diện cho một field của record. Các hàng và cột giao nhau tại các cell, trong đĩ cĩ một giá trị cụ thể cho một field của một record. Table thường lưu trữ thơng tin thuộc tính độc lập hoặc thơng tin liên quan đến một vị trí khơng gian như địa chỉ.

Terrain (kí hiệu trong Geodatabase )

Một mạng lưới tam giác khơng đều (cấu trúc TIN) được xây dựng dựa trên tập dữ liệu của các lớp đối tượng địa lý để mơ hình nhiều bề mặt cĩ sử dụng đến giá trị độ cao z.

Toolbox (kí hiệu trong Geodatabase )

Một tập hợp của các quá trình dataflow và workflow. Chúng được sử dụng cho việc thực hiện quản lý dữ liệu, phân tích và mơ hình hĩa.

Topology (kí hiệu trong Geodatabase )

Sự sắp xếp bố trí các đối tượng điểm, đường, vùng để thể hiện mối quan hệ hoặc sự liên kết về mặt hình học trong một Geodatabase. Cấu trúc liên kết xác định và thực thi các quy tắc tồn vẹn dữ liệu, truy vấn mối quan hệ topo. Nĩ cũng cho phép xây dựng đối tượng hình học phi cấu trúc.

2.5.3 Biểu diễn dữ liệu trong Geodatabase

Một Geodatabase thường chứa bốn đại diện của dữ liệu địa lý: • Dữ liệu Vector biểu diễn cho các đối tượng địa lý.

• Dữ liệu Raster biểu diễn cho hình ảnh, dữ liệu chuyên đề theo dạng lưới và các bề mặt.

• Triangulated irregular networks (TINs) biểu diễn cho bề mặt. • Địa chỉ và định vị cho việc tìm kiếm một vị trí địa lý.

2.5.3.1 Biểu diễn các đối tượng với vectơ

Nhiều đối tượng trong thế giới thực đã được xác định rõ hình dạng. Dữ liệu Vector đại diện cho hình dạng của đối tượng chính xác và đầy đủ như

một tập các tọa độ với các thuộc tính liên quan. Việc biểu diễn này hỗ trợ hoạt động hình học như tính tốn độ dài và diện tích, xác định chồng lắp và giao điểm, và việc tìm kiếm các đối tượng khác liền kề hoặc gần đĩ.

Dữ liệu vector trong Geodatabse được phân loại theo dimension:

• Point (Điểm) là hình dạng khơng chiều đại diện cho đối tượng địa lý quá nhỏ để cĩ thể được mơ tả như đường hoặc khu vực. Điểm được lưu trữ như một cặp tọa độ đơn (x,y) với các thuộc tính.

• Line (đường) cĩ hình dạng một chiều đại diện đối tượng địa lý quá hẹp để mơ tả như khu vực. Line được lưu trữ như một loạt các cặp tọa độ x, y cùng với các thuộc tính. Các phân đoạn (segment) của một Line cĩ thể là đường thẳng, hình trịn, hình elip.

• Polygon (vùng, đa giác) cĩ hình dạng hai chiều đại diện cho đối tượng địa lý rộng lớn được lưu trữ như một loạt các segment bao quanh một vùng. Những phân đoạn tạo thành một tập hợp các vùng khép kín.

Một loại dữ liệu vector khác là annotation (chú thích). Đây là những nhãn mơ tả cĩ liên quan đến đối tượng địa lý và hiển thị tên và thuộc tính.

Dữ liệu vector trong một Geodatabase cĩ cấu trúc định hướng việc lưu

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Mô hình dữ liệu không gian áp dụng cho mạng lưới cấp nước (Trang 43 - 97)

Tải bản đầy đủ (PDF)

(97 trang)