3.2.1.1. Thông tin cần thể hiện
Ứng dụng chính định hướng việc nghiên cứu các hệ cơ sở dữ liệu không gian là GIS. Vì vậy chúng ta xem xét một vài mô hình cần thiết trong lĩnh vực này và cũng là mô hình tiêu biểu cho các ứng dụng khác. Các ví dụ được thể hiện trong không gian 2 chiều, mở rộng thành 3 hoặc nhiều chiều khi có thể. Có hai cách nhìn khác nhau về cái gì cần thể hiện:
(i) Các đối tượng trong không gian: Chúng ta quan tâm đến các đối tượng riêng biệt được sắp đặt trong không gian, mỗi đối tượng có mô tả hình học riêng của nó.
(ii) Không gian: Chúng ta mong muốn tự mô tả không gian, điều đó có nghĩa ta biết điều gì đó về mọi điểm trong không gian.
Chúng ta có thể dung hòa cả hai quan điểm trong một vài tình huống bằng cách đề xuất các khái niệm cho mô hình hóa (i) các đối tượng cơ sở và (ii) tập hợp các
đốitượng có quan hệvề không gian.
Đối với mô hình các đối tượng cơ sở, các trừu tượng cơ bản là điểm, đường và vùng. Một điểm thể hiện (ở khía cạnh hình học) một đối tượng chỉ quan tâm đến vị trí của nó trong không gian hơn là phần diện tích/thể tích mà nó chiếm. Một đường
(trong ngữ cảnh này luôn được hiểu là đường cong trong không gian, thường được thể hiện bởi một chuỗi các đoạn thẳng) là trừu tượng cơ bản cho việc mô tả các di chuyển trong không gian hoặc những kết nối trong không gian. Một vùng là trừu tượng cho những đối tượng có diện tích trong không gian 2 chiều. Vùng có thể có những lỗ hổng và cũng có thể bao gồm những phần tách biệt. Hình 3.1 cho thấy 3 trừu tượng cơ bản cho các đối tượng cơ sở.
Hình 3.1. Ba trừutượng không gian cơbảnđiểm,đường và vùng
Hai ví dụ quan trọng nhất của tập các đối tượng có quan hệ không gian là các phân hoạch (partitions) và mạng (network). Một phân hoạch có thể được xem như là tập các đối tượng vùng rời nhau. Quan hệ kề được đặc biệt quan tâm, thường tồn tại những cặp đối tượng vùng có chung biên. Các phân hoạch có thể được dùng để thể hiện các bản đồ chủ đề. Mạng có thể được xem như là đồ thị được nhúng vào mặt phẳng, bao gồm một tập các đối tượng điểm (các nút) và tập các đối tượng đường.
Hình 3.2. Phân hoạch và mạng
Trên đây chỉ là các trừu tượng cơ bản nhất được hỗ trợ trong hệ quản trị cơ sở dữ liệu không gian SDBMS (trường hợp này là GIS). Thực tế có thể cần mô tả các trừu tượng phức tạp hơn. Ví dụ, mối quan tâm khác về tập các đối tượng có quan hệ không gian là các mô hình phân cấp (ví dụ, quốc gia được phân hoạch thành các
3.2.1.2. Các kiểu dữ liệu không gian
Hệ thống các kiểu dữ liệu không gian hay đại số không gian (spatial algebra) có thể dùng các trừu tượng cơ bản đã được mô tả ở phần trên cho đối tượng điểm, đường, vùng cùng với các mối quan hệ giữa các đối tượng này và các tác vụ hợp thành. Hệ thống kiểu dữ liệu không gian là thành phần bắt buộc của mô hình dữ liệu cho DBMS không gian.
Trong hầu hết các công trình nghiên cứu đều đề xuất ba kiểu dữ liệu không gian cơ bản: điểm, đường, vùng.
Trong quá trình vận hành, khai thác hệ thống cơ sở dữ liệu không gian (đặc biệt là các hệ thống GIS), mỗi cơ quan tổ chức hoặc quốc gia sử dụng một hệ thống riêng, một phần mềm riêng và một định dạng dữ liệu khác nhau. Từ đó việc liên kết, tái sử dụng các dữ liệu theo chuẩn và định dạng khác nhau là một vấn đề hết sức khó khăn. Các cơ quan tổ chức lớn như Environmental Systems Research Institute, IBM Corporation, Informix Software, MapInfo Corporation, Oracle Corporation đã thành lập hiệp hội Open GIS Consortium viết tắt là OGC và một số cá nhân,tổ chức khác đã ngồi lại với nhau và chung sức xây dựng một chuẩn chung gọi là chuẩn OpenGIS và công bố miễn phí chuẩn này cho cộng đồng người dùng. Quá trình này được duy trì và phát huy, cập nhật liên tục. Càng ngày càng có nhiều người tham gia xây dựng và OpenGIS dần trở thành một chuẩn được cộng đồng quốc tế công nhận.
Theo xu thế của thời đại, các công ty phần mềm chuyên xây dựng các phần mềm trong lĩnh vực CAD, GIS cũng phải xây dựng các ứngdụng của mình phù hợp và đáp ứng được các tiêu chí của OpenGIS.
Dựa trên sự mở rộng của mô hình đặc tả đối tượng các đối tượng không gian cơ bản của OpenGIS có thể tóm lược theo mô hình phân cấp sau: Hình 3.3
Geometry Collection
Multi-Point Multi-Polyline Multi-Polygon Point Polyline Polygon
Geometry
3.2.1.3. Các chứcnăng khai thác dữliệu không gian cơ bản
Bảng dưới đây mô tả các chức năng khai thác dữ liệu không gian cơ bản.
Các hàm cơ bản
SpatialReference() Trả về hệ tọa độ bên dưới của đối tượng hình học
Envelope() Trả về khung bao trực giao nhỏ nhất của đối tượng hình học Export() Trả về đối tượng hình học theo cách biểu diễn khác
IsEmpty() Trả về true nếu đối tượng hình học là tập rỗng
IsSimple() Trả về true nếu đối tượng hình học là simple (không tự giao) Boundary () Trả về biên của đối tượng hình học
Các toán tử Topology / Tập hợp
Equal Trả về true nếu phần trong và biên của hai đối tượng hình học là tương đương về mặt không gian
Disjoint Trả về true nếu biên và phần trong không giao nhau
Intersect Trả về true nếu phần trong của các đối tượng hình học giao nhau Touch Trả về true nếu các biên giao nhau nhưng phần trong thì
không
Cross Trả về true nếu phần trong của các đối tượng hình học giao nhau nhưng các biên thì không Within Trả về true nếu phần trong của đối tượng hình học đã cho
không giao với phần ngoài của đối tượng hình học khác Contains Kiểm tra xem đối tượng hình học đã cho có chứa đối tượng hình học khác không Overlap Trả về true nếu phần trong của hai đối tượng hình học có phần giao khác rỗng
Phân tích không gian
Buffer Trả về vùng đệm chứa tất cả các điểm có khoảng cách tính từ đối tượng hình học đã cho nhỏ hơn hoặc bằng một khoảng cách xác định
ConvexHull Trả về tập lồi nhỏ nhất bao quanh đối tượng hình học Intersection Trả về phần giao của hai đối tượng hình học
Union Trả về phần hội của hai đối tượng hình học
Difference Trả về phần không giao với một đối tượng hình học khác SymmDiff Trả về phần không giao của hai đối tượng hình học
3.2.1.4. Tích hợpđốitượng hình học vào mô hình dữ liệu DBMS
Ý tưởng chủ đạo cho tích hợp mô hình hình học vào mô hình dữ liệu DBMS truyền thống là để thể hiện “các đối tượng không gian” (ở phương diện các đối tượng ứng dụng chẳng hạn như sông ngòi, quốc gia, thành phố…) bởi các đối tượng (ở phương diện mô hình dữ liệu DBMS) với tối thiểu một thuộc tính có kiểu dữ liệu không gian. Vì vậy mô hình dữ liệu DBMS phải được mở rộng bởi SDTs ở cấp độ các kiểu dữ liệu cơ bản (chẳng hạn như kiểu nguyên, kiểu chuỗi…) hoặc tốt hơn là mở cho kiểu người dùng định nghĩa (“hỗ trợ kiểu dữ liệu trừu tượng” [45] ).