II.4.1 Cơ sở dữ liệu là gì?
II.4.1.1. Khái niệm.
Tác giả Nguyễn Trung Trực và Dương Tuấn Anh [2] quan niệm rằng “Cơ sở dữ liệu là một tập hợp có tổ chức bao gồm các dữ liệu có liên quan luận lý với nhau và đƣợc dùng chung”. Định nghĩa trên chỉ cho ta thấy rằng, xây dựng cơ sở dữ liệu là nhằm hệ thống hóa các dữ liệu, sắp xếp, tổ chức, lưu trữ dữ liệu sao cho có khoa học và có thể khai thác sử dụng nó một cách hiệu quả nhất.
II.4.1.2 Đặc điểm.
- Giảm sự trùng lặp thông tin.
- Tính nhất quán và toàn vẹn dữ liệu.
- Đảm bảo dữ liệu đƣợc chia sẽ theo nhiều cách khác nhau.
- Tăng tính dùng chung dữ liệu.
- Tăng tính an toàn dữ liệu.
- Tính chuẩn hóa cao.
II.4.2 Phân tích, thiết kế cơ sở dữ liệu theo cách tiếp cận hướng đối tƣợng.
Để tiếp cận cơ sở dữ liệu có nhiều hướng khác nhau. Mô hình phân cấp và mô hình mạng đƣợc xếp vào thế hệ thứ nhất. Thế hệ thứ hai của các hệ quản trị cơ sở dữ liệu có mô hình quan hệ. Hai thế hệ trên đƣợc xem nhƣ là cách tiếp cận truyền thống (mô hình cổ điển). Thế hệ thứ ba cũng là mô hình cơ sở dữ liệu mới nhất với tên gọi là mô hình hướng đối tượng.
Với cách tiếp cận hướng đối tượng chúng ta chú trọng vào xây dựng lý thuyết hệ thống tổng quát như là các khái niệm cơ sở. Cơ sở dữ liệu hướng đối tƣợng là một phức hợp gồm nhiều đối tƣợng, và các đối tƣợng này có tác động qua lại lẫn nhau. Đối tượng vật lý chính là các thực thể như các thiết bị và con người hay là khái niệm trừu tƣợng nhƣ các tệp dữ liệu và các hàm. Chúng đƣợc tổ chức vào một lớp. Các đối tượng đóng vai trò trọng tâm trong các bước của quá trình phát triển hệ thống nói chung và trong phân tích thiết kế nói riêng. Các đối tƣợng trong mô hình có sự giao nhau và lặp lại giữa các bước.
Trong khi đó, phân tích hướng đối tượng là phương pháp xác định các yêu cầu của hệ thống thông qua các đối tượng, hành vi, sự tương tác của chúng trong thế
13 giới thực. Nói một cách khác, phân tích hướng đối tượng làm nhiệm vụ xác định các đối tƣợng để xác định các đơn nguyên của hệ thống. Nhiệm vụ của phần này là tìm hiểu kỹ bài toán để phân tách nó thành các thành phần nhỏ hơn và xây dựng các sơ đồ trạng thái, sơ đồ dòng dữ liệu để mô tả toàn bộ chức năng của hệ thống. Trong giai đoạn phân tích sẽ tiến hành: tìm hiểu kỹ bài toán, xác định rõ các đặc tả của chúng, xác định hành vi của đối tƣợng sẽ phải thực hiện và xác định mối quan hệ tương tác giữa các đối tượng.
Như vậy xây dựng cơ sở dữ liệu hướng đối tượng là quá trình mô hình hóa, phân lớp các đối tƣợng, tổng quát hóa, đặc biệt hóa và gộp các đối tƣợng. Các quá trình này phải đƣợc tiến hành đồng thời. Sau đó tiến hành xây dựng các đặc tả cho các đối tƣợng, các lớp và xác định cấu trúc phân cấp các lớp. Giai đoạn này bao gồm 3 quá trình: mô hình dữ liệu mức ý niệm, mô hình dữ liệu mức logic và mô hình dữ liệu mức vật lý.
II.4.3 Mô hình dữ liệu Geodatabase.
II.4.3.1 Geodatabase là gì?
Geodatabase là mô hình dữ liệu hướng đối tượng, cho phép lưu trữ, truy vấn, phân tích và xử lý dữ liệu địa lý. Dữ liệu trong Geodatabase thường được tổ chức thành các lớp dữ liệu dạng vector hoặc raster. Vì là mô hình dữ liệu hướng đối tƣợng nên các thực thể đƣợc mô tả nhƣ một đối tƣợng với các thuộc tính, hành động và quan hệ giữa chúng. Ngoài ra, Geodatabase còn cho phép định nghĩa mới mối quan hệ giữa các đối tƣợng với các luật cho phép đảm bảo tính ràng buộc toàn vẹn giữa chúng.
Hai mô hình geodatabase thường gặp trong ArcGis hiện nay:
+ Personal geodatabase: Mô hình sử dụng hệ quản trị cơ sở dữ liệu Access để lưu trữ dữ liệu không gian và thuộc tính, nó chỉ hỗ trợ một người dùng và được cài đặt trên máy đơn. Dung lượng lưu trữ của mô hình này giới hạn do sự hạn chế về dung lượng lưu trữ của hệ quản trị cơ sở dữ liệu Access.
+ Enterprise Geodatabase (File geodatabase): Mô hình sử dụng hệ quản trị cơ sở dữ liệu nhiều người dùng như Oracle, SQL Server, DB2, Postgres... để lưu trữ dữ liệu. Dữ liệu lưu trữ được quản lý thông qua ArcSDE, dung lượng lưu trữ của mô hình này thường không giới hạn do hệ quản trị mà nó sử dụng không giới hạn dung lượng lưu trữ.
14
Đặc điểm Personal Geodatabase File Geodatabase
Mô tả
Định dạng chuẩn đầu tiên quản lý trong file Microsoft Access
Định dạng được lưu trong thư mục hệ thống file
Số lượng người dùng
Một người dùng, nhiều người có thể truy cập và một người biên tập
Một người dùng, nhiều người có thể truy cập và một người biên tập
Định dạng lưu trữ
Tất cả cơ sở dữ liệu lưu trong Microsoft Access file có đuôi mở rộng .mdb
Mỗi một nhóm dữ liệu đƣợc lưu vào một file riêng biệt.
Một file geodatabase là một thƣ mục chứa các file
Giới hạn dung lƣợng Tối đa 2GB Có thể lên tới TB
Hỗ trợ Version Không Không
Bảng 1 - So sánh giữa Personal Geodatabase và File Geodatabase.
Mô hình lưu trữ và tổ chức cơ sở dữ liệu không gian trong Geodatabase của hãng Esri:
Hình 1- Mô hình cơ sở dữ liệu không gian của Esri [21]
II.4.3.2 Cấu trúc Geodatabase.
Cấu trúc của Geodatabase thể hiện theo hình sau:
15 Hình 2- Cấu trúc Geodatabase [22]
Cấu trúc đơn giản của Geodatabase ta thường gặp trong thực tế:
Hình 3- Cấu trúc Geodatabase [23]
Trong Geodatabase có một hay nhiều Feature dataset. Feature dataset là một nhóm các đối tƣợng có chung một hệ quy chiếu và hệ tọa độ. Một Feature dataset có thể chứa một hay nhiều Feature class, mỗi Feature class chỉ chứa một kiểu đối tượng ở dạng điểm, đường hoặc vùng.