Chương 2: CƠ SỞ DỮ LIỆU GIS
2.3.2. Cơ sở dữ liệu thuộc tính
Cơ sở dữ liệu thuộc tính dùng để mơ tảđặc điểm của đối tượng. Dữ liệu thuộc tính có thểlà định tính (qualitative) - mơ tả chất lượng hay là định lượng (quantative) - mô tả số lượng. Về nguyên tắc, số lượng các thuộc tính của một đối tượng là khơng có giới hạn. Để quản lý dữ liệu thuộc tính của các đối tượng địa lý trong CSDL, GIS đã sử dụng phương pháp gán các giá trị thuộc tính cho các đối tượng thơng qua các bảng số liệu. Mỗi bản ghi (record) đặc trưng cho một đối tượng địa lý, mỗi cột của bảng tương ứng với một kiểu thuộc tính của đối tượng đó.
Hình 2.1: Cấu trúc bảng dữ liệu thuộc tính
a) Các loại dữ liệu thuộc tính
Dữ liệu thuộc tính mơ tả vềđặc tính, đặc điểm và các hiện tượng xảy ra tại vịtrí địa lý xác định mà chúng khó hoặc khơng thể biểu thị trên bản đồ. CSDL thuộc tính GIS thường có 4 loại cơ bản:
- Ðặc tính của đối tượng: liên kết chặt chẽ với các thông tin đồ thị, các dữ liệu này được xửlý theo ngôn ngữ hỏi đáp cấu trúc và phân tích. Chúng được liên kết với các hình ảnh đồ thịthông qua các chỉ sốxác định chung, thông thường gọi là mã địa
lý và được lưu trữ trong cả hai mảng đồ thị và phi đồ thị. GIS có thể xử lýcác thơng tin thuộc tính riêng rẽ và tạo ra các bản đồchuyên đềtrên cơ sở các giá trị thuộc tính. Các thơng tin thuộc tính này cũng có thểđược hiển thịnhư là các ghi chú trên bản đồ hoặc là các tham sốđiều khiển cho việc lựa chọn hiển thịcác thuộc tính đó như là các ký hiệu bản đồ.
- Dữ liệu tham khảo địa lý: Mô tả các sự kiện hoặc hiện tượng xảy ra tại một vịtrí xác định. Khơng giống các thơng tin đặc tính, chúng khơng mơ tả về bản thân các hình ảnh bản đồ, thay vào đó chúng mơ tả các danh mục hoặc các hoạt động như cho phép xây dựng các khu công nghiệp mới, nghiên cứu y tế, báo cáo hiểm họa môi trường,... liên quan đến các vịtrí địa lýxác định. Các thông tin tham khảo địa lý đặc trưng được lưu trữ và quản lý trong các file độc lập và hệ thống không thể trực tiếp tổng hợp với các hình ảnh bản đồtrong cơ sở dữ liệu của hệ thống. Tuy nhiên, các bản ghi này chứa các yếu tốxác định vịtrí của sự kiện hay hiện tượng.
- Chỉ sốđịa lý:là các chỉ số vềtên, địa chỉ, khối, phương hướng định vị,... liên quan đến các đối tượng địa lý, được lưu trữtrong GIS để chọn, liên kết và tra cứu dữ liệu trên cơ sở vịtrí địa lý mà chúng đã được mô tả bằng các chỉ sốđịa lý xác định. Một chỉ số địa lý có thể bao gồm nhiều dữ liệu xác định cho các thực thể sử dụng từcác cơ quan khác nhau như là lập danh sách các mã địa lý mà chúng xác định mối quan hệ khơng gian giữa các vịtrí hoặc giữa các hình ảnh hay thực thểđịa lý.
- Quan hệkhơng gian giữa các đối tượng: Dữ liệu thuộc tính ln có mối quan hệ khơng gian giữa các đối tượng, đặc tính này rất quan trọng cho các chức năng xửlý của GIS. Các mối quan hệkhơng gian có thểđơn giản hay phức tạp như sự liên kết, khoảng cách tương thích, mối quan hệ topo giữa các đối tượng.
b) Tổ chức cấu trúc dữ liệu thuộc tính
Các dữ liệu thuộc tính trong GIS thường rất lớn và lưu trữởcác dạng file khác nhau nên tương đối phức tạp. Do vậy để quản lý, người ta phải xây dựng tổ chức các cấu trúc chặt chẽcho các CSDL. Có 3 dạng cấu trúc CSDL thuộc tính sau:
(1) Cấu trúc phân nhánh (hierarchical data structure)
Cấu trúc phân nhánh thường sử dụng cho các dữ liệu được phân cấp theo quan hệ mẹ-con hoặc 1- n. Cấu trúc này rất thuận lợi cho việc truy cập theo từkhóa nhưng nếu muốn tìm kiếm theo hệ thống thì tương đối khó khăn. Hệ thống rất dễ dàng được mở rộng bằng cách thêm nhánh nhưng rất khó sửa đổi tồn bộ cấu trúc hệ. Một bất cập khác của cấu trúc dữ liệu kiểu này là phải duy trì các file chỉ số lớn (index) và những giá trị thuộc tính phải lặp đi lặp lại ởcác cấp. Điều này làm dư thừa dữ liệu, tăng chi phí lưu trữvà thời gian truy cập.
(2) Cấu trúc mạng (network system)
Cấu trúc mạng thường hay sử dụng cho các dữ liệu địa lý có nhiều thuộc tính và mỗi thuộc tính thì lại liên kết với nhiều đối tượng. Cấu trúc mạng rất tiện lợi khi thể
hiện các mối quan hệ n - n, giúp cho việc tìm kiếm thơng tin tương đối mềm dẻo, nhanh chóng, tránh dữ liệu thừa. Tuy nhiên, đây là một hệ cấu trúc phức tạp, tương đối khó thiết kế, cần phải xác định rõ các mối quan hệđểtránh nhầm lẫn.
(3) Cấu trúc quan hệ (relation structure)
Dữ liệu được lưu trữ trong các bản ghi (record) gọi là bộ (tuple), là tập hợp các thông tin của một đối tượng theo một khuôn mẫu quy định trước. Các bộ tập hợp thành một bảng hai chiều gọi là một quan hệ. Như vậy, mỗi cột trong quan hệ thể hiện một thuộc tính. Mỗi một record có một mã index để nhận dạng và như vậy có thể liên kết qua các bảng quan hệ với nhau thơng qua mã index.
Cấu trúc quan hệ có thể tìm kiếm, truy cập đối tượng nhanh chóng và linh động bằng nhiều khóa khác nhau. Có thể tổ chức, bổ sung dữ liệu tương đối dễdàng vì đây là những dạng bảng đơn giản. Số lượng liên kết không bị hạn chếvà không gây nhầm lẫn như trong quan hệ mạng. Do vậy, không cần lưu trữ dư thừa. Tuy nhiên, chính vì khơng có con trỏnên việc thao tác tuần tự trên các file để tìm kiếm, truy cập sẽ mất nhiều thời gian.