Cơ sở dữ liệu trong GIS

Một phần của tài liệu Biên tập và khai thác mô hình số địa hình trong quản lý đất đai (Trang 33 - 38)

CHƯƠNG 2. HỆ THÔNG TIN ĐỊA LÝ VÀ PHẦN MỀM ARCGIS

2.1. Tổng quan về hệ thông tin địa lý

2.1.3. Cơ sở dữ liệu trong GIS

Cơ sở dữ liệu GIS là một tập hợp lớn các dạng số liệu trong máy tính, được tổ chức theo một thiết kế có trước sao cho có thể mở rộng cập nhật và tra cứu nhanh chóng đối với các ứng dụng khác. Số liệu có thể được tạo thành một file hoặc nhiều file hoặc thành các tập hợp trên máy tính.

Nói cách khác, cơ sở dữ liệu của hệ thông tin địa lý là một nhóm xác định các dữ liệu không gian và thuộc tính được quản lý bởi phần mềm của hệ thông tin địa lý.

Một cơ sở dữ liệu của hệ thông tin địa lý có thể chia làm hai loại dữ liệu cơ bản: Dữ liệu không gian, dữ liệu thuộc tính. Mỗi loại có những đặc điểm riêng và chúng khác nhau về yêu cầu lưu giữ số liệu, hiệu quả, xử lý và hiển thị.

1. Dữ liệu không gian

Là những thông tin về định tính của đối tượng, nó là các dữ liệu phản ánh, thể hiện các đối tượng có kích thước vật lý xác định.

Hệ thông tin địa lý dùng các dữ liệu bản đồ để tạo ra một bản đồ hay hình ảnh bản đồ dùng để thể hiện đối tượng mặt đất và ghi chú của nó trong hệ thông tin địa lý như sau: Điểm (point), Đường (line), Vùng (polygon), Ô lưới (grid cell), Ký hiệu (symbol), Điểm ảnh (pixel).

Dữ liệu bản đồ có thể được lưu trữ ở dạng vector hoặc raster.

Lớp đối tượng (layer): Thành phần dữ liệu đồ thị của hệ thông tin địa lý hay còn gọi là cơ sở dữ liệu bản đồ được quản lý ở dạng các lớp đối tượng.

Mỗi một lớp chứa các hình ảnh bản đồ liên quan đến một chức năng, một ứng dụng cụ thể. Lớp đối tượng là tập hợp các hình ảnh thuần nhất dùng để phục vụ cho một ứng dụng cụ thể và vị trí của nó so với các lớp khác trong một hệ thống cơ sở dữ liệu được xác định thông qua một hệ tọa độ chung. Việc phân tách các lớp thông tin dựa trên cơ sở của mối liên quan logic và mô tả họa đồ của tập hợp các hình ảnh bản đồ phục vụ cho mục đích quản lý cụ thể.

•Cấu trúc raster

Đây là cấu trúc dữ liệu mà trong đó dữ liệu được thể hiện thành một mảng gồm các pixel và mỗi pixel đều mang giá trị của thông sốđặc trưng cho đối tượng. Một khu vực trên bản đồđược biểu thịở dạng số bằng cách lưu giữ vị trí (tọa độ tâm điểm của chúng), kích thước và đặc tính tương ứng của đối tượng thuộc pixel đó. Mỗi pixel sẽ tương ứng với một diện tích vuông trên thực tế. Giá trịđộ lớn của pixel còn được gọi là độ phân giải của dữ liệu. Hình vuông là dạng pixel phổ biến nhất, sau đó là hình chữ nhật.

Đối với một file dữ liệu dạng raster, cần có một file chứa các thông tin về cấu trúc của dữ liệu, ta gọi là header file.

Trong cấu trúc dữ liệu raster các đối tượng cơ bản được biểu diễn là:

+ Đối tượng điểm

Điểm được xác định tương ứng với một pixel độc lập, trong thế giới thực điểm có thể là một ngôi nhà nằm trên vài pixel có cùng giá trị (mã).

+ Đối tượng đường

Đường là tập hợp các pixel liên tiếp nhau có cùng giá trị. + Đối tượng vùng

Vùng được xác định bởi một tập hợp các pixel có cùng giá trị liên tục nhau theo các hướng.

Biểu diễn raster được xây dựng trên cơ sở hình học phẳng Ơcơlit. Mỗi một cell tương ứng với một diện tích vuông trên thực tế. Độ lớn của cạnh ô vuông này còn được gọi là độ phân giải của dữ liệu. Dữ liệu raster có dung lượng rất lớn nếu không có cách lưu trữ thích hợp. Có rất nhiều giá trị giống nhau, do đó có nhiều phương pháp nén để tập dữ liệu trở nên nhỏ. Thông thường người ta hay dùng các phương pháp nén TIFF, RLE, JPEG, GIF…

Bề mặt DEM (Digital Elevation Model) là bề mặt dưới dạng raster.

•Cấu trúc dữ liệu vector

Cấu trúc dữ liệu vector là cấu trúc dữ liệu dựa trên tọa độ các điểm để biểu diễn các đối tượng qua ba yếu tố cơ bản là điểm, đường, vùng.

Cấu trúc dữ liệu vector mô tả chính xác vị trí và mối quan hệ không gian của các đối tượng và hiện tượng.

Điểm trong cấu trúc dữ liệu vector được mô tả bởi cặp tọa độ (X, Y) trong một hệ thống tọa độ nhất định. Ngoài giá trị tọa độ (X, Y), điểm còn thể hiện kiểu điểm, màu, hình dạng và dữ liệu thuộc tính đi kèm. Do đó trên bản đồ, điểm có thể được biểu diễn bằng ký hiệu hoặc text.

Đường dùng để biểu diễn tất cả các thực thể có dạng tuyến, được tạo nên từ 2 hoặc hơn cặp tọa độ (X,Y). Ví dụ đường dùng để biểu diễn hệ thống đường giao thông, hệ thống cấp thoát nước…Ngoài tọa độ, đường còn có thể bao hàm cả góc quay tại đầu mút.

Vùng là một đối tượng hình học hai chiều. Vùng có thể là một đa giác đơn giản hay hợp của nhiều đa giác đơn giản.

Trong định dạng này, thông tin được mô tả có tính chính xác cao đồng thời tiết kiệm không gian lưu trữ. Thông tin lưu trong định dạng vector chủ yếu được ứng dụng trong bài toán về mạng, hệ thống thông tin đất đai.

Mô hình dữ liệu vector hình thành trên cơ sở các vector với thành phần cơ bản là điểm. Các đối tượng khác được tạo ra bằng cách nối các điểm bởi các đường thẳng hoặc các cung. Vùng bao gồm một tập các đường thẳng.

Thuật ngữ đa giác đồng nghĩa với vùng trong cơ sở dữ liệu vector vì đa giác tạo bởi các đường thẳng nối với các điểm. Như vậy, mô hình dữ liệu vector sử dụng các đoạn thẳng hay điểm rời rạc để nhận biết các vị trí của thế giới thực.

Hình 2.4. Vector và Raster trong GIS

Bề mặt TIN (Triangular Irregular Networks) là bề mặt dưới dạng Vector được cấu trúc bằng mạng lưới các tam giác.

•So sánh vector và raster

Bảng 0-1: So sánh vector và raster

Dữ liệu Raster Dữ liệu Vector

Ưu điểm

- Cấu trúc dữ liệu đơn giản.

- Dễ dàng sử dụng các phép toán chồng xếp và các phép toán xử lý ảnh viễn thám.

- Chương trình xử lý dữ liệu tương đối ngắn gọn và đơn giản.

- Lưu trữ, mô tả chi tiết và dày đặc thông tin.

- Kỹ thuật rẻ tiền và có thể phát triển mạnh.

- Biểu diễn và xử lý tốt các đối tượng địa lý.

- Dữ liệu nhỏ gọn.

- Cho phép thực hiện tốt các mô tả và tính toán về quan hệ không gian hình học, phân tích mạng…

- Độ chính xác về hình học cao.

- Khả năng sửa chữa, bổ sung, thay đổi các dữ liệu hình học cũng như thuộc tính nhanh, tiện lợi.

- Thông tin đồ họa đẹp, sản phẩm in đạt chất lượng cao.

Nhược điểm

- Dung lượng thông tin quá lớn.

- Độ chính xác có thể giảm nếu sử dụng không hợp lý kích thước cell

- Bản đồ có hình ảnh thô, đơn điệu.

- Cấu trúc dữ liệu phức tạp - Chồng xếp bản đồ phức tạp - Các bài toán mô phỏng thường khó giải vì mỗi đơn vị không gian có cấu trúc khác nhau

- In ấn đắt tiền

- Khó khăn khi chồng xếp và phân tích các dữ liệu bản đồ lớn.

- Khối lượng tính toán có thể biến đổi tọa độ là rất lớn

- Kỹ thuật đắt tiền

- Các bài toán phân tích và các phép lọc khó thực hiện

2. Dữ liệu thuộc tính

Là những diễn tả đặc tính, số lượng mối quan hệ của các hình ảnh bản đồ với vị trí địa lý của chúng.

Thông thường các thông tin thuộc tính lưu trữđộc lập với các yêu cầu dữ liệu không gian và liên kết với dữ liệu không gian thông qua một chỉ số xác định chung.

Dữ liệu thuộc tính bao gồm hai loại là dữ liệu thuộc tính định lượng và dữ liệu thuộc tính định tính.

Toàn bộ dữ liệu thuộc tính thường được cấu trúc theo dạng bảng gồm các hàng và cột. Việc sắp xếp các dữ liệu thuộc tính thành các hàng và cột rất thuận lợi trong quá trình tìm kiếm, cập nhật và sắp xếp.

3. Mối quan hệ giữa dữ liệu không gian và dữ liệu thuộc tính

Hệ thông tin địa lý sử dụng phương pháp chung để liên kết hai loại dữ liệu đó thông qua bộ xác định, lưu trữ đồng thời trong các thành phần đồ thị và phi đồ thị.

Các bộ xác định có thể đơn giản là một số duy nhất liên tục, ngẫu nhiên hoặc là các chỉ báo địa lý hay dữ liệu vị trí lưu trữ.

Bộ xác định cho một thực thể có thể chứa tọa độ phân bố của nó, số hiệu mảnh bản đồ, mô tả khu vực hoặc là một con trỏ đến vị trí lưu trữ của dữ liệu liên quan.

Một phần của tài liệu Biên tập và khai thác mô hình số địa hình trong quản lý đất đai (Trang 33 - 38)

Tải bản đầy đủ (PDF)

(98 trang)