Cơ sở dữ liệu GIS là một tập hợp các thông tin (các tệp dữ liệu) ở dạng vector, raster và bảng số liệu với những cấu trúc chuẩn bảo đảm cho các bài toán đề tài có mức độ phức tạp khác nhau [4]. Cơ sở dữ liệu trong GIS bao gồm 2 loại đó là: cơ sở dữ liệu không gian và cơ sở dữ liệu thuộc tính.
* Cơ sở dữ liệu không gian
Dữ liệu không gian dùng để mô tả vị trí, hình dạng và kích thước của đối tượng trong không gian, chúng bao gồm toạ độ và các ký hiệu dựng để xác định các đối tượng trên bản đồ. Hệ thống thông tin địa lý dựng các số liệu không gian để tạo ra bản đồ hay hình ảnh bản đồ trên màn hình máy tính hoặc trên giấy thông qua thiết bị ngoại vi [4].
Dữ liệu không gian bao gồm 3 loại đối tượng: điểm (point), đường (polyline) và vùng (polygon). Các đối tượng không gian này được lưu trữ ở 2 mô hình dữ liệu là vector và raster.
- Mô hình dữ liệu raster: trong mô hình này, thực thể không gian được biểu diễn thông qua các ô (cell) hoặc ô ảnh (pixel) của một lưới các ô. Trong máy tính, lưới ô này được lưu trữ ở dạng ma trận trong đó mỗi cell là giao điểm của một hàng hay một cột trong ma trận. Trong cấu trúc này, điểm được xác định bởi cell, đường được xác định bởi một số các cell kề nhau theo một hướng và vùng được xác định bởi một số các cell mà trên đó thực thể phủ lên.
- Mô hình dữ liệu vector: trong mô hình này, thực thể không gian được biểu diễn thông qua các phần tử cơ bản là điểm, đường, vùng và các quan hệ topo (khoảng cách, tính liên thông, tính kề nhau…) giữa các đối
tượng với nhau. Vị trí không gian của các thực thể được xác định bởi toạ độ chung trong một hệ thống toạ độ thống nhất toàn cầu.
+ Điểm dùng cho tất cả các đối tượng không gian được biểu diễn như một cặp toạ độ (X,Y). Ngoài giá trị toạ độ (X,Y), điểm còn thể hiện kiểu điểm, màu, hình dạng và dữ liệu thuộc tính đi kèm. Do đó, trên bản đồ điểm có thể được biểu hiện bằng ký hiệu hoặc dạng text (dạng chữ).
+ Đường dùng để biểu diễn tất cả các thực thể có dạng tuyến và được tạo nên từ hai hoặc nhiều hơn 2 cặp toạ độ (X,Y).
+ Vùng là một đối tượng hình học hai chiều, vùng có thể là một đa giác đơn giản hay hợp của nhiều đa giác đơn giản. Việc đo diện tích và khoảng cách của các đối tượng được thực hiện bằng cách tính toán hình học từ các toạ độ của các đối tượng thay vì việc đếm các cell trong mô hình raster [7].
* Cơ sở dữ liệu thuộc tính
Dữ liệu thuộc tính (dữ liệu phi không gian) là các thông tin đi kèm với các dữ liệu không gian, nó được dùng để chỉ ra các tính chất đặc trưng cho mỗi đối tượng điểm, đường và vùng trên bản đồ. Thông thường, dữ liệu thuộc tính được tổ chức thành các bảng theo mô hình cơ sở dữ liệu quan hệ, phân cấp và mạng lưới.