Cơ sở dữ liệu GIS là một tập hợp các thông tin (các tệp dữ liệu) ở dạng vector, raster và bảng số liệu với những cấu trúc chuẩn bảo đảm cho các bài toán đề tài có mức độ phức tạp khác nhau (Nguyễn Trọng Bình và CS, 1996). Cơ sở dữ liệu trong GIS bao gồm 2 loại là : Cơ sở dữ liệu không gian và cơ sở dữ liệu thuộc tính.
* Cơ sở dữ liệu không gian
Dữ liệu không gian dùng để mô tả vị trí, hình dạng và kích thước của đối tượng trong không gian, chúng bao gồm tọa độ và các ký hiệu dựng để xác định các đối tượng trên bản đồ. Hệ thống thông tin địa lý dựng các số liệu không gian để tạo ra bản đồ hay hình ảnh bản đồ trên màn hình máy tính hoặc trên giấy thông qua thiết bị ngoại vi (Nguyễn Trọng Bình và CS, 1996).
Dữ liệu không gian bao gồm 3 loại đối tượng: Điểm (point), đường (polyline), vùng (polygon). Các đối tượng không gian này được lưu trữ ở 2 mô hình dữ liệu là vector và raster.
- Mô hình dữ liệu raster: trong mô hình này, thực thể không gian được biểu diễn thông qua các ô (cell) hoặc ô ảnh (pixel) của một lưới các ô. Trong máy tính, lưới ô này được lưu trữ ở dạng ma trận trong đó mỗi cell là giao điểm của một hàng hay một cột trong ma trận. Trong cấu trúc này, điểm được xác định bởi cell, đường được xác định bởi một số các cell, đường được xác định bởi một số các cell kề nhau theo một hướng và vùng được xác định bởi một số các cell mà trên đó thực thể phủ lên.
- Mô hình dữ liệu vector: trong mô hình này thực thể không gian được biểu diễn thông qua các phần tử cơ bản là điểm, đường, vùng và các quan hệ topo (khoảng cách, tính liên thông, tính kề nhau…) giữa các đối tượng với nhau. Vị trí không gian của các thực thể được xác định bởi tọa độ chung trong một hệ thống tọa độ thống nhất toàn cầu.
+ Điểm dùng cho tất cả các đối tượng không gian được biểu diễn như một cặp tọa độ (X,Y). Ngoài giá trị tọa độ (X,Y), điểm còn thể hiện kiểu điểm, màu, hình dạng và dữ liệu thuộc tính đi kèm. Do đó trên bản đồ điểm có thể được biểu hiện bằng kí hiệu hoặc dạng text (dạng chữ).
+ Đường dùng để biểu diễn tất cả các thực thể có dạng tuyến và được tạo nên từ hai hoặc nhiều hơn 2 cặp tọa độ (X,Y).
+ Vùng là một đối tượng hình học 2 chiều, vùng có thể là một đa giác đơn giản hay hợp của nhiều đa giác đơn giản. Như vậy mô hình dữ liệu vector sử dụng các đoạn thẳng hay điểm rời rạc để nhận biết các vị trí của thế giới thực. Việc đo diện tích và khoảng cách của các đối tượng được thực hiện bằng cách tính toán hình học từ các tọa độ của các đối tượng thay vì việc đếm các cell trong mô hình raster (Mẫn Quang Huy, 1999).
* Cơ sở dữ liệu thuộc tính
Dữ liệu thuộc tính (dữ liệu phi không gian) là các thông tin đi kèm với các dữ liệu không gian, nó được dùng để chỉ ra các tính chất đặc trưng cho mỗi đối tượng điểm, đường và vùng trên bản đồ. Thông thường dữ liệu thuộc tính được tổ chức thành các bảng theo mô hình cơ sở dữ liệu quan hệ, phân cấp và mạng lưới.