- Phân loại có kiểm định:
b. Xu hướng phát triển GIS
3.3.2.1. Cấu trúc dữ liệu vector
Cấu trúc dữ liệu Vector hay còn gọi là mô hình dữ liệu Vector nhằm thể hiện chính xác các đối tượng địa lý trên bề mặt Trái đất lên bản đồ số bằng giá trị liên tục của các cặp tọa độ và xác định chính xác mối quan hệ không gian của các đối tượng. Tuy vây, thực sự thì không thể tồn tại sự hiển thị chính xác tuyệt đối mà phụ thuộc vào mức độ hiển thị của máy tính. Mô hình Vector cho phép hiển thị các kiểu đối tượng dạng vùng và tuyến chính xác về vị trí và thường được lựa chọn để xây dựng cơ sở dữ liệu dạng vùng (đa giác) như thửa đất, các đơn vị ranh giới hành chính các cấp; mạng lưới giao thông, thủy văn và các đối tượng dạng tuyến khác.
Các đối tượng địa lý khác nhau được lưu trữ trong máy tính bằng một hay nhiều cặp tọa độ XY. Trong mô hình Vector, đối tượng hình học cơ bản nhất là điểm. Đối tượng dạng tuyến phức tạp hơn bởi vì nó được định nghĩa bằng chuỗi các cặp tọa độ theo từng điểm. Loại đường đơn giản nhất là đoạn đường thẳng được định nghĩa bằng hai cặp tọa độ
gọi là điểm đầu và điểm cuối. Đường phức tạp lưu nhiều cặp tọa độ hơn, các điểm nằm giữa điểm đầu và điểm cuối gọi là điểm nối (breakpoints hay vertices). Các điểm nối này cho phép đường thay đổi hướng như trường hợp sông ngòi hay đường giao thông cần phải thay đổi hướng. Mục đích của sử dụng điểm nối là nhằm mô tả hình dạng đối tượng địa lý chính xác hơn. Trong GIS, thuật ngữ điểm khởi đầu và kết thúc đoạn đường gọi là nút (node) và các điểm nối gọi là vertex, số nhiều là vertices. Lưu trữ đối tượng dạng đa giác tương tự như đối tượng dạng đường. Một đa giác được định nghĩa bằng một đường biên khép kín. Đường biên khép kín này gồm có điểm khởi đầu, các điểm vertices trung gian và điểm kết thúc trùng với điểm khởi đầu.
Định dạng chung để lưu trữ dữ liệu hình học đối tượng điểm, đường và vùng trong máy tính là tệp dữ liệu đối tượng hình học (tệp dữ liệu đối tượng hình học). Cấu tạo của tệp này tổ chức theo ma trận dữ liệu nói chung, cụ thể nó bao gồm các trường sau:
- Chỉ số nhận dạng đối tượng (object identity, ID): Chỉ số này sử dụng để nối với tệp dữ liệu thuộc tính đối tượng nếu dữ liệu hình học đối tượng và dữ liệu thuộc tính dữ liệu được tách thành 2 tệp riêng biệt.
- Các trường liệt kê giá trị cặp tọa độ x và y.
Với cấu trúc dữ liệu Vector, ta có nhiều cách khác nhau để lưu trữ thông tin hình học đối tượng trong máy tính. Mô hình dữ liệu Spaghetti và Topology là hai mô hình dữ liệu sử dụng phổ biến để lưu dữ liệu Vector trong các phần mềm hệ thống GIS. Sự khác nhau cơ bản giữa hai mô hình này là mức độ cấu trúc và tổ chức dữ liệu. Với mô hình Spaghetii, thông tin hình học các đối tượng được lưu chỉ bao gồm các cặp tọa độ. Với mô hình Topology, ngoài dữ liệu về các cặp tọa độ, các thông tin bổ trợ khác giúp định nghĩa các đối tượng lân cận được bổ sung vào tệp dữ liệu. Ví dụ, các đa giác có sự liền kề, nghĩa là một cạnh sử dụng chung cho hai đa giác cạnh nhau. Một ví dụ khác nữa là đường có tính liên tục, tức là các đoạn đường sử dụng chung điểm nút để tạo ra đường có chiều dài lớn hơn. Về tổ chức dữ liệu (định dạng dữ liệu), tệp dữ liệu của mô hình Spaghetti chỉ gồm trường định danh đối tượng (ID), trường x và y thì dữ liệu của mô hình Topology sẽ thêm các trường khác nữa. Ví dụ, tệp cung (arcs) gồm tên cung (arc_id), trường tọa độ x và y, trường nút khởi đầu (stard node), trường nút kết thúc (end node). Mục đích chính của sử dụng mô hình Topology là tăng tốc độ xử lý dữ liệu và sử dụng bộ nhớ máy tính tiết kiệm hơn mô hình Spaghetti.
Hiện nay, phần mềm Autocad, Mapinfo và MicroStation lưu dữ liệu bản đồ sử dụng mô hình cấu trúc dữ liệu Spaghetti. Phần mềm ArcGIS lưu các tệp bản đồ sử dụng cả hai mô hình dữ liệu Spaghetti như định dạng Shapefile và mô hình dữ liệu Topology như định dạng Coverage và Geodatabase. Hiện nay, mô hình Vector dạng Topology đã được Bộ Tài nguyên và Môi trường phê duyệt mô hình dữ liệu chuẩn trong xây dựng bản đồ địa chính ở Việt Nam.