- Phân loại có kiểm định:
b. Mô hình dữ liệu Topology
Đối tượng địa lý có thể nhóm thành đối tượng cơ sở (điểm, đường) và nhóm đối tượng topo (topological features) hay còn gọi là các đối tượng kết hợp (composite features). Nhóm đối tượng topo như nút (nodes), đường (routes), vùng (regions) được tạo ra từ đối tượng cở sở.
Các đối tượng topo được đặt tên và định nghĩa khác nhau tùy thuộc phần mềm GIS. Ví dụ, trong ArcInfo, các đối tượng topo gồm cung (arcs), nút (nodes), điểm nhãn (level point), polygon, điểm khống chế (tics), ký tự (annonation), đường (route), phần (section). Cung được định nghĩa là đoạn đường bao gồm tập các tọa độ theo thứ tự nhất định (a set of ordered x,y coodinates). Cung là đơn vị cơ sở để tạo ra các đối tượng dạng tuyến như mạng lưới giao thông và thủy văn, ranh giới các đa giác như đơn vị hành chính, thửa đất, kiểu sử dụng đất (land use types), loại đất (soil types). Nút là điểm khởi đầu và kết thúc của cung. Điểm nhãn được xác định bởi tọa độ x,y nhất định, sử dụng như điểm gán nhãn (users-ID to polygons) của đa giác. Đa giác là vùng khép kín bao quanh bởi các cung. Đa giác có thể chứa đa giác nhỏ bên trong nó. Điểm nhãn được sử dụng để ấn định tên (polygon-ID) đa giác. Điểm tics là điểm khống chế tọa độ địa lý sử dụng để đăng ký và chuyển đổi hệ tọa độ. Ký tự là chuỗi các từ sử dụng để đặt tên các đối tượng địa lý.
Đường (route) là đối tượng dạng tuyến gồm một hay nhiều cung (arcs) tạo thành. Phần (section) là một phần của cung được sử dụng để định nghĩa đường. Mỗi đối tượng topo trong ArcInfo đều có bảng thuộc tính kèm theo.
Mô hình dữ liệu Topology là tập các quy tắc để xây dựng và hiển thị các đối tượng topo. Hiện nay, nhiều mô hình Topology đã được nghiên cứu và đề xuất cho nhóm đối tượng topo này. Mỗi mô hình đề xuất đều có những ưu và nhược điểm.
3.3.2.2. Mô hình dữ liệu RASTER a. Khái niệm dữ liệu Raster a. Khái niệm dữ liệu Raster
Các đối tượng như thửa đất, đơn vị sử dụng đất thường có ranh giới rõ ràng như các cạnh thửa và đỉnh thửa. Tuy nhiên, nhiều đối tượng trên bề mặt Trái đất, ranh giới của chúng là không rõ ràng như độ cao (địa hình), các tính chất của đất như phân bố pH, hàm lượng chất hữu cơ, độ dày tầng đất,… mô hình dữ liệu Vector tỏ ra không hiệu quả cho những đối tượng hay hiện tượng địa lý này. Như vậy, ta cần một kiểu cấu trúc dữ liệu khác hiệu quả hơn để biểu diễn các bề mặt liên tục (continuous surfaces), đó là cấu trúc dữ liệu Raster.
Cấu trúc dữ liệu Raster là ma trận ô vuông. Mỗi ô vuông gọi là một pixel và đại diện cho một điểm trên thực địa. Nếu một vùng lãnh thổ nào đó được chia thành ma trận ô vuông, mỗi ô vuông có tọa độ riêng, tập các ô vuông trong vùng lãnh thổ chính là thực thể dữ liệu. Nếu các điểm coi như nằm ở tâm của mỗi ô vuông, ta thành lập được một bảng dữ liệu gồm tọa độ địa lý của các điểm trong vùng nhất định. Một ma trận ô vuông cho một vùng lãnh thổ gọi là mô hình dữ liệu Raster.
Để tìm hiểu mô hình cấu trúc dữ liệu Raster, ta hình dung quá trình khái quát hóa đối tượng địa lý trên bề mặt Trái đất theo giai đoạn khái lược các đối tượng địa lý chính của vùng, lập ma trận ô vuông hiển thị vùng chứa các đối tượng địa lý và cuối cùng là hiển thị hay vẽ các đối tượng địa lý ở vùng lãnh thổ lên ma trận ô vuông. Giai đoạn khái quát hóa đối tượng địa lý vùng được tư duy cho từng ứng dụng cụ thể. Việc lập lưới ô vuông để hiển thị đối tượng địa lý của vùng quan tâm, ta cần phân tích mục tiêu và mức độ chi tiết cần mô tả cho đối tượng địa lý. Kích thước ô vuông (Pixel) hay còn gọi là độ phân giải thông thường mô tả cho một đối tượng nhỏ nhất cần hiển thị trên bản đồ. Ví dụ, độ phân giải của các bản đồ mô tả phân bố các kiểu sử dụng đất ở vùng đô thị có mật độ dân cư cao khác với bản đồ mô tả các kiểu sử dụng đất chính ở vùng nông thôn hay vùng sâu, vùng xa.
Các hình dưới minh họa quá trình xây dựng và khái quát hóa mô hình dữ liệu Raster trong các hệ thống thông tin địa lý.
Rừng, hồ nước và sông được mã hóa dữ liệu dạng Raster
(Mã 3 hiển thị cho rừng, mã 2 hiển thị sông và mã 1 hiển thị hồ nước)
Cách tổ chức phổ biến của dữ liệu Raster là ma trận số gồm hàng và cột. Vị trí (tọa độ) của pixel là thứ tự của hàng và cột. Ví dụ, ta có điểm A (3,4) có vị trí là hàng 3, cột 4. Trong các hệ thống GIS, cấu trúc dữ liệu dạng Raster là một mảng hai chiều các điểm ảnh (pixel). Pixel là một đơn vị cơ sở đồng nhất biểu diễn một vùng xác định trên Trái đất. Các pixel tạo bản đồ và ảnh giống như các “tế bào” xây dựng nên cơ thể động và thực vật. Các pixel trong một bản đồ phải có cùng kích thước. Gốc toạ độ của hệ được đặt tại Pixel nằm tại đỉnh góc trái. Mỗi pixel được xác định bởi chỉ số dòng và chỉ số cột, đồng thời nó chứa một số nguyên (hoặc số thực) biểu diễn kiểu hay giá trị thuộc tính xuất hiện trên bản đồ. Kích thước của pixel trong Raster gọi là độ phân giải bản đồ hay ảnh. Pixel nên có kích thước đủ nhỏ để có thể lưu trữ chi tiết dữ liệu về đối tượng, nhưng cũng phải có kích thước đủ lớn để có thể phân tích dữ liệu một cách thuận tiện.
Trong cấu trúc dữ liệu dạng Raster, mọi đối tượng điểm, đường và đa giác trên bản đồ đều được định nghĩa từ đơn vị cơ bản pixel. Điểm được định nghĩa là một ô pixel. Đường được định nghĩa là một tập hợp các pixel nối tiếp nhau và sắp xếp theo một hướng nhất định. Vùng được định nghĩa là một tập hợp khép kín các ô vuông lưới có vị trí liền kề nhau.
Mỗi pixel đều có một giá trị nhất định theo kiểu dữ liệu riêng. Các kiểu dữ liệu cơ bản bao gồm kiểu Nominal (tên), kiểu Ordinal(liên tục), kiểu Interval (khoảng giá trị), kiểu Ratio (tỷ lệ). Kiểu Nominal là kiểu giá trị được phân loại theo tên đối tượng, mỗi miền giá trị được đặt tên riêng. Kiểu Nominal được dùng trong rất nhiều kiểu mã như mã sử dụng đất. Ví dụ, kiểu sử dụng đất trong bản đồ hiện trạng sử dụng đất là dữ liệu kiểu Nominal. Ngoài ra, tên các đơn vị hành chính, tên loại đất,...cũng thuộc loại Norminal. Kiểu Ordinal xác định theo tên và khoảng giá trị nhất định. Kiểu Interval và Ratio mô tả các giá trị liên tục của các biến là số thực.
Kiểu biến liên tục
Hiển thị mức năng lượng phản xạ ánh sáng mặt trời. Band 1, 2 và 3 là các kênh khác nhau trong dải sóng điện từ. Mỗi kênh là một vùng trong dải sóng điện từ đặc trưng bởi độ dài bước sóng hay tần số khác nhau. Thông thường, vùng sóng sử dụng thu thập dữ liệu là vùng ánh sáng trông thấy.
Kích thước ô vuông (pixel size) hay còn gọi là độ phân giải của ảnh (image resolution) được ảnh hưởng đến sự chi tiết mô tả đối tượng ngoài thực địa. Độ phân giải càng lớn thì khả năng mô tả chính xác đối tượng càng giảm.
Độ phân giải và mức độ chi tiết đối tượng: (a) vùng cần mô tả; (b) độ phân giải là 1m x 1m, (c) 2m x 2m, (d) 4m x 4m.
Các thuộc tính của đối tượng địa lý được liên kết trực tiếp với các Pixel. Giá trị của Pixel sẽ định nghĩa các nhóm, lớp tại vị trí của Pixel. Pixel tại những điểm có cùng một giá trị xác định một vùng, miền. Các Pixel trong cùng một miền không cần phải liên kết
với nhau. Khi một số nguyên được chỉ định cho một tập các Pixel thì số nguyên này có thể là mã phân biệt giữa các nhóm Pixel.
Mô hình dữ liệu Raster có cả ưu và nhược điểm. Ưu điểm lớn nhất của mô hình Raster là toàn bộ dữ liệu hình thành bản đồ được lưu trong bộ nhớ máy tính. Do vậy, các thao tác kiểu như so sánh được thực hiện dễ dàng. Tuy nhiên nó sẽ gặp bất lợi cho việc biểu diễn đường, điểm vì mỗi đối tượng này là tập các pixel trong mảng. Đường thẳng có thể bị đứt đoạn hay rộng hơn so với hình ảnh thực. Khó khăn lớn nhất khi xử lý dữ liệu Raster là vấn đề “tế bào trộn”. Sau này tuỳ thuộc vào ứng dụng thực tế mà xác định quy luật gán giá trị lại cho chúng. Một vấn đề khác mà mô hình gặp phải đó chính là việc lưu trữ dữ liệu. Ta biết rằng bản đồ chia ra làm nhiều lớp, mỗi một lớp gồm hàng triệu Pixel biểu diễn một đặc trưng địa lý nào đó. Trung bình một ảnh vệ tinh phủ khoảng 30.000 km2 với kích thước của mỗi điểm ảnh là 30 m thì có khoảng 35 triệu Pixel. Vì thế có thể nói rằng số lượng dữ liệu cần lưu trữ là khổng lồ, điều này dẫn đến nhiều khó khăn cho hệ thống thông tin. Vấn đề đặt ra là cần phải nén dữ liệu nhờ một số thuật toán thích hợp.