a) Cấu trúc bên trong của vùng b) Cấu trúc đường bao của vùng
2.4.2. Mô hình dữ liệu raster
a) Khái quát mô hình dữ liệu raster
Một file ảnh chụp về một đối tượng không gian qua máy ảnh kỹ thuật số hoặc dữ liệu ảnh vệtinh là những ví dụ về dữ liệu raster. Raster được định nghĩa như là ma trận không gian của các đơn vị ảnh (picture element) còn gọi là các pixel. Các pixel có kích thước đồng nhất về mặt hình học, chúng làcác ô vuông nhỏvà được xếp theo các dòng và các cột giống như một lưới ô vuông (Hình 2.7).
Hình 2.7: Dữ liệu raster có cấu trúc pixel
Cấu trúc raster là một trong những cấu trúc dữ liệu đơn giản nhất trong GIS. Cấu trúc raster còn được gọi là “tổ chức theo ô vuông của dữ liệu không gian”. Pixel là phần tửcơ sở của cấu trúc dữ liệu raster để biểu diễn một đặc trưng địa lý f (x, y) nào đó, giá trị của pixel chỉ tính chất của đối tượng không gian. Giá trị số của pixel chính là mã được gắn cho đối tượng không gian (tức là mỗi đối tượng không gian có một mã nhất định). Giá trị bằng không thường là những pixel chỉvùng ngoài khu vực nghiên cứu. Ví dụ: Các đối tượng đất trồng lúa có mã bằng 1, đất trồng ngô có mã bằng 2, đất trồng mía có mã bằng 3, đất trồng rau có mã bằng 4 (Hình 2.8).
Hình 2.8: Các đối tượng không gian được mã hoá trong mô hình Raster
Như vậy, mô hình raster biểu diễn không gian như là một ma trận số nguyên, mỗi một giá trị sốnguyên đại diện cho một thuộc tính, vịtrí của sốnguyên chính là vịtrí của đối tượng. Ma trận không gian từcác ô ảnh này được mã hoá và lưu trữ trong máy tính theo quy luật nhất định thông qua vịtrí của từng ô ảnh và được tham chiếu tới hệ tọa độ dùng cho Trái đất gọi là hệ tọa độ Cartsian theo hai trục x và y.
Khác với mô hình dữ liệu vector, không gian cấu trúc dữ liệu dạng raster được chia thành các ô. Vị trí của các đối tượng địa lý được xác định bởi vị trí dòng và cột. Độ phân giải không gian được quyết định bởi kích thước các ô. Trong cấu trúc dữ liệu raster các đối tượng địa lý cũng được thể hiện bằng các dạng điểm, đường và vùng.
- Đối tượng điểm: được biểu diễn bằng một ô gồm một pixel hay nhiều pixel tùy thuộc vào tỷ lệảnh.
- Đối tượng đường: là tập hợp các ô lưới vuông có cùng giá trị f (x, y) nối tiếp nhau và sắp xếp theo một hướng nhất định. Trong cấu trúc dữ liệu raster đối tượng đường được biểu diễn bằng những pixel có cùng giá trị f (x, y) liên tiếp nhau và được xếp theo hàng, cột, như một ma trận điểm nên đường nét không trơn, có dạng zic - zac.
- Đối tượng vùng: là tập hợp liên tục dày đặc các ô trải theo nhiều phương khác nhau. Vùng được xác định bằng một mảng gồm nhiều pixel có cùng giá trị thuộc tính f (x, y) trải rộng ra theo nhiều phương.
Trên thực tế mỗi pixel có một cặp tọa độ (x, y) duy nhất. Một đối tượng không gian có kích thước nhỏ hơn một pixel, ví dụ lớn hơn một nửa pixel, sẽ được coi như là một pixel trọn vẹn, có giá trị về diện tích và tọa độ của chính pixel mà nó nằm trong. Vì vậy, độ phân giải của pixel đóng vai trò hết sức quan trọng về độ chính xác của dữ liệu raster. Kích thước được chọn cho một ô lưới (pixel) của một vùng nghiên cứu phụ thuộc vào độphân giải dữ liệu yêu cầu cho phân tích chi tiết. Ô phải đủ nhỏ để nắm bắt chi tiết được yêu cầu, nhưng đủ lớn để bộ nhớmáy tính và phép toán phân tích có thể thực hiện hiệu quả.
Hình 2.9: Đối tượng điểm, đường, vùng trong mô hình cấu trúc Raster
Ưu điểm của cấu trúc dữ liệu dạng raster là dễ thực hiện các chức năng xử lý và phân tích, tốc độ tính toán nhanh, thực hiện các phép toán bản đồ dễ dàng, thuận lợi trong liên kết với dữ liệu viễn thám. Cấu trúc raster có nhược điểm là kém chính xác về vịtrí không gian của đối tượng, khi độ phân giải càng thấp (kích thước pixel lớn) thì sự sai lệch này càng tăng.
Mô hình dữ liệu raster thích hợp trong mô tả các đối tượng, hiện tượng phân bố liên tục trong không gian (độ cao, nhiệt độ, loại hình sử dụng đất...), dùng để lưu giữ thông tin dạng ảnh (ảnh mặt đất, hàng không, vũ trụ...). Một số dạng mô hình biểu diễn bề mặt như mô hình DEM (Digital Elevation Model), mô hình DTM (Digital Terrain Model), mô hình TIN (Triangulated Irregular Network) trong CSDL cũng thuộc dạng raster.
b) Giá trị thuộc tính và độphân giải của ảnh raster:
Mô hình dữ liệu raster đặc trương bởi dữ liệu ảnh. Khi nghiên cứu dữ liệu raster ta thường đề cập đến giá trị thuộc tính và độphân giải ảnh. Giá trị thuộc tính và độphân giải ảnh có mối quan hệ mật thiết với nhau.
Giá trị thuộc tính dữ liệu raster gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trịđo được ở tại vịtrí của ô. Ô có thểcó giá trịlà sốnguyên hoặc số thập phân. Khi một giá trị số nguyên được sử dụng cho ô ảnh, nó có thểđược dùng làm mã nhận dạng. Có ba cách đểxác định giá trị thuộc tính của ảnh. Cách thứ nhất là phân loại mỗi chấm điểm của ảnh, mỗi nhóm các pixel được phân loại tương tự trở thành một đối tượng. Cách thứ hai là đo giá trịmàu của ảnh. Cách thứ ba là xác định pixel tương đối với một điểm quy chiếu.
Hình 2.10: Giá trị thuộc tính của ảnh raster
Độ phân giải ảnh là khảnăng hiển thị đối tượng dưới dạng dữ liệu raster. Độphân giải phụ thuộc vào kích thước của pixel. Kích thước của pixel càng nhỏthì độphân giải càng cao, đối tượng được hiển thịcàng trung thực. Nói một cách tổng quát, độphân giải của ảnh càng cao thì việc hiển thịtrên thiết bịcàng rõ nét. Do đó, một vài bức ảnh có độ phân giải rất cao có thể chứa nhiều pixels hơn mức mà mà mắt người có thể nhìn thấy trong điều kiện bình thường.
c) Nguồn gốc và phân loại dữ liệu raster
Dữ liệu raster có nhiều nguồn khác nhau: từảnh quét, ảnh hàng không, ảnh vệ tinh, ảnh chụp trực tiếp. Trong đó, ảnh vệ tinh là dữ liệu raster thông dụng và cơ bản nhất. Ngoài ra, dữ liệu raster còn được tạo ra từ việc chuyển đổi từ nguồn dữ liệu vector, từ mô hình TIN hoặc mô hình DEM.
Phân loại dữ liệu raster thường dựa vào giá trị thuộc tính của ảnh. Căn cứvào giá trị ô ảnh có thể biểu diễn cho một trong bốn kiểu dữ liệu sau đây:
- Kiểu dữ liệu định danh: Một giá trị kiểu dữ liệu định danh giúp nhận dạng thực thể này với thực thểkhác. Đây là những giá trịđịnh tính, không phải là giá trịđịnh lượng.
- Kiểu dữ liệu thứ tự: Một giá trị kiểu dữ liệu thứ tựxác định hạng của một thực thể so với những thực thểkhác. Những phép đo này cho thấy vịtrí, như thứ tự thứ nhất, thứ hai hoặc thứ ba nhưng chúng không thiết lập tỷ lệ tương đối hoặc biên độ; cũng không thể suy luận ra được sựkhác nhau về định lượng như là thực thểnày lớn hơn, cao hơn, hoặc dày đặc hơn những thực thểkhác ra sao.
- Kiểu khoảng dữ liệu: Một giá trị kiểu khoảng dữ liệu đại diện cho một phép đo theo một thang chia độnào đấy như thời gian trong ngày, nhiệt độ Fahrenheit và giá trị độpH. Có thể làm những phép so sánh tương đối giữa các khoảng dữ liệu. Việc so sánh giá trịđo với điểm 0 của thang chia độlà không có ý nghĩa.
- Kiểu dữ liệu tỷ lệ: Một giá trị kiểu dữ liệu tỷ lệ đại diện một giá trịđo trên một thang chia độ với điểm gốc 0 cố định và có ý nghĩa. Các toán tử có thể sử dụng được những giá trị này để dự đoán kết quả. Những ví dụ của kiểu dữ liệu tỷ lệ là độ tuổi, khoảng cách, trọng lượng và thểtích.
d) Chức năng của dữ liệu raster trong hiển thịvà phân tích không gian
- Dùng làm bản đồ nền: Thông thường, raster được sử dụng làm nền bản đồ. Chúng nằm ở dưới các layer vector. Sử dụng ảnh raster giúp nhìn thấy độ sâu và tăng sự tin tưởng của người sử dụng bản đồ.
- Dùng trong quản lý sử dụng đất: Dữ liệu raster rất lý tưởng để lập mô hình và vẽ bản đồ sử dụng đất. Đa sốcác nghiên cứu sử dụng đất đều bắt đầu bằng ảnh vệ tinh hoặc ảnh hàng không, sau đó các lớp đặc trưng sẽđược đưa vào. Công việc này được tiến hành hằng năm, việc so sánh các kết quả thu nhận sẽđưa ra các quyết định về sử dụng đất.
- Dùng trong phân tích thủy văn: Thông tin địa thếthông thường nằm ở dạng raster với những giá trịđộ cao cho từng ô ảnh. Đây là mô hình sốđộcao (DEM). Các công cụ GIS dành cho raster cho phép xác định được hướng nước chảy, lưu lượng tích trữ của dòng nước ở hạlưu và dựđoán được lũ lụt.
- Dùng trong phân tích môi trường: Dữ liệu về phân bố sử dụng đất, về lớp phủ thực vật và địa thế thông thường được lưu trữ dưới dạng ảnh raster, do đó đa số các phép tính toán phân tích môi trường đều liên quan đến dữ liệu raster. Công cụphân tích GIS dành cho raster đã phát triển đến mức cho phép sử dụng dữ liệu raster để giải quyết những vấn đềở nhiều mức độ. Từcông tác bảo tồn rừng cho tới nghiên cứu những thay đổi của động vật hoang dã do đô thịhóa.
- Dùng trong phân tích địa thế: Mô hình số độ cao chứa những giá trịđộ cao cho từng ô ảnh. Các phần mềm GIS có nhiều công cụ phân tích raster đểtính độ dốc, khả năng nhận ánh sáng và tính toán độ cong của mặt đất mà thường được sử dụng trong lập kế hoạch sử dụng đất hoặc chọn vịtrí đểxây dựng công trình.
e) Tổ chức dữ liệu raster trong GIS
Mục đích tổ chức dữ liệu raster trong GIS là để tối ưu hóa việc nhập dữ liệu, giảm bớt sựlưu trữvà các yêu cầu về xửlý dữ liệu. Hình 2.11 là một ví dụ về tổ chức dữ liệu raster trong bản đồđánh giá đất đai. Dữ liệu raster được sử dụng là loại đất, tình hình sử dụng đất, giao thông và sông ngòi. Dữ liệu được tổ chức dưới dạng các lớp đối tượng, phân biệt theo kiểu, loại và đặc tính của các đối tượng.
Lớp Loại
đối tượng
Kiểu
đối tượng Đặc tính
Loại đất Vùng Phân loại, đặc tính đất Tình hình sử
dụng đất Vùng Mã hóa, định giá loại hình sửđấ dụng t
Giao thông Đường Loại hình giao thông Sông ngòi Đường Phân loại sông ngòi
Khi đã xác định được các đối tượng và thuộc tính của chúng, chúng ta có thể tổ chức các đặc tính địa lý thành các lớp dữ liệu. Có nhiều yếu tố ảnh hưởng đến tổ chức lớp trong cơ sở dữ liệu địa lý và chúng khác nhau trong mỗi kiểu ứng dụng. Cách thông thường nhất là tổ chức lớp theo kiểu của các đặc tính (điểm, đường, vùng) và nhóm theo các chuyên đề. Các lớp được tổ chức sao cho các điểm, đường và vùng được lưu trữ trong các lớp riêng biệt. Ví dụnhư các điểm phân bốdân cư mang đặc tính điểm có thể được lưu riêng thành một lớp, trong khi đường giao thông đại diện cho đặc tính đường thì được lưu trong một lớp khác. Các đặc tính có thể tổ chức theo chuyên đềmà nó đại diện. Ví dụ: Dòng chảy và đường giao thông tuy cùng mang đặc tính đường nhưng có thể tổ chức thành 2 lớp khác nhau. Các thuộc tính đi kèm đặc tính địa lý thủy hệcó thể là tên gọi, phân loại (sông hoặc kênh rạch) và vận tốc dòng chảy, trong khi thuộc tính của đường giao thông là tên gọi, kết cấu bề mặt và độ rộng. Do sựkhác nhau rất xa về thuộc tính nên chúng phải được lưu trữvào các lớp khác nhau nhưng phải cùng chung một vùng quan trắc địa lý có cùng một hệ thống tham chiếu không gian.