a) Cấu trúc bên trong của vùng b) Cấu trúc đường bao của vùng
2.4.2. Mô hình dữ liệu raster
a) Khái qt mơ hình dữ liệu raster
Một file ảnh chụp về một đối tượng không gian qua máy ảnh kỹ thuật số hoặc dữ liệu ảnh vệtinh là những ví dụ về dữ liệu raster. Raster được định nghĩa như là ma trận không gian của các đơn vị ảnh (picture element) còn gọi là các pixel. Các pixel có kích thước đồng nhất về mặt hình học, chúng làcác ơ vng nhỏvà được xếp theo các dịng và các cột giống như một lưới ơ vng (Hình 2.7).
Hình 2.7: Dữ liệu raster có cấu trúc pixel
Cấu trúc raster là một trong những cấu trúc dữ liệu đơn giản nhất trong GIS. Cấu trúc raster cịn được gọi là “tổ chức theo ơ vng của dữ liệu không gian”. Pixel là phần tửcơ sở của cấu trúc dữ liệu raster để biểu diễn một đặc trưng địa lý f (x, y) nào đó, giá trị của pixel chỉ tính chất của đối tượng không gian. Giá trị số của pixel chính là mã được gắn cho đối tượng khơng gian (tức là mỗi đối tượng khơng gian có một mã nhất định). Giá trị bằng không thường là những pixel chỉvùng ngồi khu vực nghiên cứu. Ví dụ: Các đối tượng đất trồng lúa có mã bằng 1, đất trồng ngơ có mã bằng 2, đất trồng mía có mã bằng 3, đất trồng rau có mã bằng 4 (Hình 2.8).
Hình 2.8: Các đối tượng khơng gian được mã hố trong mơ hình Raster
Như vậy, mơ hình raster biểu diễn không gian như là một ma trận số nguyên, mỗi một giá trị sốnguyên đại diện cho một thuộc tính, vịtrí của sốnguyên chính là vịtrí của đối tượng. Ma trận không gian từcác ơ ảnh này được mã hố và lưu trữ trong máy tính theo quy luật nhất định thơng qua vịtrí của từng ơ ảnh và được tham chiếu tới hệ tọa độ dùng cho Trái đất gọi là hệ tọa độ Cartsian theo hai trục x và y.
Khác với mơ hình dữ liệu vector, khơng gian cấu trúc dữ liệu dạng raster được chia thành các ơ. Vị trí của các đối tượng địa lý được xác định bởi vị trí dịng và cột. Độ phân giải không gian được quyết định bởi kích thước các ô. Trong cấu trúc dữ liệu raster các đối tượng địa lý cũng được thể hiện bằng các dạng điểm, đường và vùng.
- Đối tượng điểm: được biểu diễn bằng một ô gồm một pixel hay nhiều pixel tùy thuộc vào tỷ lệảnh.
- Đối tượng đường: là tập hợp các ô lưới vuông có cùng giá trị f (x, y) nối tiếp nhau và sắp xếp theo một hướng nhất định. Trong cấu trúc dữ liệu raster đối tượng đường được biểu diễn bằng những pixel có cùng giá trị f (x, y) liên tiếp nhau và được xếp theo hàng, cột, như một ma trận điểm nên đường nét khơng trơn, có dạng zic - zac.
- Đối tượng vùng: là tập hợp liên tục dày đặc các ô trải theo nhiều phương khác nhau. Vùng được xác định bằng một mảng gồm nhiều pixel có cùng giá trị thuộc tính f (x, y) trải rộng ra theo nhiều phương.
Trên thực tế mỗi pixel có một cặp tọa độ (x, y) duy nhất. Một đối tượng khơng gian có kích thước nhỏ hơn một pixel, ví dụ lớn hơn một nửa pixel, sẽ được coi như là một pixel trọn vẹn, có giá trị về diện tích và tọa độ của chính pixel mà nó nằm trong. Vì vậy, độ phân giải của pixel đóng vai trị hết sức quan trọng về độ chính xác của dữ liệu raster. Kích thước được chọn cho một ơ lưới (pixel) của một vùng nghiên cứu phụ thuộc vào độphân giải dữ liệu yêu cầu cho phân tích chi tiết. Ơ phải đủ nhỏ để nắm bắt chi tiết được yêu cầu, nhưng đủ lớn để bộ nhớmáy tính và phép tốn phân tích có thể thực hiện hiệu quả.
Hình 2.9: Đối tượng điểm, đường, vùng trong mơ hình cấu trúc Raster
Ưu điểm của cấu trúc dữ liệu dạng raster là dễ thực hiện các chức năng xử lý và phân tích, tốc độ tính tốn nhanh, thực hiện các phép tốn bản đồ dễ dàng, thuận lợi trong liên kết với dữ liệu viễn thám. Cấu trúc raster có nhược điểm là kém chính xác về vịtrí khơng gian của đối tượng, khi độ phân giải càng thấp (kích thước pixel lớn) thì sự sai lệch này càng tăng.
Mơ hình dữ liệu raster thích hợp trong mơ tả các đối tượng, hiện tượng phân bố liên tục trong không gian (độ cao, nhiệt độ, loại hình sử dụng đất...), dùng để lưu giữ thông tin dạng ảnh (ảnh mặt đất, hàng khơng, vũ trụ...). Một số dạng mơ hình biểu diễn bề mặt như mơ hình DEM (Digital Elevation Model), mơ hình DTM (Digital Terrain Model), mơ hình TIN (Triangulated Irregular Network) trong CSDL cũng thuộc dạng raster.
b) Giá trị thuộc tính và độphân giải của ảnh raster:
Mơ hình dữ liệu raster đặc trương bởi dữ liệu ảnh. Khi nghiên cứu dữ liệu raster ta thường đề cập đến giá trị thuộc tính và độphân giải ảnh. Giá trị thuộc tính và độphân giải ảnh có mối quan hệ mật thiết với nhau.
Giá trị thuộc tính dữ liệu raster gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trịđo được ở tại vịtrí của ơ. Ơ có thểcó giá trịlà sốnguyên hoặc số thập phân. Khi một giá trị số nguyên được sử dụng cho ơ ảnh, nó có thểđược dùng làm mã nhận dạng. Có ba cách đểxác định giá trị thuộc tính của ảnh. Cách thứ nhất là phân loại mỗi chấm điểm của ảnh, mỗi nhóm các pixel được phân loại tương tự trở thành một đối tượng. Cách thứ hai là đo giá trịmàu của ảnh. Cách thứ ba là xác định pixel tương đối với một điểm quy chiếu.
Hình 2.10: Giá trị thuộc tính của ảnh raster
Độ phân giải ảnh là khảnăng hiển thị đối tượng dưới dạng dữ liệu raster. Độphân giải phụ thuộc vào kích thước của pixel. Kích thước của pixel càng nhỏthì độphân giải càng cao, đối tượng được hiển thịcàng trung thực. Nói một cách tổng quát, độphân giải của ảnh càng cao thì việc hiển thịtrên thiết bịcàng rõ nét. Do đó, một vài bức ảnh có độ phân giải rất cao có thể chứa nhiều pixels hơn mức mà mà mắt người có thể nhìn thấy trong điều kiện bình thường.
c) Nguồn gốc và phân loại dữ liệu raster
Dữ liệu raster có nhiều nguồn khác nhau: từảnh quét, ảnh hàng khơng, ảnh vệ tinh, ảnh chụp trực tiếp. Trong đó, ảnh vệ tinh là dữ liệu raster thông dụng và cơ bản nhất. Ngồi ra, dữ liệu raster cịn được tạo ra từ việc chuyển đổi từ nguồn dữ liệu vector, từ mơ hình TIN hoặc mơ hình DEM.
Phân loại dữ liệu raster thường dựa vào giá trị thuộc tính của ảnh. Căn cứvào giá trị ơ ảnh có thể biểu diễn cho một trong bốn kiểu dữ liệu sau đây:
- Kiểu dữ liệu định danh: Một giá trị kiểu dữ liệu định danh giúp nhận dạng thực thể này với thực thểkhác. Đây là những giá trịđịnh tính, khơng phải là giá trịđịnh lượng.
- Kiểu dữ liệu thứ tự: Một giá trị kiểu dữ liệu thứ tựxác định hạng của một thực thể so với những thực thểkhác. Những phép đo này cho thấy vịtrí, như thứ tự thứ nhất, thứ hai hoặc thứ ba nhưng chúng không thiết lập tỷ lệ tương đối hoặc biên độ; cũng không thể suy luận ra được sựkhác nhau về định lượng như là thực thểnày lớn hơn, cao hơn, hoặc dày đặc hơn những thực thểkhác ra sao.
- Kiểu khoảng dữ liệu: Một giá trị kiểu khoảng dữ liệu đại diện cho một phép đo theo một thang chia độnào đấy như thời gian trong ngày, nhiệt độ Fahrenheit và giá trị độpH. Có thểlàm những phép so sánh tương đối giữa các khoảng dữ liệu. Việc so sánh giá trịđo với điểm 0 của thang chia độlà không có ý nghĩa.
- Kiểu dữ liệu tỷ lệ: Một giá trị kiểu dữ liệu tỷ lệ đại diện một giá trịđo trên một thang chia độ với điểm gốc 0 cố định và có ý nghĩa. Các tốn tử có thể sử dụng được những giá trị này để dự đốn kết quả. Những ví dụ của kiểu dữ liệu tỷ lệ là độ tuổi, khoảng cách, trọng lượng và thểtích.
d) Chức năng của dữ liệu raster trong hiển thịvà phân tích khơng gian
- Dùng làm bản đồ nền: Thơng thường, raster được sử dụng làm nền bản đồ. Chúng nằm ở dưới các layer vector. Sử dụng ảnh raster giúp nhìn thấy độ sâu và tăng sự tin tưởng của người sử dụng bản đồ.
- Dùng trong quản lý sử dụng đất: Dữ liệu raster rất lý tưởng để lập mơ hình và vẽ bản đồ sử dụng đất. Đa sốcác nghiên cứu sử dụng đất đều bắt đầu bằng ảnh vệ tinh hoặc ảnh hàng khơng, sau đó các lớp đặc trưng sẽđược đưa vào. Công việc này được tiến hành hằng năm, việc so sánh các kết quả thu nhận sẽđưa ra các quyết định về sử dụng đất.
- Dùng trong phân tích thủy văn: Thông tin địa thếthông thường nằm ở dạng raster với những giá trịđộ cao cho từng ô ảnh. Đây là mơ hình sốđộcao (DEM). Các cơng cụ GIS dành cho raster cho phép xác định được hướng nước chảy, lưu lượng tích trữ của dịng nước ở hạlưu và dựđốn được lũ lụt.
- Dùng trong phân tích mơi trường: Dữ liệu về phân bố sử dụng đất, về lớp phủ thực vật và địa thế thông thường được lưu trữ dưới dạng ảnh raster, do đó đa số các phép tính tốn phân tích mơi trường đều liên quan đến dữ liệu raster. Cơng cụphân tích GIS dành cho raster đã phát triển đến mức cho phép sử dụng dữ liệu raster để giải quyết những vấn đềở nhiều mức độ. Từcông tác bảo tồn rừng cho tới nghiên cứu những thay đổi của động vật hoang dã do đơ thịhóa.
- Dùng trong phân tích địa thế: Mơ hình số độ cao chứa những giá trịđộ cao cho từng ô ảnh. Các phần mềm GIS có nhiều cơng cụ phân tích raster đểtính độ dốc, khả năng nhận ánh sáng và tính tốn độ cong của mặt đất mà thường được sử dụng trong lập kế hoạch sử dụng đất hoặc chọn vịtrí đểxây dựng cơng trình.
e) Tổ chức dữ liệu raster trong GIS
Mục đích tổ chức dữ liệu raster trong GIS là để tối ưu hóa việc nhập dữ liệu, giảm bớt sựlưu trữvà các yêu cầu về xửlý dữ liệu. Hình 2.11 là một ví dụ về tổ chức dữ liệu raster trong bản đồđánh giá đất đai. Dữ liệu raster được sử dụng là loại đất, tình hình sử dụng đất, giao thơng và sơng ngịi. Dữ liệu được tổ chức dưới dạng các lớp đối tượng, phân biệt theo kiểu, loại và đặc tính của các đối tượng.
Lớp Loại đối tượng Kiểu đối tượng Đặc tính
Loại đất Vùng Phân loại, đặc tính đất Tình hình sử
dụng đất Vùng Mã hóa, định giá loại hình sử dụng đất Giao thơng Đường Loại hình giao thơng
Sơng ngịi Đường Phân loại sơng ngịi
Khi đã xác định được các đối tượng và thuộc tính của chúng, chúng ta có thể tổ chức các đặc tính địa lý thành các lớp dữ liệu. Có nhiều yếu tố ảnh hưởng đến tổ chức lớp trong cơ sở dữ liệu địa lý và chúng khác nhau trong mỗi kiểu ứng dụng. Cách thông thường nhất là tổ chức lớp theo kiểu của các đặc tính (điểm, đường, vùng) và nhóm theo các chuyên đề. Các lớp được tổ chức sao cho các điểm, đường và vùng được lưu trữ trong các lớp riêng biệt. Ví dụnhư các điểm phân bốdân cư mang đặc tính điểm có thể được lưu riêng thành một lớp, trong khi đường giao thơng đại diện cho đặc tính đường thì được lưu trong một lớp khác. Các đặc tính có thể tổ chức theo chun đềmà nó đại diện. Ví dụ: Dịng chảy và đường giao thơng tuy cùng mang đặc tính đường nhưng có thể tổ chức thành 2 lớp khác nhau. Các thuộc tính đi kèm đặc tính địa lý thủy hệcó thể là tên gọi, phân loại (sơng hoặc kênh rạch) và vận tốc dịng chảy, trong khi thuộc tính của đường giao thông là tên gọi, kết cấu bề mặt và độ rộng. Do sựkhác nhau rất xa về thuộc tính nên chúng phải được lưu trữvào các lớp khác nhau nhưng phải cùng chung một vùng quan trắc địa lý có cùng một hệ thống tham chiếu khơng gian.