CHƯƠNG 2 : CÁC SẢN PHẨM ẢNH VỆ TINH
3.3. Phương pháp tiền xử lý dữ liệu
3.3.1. Tiền xử dữ liệu ảnh vệ tinh
Dữ liệu ảnh viễn thám thường bao gồm rất nhiều thông tin: nhiều kênh ảnh, nhiều đối tượng, dữ liệu,…vì vậy để nâng cao tính chính xác và hiệu quả khi nghiên cứu ảnh viễn thám, người ta cần nhận biết các đối tượng quan tâm qua quá trình xử lý và giải đoán ảnh. Ảnh viễn thám MODIS có định dạng HDF (Hierarchical Data Format) –định dạng ảnh viễn thám cho phép lưu nhiều tập dữ liệu ảnh về các thông tin đối tượng khác nhau trong cùng 1 file, còn ảnh VIIRS có định dạng h5 (HDF5). Khác với ảnh số thông thường ảnh viễn thám bao gồm ma trận điểm ảnh và có thể chứa các thông tin siêu dữ liệu đặc thù như: hệ quy chiếu, các kênh ảnh, kích cỡ ảnh,…Từ đó người sử dụng có thể nhận biết các thông số và hiệu chỉnh ảnh đúng với mục đích sử dụng.
Quá trình xử lý ảnh có thể được thực hiện bằng mắt hoặc sử dụng phần mềm máy tính chuyên nghiệp. Việc xử lý bằng mắt có thể tốn kém thời gian và kết quả không đồng nhất trên tập dữ liệu lớn. Vì vậy, để Nâng cao hiệu suất, rút ngắn thời gian, khả năng áp dụng nhiều thuật toán, có thể sử dụng các phần mềm máy tính chuyên nghiệp. Công cụ giúp tách các tập dữ liệu ảnh và chuyển sang dạng Geotiff để bắt đầu nghiên cứu, sử dụng. Định dạng Geotiff là một định dạng ảnh chuẩn được sử dụng rộng rãi trong lĩnh vực viễn thám. Ngoài các điểm ảnh nó còn tích hợp các thông tin siêu dữ liệu như: hệ quy chiếu, tọa độ 4 góc ảnh, loại vệ tinh,...
Tập tin .hdf
Lấy thông tin metadata, bốn góc
Trích xuất dữ liệu Optical_Depth_Land_An
d_Ocean
Tạo ảnh PNG và lưu vào ổ cứng
Chuyển định dạng Geotiff và lưu vào ổ
cứng
Lưu trữ vào cơ sở dữ liệu Chuyển định dạng Raster bắt đầu kết thúc Hình 3.2: Các bước xử lý ảnh MODIS
Quá trình tiền xử lý ảnh có thể chia làm 4 bước:
Bước 1: Thu thập dữ liệu: Ảnh được tải về từ các nhà cung cấp và lưu trữ trên ổ cứng. Thông thường, ảnh tải về đã được các nhà cung cấp ảnh kiểm tra và xử lý dữ liệu
ảnh để nâng cao chất lượng ảnh. Trong trường hợp sử dụng dữ liệu chưa được hiệu chỉnh, người dùng cần tự hiệu chỉnh ảnh để nâng cao chất lượng.
Bước 2: Biến đổi ảnh: thay đổi mầu sắc, xoay ảnh, chỉnh sửa ảnh,…có thể được thực hiện bởi người sử dụng để đạt được hiệu quả cao khi nghiên cứu ảnh.
Bước 3: Phân loại ảnh: phân loại các đối tượng trên ảnh, làm nổi bật các đối tượng quan tâm, trích xuất các dữ liệu mong muốn. Ở đây là dữ liệu AOD 550nm. Đồng thời chuyển đổi dữ liệu vừa trích xuất sang dạng Geotiff để sử dụng.
Bước 4: Kết quả: sau các quá trình xử lý và giải đoán ảnh, có thể tạo ra các ảnh chuyên đề, các ảnh đã tiền xử lý để làm đầu vào cho các mục đích nghiên cứu khác nhau. Áp dụng phương pháp trên vào việc xử lý ảnh MODIS, thực hiện xử lý ảnh theo sơ đồ như Hình 3.2.
Đầu vào quá trình xử lý là các ảnh vệ tinh MODIS với định dạng tệp tin hdf. Các thông tin về siêu dữ liệu, bốn góc sẽ được trích xuất và lưu trữ riêng thành các tệp tin txt. Tiếp theo, thực hiện xử lý tập dữ liệu độ dày quang học sol khí được trích xuất nằm trong Optical_Depth_Land_And_Ocean. Dữ liệu này được xử lý theo ba cách: tạo ra các ảnh dưới dạng PNG, trích xuất và chuyển đổi thành ảnh định dạng Geotiff, trích xuất và chuyển đổi thành dữ liệu dạng Raster để lưu trữ vào cơ sở dữ liệu. Cơ sở dữ liệu sử dụng là PostgresSQL. Sau khi dữ liệu được lưu trữ thành công vào cơ sở dữ liệu, việc xử lý ảnh kết thúc. Đầu ra của quá trình xử lý bao gồm: 1 tệp tin siêu dữ liệu, 1 tệp tin góc, 1 tệp tin dưới dạng Geotiff sau khi xử lý, 1 tệp tin dưới dạng PNG, dữ liệu lưu trong cơ sở dữ liệu. Quá trình xử lý này lặp lại cho đến khi xử lý xong tất cả ảnh.
Tương tự đối với ảnh viễn thám VIIRS, quá trình xử lý khá giống với sản phẩm ảnh của MODIS, tuy nhiên việc xử lý cần thêm một số công đoạn phụ khác liên quan đến xử lý GCP (Ground Control Point), đây là thông số về tọa độ các điểm được đánh dấu trên mặt đất giúp nâng cao độ chính xác của bản đồ. Chi tiết quá trình tiền xử lý ảnh vệ tinh VIIRs trong Hình 3.3.
Đầu vào của quá trình xử lý là ảnh vệ tinh VIIRS với định dạng h5. Quá trình tiền xử lý ảnh vệ tinh sẽ thực hiện trích xuất các siêu dữ liệu, tạo ra các ảnh PNG và ảnh Geotiff, sau đó thực hiện chuyển thành định dạng raster và lưu trữ vào cơ sở dữ liệu PostgreSQL. Đầu ra của quá trình xử lý ảnh vệ tinh VIIRS là 1 tệp tin siêu dữ liệu, 1 tệp tin góc, 1 tệp tin dưới dạng Geotiff sau khi xử lý, 1 tệp tin dưới dạng PNG, dữ liệu lưu trong cơ sở dữ liệu.
Tập tin .h5
Lấy thông tin metadata, bốn góc
Trích xuất dữ liệu Optical_Depth_Land_An
d_Ocean
Tạo ảnh PNG và lưu vào ổ cứng
Chuyển định dạng Geotiff và lưu vào ổ
cứng
Lưu trữ vào cơ sở dữ liệu
Chuyển định dạng Raster
bắt đầu
kết thúc
Lấy thông tin GCP
Chuẩn hóa dữ liệu GCP
Hình 3.3: Quá trình xử lý ảnh vệ tinh VIIRS
3.3.2. Tiền xử lý dữ liệu quan trắc và dữ liệu các điểm cháy
Dữ liệu các trạm quan trắc AERONET sau khi tải về là dữ liệu cấp 2.0 dưới dạng tệp tin. Quá trình xử lý dữ liệu tuân thủ 3 bước như sau:
Bước 1: Thu thập dữ liệu. Dữ liệu các trạm AERONET có thể được tải về trên trang chính của hệ thống [20]. Đây là dữ liệu có chất lượng tốt nhất và không cần hiệu chỉnh.
Bước 2: Xử lý dữ liệu. Thực hiện trích xuất các dữ liệu mong muốn và lưu trữ các dữ liệu này theo phương thức phù hợp.
Áp dụng đối với dữ liệu sử dụng trong đề tài, thực hiện trích xuất dữ liệu thời gian, AOD_500nm, Angstrom 440-675 nm để thực hiện lưu trữ trên cơ sở dữ liệu.
Dữ liệu các điểm cháy được tải về từ website của MODIS. Đây là dữ liệu dưới dạng tệp tin txt. Áp dụng tương tự quá trình xử lý của dữ liệu trạm quan trắc AERONET. Đầu ra thu được là dữ liệu các vị trí cháy rừng được lưu vào cơ sở dữ liệu.