Chuyển đổi khuôn dạng gốc về khuôn dạng thống nhất

Một phần của tài liệu Nghiên cứu đề xuất phương pháp nhận dạng và phân loại vết dầu trên biển từ tư liệu viễn thám siêu cao tần (Trang 55 - 67)

3.1.1.1. Khuôn dạng dữ liệu thống nhất GeoTIFF

Dữ liệu viễn thám siêu cao tần có nhiều mức xử lý và được lưu ở các cấu trúc khác nhau tùy thuộc vào từng trạm thu ảnh vệ tinh. Dữ liệu vệ tinh siêu cao tần ở định dạng gốc thường được lưu dưới định dạng chuẩn CEOS hoặc dưới định dạng chuẩn của trạm thu ảnh vệ tinh. Các thông tin về tọa độ, thông tin về lịch sử quá trình xử lý dữ liệu… được lưu trong dữ liệu ảnh gốc. Tuy nhiên, để đọc được các định dạng dữ liệu gốc của tư liệu ảnh SAR đòi hòi cần có các chương trình riêng biệt cho từng chương trình phần mềm xử lý ảnh. Để thuận tiện cho việc xử lý, hiển

thị các dữ liệu trung gian trong quá trình nghiên cứu thì dữ liệu ảnh SAR cần chuyển đổi từ khuôn dạng gốc về một khuôn dạng dữ liệu thống nhất, có thể đọc được trên các phần mềm xử lý ảnh hiện nay.

Hiện nay, trong các phần mềm xử lý ảnh như ENVI, ERDAS có sử dụng nhiều định dạng dữ liệu để trao đổi dữ liệu giữa các phần mềm khác nhau như JPEG, GeoTIFF, PNG, ECW… Trong đó khuôn dạng dữ liệu chuẩn GeoTIFF là khuôn dạng dữ liệu ảnh có thể đọc được bằng các phần mềm xử lý ảnh thương mại và các phần mềm GIS hiện nay. Đồng thời, dữ liệu GeoTIFF cho phép lưu các dữ liệu thông tin không gian trong cùng một tệp dữ liệu ảnh.

Khuôn dạng GeoTIFF được xây dựng từ khuôn dạng tệp dữ liệu TIFF (Tagged Image File Format) được sử dụng để lưu các dữ liệu ảnh. Tuy nhiên, định dạng tệp dữ liệu TIFF không cho phép lưu các thông tin không gian trong cùng một tệp dữ liệu ảnh. Vì vậy, các nhà khoa học đã phát triển khuôn dạng TIFF thành khuôn dạng TIFF 6.0 và được coi là phiên bản của GeoTIFF.

Hiện nay, việc lập trình ghi và đọc định dạng GeoTIFF dựa trên các thư viện hỗ trợ cho các ngôn ngữ lập trình như C++, Java, Matlab. Các thư viện này cho phép xây dựng một cấu trúc tệp dữ liệu GeoTIFF với định dạng chuẩn bao gồm phần Header, các IFD chứa codes và dữ liệu hoặc các con trỏ tới dữ liệu. Ngoài ra, các thông tin của ảnh sẽ được lưu dưới dạng các Tag và các thông tin không gian của ảnh sẽ được lưu dưới dạng các GeoKeys.

Dữ liệu ảnh SAR được sử dụng trong nhận dạng và phân tích vết dầu trên biển có đặc điểm là dữ liệu 16 bit và được lưu ở dạng 1 kênh ảnh. Do đó, các thông tin cần thiết của ảnh sẽ bao gồm:

- Số pixel trên hàng (TIFFTAG_IMAGEWIDTH) - Số hàng trên ảnh (TIFFTAG_IMAGELENGTH) - Số bit (TIFFTAG_BITSPERSAMPLE)

- Số kênh ảnh (TIFFTAG_SAMPLESPERPIXEL). Quá trình nhận dạng và phân loại vết dầu trên biển sẽ tiến hành phân tích từng ảnh SAR nên số kênh ảnh trong trường hợp này là 1.

- Dữ liệu ảnh SAR sẽ được lưu ở dạng không nén TIFFTAG_COMPRESSION = COMPRESSION_NONE

- Thông tin về màu sẽ sử dụng TIFFTAG_PHOTOMETRIC. Dữ liệu ảnh SAR sẽ là ảnh cấp độ xám nên TIFFTAG_PHOTOMETRIC = PHOTOMETRIC_RGB

- Thông tin về độ phân giải của ảnh sẽ sử dụng TIFFTAG_XRESOLUTION

TIFFTAG_YRESOLUTION

Bên cạnh đó, các thông tin không gian của ảnh sẽ được lưu bằng cách sử dụng các GeoKey được xây dựng trong thư viện hỗ trợ.

- Thông tin về phép chiếu sử dụng GTModelTypeGeoKey. GTModelTypeGeoKey

có 3 định dạng tương ứng với giá trị 1, 2, 3. Trong đó:

ModelTypeProjected = 1 /* Projection Coordinate System */

ModelTypeGeographic = 2 /* Geographic latitude-longitude System */ ModelTypeGeocentric = 3 /* Geocentric (X,Y,Z) Coordinate System */ - Ảnh được lưu dưới dạng các pixel nên GTRasterTypeGeoKey=1 tương ứng với mặc định RasterPixelIsArea

- Thông tin về tọa độ góc khung của ảnh được xác định bằng GTIFF_TIEPOINTS

với các giá trị tọa độ (X, Y, Z) của điểm góc trên bên trái và điểm góc dưới bên phải. Khai báo thông tin tọa độ điểm góc khung của ảnh như sau:

TIFFSetField(tif, GTIFF_PIXELSCALE, 3,&CellSize); tiepoints[0]=0.; tiepoints[1]=0.; tiepoints[2]=0.; tiepoints[3]=LeftTopX; tiepoints[4]=LeftTopY; tiepoints[5]=0.;

TIFFSetField(tif, GTIFF_TIEPOINTS, 6,&tiepoints);

- Thông tin về đơn vị đo chiều dài ProjLinearUnitsGeoKey=1 (Linear_Meter)

- Thông tin về Ellipsoid GeogGeodeticDatumGeoKey=1 (Datum_WGS84)

- Thông tin về hệ quy chiếu ProjCoordTransGeoKey=1 tương ứng với hệ quy chiếu CT_TransverseMercator

- Thông tin về tỷ lệ chiếu sử dụng ProjScaleAtNatOriginGeoKey

Như vậy, với việc sử dụng các Tag và GeoKey thì các thông tin của ảnh bao gồm thông tin về cấp độ xám, số hàng, số cột… và thông tin không gian của ảnh như tọa độ, phép chiếu bản đồ… sẽ được lưu chính xác trong một tệp dữ liệu ảnh GeoTIFF.

3.1.1.2. Chuyển đổi khuôn dạng tư liệu ALOS PALSAR

Tư liệu ALOS PALSAR được cung cấp bởi hai cơ quan là Trung tâm phân tích dữ liệu viễn thám Trái đất của Nhật Bản (ERSDAC) và Cơ quan khám phá hàng không vũ trụ Nhật Bản (JAXA). Tư liệu được sử dụng trong giám sát và phát hiện sớm vết dầu tràn trên biển là tư liệu xử lý ở mức 4.2 (ERSDAC cung cấp) và mức 1.5 (JAXA cung cấp) với độ phân giải 50m, chế độ thu nhận ScanSAR (chế độ thu nhậndiện rộng) cho phép giám sát một vùng rộng. Dữ liệu ALOS PALSAR được lưu dưới định dạng chuẩn CEOS. Định dạng CEOS là định dạng kết hợp dữ liệu ở dạng ASCII và dạng nhị phân (Binary). Tổ chức của một dữ liệu được lưu dưới định dạng tệp dữ liệu CEOS sẽ bao gồm tập hợp các tệp dữ liệu liên quan sau đây:

- Volume directory file - Leader file

- Data file (adsbygoogle = window.adsbygoogle || []).push({});

- Null directory file

Vì vậy, để đọc được dữ liệu CEOS đòi hỏi cần phải có đầy đủ 4 tệp dữ liệu và có chương trình để đọc được định dạng dữ liệu này. Để thuận tiện cho quá trình đọc, hiển thị và xử lý dữ liệu, nghiên cứu sinh đã xây dựng modul chuyển đổi dữ liệu ALOS PALSAR mức 4.2 (ERSDAC) và mức 1.5 (JAXA) ở định dạng gốc CEOS sang định dạng thống nhất GeoTIFF (tham khảo phụ lục 1).

Hình 3.1. Sơ đồ thuật toán chuyển đổi khuôn dạng tư liệu ALOS PALSAR Chương trình bắt đầu tìm kiếm thông tin trong tệp Volume để kiểm tra dữ liệu đọc vào là dữ liệu ALOS PALSAR hay không. Nếu không đúng là dữ liệu ALOS PALSAR thì chương trình sẽ kết thúc. Nếu đúng là dữ liệu ALOS PALSAR thì chương trình sẽ đọc tiếp tệp Leader.

Tệp Leader có chứa thông tin về xác định khuôn dạng của dữ liệu là CEOS. Nếu định dạng của dữ liệu không phải là CEOS thì chương trình sẽ kết thúc. Nếu định dạng của dữ liệu đúng là CEOS thì chương trình tiếp tục đọc các thông tin về số hàng, số cột, độ phân giải của ảnh. Ở các mức xử lý khác nhau thì dữ liệu sẽ được đưa về các hệ tọa độ khác nhau như mức xử lý 4.2 SCG (của hãng ERSDAC) đã đưa về hệ tọa độ UTM [18], do đó cần kiểm tra phép chiếu của ảnh khi đọc dữ

Số cột Số hàng Độ phân giải pixel

Tệp Volume

Kiểm tra dữ liệu ALOS PALSAR

Kiểm tra định

dạng CEOS Tệp Data

Dữ liệu ảnh

Chuyển đổi byte order (Big Endian sang Little Endian) Phép chiếu

bản đồ

Tọa độ X của điểm góc trên bên trái

Tọa độ Y của điểm góc trên bên trái

Ghi dữ liệu dƣới khuôn dạng GeoTIFF

Kết thúc chƣơng trình Đúng Đúng Sai Đúng Sai Tệp Leader Bắt đầu

liệu. Các thông tin về hệ tọa độ UTM, múi chiếu và điểm tọa độ X, Y góc trên bên trái là những thông tin không gian quan trọng của ảnh và sẽ được lưu để chuyển sang khuôn dạng GeoTIFF.

Bên cạnh đó, nếu định dạng của dữ liệu được lưu là CEOS thì chương trình sẽ đọc dữ liệu ảnh gốc được lưu trong tệp dữ liệu Data. Dữ liệu ảnh trong tư liệu PALSAR được lưu theo khuôn dạng BSQ. Đối với dữ liệu ảnh SAR sẽ được lưu trong 1 kênh ảnh bắt đầu từ vị trí byte thứ 193 trong bản ghi Process Data Record của tệp dữ liệu Data [18]. Tuy nhiên, trên mỗi dòng thì vị trí của dữ liệu ảnh sẽ được ghi bắt đầu từ bytes thứ 192 trở đi tính từ vị trí đầu dòng ảnh. Do đó khi đọc dữ liệu cần tìm đến byte thứ 193 tại mỗi dòng ảnh để đọc dữ liệu ảnh. Dữ liệu ảnh được lưu theo từng dòng và mỗi một pixel ảnh được lưu trong 2 byte theo chuẩn Motorola (Big Endian). Để có thể xử lý trên máy tính Intel thì cần chuyển thứ tự các byte từ Big Endian về Little Endian. Thông tin không gian của ảnh và dữ liệu ảnh sẽ được ghi dưới khuôn dạng GeoTIFF.

Kết quả thử nghiệm chuyển đổi từ định dạng gốc CEOS sang định dạng GeoTIFF đối với ảnh ALOS PALSAR Level 1.5 của hãng JAXA thu nhận ngày 08/03/2007 và ảnh ALOS PALSAR Level 4.2 của hãng ERSDAC thu nhận ngày 13/06/2007 được thể hiện trong Hình 3.2 và Hình 3.3.

Hình 3.3. Kết quả chuyển đổi ảnh ALOS PALSAR Level 4.2 (ERSDAC)

3.1.1.3. Chuyển đổi khuôn dạng EnviSAT ASAR

Vệ tinh ENVISAT ASAR cung cấp tư liệu siêu cao tần ở nhiều chế độ quan trắc khác nhau. Sau khi xử lý tại trạm thu, tư liệu siêu cao tần được lưu ở khuôn dạng đặc biệt. Cấu trúc của dữ liệu ASAR bao gồm các phần tiêu đề chính (MPH), tiêu đề riêng (SPH) và các bảng mô tả dữ liệu (Hình 3.4). Các mô tả kỹ thuật chi tiết được trình bày trong tài liệu tham khảo [16].

Hình 3.4. Cấu trúc chung của sản phẩm ASAR [16]

chế độ thu nhận WSM có độ phân giải 75m và có bề rộng tuyến thu 400km. Sản phẩm ở mức xử lý 1B được xác định trong hệ tọa độ WGS84 tại thời điểm thu nhận ảnh. Trên thực tế, dữ liệu được đọc từ tệp dữ liệu gốc của tư liệu ENVISAT ASAR ở mức xử lý ASA_WSM_1P được lưu không đúng với vị trí thực tế (Hình 3.5a và Hình 3.5c). Tùy thuộc vào từng trường hợp dịch chuyển của vệ tinh theo hướng quỹ đạo đi lên (ascending) hoặc quỹ đạo đi xuống (descending) mà ảnh cũng bị xoay khác nhau. Do đó, để có thể xoay ảnh về đúng vị trí như lúc thu nhận đòi hỏi cần phải xác định được các thông tin về tọa độ các điểm khống chế trong hệ tọa độ WGS84 và hướng dịch chuyển của vệ tinh. Tọa độ trắc địa của 06 điểm khống chế trên ảnh và hướng dịch chuyển của vệ tinh theo quỹ đạo lên hoặc xuống được lưu tại phần SPH của dữ liệu.

Nếu hướng dịch chuyển của vệ tinh là quỹ đạo đi lên thì sẽ tiến hành lật ảnh theo hàng quét, đồng thời chuyển đổi thứ tự byte từ BigEndian của Motorolla về LittleEndian của Intel (Hình 3.5a và Hình 3.5b). Nếu hướng dịch chuyển của vệ tinh là quỹ đạo đi xuống thì sẽ tiến hành lật ảnh theo hướng phương vị và cũng chuyển đổi thứ tự byte từ BigEndian của Motorolla về LittleEndian của Intel (Hình 3.5c và Hình 3.5b). Dữ liệu ảnh được đọc bắt đầu từ byte thứ 18 trên mỗi hàng ảnh. Kết quả dữ liệu ảnh sau khi chuyển đổi sẽ được lưu dưới định dạng GeoTIFF trong hệ tọa độ WGS84.

Như vậy, quá trình hiệu chỉnh dữ liệu ảnh ASAR chế độ chụp WSM về đúng vị trí lúc chụp ảnh được thực hiện hoàn toàn tự động sau khi đọc dữ liệu ảnh từ tệp dữ liệu gốc (tham khảo phụ lục 2). Sơ đồ thuật toán chuyển đổi dữ liệu ASAR từ khuôn dạng gốc về khuôn dạng thống nhất GeoTIFF được mô tả trong Hình 3.6.

(a) (b)

(c) (d)

Hình 3.5. Dữ liệu ảnh Envisat ASAR trước và sau hiệu chỉnh Hình (a) và (c) là dữ liệu gốc của ENVISAT ASAR (a) Ảnh thu nhận 07/07/2008 (quỹ đạo đi lên) (adsbygoogle = window.adsbygoogle || []).push({});

(c) Ảnh thu nhận 26/01/2008 (quỹ đạo đi xuống).

Hình 3.6. Sơ đồ thuật toán đọc và hiệu chỉnh hình học ảnh ASAR

Thuật toán chương trình đọc và chuyển đổi dữ liệu gốc về khuôn dạng thống nhất được minh hoạ tại phụ lục 1 và phụ lục 2.

3.1.2.Loại bỏ vùng đất liền và hải đảo

Đặc điểm của tín hiệu thu nhận trên ảnh SAR phụ thuộc vào năng lượng tán

nPixels (Số cột) Lật ảnh đối xứng qua tuyến bay Nén tín hiệu theo phươn g vị Đọc file *.N1 Kết thúc chƣơng trình Đọc dữ liệu MPH Số lượng DSDs Kích thước của 1 DSD Đọc dữ liệu SPH Tọa độ địa lý điểm KC Độ phân giải của pixel

Đọc dữ liệu tại MDS1 Đọc dữ liệu tại MDS2

Nén tín hiệu theo phương vị Nén tín hiệu theo phương vị Đọc dữ liệu ảnh Nén tín hiệu theo phương vị Kiểm tra ĐK Quỹ đạo bay

Xử lý look

Xử lý look

Lật ảnh đối xứng qua hàng quét

Nén tín hiệu theo phương vị

Xoay ảnh về hệ tọa độ WGS84

Nén tín hiệu theo phương vị Ghi dữ liệu ảnh sang định dạng geotiff

Nén tín hiệu theo phương vị

ASCENDING Nén tín hiệu theo phương vị DESCENDING Nén tín hiệu theo phương vị Nén tín hiệu Bắt đầu

xạ phản hồi từ bề mặt đối tượng. Mức độ thay đổi của bề mặt địa hình được thể hiện bằng sự thay đổi của mức độ xám trên ảnh. Do đặc điểm địa hình của vùng đất liền khác với bề mặt nước biển nên cần phải loại bỏ vùng đất liền, hải đảo trước khi phân tích dữ liệu ảnh phục vụ quá trình nhận dạng và phân loại vết dầu trên biển. Việc loại bỏ vùng đất liền, hải đảo sẽ tạo một môi trường đồng nhất là bề mặt biển trong quá trình xử lý trên ảnh.

Quá trình loại bỏ vùng đất liền và hải đảo được tiến hành tự động dựa trên dữ liệu ảnh siêu cao tần và dữ liệu đường bờ và hải đảo ở dạng dữ liệu ảnh với độ phân giải 100m, trong đó đường bờ có vùng đệm là 5km (Hình 3.7).

(a) (b)

Hình 3.7. Cơ sở đường bờ biển khu vực biển Đông do GEBCO công bố (a) Dữ liệu đường bờ dạng vector

(b) Dữ liệu đường bờ dạng ảnh sau khi đã tạo vùng đệm 5km

Thông tin về cơ sở dữ liệu ảnh đường bờ và hải đảo sau khi chuyển từ dạng vec tơ về raster là như sau:

 Số cột là 22777

 Số hàng là 26013

 Giá trị B của điểm góc trên bên trái: 25.040928038

 Giá trị L của điểm góc dưới bên phải: 121.045003502

 Giá trị B của điểm góc dưới bên phải: 0.954815

 Header của ảnh là 2048 byte.

 Giá trị điểm ảnh vùng đất liền và hải đảo là 1 và vùng ngoài biển là 2.

Dựa vào tọa độ của điểm góc trên bên trái và góc dưới bên phải của ảnh SAR, tọa độ (B, L) của điểm góc trên bên trái của ảnh CSDL để xác định toàn bộ vị trí của ảnh SAR trên ảnh CSDL. Sau khi tìm kiếm và cắt đúng vị trí ảnh SAR trên ảnh CSDL đường bờ sẽ tiến hành chuyển ảnh CSDL sau khi cắt sang ảnh nhị phân bằng thuật toán phân ngưỡng tổng thể với giá trị ngưỡng là 1, trong đó phần đất liền và hải đảo sẽ có giá trị là 0 và vùng biển sẽ có giá trị là 1. Do kích thước độ phân giải của ảnh SAR bao gồm các giá trị 50m, 75m, 100m tùy thuộc vào dữ liệu của từng vệ tinh và từng mức xử lý nên cần phải tiến hành thay đổi độ phân giải của dữ liệu ảnh cắt trên CSDL cho phù hợp với độ phân giải của ảnh vệ tinh. Dữ liệu vùng đất liền và hải đảo được loại bỏ trên ảnh dựa vào thuật toán nhân giá trị ảnh giữa ảnh nhị phân CSDL đường bờ và ảnh SAR (Hình 3.8). (adsbygoogle = window.adsbygoogle || []).push({});

(a) (b)

Hình 3.8. Ảnh trước và sau khi loại bỏ vùng đất liền (a) Ảnh gốc; (b) Ảnh sau khi đã loại bỏ vùng đất liền

Thuật toán và chương trình tự động loại bỏ vùng đất liền và hải đảo được minh họa ở phụ lục 3.

Một phần của tài liệu Nghiên cứu đề xuất phương pháp nhận dạng và phân loại vết dầu trên biển từ tư liệu viễn thám siêu cao tần (Trang 55 - 67)