Dữ liệu ảnh viễn thám

Một phần của tài liệu Nghiên cứu hàm lượng chlorophyll_a và nhiệt độ bề mặt biển từ dữ liệu ảnh viễn thám MODIS (Trang 37)

5. Cấu trúc luận văn

2.1.1.Dữ liệu ảnh viễn thám

Ocean Color của NASA được hỗ trợ bởi nhóm xử lý sinh học đại dương (OBPG) tại trung tâm chuyến bay không gian Goddard của NASA. Với tư cách là hệ thống xử lý do nhà điều tra Khoa học (SIPS) lãnh đạo, trách nhiệm bao gồm việc thu thập, xử lý, hiệu chuẩn, xác nhận các sản phẩm liên quan đến đại dương từ một số lượng lớn các nhiệm vụ viễn thám dựa trên vệ tinh hoạt động, cung cấp màu đại dương, SST và SSS cho cộng đồng nghiên cứu quốc tế. Dữ liệu MODIS thu nhận từ nguồn cung cấp của NASA được Ocean Color Web phân phối ở nhiều cấp độ khác nhau. Hệ thống thu nhận của NASA xử lý dữ liệu MODIS cho toàn cầu và tạo ra các sản phẩm chuẩn để lưu trữ cho các mục đích nghiên cứu và theo dõi tài nguyên môi trường bề mặt lục địa và đại dương toàn cầu.

Trong quá trình nghiên cứu, luận văn sử dụng dữ liệu ảnh viễn thám MODIS Aqua cấp độ 2 (level 2) hàng ngày, độ phân giải 1000m, thu thập ảnh trong khoảng thời gian từ 01/2015 đến 12/2020 qua trang wed: http://www.oceancolor.com (Hình 2.1). Sau khi thu thập những cảnh ảnh có độ che phủ mây thấp (<20%) tại vùng biển nghiên cứu, lưu trữ ảnh trong cùng một thư mục (folder) để xử lý đồng thời. Cảnh ảnh thu thập về có định dạng netCDF - Network Common Data Form (phần tập tin mở rộng có dạng *.nc), định dạng netCDF được xuất hiện lần đầu tiên vào cuối những năm 1980 bởi Unidata Program Center với mục đích là xây dựng một định dạng tệp cho phép chia sẻ dữ liệu giữa các nhà khoa học trong lĩnh vực khí quyển, đại dương.

34

Hình 2.1. Trang web tải ảnh MODIS Aqua cấp độ 2 hàng ngày 2.1.2.Dữ liệu thực đo

Để bổ trợ cho quá trình kiểm chứng độ tin cậy, đánh giá độ chính xác những số liệu SST, Chl-a được xác định từ dữ liệu ảnh viễn thám, luận văn sử dụng số liệu thực đo SST, hàm lượng Chl-a tầng mặt để kiểm chứng với số liệu từ dữ liệu ảnh viễn thám. Những số liệu này được thu thập từ các chuyến điều tra, khảo sát của các chương trình, đề tài, dự án thực hiện tại Viện Nghiên cứu Hải sản trong vùng biển Việt Nam từ năm 2015 đến năm 2020 bằng thiết bị CTD - Conductyvity Temperature Depth (Nhật Bản) với độ chính xác cao. Chi tiết các trạm thực đo thể hiện trong Hình 2.2; Bảng 2.1.

35

Hình 2.2. Phân bố mạng trạm thực đo

Bảng 2.1. Thống kê trạm thực đo được sử dụng

Thời gian Trạm đo SST Trạm đo Chl-a

2015 40 40 2016 160 160 2017 176 176 2018 515 515 2019 450 450 2020 66 66 Tổng số trạm đo 1407 1407

36

Các dữ liệu này cùng với toàn bộ các dữ liệu khí tượng, hải dương học khác (sóng, gió, độ muối, độ đục, dòng chảy, độ ẩm không khí, nhiệt độ không khí, áp suất khí quyển, ...) của các chương trình, đề tài, dự án đã thực hiện trên vùng biển Việt Nam được tổng hợp trong cơ sở dữ liệu (CSDL) hải dương học lưu trữ tại Viện Nghiên cứu Hải Sản.

2.1.3.Dữ liệu khác

Ngoài ra, để phục vụ cho việc xây dựng thành lập bản đồ phân bố không gian, một số nguồn dữ liệu khác được đưa vào sử dụng như: bản đồ nền, … Các bản đồ được xây dựng trên bản đồ nền hành chính có ranh giữa biển, đất liền, hệ thống các đảo và quần đảo Việt Nam và tư liệu ảnh MODIS.

2.2. Thuật toán xác định hàm lượng Chl-a và SST từ dữ liệu ảnh viễn thám MODIS MODIS

2.2.1.Thuật toán xác định hàm lượng Chl-a

Chl-a cũng có thể đo đạc được bằng phương pháp viễn thám. Các cảm biến đặt trên vệ tinh đo đạc màu của nước biển để xác định lượng Chl-a có trong nước. Nước biển thường có màu xanh lơ, khả năng của vệ tinh có thể phát hiện được sự thay đổi rất nhỏ về màu sắc của nước biển cho kết quả hàm lượng Chl-a có trong tảo.

Thuật toán OC3M được sử dụng để tính toán giá trị Chl-a từ ảnh MODIS (còn gọi là Chl-a MODIS), thuật toán sử dụng ba kênh phổ ở dải phổ trung tâm 0,443µm; 0,488µm; 0,551µm (Bảng 2.2) [11, 19].

Chla = 10a0− a1R + a2R2+ a3R3− a4R4 (2.1) Trong nghiên cứu này các hệ số: ao = 0,283, a1 = - 2,753, a2 = 1,457, a3 = 0,659 và a4 = -1,403

R = lg (max (R443, R488)

R551 ) (2.2)

Trong đó:

 Chla là nồng độ chất diệp lục (mg/m3)

 R443, R488, R551, là giá trị bức xạ của các kênh phổ tương ứng

37

Bảng 2.2. Các kênh phổ MODIS sử dụng trong tính toán hàm lượng Chl-a Kênh phổ Dải phổ (µm) Ứng dụng chính Độ phân giải (m)

Kênh 09 0,438 – 0,448 Màu đại dương 1000

Kênh 10 0,483 – 0,493 Màu đại dương 1000

Kênh 12 0,546 – 0,556 Màu đại dương 1000

Việc sử dụng các đơn vị đo hàm lượng Chl-a có khác nhau trong các thiết bị đo, song các đơn vị này đều tương đương nhau. Về mặt lịch sử, những phép đo trực tiếp hàm lượng Chl-a thể hiện chung một đơn vị là μg/l và phép đo gián tiếp trên ảnh viễn thám là mg/m3, còn phụ thuộc vào phương pháp và thiết bị sử dụng. Trong văn bản kỹ thuật đo lường Việt Nam TCVN 6662:2000, các đơn vị đo hàm lượng Chl-a đó là tương đương nhau:

1mg/m3 = 1μg/l

Trong nghiên cứu này, các dữ liệu đo đạc thực đo được thực hiện bằng thiết bị đo chuyên dụng hải dương học CTD với đơn vị đo hàm lượng Chl-a là μg/l. Dữ liệu ảnh viễn thám MODIS Aqua đơn vị đo hàm lượng Chl-a là mg/m3 vì vậy đơn vị hàm lượng Chl-a được sử dụng trong nghiên cứu này là mg/m3.

2.2.2.Thuật toán xác định SST

Trong các thuật toán tính SST từ dữ liệu MODIS có sự tham gia của các thông số khí quyển và bề mặt, đó là hàm lượng hơi nước trong khí quyển. Theo bản chất vật lý của sóng điện từ và cấu tạo của đầu thu, để tính toán tổng lượng hơi nước trong khí quyển các nghiên cứu thường sử dụng các kênh 2, 17, 18 và 19 của đầu thu MODIS. Trong đó, kênh 2 là kênh cửa sổ khí quyển, kênh 17, 18, 19 là các kênh hấp thụ hơi nước.

Từ lý thuyết trên, Sobrino (2003) đã đưa ra ba thuật toán ước tính SST từ dữ liệu ảnh MODIS, bao gồm:

Thuật toán bậc nhất:

SST1 =T31+a0 (T31 −T32 ) + a1 (2.3) Thuật toán bậc hai:

38

SST2 = T31 + a0 (T31 − T32 ) + a1(T31 − T32 )2 + a2 (2.4) Thuật toán cấu trúc (có xét ảnh hưởng của tổng cột hơi nước)

SST3 = T31 + (a0 +a1W)(T31 − T32 ) + a3 + a2W (2.5) Trong đó

 ai: hệ số và được Sobrino đề xuất theo Bảng 2.3

 T31, T32: tương ứng là nhiệt độ kênh phổ 31 và 32

 W: hàm lượng hơi nước trong khí quyển

Bảng 2.3. Hệ số ai của thuật toán SST

Thuật toán a0 a1 a2 a3

SST1 3,83 0,14 - -

SST2 2,75 0,67 0,36 -

SST3 1,90 0,44 0,5 0,34

Tuy nhiên tại Việt Nam, Dương Văn Khảm (2008) đánh giá thuật toán bậc nhất không có sự tham gia của hàm lượng hơi nước trong khí quyển cho sai số thấp nhất [7].

2.3. Đồng bộ số liệu và đánh giá sai số

2.3.1.Đồng bộ số liệu viễn thám với số liệu thực đo

Để đánh giá độ tin cậy của số liệu SST và Chl-a từ dữ liệu viễn thám so với số liệu thực đo, yêu cầu tiên quyết đầu tiên đối với hai loại số liệu này là phải đồng bộ (nghĩa là phải cùng vị trí: tọa độ kinh, vĩ tuyến và cùng thời gian: ngày, tháng, năm đo trùng với ngày thu nhận ảnh). Đối với ảnh viễn thám quang học MODIS Aqua dữ liệu Chl-a bị che phủ nhiều bởi mây và sương mù, vùng ven bờ dữ liệu Chl-a thường bị nhiễu do ảnh hưởng bởi đường bờ. Số liệu Chl-a thực đo tại các trạm đo ven bờ, cửa sông, vũng, vịnh thì bị ảnh hưởng nhiều bởi thủy triều, độ đục, phù sa nên độ chính xác không cao. Để đánh giá chính xác hơn, các trạm thực đo cách mép bờ >=5 hải lý ưu tiên sẽ được chọn để đánh giá độ tin cậy với số liệu viễn thám. Nhiệt độ nước biển thay đổi trong ngày phụ thuộc vào từng thời điểm và vị trí địa lý. Vì vậy để đồng bộ số liệu nhiệt độ, Chl-a từ dữ liệu ảnh viễn thám với thực đo, học viên đã đồng bộ số liệu theo thời gian tuần (7 ngày) và không gian là tâm ô lưới 0,25o x 0,25o.

39

Trên thực tế các trạm thực đo thường có sai khác ít nhiều so với các tâm ô lưới, do vậy cần phải đồng bộ số liệu viễn thám với số liệu thực đo để đánh giá độ tin cậy như sau:

+ Bước 1: Loại bỏ sai số thô của số liệu thực đo sau đó tách số liệu nhiệt độ và Chl-a tầng mặt (độ sâu từ 0 – 1m) theo từng trạm đo và lưu vào tệp riêng;

+ Bước 2: Sau khi trích lọc dữ liệu viễn thám về file số *csv độ phân giải 0,1o x 0,1o kinh, vĩ tuyến cần lọc loại bỏ các sai số Chl-a nằm ngoài khoảng (0 - 20mg/m3) và lọc bỏ SST nằm ngoài khoảng (10 - 40oC) [28, 38, 39], sau đó chọn ra những file có số liệu thực đo dựa vào thông tin dữ liệu (ngày, tháng, năm) và lưu tệp riêng.

+ Bước 3: Đồng bộ số liệu viễn thám với số liệu thực đo theo tâm ô lưới 0,25o x 0,25o và thời gian trung bình tuần theo các ngày tương ứng. Trường hợp những vị trí nằm trên các đường kinh, vĩ tuyến thì vị trí đó được tính cho cả hai ô lưới.

+ Bước 4: Quét tìm tâm ô lưới có vị trí trùng nhau sau đó nhập vào chuỗi số liệu thực đo và viễn thám đã đồng bộ theo các bước trên vào cùng một file, thư mục. 2.3.2.Kiểm chứng số liệu từ dữ liệu ảnh viễn thám

Kiểm chứng số liệu từ dữ liệu ảnh viễn thám là rất quan trọng vì các số liệu này ngày càng được sử dụng rộng rãi trong nhiều lĩnh vực khác nhau và độ chính xác của số liệu quyết định đến chất lượng của các kết quả. Ngoài ra, việc đánh giá, so sánh các số liệu ước tính (viễn thám) do thuật toán tính ra với các giá trị được quan sát (thực đo) đáng tin cậy là bước cơ bản để phát triển và sử dụng thuật toán. Vì vậy, học viên sử dụng các phương pháp sau để kiểm chứng số liệu từ dữ liệu ảnh viễn thám.

Phân tích tương quan hồi quy là một phương pháp có hiệu lực trong phân tích quan hệ dự đoán giá trị của biến phụ thuộc Y dựa trên giá trị đã biết của một hay nhiều biến độc lập. Mục đích của hồi quy là đi tìm một phương trình mà khi biểu diễn nó trên đồ thị, chúng ta có một đường thẳng phù hợp nhất và ước tính được biến phụ thuộc Y dựa vào những thay đổi của biến độc lập X.

Phương trình hồi quy tuyến tính đơn giản có dạng:

Yi = A + B*Xi + Ei (2.6)

40

 Ei: Sai số ngẫu nhiên;

 A: Giá trị trung bình của biến phụ thuộc Y khi biến độc lập X thay đổi 1 đơn vị (điểm cắt đường thẳng hồi quy và trục Y);

 B: Diễn tả sự thay đổi của giá trị trung bình của biến phụ thuộc Y khi biến độc lập X thay đổi 1 đơn vị (hệ số góc).

Trong phân tích tương quan hồi quy, hệ số tương quan (R) Pearson là thống kê kiểm định đo lường mối quan hệ thống kê, hay sự liên kết (mức độ tuyến tính) giữa hai biến liên tục. Nó được biết đến là phương pháp tốt nhất để đo lường mối liên hệ giữa các biến quan tâm vì nó dựa trên phương pháp hiệp phương sai. Nó cung cấp thông tin về độ lớn của mối liên kết hoặc mối tương quan, cũng như hướng của mối quan hệ. Hệ số tương quan Pearson là thước đo sức mạnh của mối quan hệ tuyến tính giữa hai biến. Tương quan bình phương R (hay còn gọi hệ số xác định: R2) là một thước đo thống kê quan trọng, trong mô hình hồi quy thể hiện tỷ lệ của sự khác biệt hoặc phương sai về mặt thống kê đối với một biến phụ thuộc có thể được giải thích bằng một biến hoặc các biến độc lập. Hệ số xác định R2 được xác định mức độ phù hợp của dữ liệu với mô hình hồi quy với dữ liệu quan sát. Để tính toán hệ số xác định cần tính toán tương quan R sau đó bình phương nó.

Trong nghiên cứu này, hệ số tương quan R cho phép đánh giá mối quan hệ tuyến tính giữa tập giá trị viễn thám và tập giá trị thực đo tại các trạm đồng bộ. Giá trị của nó biến thiên trong khoảng -1 đến 1, giá trị hoàn hảo bằng 1. Giá trị tuyệt đối của hệ số tương quan càng lớn thì mối quan hệ tuyến tính giữa hai biến càng chặt chẽ. Hệ số tương quan dương phản ánh mối quan hệ cùng chiều (đồng biến), ngược lại hệ số tương quan âm biểu thị mối quan hệ ngược chiều (nghịch biến) giữa số liệu viễn thám và thực đo. Trong khi đó, hệ số xác định R2 có giá trị giữa 0 và 1, R2 càng cao cho biết độ chính xác của kết quả nghiên cứu càng cao. Công thức tính hệ số tương quan R_Pearson [8, 12]. R = ∑n (Xi−X̅)(Yi−Y̅) i=1 √∑n (Xi−X̅)2 i=1 √∑n (Yi−Y̅)2 i=1 (2.7) Trong đó:

41

 Yi, Xi tương ứng là giá trị từ viễn thám và giá trị thực đo;

 𝑌̅ , 𝑋̅ tương ứng là giá trị trung bình từ viễn thám và thực đo;

 n là độ dài chuỗi số liệu. Miền xác định R: -1 ≤ R ≤ 1

R > 0: mối tương quan tuyến tính thuận (cùng chiều);

R < 0: mối tương quan tuyến tính nghịch (ngược chiều);

R = ± 1: mối liên hệ chặt chẽ;

R = 0: không có mối liên hệ;

|R| càng gần 1: mối liên hệ càng chặt chẽ.

 Nếu |R|< 0,1 thì tương quan rất yếu;

 Nếu 0,2 < |R|< 0,3: yếu;

 Nếu 0,4 < |R|< 0,5: trung bình;

 Nếu 0,6 < |R| < 0,7: cao;

 Nếu |R| > 0,8: tương quan rất cao. 2.3.3.Đánh giá sai số số liệu từ dữ liệu viễn thám

Một số chỉ số thường dùng trong mô hình dự báo được áp dụng để đánh giá sai số số liệu từ viễn thám với số liệu thực đo: Sai số trung bình (ME - Mean Error); sai số tuyệt đối trung bình (MAE - Mean Absolute Error) và sai số trung phương (RMSE - Root Mean Square Error). Trong các công thức dưới đây: Yi là giá trị viễn thám, Xi là giá trị thực đo, n là số trạm đồng bộ.

Sai số trung bình ME cho biết xu hướng lệch trung bình của giá trị viễn thám so với giá trị thực đo, nhưng không phản ánh độ lớn của sai số. ME dương cho biết giá trị viễn thám cao hơn giá trị thực đo, ME âm cho biết giá trị viễn thám thấp hơn giá trị thực đo, ME = 0 được xem là “hoàn hảo” (không thiên lệch về một phía nào cả). Giá trị của ME nằm trong khoảng (-∞, +∞), công thức sai số trung bình ME:

ME = 1

n ∑ni=1(Yi− Xi) (2.8) Sai số tuyệt đối trung bình MAE biểu thị biên độ trung bình của sai số nhưng không nói lên xu hướng lệch của giá trị viễn thám và thực đo. Khi MAE = 0, giá trị viễn thám hoàn toàn trùng khớp với giá trị thực đo, mô hình được xem là “lý tưởng”.

42

Thông thường MAE được sử dụng cùng với ME để đánh giá độ tin cậy. Chẳng hạn, nếu MAE khác biệt hẳn so với ME thì việc hiệu chỉnh là hết sức mạo hiểm. Trong trường hợp ngược lại, khi mà MAE và ME tương đối “sát” với nhau thì có thể dùng ME để hiệu chỉnh dữ liệu viễn thám một cách đáng tin cậy, giá trị MAE nằm trong khoảng (0, +∞). Công thức tính sai số tuyệt đối trung bình MAE:

MAE = 1

n ∑n |Yi− Xi|

i=1 (2.9)

Sai số trung phương RMSE là một trong những đại lượng cơ bản và thường được sử dụng phổ biến cho việc đánh giá kết quả của mô hình dự báo số trị. Người ta thường hay sử dụng đại lượng sai số trung phương RMSE để biểu thị độ lớn trung bình của sai số. Đặc biệt RMSE rất nhạy với những giá trị sai số lớn. Do đó nếu RMSE càng gần MAE sai số mô hình càng ổn định và có thể thực hiện việc hiệu chỉnh sản phẩm mô hình. Giống như MAE, RMSE không chỉ ra độ lệch giữa giá trị

Một phần của tài liệu Nghiên cứu hàm lượng chlorophyll_a và nhiệt độ bề mặt biển từ dữ liệu ảnh viễn thám MODIS (Trang 37)