Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 13 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
13
Dung lượng
0,99 MB
Nội dung
Nghiên cứu - Ứng dụng GIÁM SÁT LÚA VÀ ƯỚC TÍNH SINH KHỐI DỰA TRÊN THUẬT TỐN HỌC MÁY VỚI DỮ LIỆU SENTINEL-1A ĐA THỜI GIAN ĐỖ THỊ NGỌC ÁNH(1), NGUYỄN THỊ THẢO VÂN(1), NGUYỄN PHƯƠNG ANH(1), PHẠM MINH HẢI(2), HOÀNG ANH LÊ(1), BÙI QUANG THÀNH(1), PHẠM VĂN MẠNH(1,*) (1) Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội (2) Viện Khoa học Đo đạc Bản đồ, Bộ Tài ngun Mơi trường Tóm tắt: Viễn thám radar độ tổng hợp (SAR) cung cấp phương pháp tiếp cận linh hoạt mang đến hội thu thập thông tin trồng mà không bị hạn chế yếu tố điều kiện thời tiết Khả ứng dụng liệu Sentinel-1 SAR với phân cực kép cho phép nhận diện ruộng lúa riêng lẻ, với chu kỳ chụp lặp đủ để giám sát tình trạng sinh trưởng loại trồng khác Trong năm gần đây, với phát triển khơng ngừng thuật tốn học máy, học sâu giới, đặc biệt mạng nơ-ron tích chập (CNN) thu nhiều kết tốt phát chiết tách thông tin ảnh viễn thám Nghiên cứu này, đề xuất mô hình phân loại dựa mạng nơ-ron tích chập sâu (DCNN) để chiết tách ruộng lúa từ liệu Sentinel-1 SAR Các số vật lý tính tốn từ phân cực (VH VV) đội di động kiểm tra hình thái sinh trưởng lúa Đối với kết trích xuất ruộng lúa xác minh độ xác tổng thể (OA) xác nhận chéo (CV) đạt kết tốt 0,85 Trong đó, độ xác ước tính định lượng sinh khối lúa đạt kết cao hai vụ Đông-Xuân (R2=0,79; RMSE=0,12 kg) Hè-Thu (R2=0,77; RMSE=0,15 kg) Kết rằng, việc sử dụng liệu Sentinel-1 SAR áp dụng để lập đồ phân bố khơng gian ước tính định lượng sinh khối lúa điều kiện thời tiết khác Khung phương pháp luận tổng hợp phát triển nghiên cứu này, áp dụng ruộng lúa khắp Việt Nam khu vực trồng lúa lớn tương tự giới Từ khóa: Lúa gạo, Viễn thám, Sentinel-1 SAR, Mạng nơ-ron tích chập, Học sâu Tính cấp thiết Lúa gạo loại lương thực quan trọng gần tỷ người dân giới trồng rộng rãi nước nhiệt đới, Việt Nam quốc gia có diện tích ruộng lúa lớn vào bậc giới [1] Tuy nhiên, khó để tăng sản lượng lúa gạo để đáp ứng nhu cầu đất canh tác trồng lúa phải đối mặt với thách thức không nhỏ năm tới, quy mô dân số, tốc độ thị hóa cạnh tranh ngành phi nông nghiệp phát triển nhanh chóng [2] Ruộng lúa đóng vai trị quan trọng việc sử dụng tài nguyên nước mặt (khoảng 25% nước giới sử dụng để tưới tiêu) Ngoài ruộng lúa xác định nguồn phát thải khí metan quan trọng, có tác động đáng kể đến hiệu ứng nhà kính [3] Chính vậy, việc lập đồ phân bố khơng gian ước tính diện tích ruộng lúa quy mơ lớn để có định hướng sản xuất lúa gạo, sử dụng nguồn nước, ứng phó với biến đổi khí hậu Ngày nhận bài: 5/9/2021, ngày chuyển phản biện: 9/9/2021, ngày chấp nhận phản biện: 15/9/2021, ngày chấp nhận đăng: 18/9/021 52 TẠP CHÍ KHOA HỌC ĐO ĐẠC VÀ BẢN ĐỒ SỐ 49-9/2021 Nghiên cứu - Ứng dụng định sách phủ [4] Việc lập đồ ruộng lúa quy mô lớn dựa vào việc khảo sát thực địa tốn nhiều thời gian, công sức không kinh tế [5] Nhờ khả thu thập thơng tin phạm vi khu vực tồn cầu, viễn thám với cảm biến quang học cảm biến Radar (SAR) hai số loại liệu viễn thám sử dụng để ước tính định lượng sinh khối giám sát diện tích ruộng lúa [5], [6] Các nghiên cứu trước thường sử dụng cảm biến quang học với độ phân giải không gian thấp (Modis), trung bình (Landsat) cao (Sentinel-2) để giám sát ước tính suất lúa [7]–[9] Tuy nhiên, ruộng lúa ln nằm điều kiện có đám mây lớn bao phủ suốt thời gian canh tác gây khó khăn cho việc giám sát cảm biến quang học So với cảm biến quang học thụ động, hệ thống SAR có khả tạo hình ảnh chất lượng cao quan sát trái đất điều kiện bất lợi thời tiết Do đó, cảm biến SAR chủ động hiệu để theo dõi tình trạng sinh trưởng trồng sinh khối từ trung bình đến cao so với cảm biến quang học [10] Hơn nữa, liệu SAR cung cấp thơng tin hoạt động trước gieo sạ trạng thái sinh trưởng lúa từ bắt đầu nảy mầm đến giai đoạn trưởng thành Các nghiên cứu gần tiềm cao việc sử dụng liệu cảm biến SAR để giám sát trồng, nguồn liệu trở nên phổ biến [11], [12] Bên cạnh số liệu cảm biến SAR (Radarsat-1/2, Envisat Asar, Alos Palsar), liệu Sentinel-1A liệu SAR sử dụng để lập đồ giám sát lúa gạo khả chụp lặp với chuỗi thời gian dày đặc (12 ngày khu vực châu Âu) truy cập mở độ phân giải không gian cao (10m chế độ IW), có khả thu thập thông tin khu vực trồng lúa thường xuyên có mây dày che phủ thay đổi đáng kể hệ số tán xạ ngược suốt chu kỳ sinh trưởng lúa [13] Ước tính sinh khối lúa thực cách sử dụng phương pháp đo đạc chỗ sử dụng liệu viễn thám từ xa Tuy nhiên, phương pháp đo đạc chỗ tốn nhiều thời gian, công sức chi phí lớn liên quan đến q trình thu hoạch để ước tính định lượng sinh khối tươi mặt đất làm khơ để ước tính định lượng sinh khối lúa [1] Ước tính sinh khối thay đổi theo mùa điều kiện môi trường khác nhau, điều quan trọng phải ước tính định lượng kịp thời giá trị chúng Sinh khối mặt đất ước tính theo hai cách triệt tiêu khơng phá hủy Mặc dù sinh khối thu trực tiếp từ phép đo thực địa có độ xác cao, khơng phải cách tiếp cận phù hợp cho ước tính định lượng sinh khối diện rộng [14] Do đó, phương pháp sử dụng liệu viễn thám trở thành cách tiếp cận hiệu để ước tính định lượng sinh khối lúa quy mô lớn mà không cần tiếp xúc trực tiếp [10], [15] Việc ước tính định lượng xác sinh khối tươi không quan trọng công tác quản lý trồng, mà cịn góp phần giúp nhà hoạch định sách định lượng chu trình carbon hệ sinh thái nơng nghiệp ước tính định lượng suất, sản lượng lúa [16] Trong đó, việc ước tính sinh khối khơ hữu ích trường hợp ước tính lượng phát thải, đánh giá hậu việc đốt phế phụ phẩm nông nghiệp [1] Trong năm gần đây, thuật toán học máy khác phát triển nhanh (mạng nơ-ron nhân tạo - ANN, máy vectơ hỗ trợ - SVM, rừng ngẫu nhiên – RF, định – DT), phát triển để lập đồ ruộng lúa loại trồng khác [5], [6] Khả tổng quát hóa chống nhiễu phương pháp học máy chứng minh trường hợp liệu mẫu ít, thuật tốn học máy trở thành phương pháp hữu ích để xử lý liệu viễn thám lớn cung cấp giải pháp lĩnh vực nông nghiệp Hiện nay, thuật tốn học máy dựa mạng nơ-ron tích chập sâu (DCNN) TẠP CHÍ KHOA HỌC ĐO ĐẠC VÀ BẢN ĐỒ SỐ 49-9/2021 53 Nghiên cứu - Ứng dụng trở thành chủ đề nóng lĩnh vực này, cách sử dụng lớp tích chập phương pháp tổng hợp tối đa Mơ hình DCNN tự động trích xuất tính thơng tin từ ảnh gốc với xử lý từ siêu máy tính, cải thiện độ xác kết phân loại [5] Mục tiêu nghiên cứu tại: (1) Khám phá tính khả thi mơ hình DCNN trích xuất ruộng lúa với liệu từ hình ảnh SAR đa thời gian; (2) Ước tính định lượng sinh khối tươi lúa dựa mơ hình học máy hồi quy tuyến tính đa biến Cụ thể, nghiên cứu xây dựng mơ hình DCNN trích xuất diện tích ruộng lúa dựa mạng nơron tích chập chiều mạng nơ-ron tích chập đa chiều từ liệu Sentinel-1A đa thời gian hai vụ lúa (Đơng-Xn Hè-Thu) Cuối cùng, thời điểm bơng lúa non (thời kỳ phát triển lúa) sử dụng để ước tính định lượng sinh khối tươi lúa (AGBlúa) cho hai vụ lúa khu vực thành phố Hà Nội Dữ liệu phương pháp tiếp cận 2.1 Khu vực nghiên cứu Khu vực thành phố Hà Nội – vùng có nhiều lợi để phát triển nông nghiệp chất lượng cao, thành phố có diện tích lớn Việt Nam khoảng 3.360 km2 đồng thời thành phố có dân số mật độ cao thứ hai 63 tỉnh thành Việt Nam Nằm phía Tây Bắc trung tâm vùng đồng châu thổ sông Hồng, phạm vi từ 20°34' đến 21°18' vĩ độ Bắc từ 105°17' đến 106°02' kinh độ Đông, vùng tam giác châu thổ sông Hồng, đất đai màu mỡ trù phú (Hình 1) Hà Nội có hệ thống thủy văn dày bao gồm nhiều sông lớn nhỏ khác (sông Hồng, sông Đuống, sông Đà, sông Nhuệ, sông Cầu, sơng Đáy, sơng Cà Lơ) Hình 1: Khu vực nghiên cứu vị trí điểm đo đạc thực địa Hà Nội có đủ điều kiện để phát triển nông nghiệp đại, thị trường tiêu thụ loại lúa gạo chất lượng cao với số lượng lớn ổn định Nhưng diện tích gieo trồng lúa chất lượng cao địa bàn thấp, chưa đáp ứng nhu cầu người dân thành phố Mặc dù chuyển đổi cấu trồng lúa gạo trồng chủ lực sản xuất nông nghiệp Hà Nội Theo tổng cục thống kê, diện tích trồng lúa hàng năm Hà Nội có 150 nghìn đất trồng lúa, có nhiều điều 54 kiện thuận lợi để phát triển loại lúa chất lượng cao, phục vụ nhu cầu người dân Hà Nội có hai vụ lúa (Đơng-Xn Hè-Thu), đó, vụ lúa Đơng-Xn chiếm 40% diện tích gieo trồng lúa năm sản lượng đạt từ 45 - 47% tổng sản lượng lúa sản xuất năm Đây vụ lúa Hà Nội có vai trị quan trọng việc thực kế hoạch sản xuất lúa gạo [17] Trong nghiên cứu này, 45 ô tiêu chuẩn chọn để thực phép đo chiều cao TẠP CHÍ KHOA HỌC ĐO ĐẠC VÀ BẢN ĐỒ SỐ 49-9/2021 Nghiên cứu - Ứng dụng sinh khối lúa Mỗi tiêu chuẩn có diện tích 25m2 (5m×5m), mẫu chọn ngẫu nhiên phân bố toàn khu vực nghiên cứu Hơn nữa, ô mẫu chọn phải thuận tiện cho việc lại tiếp cận Từ tháng 12/2020 đến tháng 10/2021, có tổng cộng 24 khảo sát thực địa với chu kỳ lặp lại 12 ngày, trùng với thời điểm ngày thu ảnh vệ tinh sử dụng nghiên cứu Ngồi ra, thơng tin ngày gieo sạ, ngày thu hoạch thu thập để bao quát thay đổi ruộng lúa từ làm đất đến thu hoạch Những thông tin quan trọng để xác định giai đoạn sinh trưởng phát triển lúa, góp phần tăng độ xác cho ước tính định lượng AGBlúa 2.2 Xử lý liệu Sentinel-1A Các loại tán xạ bề mặt tán xạ khối phần khác lúa biểu ảnh Radar Tia Radar có khả đâm xuyên vào vòm lúa tương tác với thành phần Các tia Radar sau phản hồi trở lại đầu thu mang thông tin thực vật nhờ ước tính sinh khối thơng qua tín hiệu phản hồi sóng Radar Tán xạ lúa tổng tán xạ từ chế tán xạ ngược như: (i) Tán xạ trực tiếp cây; (ii) Tán xạ trực tiếp thân – mặt đất; (iii) Tán xạ thân cây; (iv) Tán xạ nhiều lần thân – mặt đất; (v) Suy giảm mặt đất; (vi) Tán xạ trực tiếp mặt đất (Hình 2) Hình 2: Tán xạ ngược tia Radar với lúa (Bên trái – trường hợp đất khơng có nước mặt; Bên phải – trường hợp đất có mặt nước) Để xử lý trích xuất ruộng lúa từ liệu Sentinel-1A, nghiên cứu sử dụng tổng cộng 24 cảnh ảnh Level-1 GRD (Ground Range Detected) với phân cực kép (VH VV), với thời gian truy cập lại khoảng 12 ngày cho hai vụ lúa (Đông-Xuân Hè-Thu) khu vực thành phố Hà Nội Do thời gian trồng lúa vụ Đông-Xuân từ tháng đến tháng năm, bao gồm ngày tháng (10, 31), tháng hai (12, 24), tháng ba (8, 20), tháng tư (1, 13, 25), tháng năm (7, 19, 31) Vụ Hè-Thu tháng sáu đến tháng mười, bao gồm ngày (3, 12, 24 - tháng sáu; 6, 18, 30 - tháng bảy; 11, 23 tháng tám; 4, 16, 28 - tháng chín; 10 - tháng mười) Quá trình tiền xử lý liệu ảnh thực phần mềm mã nguồn mở SNAP Desktop 8.0.5 minh họa theo sơ đồ Hình Hình 3: Sơ đồ bước tiền xử lý liệu Sentinel-1A TẠP CHÍ KHOA HỌC ĐO ĐẠC VÀ BẢN ĐỒ SỐ 49-9/2021 55 Nghiên cứu - Ứng dụng Trong thập kỷ trở lại đây, kỹ thuật khả liệu Sentinel-1A nghiên cứu để giám sát ước tính định lượng sinh khối trồng, với có nhiều thuật tốn xử lý ảnh sử dụng để xác định số vật lý nhạy cảm với thông tin lúa tính tốn từ phân cực (VH VV) đề xuất nhiều nghiên cứu [3], [4], [18], [19] Cấu trúc lúa (mở đóng) điều kiện mực nước vào ngày thu nhận tín hiệu, có ảnh hưởng đến khối lượng tán xạ ngược hai phân cực VH VV Trong nghiên cứu này, nhóm tác giả tính tốn lựa chọn số vật lý chiết tách từ liệu Sentinel-1A sau tham khảo nghiên cứu trước đây, bao gồm: VH, VV, VH-VV, VH+VV, VV-VH, VH×VV, (VH+VV)/2, sqrt(VV-VH), sqrt(VH×VV), sqrt(VV/VH) sqrt((VHVV)/(VH+VV)) tham gia vào mơ hình ước tính định lượng sinh khối lúa (Hình 4) Hình 4: Các số vật lý tính tốn từ ảnh Sentinel-1A 2.3 Mạng nơ-ron tích chập trích xuất ruộng lúa Trong mạng nơ-ron tích chập, liệu ảnh đầu vào coi ma trận giá trị pixel (đại diện cho giá trị xạ pixel định hình ảnh) Khơng mạng nơ-ron truyền thống khác (hình ảnh mạng chiều) Mơ hình DCNN xem xét mức độ liên quan đến không gian pixel với pixel lân cận Mạng nơ-ron tích chập sâu q trình trích xuất ruộng lúa bao gồm (i) Dữ ảnh đầu vào; (ii) Lớp tích chập; (iii) Lớp lấy mẫu; (iv) Lớp phân nhóm; (v) Lớp kết nối đầy đủ; (vi) Lớp đầu phân loại cuối (Hình 5) Hình 5: Minh họa cấu trúc mạng tích chập mơ hình học sâu DCNN sử dụng nghiên cứu C1 (mạng nơ-ron tích chập chiều), C2 (mạng nơ-ron tích chập đa chiều) 56 TẠP CHÍ KHOA HỌC ĐO ĐẠC VÀ BẢN ĐỒ SỐ 49-9/2021 Nghiên cứu - Ứng dụng Mạng nơ-ron tích chập chiều (C1) có cấu trúc đơn giản nhất, thường sử dụng cho liệu theo trình tự Mơ hình sử dụng nghiên cứu để trích xuất chuỗi chiều cục từ chuỗi liệu ảnh Sentinel-1A đầu vào xác định mẫu cục cửa sổ tích chập Thơng tin giá trị tán xạ ngược đối tượng lúa pixel xem xét mơ hình mạng nơ-ron tích chập chiều (C1 - Hình bên trên) bao gồm ba lớp tích chập, lớp làm phẳng, ba lớp kết nối đầy đủ Chức đơn vị tuyến tính chỉnh lưu (ReLU) sử dụng để tăng biểu thức phi tuyến mạng nơ-ron giải vấn đề độ chặt liệu Mạng nơ-ron tích chập đa chiều (C2 – Hình bên dưới) sử dụng xác định đối tượng lúa thông qua lọc tích chập di chuyển theo đa hướng để tính tốn đối tượng liên quan đến tính địa lý cấp cao từ tập hợp đối tượng cấp thấp Mơ hình mạng tích chập C2 có mối quan hệ không gian pixel trung tâm với pixel xung quanh hạn chế pixel không đồng khơng phải thơng tin tán xạ ngược tính tốn Cũng giống mơ hình C1, mơ hình C2 bao gồm lớp làm phẳng, ba lớp tích chập, ba lớp phân nhóm Để q trình xử lý khơng bị chậm hay tải, lớp chuẩn hóa thêm vào lớp kết nối đầy đủ Mô hình C2 sử dụng chức ReLU mơ hình C1 Hàm softmax sử dụng để trích xuất đối tượng ruộng lúa, hàm biến vector k chiều có giá trị thực thành vector k chiều có giá trị thực có tổng Giá trị nhập dương, âm, lớn 1, hàm softmax biến chúng thành giá trị nằm khoảng [0-1] Cuối cùng, hình ảnh chia thành nhiều có giá trị 1, thuật tốn phân loại hình ảnh có đối tượng ruộng lúa hay khơng có đối tượng ruộng lúa (Hình 5) 2.4 Mơ hình ước tính sinh khối lúa Một phương pháp phổ biến đánh giá hồi quy tuyến tính đa biến (multiple linear regression) phương pháp thống kê sử dụng biến tiên lượng khác để ước tính kết biến phụ thuộc (thay đổi ảnh hưởng tham số khác) [20] Trong nghiên cứu này, nhóm tác giả sử dụng mơ hình học máy hồi quy tuyến tính đa biến để đánh giá mức độ mối quan hệ số vật lý tính tốn từ ảnh Sentinel-1A sinh khối lúa đo đạc thực tế, việc ước tính định lượng sinh khối tươi lúa (AGBlúa) Trong phương pháp hồi quy tuyến tính đa biến, cần tính hai số định lượng giá trị đo giá trị tính tốn Đối với mơ hình hồi quy tuyến tính đa biến, nhóm tác giả sử dụng phương pháp học máy BMA (Bayesian Model Average) tích hợp phần mềm mã nguồn mở R-studio để ước tính định lượng AGBlúa Mơ hình sử dụng 70% số mẫu sinh khối tươi lúa đo đạc thực tế có giá trị từ 3,85 kg/m2 đến 7,46 kg/m2, trung bình 5,72 kg/m2 tham gia vào mơ hình tính tốn mối quan hệ thống kê 11 số tính tốn từ ảnh Sentinel-1A (Bảng 1) Bảng 1: Lựa chọn mơ hình tối ưu ước tính định lượng sinh khối lúa Mơ hình BMA với 11 biến phụ thuộc Intercept VH VV VH-VV VH+VV VV-VH VH×VV p!=0 EV SD Model Model Model Model Model 100 15,5 16,5 14,4 5,2 6,9 6,1 4,398e+00 -8,844e-03 2,673e-02 6,743e-03 -3,894e-04 -1,895e-03 -5,702e-05 1,31 0,04 0,08 0,02 0,01 0,01 0,00 4,01 - 4,24 0,04 - 4,74 0,05 - 4,03 -0,03 - 6,44 -0,11 0,26 - TẠP CHÍ KHOA HỌC ĐO ĐẠC VÀ BẢN ĐỒ SỐ 49-9/2021 57 Nghiên cứu - Ứng dụng (VH+VV)/2 sqrt(VV-VH) sqrt(VH×VV) sqrt(VV/VH) sqrt((VH-VV)/(VH+VV)) 100 8,1 8,4 100 91,1 2,406e-01 -6,037e-03 -5,056e-02 1,793e-01 4,212e+00 0,64 0,04 0,29 0,06 1,54 nVAR R2 BIC POST PROB Kết tính tốn với mơ hình học máy hồi quy tuyến tính đa biến lựa chọn mơ hình tối ưu với xác suất sau tích lũy 0,64 tổng số 74 mơ hình tính tốn, mơ hình xếp theo thứ tự ưu tiên, mơ hình thứ coi phù hợp để ước tính định lượng sinh khối tươi lúa khu vực nghiên cứu Do vậy, việc áp dụng hồi quy tuyến tính đa biến để ước tính định lượng sinh khối tươi lúa số vật lý khác Phương trình ước tính định lượng sinh khối tươi lúa sử dụng nghiên cứu có dạng tổng qt theo hàm cơng thức 𝐴𝐺𝐵𝑙ú𝑎 = 𝑥0 + 𝑥1 𝜎𝑚1 + 𝑥2 𝜎𝑚2 + 𝑥𝑛 𝜎𝑚𝑛 (1) Trong đó: 𝜎𝑚1 , 𝜎𝑚2 𝜎𝑚𝑛 số vật lý tính tốn từ liệu Sentinel1A 𝑥0 , 𝑥1 , 𝑥2 , 𝑥𝑛 hệ số mơ hình đa biến 2.5 Đánh giá độ xác mơ hình DCNN mơ hình ước tính sinh khối lúa Để đánh giá độ xác mơ hình DCNN trích xuất ruộng lúa nghiên cứu này, nhóm tác giả sử dụng độ xác tổng thể (OA), độ xác xác nhận chéo (CV) Trong đó, để đánh giá độ tin cậy mơ hình ước tính định lượng AGBlúa, nghiên cứu sử dụng hệ số xác định (R2) sai số bình phương trung bình (RMSE) 𝑂𝐴 = 58 𝐶𝑉 = 𝑇𝑃+𝑇𝑁 𝑇𝑁+𝑇𝑃+𝐹𝑁+𝐹𝑃 2×𝑇𝑃 𝑇𝑃 × (𝑇𝑃+𝐹𝑁) (𝑇𝑃+𝐹𝑃) 𝑇𝑃 𝑇𝑃 + (𝑇𝑃+𝐹𝑁) (𝑇𝑃+𝐹𝑃) (2) (3) 0,24 0,16 4,71 0,23 0,22 4,72 0,25 0,18 3,79 0,24 0,16 4,98 0,23 0,20 - 0,761 -50,69 0,336 0,755 -47,99 0,087 0,753 -47,72 0,076 0,752 -47,54 0,069 0,752 -47,51 0,068 𝑅𝑀𝑆𝐸 = √ ∑𝑛𝑖=1(𝑌𝑖 − 𝑋𝑖 )2 𝑅2 = 𝑛 ̅ ̅ ∑𝑛 𝑖=1[(𝑌𝑖 −𝑌𝑖 )(𝑋𝑖 −𝑋𝑖 )] (4) (5) 𝑛 ̅ ̅ √∑𝑛 𝑖=1(𝑌𝑖 −𝑌𝑖 ) ×√∑𝑖=1(𝑋𝑖 −𝑋𝑖 ) Trong đó: TP đối tượng ruộng lúa phân loại đúng; TN đối tượng ruộng lúa phân loại đúng; FP đối tượng ruộng lúa phân loại sai; FN đối tượng ruộng lúa phân loại sai 𝑌𝑖 , 𝑌̅𝑖 biến ước tính giá trị trung bình; 𝑋𝑖 , 𝑋̅𝑖 biến đo thực địa giá trị trung bình; n số lượng mẫu Hệ số xác định (R2) hệ số sử dụng rộng rãi mơ hình hồi quy với khoảng giá trị hệ số hồi quy biến thiên từ [01] Sai số bình phương trung bình (RMSE) hệ số phổ biến dùng để đo lường độ xác cho biến liên tục Một mơ hình đánh giá tối ưu chứa giá trị RMSE thấp hệ số xác định R2 cao Kết thảo luận 3.1 Diễn giải trình sinh trưởng phát triển lúa thực địa giá trị tán xạ ngược ảnh Sentinel-1A Hình Hình cho thấy giá trị tán xạ ngược theo thời gian ruộng lúa chọn sử dụng trình đào tạo phân loại ảnh cho phân cực VH VV Kết cho thấy phân cực VV cao VH theo quan sát Đặc điểm thời gian phân cực VH cho thấy thay đổi quán tán xạ ngược ghi lại ruộng lúa Chẳng hạn, giai đoạn đẻ nhánh chín lúa, tán xạ ngược TẠP CHÍ KHOA HỌC ĐO ĐẠC VÀ BẢN ĐỒ SỐ 49-9/2021 Nghiên cứu - Ứng dụng VH theo xu hướng tăng quán hệ số tán xạ ngược từ giai đoạn bắt đầu trổ đến giai đoạn lúa non (65 - 100 ngày), lúa đạt mức tăng trưởng cao bắt đầu vào giai đoạn chín, giá trị tán xạ ngược VH có xu hướng bão hịa (Hình 6) Điều không giống với giá trị tán xạ ngược phân cực VV đạt giá trị cực đại sớm giai đoạn địng (chuẩn bị trổ bơng) giảm dần xuống giai đoạn Lý cho gia tăng liên tục sơ đồ tán xạ ngược phân cực VH tín hiệu bị ảnh hưởng thay đổi bề mặt ngập nước, làm cho trở thành phân cực đáng tin cậy để xác định điều kiện sinh trưởng lúa [21] Hình 6: Quá trình sinh trưởng lúa giá trị tán xạ ngược phân cực VH Mặt khác, độ nhạy phân cực VV bề mặt ngập nước kết suy giảm mạnh thân lá, dễ dàng phát phân cực VV (Hình 7) Tuy nhiên, đặc trưng khác biệt điều kiện sinh trưởng lúa với phân cực VH VV, đưa thay đổi theo thời gian khác trình chuyển đổi giá trị tán xạ ngược đóng góp nhiều vào việc lập đồ ruộng lúa Sự thay đổi theo thời gian hệ số tán xạ ngược hoàn toàn phù hợp với thay đổi theo thời gian thu thông số sinh trưởng trình khảo sát thực địa Hình 7: Quá trình sinh trưởng lúa giá trị tán xạ ngược phân cực VV Trong nghiên cứu này, nhóm tác giả đánh giá đóng góp hai phân cực VH VV đa thời gian vào trình phân loại ruộng lúa cách tiếp cận Bởi hai phân cực VH VV có giá trị tán xạ ngược tăng mạnh giai đoạn sinh dưỡng, mặt khác có khác biệt giai đoạn sinh sản chín (giá trị tán xạ ngược phân cực VH tiếp tục phát triển nhẹ, giá trị tán xạ ngược VV giảm rõ rệt) Kết phân TẠP CHÍ KHOA HỌC ĐO ĐẠC VÀ BẢN ĐỒ SỐ 49-9/2021 59 Nghiên cứu - Ứng dụng loại theo mơ hình DCNN trình bày phần sau 3.2 Độ xác mơ hình DCNN Các phân loại mạng nơ-ron tích chập chiều (C1) đa chiều (C2) mơ hình DCNN với độ xác tổng thể (OA) xác nhận chéo (CV) đạt kết tốt 0,85 Trong đó, độ xác OA 0,89 CV 0,86 vụ Đông-Xuân vụ Hè-Thu đạt 0,87 (OA) 0,85 (CV) Bên cạnh đó, thời gian xử lý (thời gian đào tạo thử nghiệm) phân loại mạng nơ-ron tích chập C1 C2 theo mơ hình DCNN chấp nhận Hai đồ phân bố không gian ruộng lúa (Đông-Xuân HèThu) thành phố Hà Nội phân loại (Hình 8) Kết cho thấy, dựa liệu thực địa liệu thu thập, đồ diện tích lúa lập với ước tính diện tích gieo trồng lúa 81.251,4 (vụ Đông-Xuân) Theo kết thống kê Chi cục Thủy lợi Hà Nội, diện tích lúa vụ Đơng-Xn 2021 thành phố Hà Nội có khoảng 84.843,75 [17]; đối chiếu với diện tích lúa trích xuất từ ảnh Sentinel-1A cho kết đạt độ xác cao (95,77%) Trong đó, diện tích gieo trồng lúa vụ Hè-Thu 77.412,65 ha, 8.010,75 so với diện tích vụ Đơng-Xn Hình 8: Phân bố khơng gian diện tích gieo trồng vụ lúa Đông-Xuân (bên trái) Hè-Thu (bên phải) năm 2021 Dữ liệu Sentinel-1A sử dụng nghiên cứu cung cấp hệ thống giám sát sinh trưởng phát triển lúa theo thời gian, có khả giám sát diện rộng khu vực tồn cầu Do đó, việc sử dụng liệu SAR để lập đồ ruộng lúa cần phải sử dụng liệu đa thời gian [5], [18], [22] Với phát triển không ngừng thuật toán học máy, quy tắc học nội hệ thống phân cấp liệu mẫu, hoạt động tốt hầu hết thuật toán học máy so với thuật toán học máy truyền thống phân loại lớp phủ/sử dụng đất phân loại trồng [5] Đặc biệt, 60 với phát triển cơng nghệ 4.0 thuật tốn học sâu phát triển vượt trội so với thuật toán học máy truyền thống đa cấp độ (tốc độ xử lý nhanh, độ xác phân loại tốt hơn…) Trong đó, mơ hình DCNN sử dụng rộng rãi cộng đồng ứng dụng lĩnh vực xử lý ảnh đạt hiệu Trong nghiên cứu này, mơ hình tích hợp hai mạng nơ-ron tích chập chiều (C1) mạng nơ-ron tích chập đa chiều (C2) mơ hình DCNN sử dụng để phân loại ruộng lúa mang lại độ xác cao Đối với phân loại quy mô lớn, bối cảnh khơng gian địa lý đóng TẠP CHÍ KHOA HỌC ĐO ĐẠC VÀ BẢN ĐỒ SỐ 49-9/2021 Nghiên cứu - Ứng dụng vai trò quan trọng cung cấp thông tin đối tượng pixel mục tiêu Trong đó, khó để mơ tả đầy đủ thông tin đặc trưng đối tượng mặt đất với không gian độc lập pixel, với mạng nơ-ron tích chập sâu đa chiều sử dụng phép biến đổi phân loại tạo tính phức tạp phép tích chập có để đảm bảo mơ hình có đủ khả biểu đạt tổng qt hóa đối tượng 3.3 Phân tích định lượng sinh khối lúa không gian AGBlúa thành lập với độ xác kết xác minh cách so sánh với sinh khối lúa đo ngồi thực địa, mơ hình sử dụng 13/45 mẫu (khoảng 30%) lại chọn ngẫu nhiên để đánh giá độ xác mơ hình tính tốn AGBlúa Độ xác kết ước tính định lượng AGBlúa mức tốt Trong đó, AGBlúa vụ Đơng-Xn có hệ số R2=0,79; RMSE=0,12 kg R2=0,77; RMSE=0,15 kg AGBlúa vụ Hè-Thu Từ phương trình tính sinh khối tươi lúa theo hàm công thức Hai đồ phân bố 𝐴𝐺𝐵𝑙ú𝑎 = 4,01 + 0,24 × (𝑉𝑉+𝑉𝑉) + 0,16 × √ Bản đồ phân bố không gian AGBlúa (giai đoạn lúa non) khu vực thành phố Hà Nội phân loại thành năm lớp dựa thuật toán "natural break" hiệu chỉnh người có kiến thức chuyên môn lĩnh vực nông nghiệp, lớp sau: (i) AGBlúa 4,5 (kg/m2), (ii) AGBlúa từ 4,5-5,2 (kg/m2), (iii) AGBlúa từ 5,2-5,8 (kg/m2), (iv) AGBlúa từ 5,8-6,5 (kg/m2) (v) 6,5 (kg/m2) Kết cho thấy giá trị AGBlúa từ 5.8-6.5 (kg/m2) chiếm 𝑉𝑉 𝑉𝐻 + 4,71 × √ (𝑉𝐻−𝑉𝑉) (𝑉𝐻+𝑉𝑉) (6) diện tích lớn nhất, khoảng 46.457,34 (vụ Đơng-Xn), 38.598,58 (vụ Hè-Thu) AGBlúa > 6.5 (kg/m2) chiếm diện tích nhất, khoảng 1.458,89 (vụ Đông-Xuân) 2.724,63 (vụ Hè-Thu) Đối chiếu với kết đo lường cho thấy khả ứng dụng chuỗi liệu Sentinel-1A để theo dõi sinh trưởng ước tính định lượng AGBlúa đem lại kết tốt Hình minh họa phân bố không gian AGBlúa hai vụ Đông-Xuân Hè-Thu thành phố Hà Nội Hình 9: Phân bố không gian sinh khối lúa vụ Đông-Xuân (bên trái) Hè-Thu (bên phải) năm 2021 Lúa năm lương thực quan trọng giới, chủ yếu phát triển vùng nhiệt đới cận nhiệt đới Do đó, sản xuất lúa gạo đóng vai trị quan trọng an ninh lương thực tồn cầu đảm bảo phát triển bền vững Thành phố Hà Nội TẠP CHÍ KHOA HỌC ĐO ĐẠC VÀ BẢN ĐỒ SỐ 49-9/2021 61 Nghiên cứu - Ứng dụng vùng trồng lúa đồng sơng Hồng, với diện tích suất lúa cao Tìm hiểu phân tích phát triển lúa thành phố Hà Nội có ý nghĩa lớn phát triển kinh tế - xã hội thành phố Các thơng số sơ giúp nhà hoạch định sách lĩnh vực nông nghiệp xác định đắn sản xuất lúa gạo cung cấp an ninh lương thực, góp phần ước tính kịp thời dự báo đáng tin cậy suất lúa gạo Các nghiên cứu tương lai tập trung vào việc khai thác liệu Sentinel-1A để cải thiện mơ hình giám sát trồng nhằm ước tính định lượng suất tốt đưa chiến lược phát triển nông nghiệp bền vững Kết luận Trong nghiên cứu này, nhóm tác giả đề xuất lựa chọn tích hợp hai mạng nơ-ron tích chập chiều (C1) mạng nơ-ron tích chập đa chiều (C2) mơ hình DCNN để phân loại trích xuất khu vực ruộng trồng lúa cách sử dụng liệu Sentinel-1A đa thời gian khu vực thành phố Hà Nội Kết phân loại đạt kết tốt kết hợp hai mạng nơ-ron tích chập sâu, phương pháp đề xuất có ưu điểm tự động xác định thông tin không gian địa lý xung quanh đối tượng mục tiêu để dự đốn phần thơng tin tương tự Đây điểm mạnh thuật tốn học sâu, qua q trình học (training) với nhiều liệu, mơ hình sử dụng nghiên cứu có khả tính tốn thơng tin ruộng lúa với độ xác cao Bài báo tiến hành nghiên cứu tiềm liệu SAR băng tần C để ước tính định lượng sinh khối lúa Điều tạo điều kiện thuận lợi cho việc lập đồ xác thơng số lý sinh lúa tính tốn dự báo suất sản lượng khu vực Ngoài ra, nghiên cứu chứng minh việc sử dụng liệu Sentinel-1A phương pháp thay đáng tin cậy để theo dõi trạng thái sinh trưởng ước tính định lượng sinh khối lúa khu vực so với phương pháp 62 truyền thống (đo đạc chỗ) Kết cho thấy khả ứng dụng thuật toán học sâu sử dụng để theo dõi ngày gieo/cấy thu hoạch giai đoạn sinh trưởng với chuỗi liệu xử lý trước Các thông tin sinh trưởng sinh khối lúa có ý nghĩa quan trọng cơng tác quản lý nông nghiệp đại theo giai đoạn phát triển trồng. Lời cảm ơn Nghiên cứu tài trợ đề tài “Mạng nơ-ron tích chập sâu (CNN) phân loại lớp phủ mặt đất, sử dụng đất ảnh vệ tinh liệu từ thiết bị bay không người lái”, mã số: 105.99-2020.09 Tài liệu tham khảo [1] H A Le, D M Phuong, and L T Linh, “Emission inventories of rice straw open burning in the Red River Delta of Vietnam: Evaluation of the potential of satellite data,” Environ Pollut., vol 260, p 113972, May 2020, doi: 10.1016/j.envpol.2020.113972 [2] E Ndikumana et al., “Estimation of Rice Height and Biomass Using Multitemporal SAR Sentinel-1 for Camargue, Southern France,” Remote Sens., vol 10, no 9, p 1394, Sep 2018, doi: 10.3390/rs10091394 [3] L R Mansaray, K Zhang, and A S Kanu, “Dry biomass estimation of paddy rice with Sentinel-1A satellite data using machine learning regression algorithms,” Comput Electron Agric., vol 176, p 105674, Sep 2020, doi: 10.1016/j.compag.2020.105674 [4] Z Chao, N Liu, P Zhang, T Ying, and K Song, “Estimation methods developing with remote sensing information for energy crop biomass: A comparative review,” Biomass Bioenergy, vol 122, pp 414–425, Mar 2019, doi: 10.1016/j.biombioe.2019.02.002 [5] W Zhang, H Liu, W Wu, L Zhan, and J Wei, “Mapping Rice Paddy Based on Machine Learning with Sentinel-2 Multi-Temporal Data: TẠP CHÍ KHOA HỌC ĐO ĐẠC VÀ BẢN ĐỒ SỐ 49-9/2021 Nghiên cứu - Ứng dụng Model Comparison and Transferability,” Remote Sens., vol 12, no 10, p 1620, May 2020, doi: 10.3390/rs12101620 [6] A O Onojeghuo, G A Blackburn, Q Wang, P M Atkinson, D Kindred, and Y Miao, “Mapping paddy rice fields by applying machine learning algorithms to multi-temporal Sentinel1A and Landsat data,” Int J Remote Sens., vol 39, no 4, pp 1042–1067, Feb 2018, doi: 10.1080/01431161.2017.1395969 [7] P Arumugam, A Chemura, B Schauberger, and C Gornott, “Remote Sensing Based Yield Estimation of Rice (Oryza Sativa L.) Using Gradient Boosted Regression in India,” Remote Sens., vol 13, no 12, p 2379, Jun 2021, doi: 10.3390/rs13122379 [8] I W Nuarsa, F Nishio, and C Hongo, “Rice Yield Estimation Using Landsat ETM+ Data and Field Observation,” J Agric Sci., vol 4, no 3, p p45, Dec 2011, doi: 10.5539/jas.v4n3p45 [9] K Guan et al., “Mapping Paddy Rice Area and Yields Over Thai Binh Province in Viet Nam From MODIS, Landsat, and ALOS2/PALSAR-2,” IEEE J Sel Top Appl Earth Obs Remote Sens., vol 11, no 7, pp 2238– 2252, Jul 2018, doi: 10.1109/JSTARS.2018.2834383 [10] A Sharifi and M Hosseingholizadeh, “Application of Sentinel-1 Data to Estimate Height and Biomass of Rice Crop in Astaneh-ye Ashrafiyeh, Iran,” J Indian Soc Remote Sens., vol 48, no 1, pp 11–19, Jan 2020, doi: 10.1007/s12524-019-01057-8 [11] D Ho Tong Minh, E Ndikumana, G Vieilledent, D McKey, and N Baghdadi, “Potential value of combining ALOS PALSAR and Landsat-derived tree cover data for forest biomass retrieval in Madagascar,” Remote Sens Environ., vol 213, pp 206–214, Aug 2018, doi: 10.1016/j.rse.2018.04.056 [12] E Erten, J M Lopez-Sanchez, O Yuzugullu, and I Hajnsek, “Retrieval of agricultural crop height from space: A comparison of SAR techniques,” Remote Sens Environ., vol 187, pp 130–144, Dec 2016, doi: 10.1016/j.rse.2016.10.007 [13] M Jia, L Tong, Y Zhang, and Y Chen, “Rice Biomass Estimation Using Radar Backscattering Data at S-band,” IEEE J Sel Top Appl Earth Obs Remote Sens., vol 7, no 2, pp 469–479, Feb 2014, doi: 10.1109/JSTARS.2013.2282641 [14] S M Ghosh and M D Behera, “Aboveground biomass estimation using multisensor data synergy and machine learning algorithms in a dense tropical forest,” Appl Geogr., vol 96, pp 29–40, Jul 2018, doi: 10.1016/j.apgeog.2018.05.011 [15] H Cen et al., “Dynamic monitoring of biomass of rice under different nitrogen treatments using a lightweight UAV with dual image-frame snapshot cameras,” Plant Methods, vol 15, no 1, p 32, Dec 2019, doi: 10.1186/s13007-019-0418-8 [16] H M Naser, O Nagata, S Sultana, and R Hatano, “Carbon Sequestration and Contribution of CO2, CH4 and N2O Fluxes to Global Warming Potential from Paddy-Fallow Fields on Mineral Soil Beneath Peat in Central Hokkaido, Japan,” Agriculture, vol 10, no 1, p 6, Dec 2019, doi: 10.3390/agriculture10010006 [17] Tổng cục thống kê, “Dữ liệu Số liệu thống kê.” 2021 [Online] Available: https://www.gso.gov.vn/ [18] C Dineshkumar, J S Kumar, and S Nitheshnirmal, “Rice Monitoring Using Sentinel-1 Data in the Google Earth Engine Platform,” Proceedings, vol 24, no 1, p 4, Jun 2019, doi: 10.3390/IECG2019-06206 [19] O Yuzugullu, E Erten, and I Hajnsek, “Estimation of Rice Crop Height From X- and C-Band PolSAR by Metamodel-Based TẠP CHÍ KHOA HỌC ĐO ĐẠC VÀ BẢN ĐỒ SỐ 49-9/2021 63 Nghiên cứu - Ứng dụng Optimization,” IEEE J Sel Top Appl Earth Obs Remote Sens., vol 10, no 1, pp 194–204, Jan 2017, doi: 10.1109/JSTARS.2016.2575362 [20] M Van Pham et al., “Integrating Sentinel-1A SAR data and GIS to estimate aboveground biomass and carbon accumulation for tropical forest types in Thuan Chau district, Vietnam,” Remote Sens Appl Soc Environ., vol 14, pp 148–157, Apr 2019, doi: 10.1016/j.rsase.2019.03.003 “Monitoring rice growth status in the Mekong Delta, Vietnam using multitemporal Sentinel-1 data,” J Appl Remote Sens., vol 14, no 01, p 1, Mar 2020, doi: 10.1117/1.JRS.14.014518 [22] L Tan, Y Chen, M Jia, L Tong, X Li, and L He, “Rice biomass retrieval from advanced synthetic aperture radar image based on radar backscattering measurement,” J Appl Remote Sens., vol 9, no 1, p 097091, May 2015, doi: 10.1117/1.JRS.9.097091. [21] H.-P Phung, L.-D Nguyen, N.-H Thong, L.-T Thuy, and A A Apan, Summary Monitoring of rice paddy and estimating biomass based on machine learning algorithms to multi-temporal sentinel-1a data Do Thi Ngoc Anh, Nguyen Thi Thao Van, Nguyen Phuong Anh, Hoang Anh Le, Bui Quang Thanh, Pham Van Manh University of Science, Vietnam National University, Hanoi Pham Minh Hai Vietnam Institute of Geodesy and Cartography, Ministry of Natural Resources and Environment Synthetic aperture radar (SAR) remote sensing offers a flexible approach and brings the opportunity to collect crop information that is not limited by weather conditions The applicability of Sentinel-1 SAR data with dual-polarization enables the identification of individual rice fields, and with sufficient repeatability to monitor the growth status of different crops In recent years, with the continuous development of machine learning algorithms, deep learning in the world, especially convolutional neural networks (CNN), has obtained good results in detecting and extracting information on remote sensing images In this study, we propose a classification model based on deep convolutional neural network (DCNN) to extract rice fields from Sentinel-1 SAR data Physical indices were calculated from (VH and VV) polarization and a mobile team examined the growth morphology of rice plants The results were checked using visual field data with the overall accuracy, and cross-validation values of the rice parameters extracted were higher than 0.85 The accuracy of rice biomass estimation reached (R2=0.79, RMSE=0.12 kilograms) for the Winter-Spring crop and (R2=0.77, RMSE=0.15 kilograms) for the Summer-Autumn crop The results showed that Sentinel1 data could map the spatial distribution of retrieved rice biomass in various weather conditions The integrated methodology framework developed in this study can be applied to rice fields across Vietnam and similarly rice fields in the world. Keywords: Rice, Remote sensing, Sentinel-1 SAR, Convolutional neural network, Deep learning 64 TẠP CHÍ KHOA HỌC ĐO ĐẠC VÀ BẢN ĐỒ SỐ 49-9/2021 ... tích chập đa chiều từ liệu Sentinel- 1A đa thời gian hai vụ lúa (Đơng-Xn Hè-Thu) Cuối cùng, thời điểm lúa non (thời kỳ phát triển lúa) sử dụng để ước tính định lượng sinh khối tươi lúa (AGBlúa) cho... quan hệ số vật lý tính toán từ ảnh Sentinel- 1A sinh khối lúa đo đạc thực tế, việc ước tính định lượng sinh khối tươi lúa (AGBlúa) Trong phương pháp hồi quy tuyến tính đa biến, cần tính hai số định... đây, kỹ thuật khả liệu Sentinel- 1A nghiên cứu để giám sát ước tính định lượng sinh khối trồng, với có nhiều thuật tốn xử lý ảnh sử dụng để xác định số vật lý nhạy cảm với thơng tin lúa tính tốn