Dữ liệu nghiên cứu

Một phần của tài liệu HỘI THẢO QUỐC GIAGẮN KẾT ĐÀO TẠO, NGHIÊN CỨU KHOA HỌC VÀ CHUYỂN GIAO CÔNG NGHỆ LĨNH VỰC TÀI NGUYÊN VÀ MÔI TRƯỜNG VỚI THỰC TIỄN XÃ HỘI (Trang 78 - 83)

KHẢ NĂNG ỨNG DỤNG TẠI VIỆT NAM

2. Dữ liệu nghiên cứu

Trong nghiên cứu này, nhóm tác giả đã sử dụng sản phẩm là hai loại dữ liệu LULC toàn cầu (DW và VC) và một sản phẩm được phân loại trực tiếp trên GEE. Các lớp phủ được phân loại đều có nguồn gốc dữ liệu là ảnh vệ tinh Sentine - 2 với độ phân giải không gian 10 m.

Sản phẩm DW là bộ dữ liệu gần dữ liệu thời gian thực, trong khi các phương pháp tiếp cận truyền thống để xây dựng dữ liệu lớp phủ sử dụng đất có thể mất hàng tháng hoặc hàng năm để tạo ra. Đây là kết quả của việc tận dụng một phương pháp học sâu, dựa trên Sentinel - 2 TOA, DW cung cấp và cập nhật lớp phủ toàn cầu từ 2 đến 5 ngày một lần tùy thuộc vào vị trí. DW được thành lập dựa trên nền tảng dữ liệu điện toán đám mây của Google Earth Engine và mô hình AI.

Sản phẩm DW được xây dựng phù hợp với nguyên tắc AI của Google. DW được phát triển bằng cách sử dụng dữ liệu đào tạo của Hiệp hội Địa lý quốc gia (National Geographic Society). Tập dữ liệu này được thành lập bởi dự án hợp tác giữa Hiệp hội Địa lý Quốc gia và Google cùng với Viện Tài nguyên Thế giới (World Resources Institute). Sản phẩm bao gồm 9 loại lớp phủ được mô tả tại Bảng 1 dưới đây:

Bảng 1. Mô tả về các loại lớp phủ của DW

STT Tên lớp phủ Mô tả

1 Mặt nước Các vùng nước vĩnh viễn và theo mùa 2 Cây cối Bao gồm rừng nguyên sinh và rừng thứ sinh, cũng như rừng trồng quy

mô lớn 3 Cỏ Đồng cỏ tự nhiên, đồng cỏ chăn nuôi và công viên 4 Thảm thực vật ngập nước Rừng ngập mặn và các hệ sinh thái ngập nước khác 5 Cây trồng Bao gồm cây trồng và lúa

6 Cây bụi Cây bụi và các thảm thực vật thưa thớt đến rậm rạp 7 Khu vực xây dựng Các tòa nhà chung cư, đường xá, làng mạc

8 Sa mạc Đất trống và đá lộ thiên 9 Tuyết và băng Băng, tuyết phủ vĩnh viễn và theo mùa

Sản phẩm WC (ESA World Cover) đã được xác nhận độc lập bởi Đại học Wageningen. Sản phẩm WC 2020 đạt độ chính xác tổng thể là 74,4 %. Sản phẩm này từ sau hội nghị World Cover 2017 do Cơ quan Vũ trụ châu Âu (European Space Agency - ESA) là một tổ chức liên chính phủ được thành lập năm 1975 tổ chức, với các yêu cầu chính của dự án World Cover là tạo nhanh và xác nhận lớp phủ đất trên thế giới dựa trên các dữ liệu ảnh vệ tinh Sentinel - 2 và Sentinel - 1 với độ phân giải không gian 10 m. Các sản phẩm của WC cơ bản bao gồm 11 lớp phủ mô tả bề mặt trái đất với độ phân giải không gian là 10 m. Trong đó, bao gồm các lớp phủ: “Rừng”, “Cây bụi”,

“Đồng cỏ”, “Đất trồng trọt”, “Khu vực xây dựng”, “Cây cối trơ trụi/thưa thớt”, “Băng tuyết” ,

“Các vùng nước vĩnh viễn và theo mùa”, “Đất ngập nước cây cỏ”, “Rừng ngập mặn”, “Rêu và địa y”. Sản phẩm ESA WC đã được xác nhận độc lập bởi Đại học Wageningen (thống kê) và IIASA (không gian). Trong đó độ chính xác tổng thể là 74,4 % [7]. Tổ chức của sản phẩm WC được xây dựng dựa trên một nhóm các nhà cung cấp dịch vụ và tổ chức nghiên cứu lớn ở châu Âu đã có nhiều kinh nghiệm trong sản xuất và nghiên cứu, bao gồm tất cả việc lập bản đồ lớp phủ sử dụng đất. Các lớp phủ được mô tả ở Bảng 2.

Bảng 2. Mô tả về các loại lớp phủ của WC

STT Tên lớp phủ Mô tả

1 Rừng Các loại rừng cây, thực vật tập trung mật độ lớn 2 Vùng cây bụi Cây bụi nhỏ và các thảm cây bụi lớn

3 Đồng cỏ Đồng cỏ tự nhiên, đồng cỏ chăn nuôi và công viên

4 Đất trồng trọt Cây trồng và lúa

5 Tích hợp Bao gồm các loại lớp phủ khác

6 Cây cối trơ trọi /thưa thớt Cây bụi và các thảm thực vật thưa thớt đến rậm rạp 7 Băng tuyết Các tòa nhà chung cư, đường xá, làng mạc

8 Các vùng nước vĩnh viễn Tương tự mặt nước vĩnh viễn 9 Đất ngập nước cây cỏ Các vùng cây ngập nước vĩnh viễn và theo mùa

10 Rừng ngập mặn Rừng ngập mặn

11 Rêu và địa y Rêu và cây địa y

WC được đánh giá là một sản phẩm gồm các lớp phủ sử dụng đất toàn cầu cơ bản ở độ phân giải 10 m tương ứng với năm 2020 dựa trên dữ liệu Sentinel - 1 và Sentinel - 2 đã được phát triển và xác thực trong thời gian gần thực. Ngoài ra, nghiên cứu này cũng sử dụng dữ liệu ảnh vệ tinh Sentinel - 2 để phân loại lớp phủ sử dụng đất bao gồm 5 lớp phủ sử dụng đất cơ bản tại huyện Ba Vì, Hà Nội, Việt Nam cùng thời điểm 2020 với các sản phẩm trên để so sánh, phân tích khả năng ứng dụng của của các sản phẩm nghiên cứu [2].

3. Phương pháp nghiên cứu

Tổng quan phương pháp nghiên cứu được thể hiện như sơ đồ tại Hình 2. Trước hết, nhóm tác giả sử sụng nền tảng GEE và ngôn ngữ lập trình JavaScrip để trích xuất các dữ liệu toàn cầu DW, WC theo khu vực cần nghiên cứu. Cụ thể, nhóm tác giả đã thu nhận dữ liệu LULC của khu vực huyện Ba Vì, Hà Nội, Việt Nam của các sản phẩm toàn cầu là DW, WC dựa trên mô hình AI.

Tiếp theo, nhóm tác giả sử dụng thuật toán SVM phân loại ảnh Sentinel - 2 theo 5 lớp sử dụng đất cơ bản, bao gồm: Đất trống; Mặt nước; Khu vực xây dựng; Rừng; Cây bụi. Quy trình nghiên cứu được thể hiện tại Hình 2.

4. Kết quả nghiên cứu

Kết quả nghiên cứu này sử dụng sản phẩm DW và WC năm 2020 cùng với phân loại ảnh Sentinel - 2 năm 2020 để so sánh, đánh giá khả năng sử dụng của các sản phẩm. Các sản phẩm toàn cầu DW và WC đã được một số nghiên cứu đánh giá có khả năng sử dụng cho một số lĩnh vực cụ thể với mức độ tổng quan [7]. Đối với khu vực Ba Vì, nhóm tác giả sử dụng thuật toán SVM để thành lập các lớp phủ sử dụng đất với 5 lớp phủ sử dụng đất cơ bản như đã nêu ở trên, kết quả đánh giá độ chính xác phân loại dựa trên ma trận nhầm lẫn (Confusion - matrix) với các thông số như độ chính xác tổng thể (Overall Accuracy - OA) và hệ số Kappa. Trong đó hệ số Kappa có giá trị từ 0,4 đến 0,6 được đánh giá là đạt kết quả trung bình, giá trị từ lớn hơn 0,6 đến 0,8 là tốt và hơn 0,8 đến 1,0 là rất tốt [8]. Thực hiện đánh giá trên nền GEE với hàm errorMatrix, trong đó sử dụng 70 % số lượng mẫu dùng để phân loại ảnh và 30 % số lượng mẫu dùng để kiểm tra đánh giá. Cụ thể, kết quả đánh giá độ

chính xác đạt được giá trị OA và Kapa tương ứng là 0,96 và 0,92. Đây là các giá trị hoàn toàn có khả năng đáp ứng được yêu cầu trong phân loại các lớp phủ sử dụng đất từ dữ liệu ảnh vệ tinh.

Hình 2: Quy trình thực hiện so sánh các sản phẩm

Hình 3 thể hiện kết quả so sánh tỷ lệ các lớp phủ cơ bản là: Mặt nước; Đất trống; Khu vực xây dựng được phân loại theo các sản phẩm DW, WC - 2020 và sản phẩm được phân loại trên nền tảng GEE với thuật toán học máy SVM (GEE - SVM).

Hình 3: So sánh tỷ lệ các lớp phủ sử dụng đất cơ bản

Các kết quả trên có sự khác biệt rõ ràng giữa các sản phẩm DW, WC và nghiên cứu phân loại với thuật toán SVM trên nền tảng dữ liệu điện toán đám mây GEE. Trong đó, có sự chênh lệch lớn về lớp mặt nước của sản phẩm WC năm 2020 so với kết quả phân loại do nhóm tác giả thực

hiện, giá trị khác biệt của lớp mặt nước đạt tới 3,58 % so với tổng diện tích tự nhiên của khu vực nghiên cứu.

Bảng 3. Kết quả khác biệt giữa sản phẩm toàn cầu DW, WC và kết quả phân loại

theo thuật toán SVM trên nền GEE

Loại sản phẩm Mặt nước (%) Đất trống (%) Nhà cửa (%)

DW 0,3 1,13 -1,7

WC -3,58 2,62 -2,82

Sự khác biệt trên cũng có thể nhìn nhận một cách tương đối rõ ràng trên các hình ảnh của các sản phẩm phân loại lớp phủ sử dụng đất tại Hình 4.

a. Sản phẩm của DW b. Sản phẩm của VC-2020 c. Sản phẩm GEE-SVM Hình 4: Các sản phẩm LULC toàn cầu và kết quả thực hiện phân loại với thuật toán SVM

theo mô hình AI trên nền tảng dữ liệu điện toán đám mây GEE

Các khác biệt về kết quả phân loại giữa các sản phẩm có thể do nhiều nguyên nhân bao gồm cả khách quan và chủ quan. Từ Bảng 3 cho thấy kết quả tương đối gần nhau hơn giữa sản phẩm DW và GEE - SVM. Trong khi đó, sự khác biệt thể hiện là lớn hơn một cách rõ ràng giữa sản phẩm WC và GEE - SVM. Để so sánh các kết quả DW và WC và đánh giá độ tin cậy của sản phẩm nào tốt hơn với các điều kiện tại khu vực nghiên cứu tại thời điểm này là thực sự còn nhiều khó khăn. Có nhiều nguyên nhân tồn tại trong việc đánh giá độ tin cậy của các sản phẩm toàn cầu DW và WC để phục vụ các công tác nghiên cứu cũng như quản lý sử dụng. Một trong những nguyên nhân ban đầu là mỗi sản phẩm hướng đến một trong những mục tiêu sử dụng khác nhau, có các lớp phủ sử dụng đất khác nhau nên gây khó khăn trong việc đánh giá độ chính xác của sản phẩm.

Với 9 lớp phủ của sản phẩm DW, 11 lớp phủ của sản phẩm WC và 5 lớp phủ được phân loại bằng ảnh Sentinel - 2 tại khu vực Ba Vì, Hà Nội, Việt Nam là khó khăn trong đánh giá độ tin cậy phân loại các lớp phủ của sản phẩm DW và WC. Tuy nhiên nghiên cứu này cũng đã sử dụng 3 lớp phủ cơ bản trùng lặp với 3 lớp phủ của sản phẩm DW và WC để so sánh, đánh giá các kết quả như đã phân tích ở trên. Kết quả đánh giá cũng đã cho thấy được một số sự tương đồng của 3 sản phẩm.

Các khác biệt lớn giữa WC và GEE - SVM có thể do dữ liệu sử dụng của sản phẩm WC năm 2020 được phân loại và tổng hợp từ nhiều nguồn nghiên cứu khác như công bố của các nhà nghiên cứu nên khó đạt được sự thống nhất và nhất là khó có khả năng là sản phẩm được phân loại trong 1 thời điểm nhất định. Trong khi đó sản phẩm DW và GEE - SVM đều là sản phẩm được phân loại từ dữ

liệu ảnh vệ tinh Sentinel - 2 thu nhận ngày 21 tháng 3 năm 2020, đây cũng là các sản phẩm được coi như là sản phẩm gần thời gian thực (Near Real Time - NRT) nên khả năng tương đồng về kết quả phân loại có khả năng cao hơn như kết quả thể hiện tại Bảng 3.

5. Kết luận và đề xuất

Việc chuyển đổi phương pháp khai thác, phân tích dữ liệu ảnh vệ tinh trực tuyến và các sản phẩm toàn cầu phục vụ công tác quản lý đất đai đang ngày càng tỏ ra hiệu quả. Điều này cũng góp phần tích cực vào công cuộc chuyển đổi số nói chung hiện nay và của ngành quản lý đất đai nói riêng.

Sản phẩm WC năm 2020 là sản phẩm tổng hợp của phân loại từ ảnh vệ tinh Sentinel-2 và một số kết quả nghiên cứu khác, do đó cần có những nghiên cứu đánh giá chi tiết hơn về tính thống nhất và độ tin cậy của sản phẩm khi sử dụng cho các lĩnh vực cụ thể.

Sản phẩm DW là một trong nhưng sản phẩm về các lớp phủ sử dụng đất toàn cầu có nhiều ưu điểm như là gần thời gian thực, đây là một trong những yếu tố rất quan trọng trong các phân tích, đánh giá phục vụ công tác quản lý nhà nước về đất đai, môi trường.

Nghiên cứu này cũng cho thấy sự tương đồng về kết quả tốt hơn giữa sản phẩm DW và GEE - SVM so với kết quả phân loại lớp phủ sử dụng đất từ sản phẩm WC 2020 và GEE-SVM.

Các kết quả phân loại ảnh đã được đánh giá và thể hiện được độ tin cậy, tuy nhiên để có những căn cứ chắc chắn hơn nữa, các nghiên cứu sau này nên có sự so sánh với các loại bản đồ như là bản đồ hiện trạng sử dụng đất qua các thời kỳ.

Ngoài ra, để nâng cao hơn nữa hiệu quả sử dụng các sản phẩm toàn cầu phục vụ công tác nghiên cứu, quản lý đất đai một cách nhanh chóng, chính xác, cần có những nghiên cứu đánh giá cụ thể của từng loại sản phẩm DW và WC cho từng loại lớp phủ và đối với từng khu vực khác nhau.

TÀI LIỆU THAM KHẢO

[1]. Bùi Thị Hồng Thắm, Trịnh Thị Thu (2020). Phân loại đối tượng chiết tách lớp phủ bề mặt tại khu vực

Công viên Địa chất toàn cầu non nước Cao Bằng dựa trên nền tảng điện toán đám mây. Tạp chí Khoa học

Tài nguyên và Môi trường, 31, 65.

[2]. Đặng Thanh Tùng (2021). Khai thác trực tuyến cơ sở dữ liệu ảnh vệ tinh, so sánh thuật toán học máy

về phân loại lớp phủ trên nền Google Earth Engine. Kỷ yếu Hội thảo Quốc gia giải pháp kết nối và chia

sẻ hệ thống cơ sở dữ liệu phục vụ công tác đào tạo, quản lý lĩnh vực tài nguyên và môi trường. Nxb. Khoa học và Công nghệ, Hà Nội, tr. 192.

[3]. Lewis, R. J. (2000). An introduction to classification and regression tree (CART) analysis. In Annual meeting of the society for academic emergency medicine in San Francisco, California (Vol. 14). Citeseer.

[4]. Mirmazloumi, S. M.; Kakooei, M.; Mohseni, F.; Ghorbanian, A.; Amani, M.; Crosetto, M.; Monserrat, O. (2022). ELULC - 10, a 10 m European land use and land cover map using Sentinel and Landsat data in

Google Earth Engine. Remote Sens. 14, 3041. https://doi.org/10.3390/rs14133041.

[5]. Breiman L. J. M. (2001). Random forests. Kluwer Academic Publishers. Manufactured in The

Netherlands, 45(5).

[6]. Cortes C. and V. Vapnikl (1995). Support - vector networks. J Machine learning, Kluwer Academic

Publishers, Boston. Manufactured in The Netherlands, 20, 273.

[7]. Venter, Z.S.; Barton, D.N.; Chakraborty, T.; Simensen, T.; Singh, G (2022). Global 10 m land use land

cover datasets: A Comparison of Dynamic World, World Cover and Esri Land Cover. Remote Sens. 14,

4101. https://doi.org/10.3390/rs14164101.

[8]. Visa S., B. Ramsay, A. L. Ralescu and E. J. M. Van Der Knaapl (2011). Confusion matrix-based feature

selection. 710, 120.

BBT nhận bài: 20/9/2022; Chấp nhận đăng: 31/10/2022

Một phần của tài liệu HỘI THẢO QUỐC GIAGẮN KẾT ĐÀO TẠO, NGHIÊN CỨU KHOA HỌC VÀ CHUYỂN GIAO CÔNG NGHỆ LĨNH VỰC TÀI NGUYÊN VÀ MÔI TRƯỜNG VỚI THỰC TIỄN XÃ HỘI (Trang 78 - 83)

Tải bản đầy đủ (PDF)

(504 trang)