1. Trang chủ
  2. » Khoa Học Tự Nhiên

Nghiên cứu cơ sở khoa học ứng dụng thuật toán random forest trong phân loại ảnh vệ tinh SPOT6 với khu vực thực nghiệm tại tỉnh Cà Mau

5 25 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Trong phạm vi bài viết này, nhóm nghiên tiến hành thử nghiệm một thuật toán của phương pháp học máy (Machine Learning) trong phân loại rừng ngập mặn trên ảnh vệ tinh SPOT6 với khu vực thử nghiệm tại Tỉnh Cà Mau.

Kỷ yếu Hội nghị: Nghiên cứu “Khoa học Trái đất Môi trường” DOI: 10.15625/vap.2019.000155 NGHIÊN CỨU CƠ SỞ KHOA HỌC ỨNG DỤNG THUẬT TOÁN RANDOM FOREST TRONG PHÂN LOẠI ẢNH VỆ TINH SPOT6 VỚI KHU VỰC THỰC NGHIỆM TẠI TỈNH CÀ MAU Phạm Minh Hải1, Đỗ Thị Hoài1, Bùi Quang Thành2, Nguyễn Ngọc Quang3 Viện Khoa học Đo đạc Bản đồ, Bộ Tài Nguyên Môi trường Email: pmhai@monre.gov.vn, haialas@yahoo.com Trường Đại học Khoa học Tự nhiên, ĐHQG Hà Nội Email: qthanh.bui@gmail.com Cục Viễn thám Quốc gia, Bộ Tài Nguyên Môi trường Email: quangavril@yahoo.com TÓM TẮT Random forest (RF) phương pháp học máy (machine learning statistic) dùng để phục vụ mục đích phân loại, tính hồi quy nhiệm vụ khác cách xây dựng nhiều định (Decision tree) Trong phạm vi báo này, nhóm nghiên tiến hành thử nghiệm thuật tốn phương pháp học máy (Machine Learning) phân loại rừng ngập mặn ảnh vệ tinh SPOT6 với khu vực thử nghiệm Tỉnh Cà Mau Kết thực nghiên cứu đạt điểm là: ứng dụng thành công phương pháp học máy (RF) phân loại ảnh viễn thám; khả phương pháp phân loại chi tiết theo loài thực vật rừng ngập mặn khu vực thực nghiệm Từ khóa: Viễn thám, rừng ngập mặn, random forest GIỚI THIỆU Từ trước đến nay, để chiết tách thông tin ảnh viễn thám, việc ứng dụng thuật toán có kiểm định K-Nearest Neighbors (KNN) trở nên phổ biến K-Nearest Neighbors phương pháp để phân lớp đối tượng dựa vào khoảng cách gần đối tượng cần xếp lớp (Query point) tất đối tượng mẫu (Training Data) Tuy nhiên nay, nhà nghiên cứu phát triển nhiều thuật toán mới, phức tạp, mạnh mẽ hiệu Một số Random Forest Thuật tốn cho phép người xác định xác thông tin phân loại thống kê dựa vào tập liệu khổng lồ Trong phạm vi báo này, nhóm nghiên cứu tiến hành thử nghiệm thuật toán phương pháp học máy (Machine Learning) - RF phân loại rừng ngập mặn ảnh viễn thám SPOT6 với khu vực thử nghiệm Tỉnh Cà Mau PHƯƠNG PHÁP LUẬN CỦA NGHIÊN CỨU Random forest phương pháp thống kê mơ hình hóa máy (machine learning statistic) dùng để phục vụ mục đích phân loại, tính hồi quy nhiệm vụ khác cách xây dựng nhiều định (Decision tree) [1] Mỗi Node thuộc tính, nhánh giá trị lựa chọn thuộc tính Từ hình thấy Random Forest cấu thành số định Thuật toán lấy mẫu cho phương pháp random forest ứng dụng cho phương pháp sử dụng thuật tốn mơ tả thống kê để ước lượng số lượng từ mẫu liệu (bagging) Một tập mẫu X = x1, , xn với câu trả lời Y = y1, , yn, lấy giá trị trung bình (B lần), chọn mẫu ngẫu nhiên từ mẫu phù hợp với định: Lặp b = 1,…, B; n mẫu từ giá trị tọa độ (X, Y); gọi (Xb, Yb); lớp liệu hay kết hồi quy fb biến Xb, Yb; 361 Hồ Chí Minh, tháng 11 năm 2019 Cây Cây Cây Tổng hợp để phân lớp hay chia trung bình để tính hồi quy Hình Sơ đồ biểu diễn định phương pháp random forest [1] Sau lấy mẫu, phép tính tốn cho mẫu ẩn số x’ thực cách lấy trung bình giá trị nội suy từ tất hồi quy riêng lẻ biến x' lấy giá trị từ đa số mẫu định: ∑ Random forest xếp quan trọng biến tốn phân loại hay hồi quy, mơ tả nghiên cứu Breiman, xác định biến quan trọng tập liệu làm phù hợp phương pháp random forest với tập liệu: Để xác định tính quan trọng đối tượng thứ i sau lấy mẫu, giá trị mẫu i hoán vị tập mẫu lỗi dự báo tính tốn lại tập liệu Độ quan trọng đối tượng tính điểm, điểm tính tốn cách lấy trung bình độ chênh lệch lỗi dự báo trước sau hốn vị Các đối tượng có giá trị lớn xếp quan trọng điểm có giá trị nhỏ KẾT QUẢ VÀ THẢO LUẬN 3.1 Dữ liệu đầu vào khu vực thực nghiệm a Khu vực thực nghiệm Khu vực thử nghiệm nghiên cứu thuộc huyện Đầm Dơi Ngọc Hiển Tỉnh Cà Mau Hình Phạm vi khu vực thực nghiệm (Ảnh SPOT6 band 3,2,1) b Dữ liệu đầu vào công tác tiền xử lý ảnh Bài báo thực với liệu ảnh vệ tinh SPOT6 chụp thời điểm năm 2015 Dữ liệu cung cấp Đài thu Viễn thám Quốc Gia, Cục Viễn thám Quốc Gia, Bộ Tài Nguyên Môi Trường Ảnh vệ tinh đề tài có độ phủ mây nhỏ 10%, hiệu chỉnh xạ khí công cụ ATCOR (Atmospheric correction) phần mềm PCI Geomatic 2018 Quá trình tiền xử lý ảnh gồm bước: Hiệu chỉnh xạ trước đầu thu; hiệu chỉnh xạ ảnh hưởng mây; hiệu chỉnh ảnh hưởng khí Nhóm thực hiền nghiên cứu tiến hành cơng tác nắn chỉnh 362 Kỷ yếu Hội nghị: Nghiên cứu “Khoa học Trái đất Mơi trường” hình học trộn ảnh độ phân giải 2.5m Ảnh nắn hệ tọa độ WGS84 hệ quy chiếu UTM múi 48 Để đánh giá độ xác kết thực hiện, nhóm thực đề tài sử dụng đồ kiểm kê rừng khu vực nghiên cứu thành lập năm 2015 3.2 Kết thực Nhóm thực đề tiến hành để thu thập mẫu giải đoán ảnh khu vực nghiên cứu Công tác thu thập mẫu tiến hành phương pháp thực địa phần mềm Google Earth Hệ thống giải xây dựng thê bảng Bảng Hệ thống giải xây dựng STT Mã Chú giải RNMG Rừng ngập mặn giàu RNMTB Rừng ngập mặn trung bình RNMPH Rừng ngập mặn phục hồi DTR Đất trống, bãi cát MN Mặt nước DNN Đất NN, NTTS Trong đó, tập liệu sau giải đốn chia thành phần với số lượng điểm bố trí điểm thể hình Trong đó, 70% mẫu sử dụng mẫu huấn luyện để phân loại (training data), 30 % mẫu lại sử dụng mẫu kiểm chứng kết phân loại (testing data) Sử dụng thuật toán Random Forest liệu ảnh SPOT6, nhóm thực nghiên cứu xây dựng trạng rừng ngập mặn khu vực thực nghiệm với đối tượng ngậm mặn chia thành loại như: mắm, đước, hỗn giao.v.v Nhóm thực xây dựng trạng trữ lượng rừng ngập mặn theo loài khu vực thực nghiệm Nhằm đánh giá độ xác kết phân loại ảnh, nhóm thực đề tài tiến hành so sánh mắt thường ranh giới khu vực rừng ngập mặn kết phân loại ảnh đồ kiểm kê rừng thời kỳ Kết cho thấy, kết phân loại ảnh cho độ xác cao với mức độ chi tiết đường ranh giới khu vực rừng ngập mặn cao Ngược lại, nhiều khu vực có đường ranh giới khu vực rừng ngập mặn đồ kiểm kê rừng thời kỳ bị khái quát hóa cao thành lập phản ánh khơng xác vị trí ranh giới khu vực rừng ngập mặn Kết đánh giá độ xác kiểm chứng với 109 điểm kiểm chứng sau: Độ xác tổng thể đạt 83%, kết phân loại rừng đước cho độ xác cao độ xác pixel độ xác tổng thể, rừng hỗn giao đước, mắm có độ xác tổng thể đạt 74%, mắm có độ xác pixel đạt 68 % chưa tách lớp khác bị lẫn vào điểm ảnh Hình Kết phân loại ảnh sử dụng thuật toán Random Forest 363 Hồ Chí Minh, tháng 11 năm 2019 Bản đồ kiểm kê rừng 2015 Kết phân loại ảnh SPOT6 2015 Hình Minh họa so sánh đánh giá độ xác kết phân loại ảnh đồ kiểm kê rừng thời kỳ KẾT LUẬN Qua công tác nghiên cứu khảo sát cho thấy, việc nghiên cứu ứng dụng phương pháp Randon Forest phân loại ảnh viễn thám có sở khoa học thực tiễn, mang lại độ xác cao với chi phí thấp với phương pháp phân loại có kiểm định truyền thống Kết thực nghiên cứu đạt điểm là: ứng dụng thành công phương pháp học máy (RF) phân loại ảnh viễn thám, khả phương pháp phân loại chi tiết theo loài thực vật rừng ngập mặn khu vực thực nghiệm Nghiên cứu thực đạt kết định, nhiên nhóm nghiên cứu có số kiến nghị cần nghiên cứu tiếp để có kết có độ xác cao Đó là: 1) Sử dụng ảnh RADAR để phản ảnh cấu trúc đứng rừng ngập mặn; 2) Sử dụng yếu tố kiến trúc ảnh (image texture) số hình dạng (shape index) phân loại kiểu rừng; 3) Thiết kế điểu khảo sát, OTC để xác định loài, cấu trúc rừng, trữ lượng rừng để phân loại, kiểm chứng từ ảnh vệ tinh TÀI LIỆU THAM KHẢO [1] Sesnie, S.E.; Gessler, P.E.; Finegan, B.; Thessler, S Integrating Landsat TM and SRTM-DEM derived variables with decision trees for habitat classification and change detection in complex neotropical environments (2018) Remote Sens Environ, 112, 2145–2159 [2] Rodriguez-Galiano, V.F.; Ghimire, B.; Rogan, J.; Chica-Olmo, M.; Rigol-Sanchez, J.P (2012) An assessment of the effectiveness of a random forest classifier for land-cover classification ISPRS J Photogramm Remote Sens, 67, 93–104 [3] Hai., P.M (2016) “Nghiên cứu đề xuất giải pháp nâng cao độ xác cơng tác phân loại ảnh khu vực có lớp phủ hỗn hợp-Cơ sở khoa học”, Tạp chí Khoa học Đo đạc Bản đồ, Số 29(9)/2016 364 Kỷ yếu Hội nghị: Nghiên cứu “Khoa học Trái đất Môi trường” RESRACHING ON THE METHODOLOGY OF APPLYING RANDOM FOREST IN SPOT6 SATELLITE IMAGE CLASSIFICATION WITH THE CASE IN CAMAU PROVINCE Pham Minh Hai1, Do Thi Hoai1, Bui Quang Thanh2, Nguyen Ngoc Quang3 Vietnam Institute of Geodesy and Cartography, Ministry of Natural Resources and Environment, Emails: pmhai@monre.gov.vn, haialas@yahoo.com VNU Univeristy Science, Email: qthanh.bui@gmail.com Department of National Remote Sensing, Email: quangavril@yahoo.com ABSTRACT Random forest (RF) is a machine learning algorith, which used for the purposes of classification and regression by constructing the decision trees The objective of this research was to investigate the ability of an algorithm of Machine Learning method (RF) in classifying SPOT6 satellite image with the study area in Ca Mau Province The results of the study have achieved two new points: the successful application of machine learning (RF) in remote sensing image classification, and the ability of the classification method to magrove species in the study area Key words: Remote sensing, mangrove, random forest 365 ... 3.1 Dữ liệu đầu vào khu vực thực nghiệm a Khu vực thực nghiệm Khu vực thử nghiệm nghiên cứu thuộc huyện Đầm Dơi Ngọc Hiển Tỉnh Cà Mau Hình Phạm vi khu vực thực nghiệm (Ảnh SPOT6 band 3,2,1) b... chứng kết phân loại (testing data) Sử dụng thuật toán Random Forest liệu ảnh SPOT6, nhóm thực nghiên cứu xây dựng trạng rừng ngập mặn khu vực thực nghiệm với đối tượng ngậm mặn chia thành loại. .. tác nghiên cứu khảo sát cho thấy, việc nghiên cứu ứng dụng phương pháp Randon Forest phân loại ảnh viễn thám có sở khoa học thực tiễn, mang lại độ xác cao với chi phí thấp với phương pháp phân loại

Ngày đăng: 08/10/2021, 15:09

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w