Bài viết Khai thác trực tuyến cơ sở dữ liệu ảnh vệ tinh, so sánh thuật toán học máy về phân loại lớp phủ trên nền Google Earth Engine tiến hành khai thác dữ liệu ảnh vệ tinh trực tuyến trên nền GEE, sử dụng ngôn ngữ JavaScript xây dựng chương trình tính toán và so sánh kết quả của việc sử dụng các thuật toán SVM, Cart và RF đối với khu vực nghiên cứu là huyện Ba Vì, thành phố Hà Nội.
KHAI THÁC TRỰC TUYẾN CƠ SỞ DỮ LIỆU ẢNH VỆ TINH, SO SÁNH THUẬT TOÁN HỌC MÁY VỀ PHÂN LOẠI LỚP PHỦ TRÊN NỀN GOOGLE EARTH ENGINE Đặng Thanh Tùng1, Nguyễn Thanh Tùng1, Hoàng Thị Thủy2 Tăng Thị Thanh Nhàn1, Đặng Thu Hằng1, Võ Ngọc Hải1 Nguyễn Dũng Dương1 Trường Đại học Tài nguyên Môi trường Hà Nội Trường Đại học Mỏ - Địa chất Tóm tắt Việc khai thác liệu ảnh vệ tinh trực tuyến từ Google Earth Engine đến phát huy hiệu cao công tác phân loại lớp phủ bề mặt đất Nghiên cứu sử dụng thuật toán Support Vector Machine (SVM), Classification and regression tree (Cart) Random Forest (RF) để phân loại lớp phủ bề mặt ảnh vệ tinh Landsat Kết có khác biệt rõ ràng thuật toán cho thấy thuật toán RF có khả phân loại nhạy cảm lớp phủ đất nông nghiệp khu vực nghiên cứu Ngồi ra, thuật tốn Cart đánh giá có độ tin cậy phân loại cao so với hai thuật tốn RF SVM Từ khóa: Landsat; Phân loại lớp phủ; Google Earth Engine; Thuật toán SVM; Cart; RF Abstract Online data mining of satellite images, comparison of machine learning algorithms on land cover classification based on Google Earth Engine The data mining of satellite images from Google Earth Engine has been highly effective in classifying land cover This study used Support Vector Machine (SVM), Classification and regression tree (Cart), and Random Forest (RF) algorithms to classify basic land covers on the Landsat satellite images The results for the study area show a clear difference between the above algorithms, and also show that the RF algorithm can classify more sensitively for agricultural cover in the study area In addition, the Cart algorithm is evaluated to have more reliability than the RF, and SVM algorithms in the land cover classification Keywords: Landsat; Land cover; Google Earth Engine; SVM; Cart; RF algorithms Mở đầu Cho đến nay, có nhiều thuật tốn ứng dụng cách hiệu việc phân loại lớp phủ bề mặt đất từ ảnh vệ tinh Maximum Likelihood Classifier (MLC), Minimum Distance Classifier (MDC), K-Nearest Neighbor (KNN), Support Vector Machine (SVM), Classification and regression tree (Cart) Random Forest (RF), Trong đó, thuật tốn Cart, RF SVM thuật toán áp dụng cho việc học máy sử dụng nhiều khai phá sở liệu ảnh vệ tinh trực tuyến từ Google Earth Engine (GEE) Hiện nay, có nghiên cứu Việt Nam giới cho thấy tính hiệu việc khai thác thuật toán SVM, Cart RF cách đơn lẻ đánh giá độ tin cậy thuật toán nêu việc ứng dụng để phân loại lớp phủ bề mặt đất từ ảnh vệ tinh [1, 2, 3] Tuy nhiên, kết phân loại lớp phủ bề mặt đất từ ảnh vệ tinh phụ thuộc nhiều yếu tố điều kiện tự nhiên, vị trí địa lý, khí hậu, khu vực nghiên cứu, chất lượng ảnh, thời điểm thu nhận ảnh, loại ảnh, độ phân giải không gian công tác lấy mẫu, đặc biệt thuật tốn sử dụng cơng tác xử lý, phân loại ảnh 192 Giải pháp kết nối chia sẻ hệ thống sở liệu phục vụ công tác đào tạo, quản lý lĩnh vực tài nguyên môi trường Để đánh giá rõ kết phân loại lớp phủ bề mặt đất, nghiên cứu tiến hành khai thác liệu ảnh vệ tinh trực tuyến GEE, sử dụng ngôn ngữ JavaScript xây dựng chương trình tính tốn so sánh kết việc sử dụng thuật toán SVM, Cart RF khu vực nghiên cứu huyện Ba Vì, thành phố Hà Nội Dữ liệu khu vực nghiên cứu Khu vực nghiên cứu lựa chọn huyện Ba Vì, thành phố Hà Nội, có tọa độ địa lý trung tâm khu vực 21010’00”; 105024’00”, diện tích khoảng 427.3 km2, dân số 282.600 người Mật độ dân số đạt 660 người/km², khí hậu hàng năm có hai mùa rõ rệt mùa mưa (từ tháng đến tháng 11) mùa khô (từ tháng 12 đến tháng 3) Đặc biệt, có khu vực Vườn quốc gia Ba Vì có 3/5 núi cao với độ cao trung bình 1.000 m so với mực nước biển Khu vực Vườn quốc gia với khí hậu mát mẻ, thường có nhiều mây che phủ, có biến động lớp phủ rừng điều kiện rõ ràng, tương đối ổn định liệu đầu vào để so sánh, đánh giá kết phân loại thuật toán Cart, RF SVM Trong nghiên cứu này, nhóm tác giả sử dụng tư liệu ảnh vệ tinh Landsat khai thác trực tuyến tảng GEE Để đảm bảo tăng cường độ tin cậy việc phân loại lớp phủ, nhóm tác giả ưu tiên lựa chọn ảnh có chất lượng rõ ràng, độ phủ mây thấp Kết lựa chọn ảnh Landsat thu nhận thời điểm ngày 30 tháng năm 2019, liệu lọc, xử lý khoảng thời gian từ 2019 đến 2021, từ đó, cảnh ảnh có chất lượng tốt, hình ảnh rõ ràng với độ phủ mây thấp, khoảng 0,12 % lựa chọn để tiến hành nghiên cứu Hình thể ảnh vệ tinh khu vực nghiên cứu Hình 1: Ảnh Landsat ngày 30/9/2019 khu vực Ba Vì Phương pháp nghiên cứu Sử dụng thuật toán Cart, RF SVM để tính tốn, phân loại lớp phủ bề mặt cho liệu đầu vào ảnh vệ tinh Landsat Việc phân loại ảnh theo thuật tốn nêu thực ngơn ngữ lập trình JavaScript hệ thống sở liệu trực tuyến GEE Đối với nghiên cứu khu vực này, nhóm tác giả lựa chọn năm lớp phủ để phân loại bao gồm: Giải pháp kết nối chia sẻ hệ thống sở liệu phục vụ công tác đào tạo, quản lý lĩnh vực tài nguyên môi trường 193 (1) Lớp phủ Đất trống, (2) Lớp phủ Mặt nước, (3) Lớp phủ Rừng, (4) Lớp phủ Nông nghiệp, (5) Lớp phủ Cơng trình xây dựng Các lớp phủ lựa chọn để phân loại trạng thời điểm thu nhận ảnh, với lớp Đất trống điểm lấy mẫu phân loại chọn khu vực đất cát, bãi bồi, đường đất, đường giao thông, khu vực san lấp khu vực đồng ruộng, vườn tược trống trồng thu hoạch Lớp phủ Mặt nước gồm khu vực ao hồ, sông suối, kênh mương Lớp phủ Rừng bao gồm khu vực có cối dày đặc, phủ kín khu vực Vườn quốc gia Ba Vì Lớp phủ Nơng nghiệp khu vực canh tác đồng ruộng, vườn tược có cối chưa khai thác Lớp phủ Cơng trình xây dựng gồm: nhà cửa, cơng trình xây dựng độc lập khu vực nhà cửa, công trình xây dựng làng mạc, khu dân cư, khu du lịch, Số lượng 460 điểm lấy mẫu khu vực nghiên cứu xếp theo loại lớp phủ từ đến là: 111, 100, 68, 98, 83 vị trí lấy mẫu Các bước phân loại tiến hành theo hình minh họa (Hình 2) Trong bao gồm: Thu thập liệu ảnh Landsat (level 1T) từ GEE; lọc lựa chọn ảnh có độ phủ mây thấp nhất; lấy mẫu theo vị trí để phục vụ phân loại; phân loại theo thuật toán Cart, RF SVM; thu nhận kết ảnh phân loại theo thuật tốn Cart, RF SVM; đánh giá độ xác ảnh sau phân loại theo thuật toán trên; so sánh kết ảnh sau phân loại thuật tốn Hình 2: Sơ đồ quy trình phân loại ảnh Các thuật toán sử dụng phân loại nghiên cứu bao gồm Cart, RF SVM trình bày theo nội dung đây: 3.1 Thuật toán Cart Thuật toán Cart thuật toán học máy có giám sát hệ thống phân loại dựa định (Decision tree) sử dụng mẫu huấn luyện để xác định, nhận dạng, phân loại đối tượng ảnh viễn thám Cart sử dụng rộng rãi để phân loại viễn thám, cịn gọi phân loại hồi quy [4] Thuật tốn Cart chia khơng gian n chiều thành hình chữ nhật 194 Giải pháp kết nối chia sẻ hệ thống sở liệu phục vụ công tác đào tạo, quản lý lĩnh vực tài nguyên môi trường không chồng lên phép đệ quy Đầu tiên, biến độc lập xi chọn sau xác định giá trị ui tương ứng Khơng gian n chiều chia thành hai phần Một số điểm thỏa mãn xi ≤ ui điểm khác thỏa mãn xi > ui Đối với biến không liên tục, có hai giá trị khơng Trong q trình xử lý đệ quy, hai phần dựa vào bước để chọn lại thuộc tính tiếp tục phân vùng chia hết không gian n chiều Các thuộc tính có giá trị hệ số GINI tối thiểu sử dụng làm mục phân vùng Đối với tập liệu D, hệ số GINI xác định sau: GINI∗(D) = ∑i = 1kpi∗(1−pi) = 1−∑i = 1kp2i (1) đó: k số loại mẫu pi biểu thị xác suất mẫu xếp vào loại i Giá trị GINI nhỏ có nghĩa chất lượng mẫu cao hiệu ứng phân loại tốt Cây định bao gồm nút nhiều cấp nhiều Các nút tối đa đề cập đến số lượng tối đa quần thể tối thiểu số lượng nút tối thiểu tạo cho tập huấn luyện Để xây dựng phù hợp, phải tạo đủ nút nhánh Giá trị nút tối đa không giới hạn khơng định Hình 3: Mơ hình phân loại theo thuật tốn Cart (nguồn Internet) 3.2 Thuật tốn RF RF thuật tốn học tích hợp tích hợp nhiều định sau tạo thành khu rừng Thuật tốn kết hợp tính ngẫu nhiên để tạo Phương pháp đóng bao sử dụng để tạo mẫu huấn luyện tính chọn rút ngẫu nhiên cách thay N (kích thước tập huấn luyện ban đầu) Sau đó, kết dự đoán cuối thu cách kết hợp nhiều định [5] Công thức (2) thực định phân loại cuối sau: H(x) = argmaxY∑i = 1kI(hi(x) = Y) (2) đó: H(x) mơ hình kết hợp, hi mơ hình phân loại định đơn lẻ, Y biến đầu (hoặc biến mục tiêu) I (⋅) hàm báo Công thức cho thấy RF sử dụng đa số định biểu để xác định phân loại cuối Giải pháp kết nối chia sẻ hệ thống sở liệu phục vụ công tác đào tạo, quản lý lĩnh vực tài nguyên mơi trường 195 Hình 4: Mơ hình phân loại theo thuật toán RF (nguồn Internet) Tham số điều chỉnh thuật toán RF số lượng số lượng chọn theo kinh nghiệm Trong toán phân lớp liệu thuật tốn RF sử dụng phổ biến Thuật toán RF đánh giá cao tính xác mơ hình Nhược điểm thuật tốn RF khối lượng tính tốn lớn 3.3 Thuật toán SVM SVM thuật toán học máy giám sát quản lý khan mẫu, mạnh mẽ thường mang lại kết tốt trình phân loại hồi quy SVM phân chia vector hỗ trợ nhằm phân loại điểm liệu nhật ký cách rõ ràng với mục tiêu tìm hai loại vectơ hỗ trợ độc lập có biên độ lớn [6, 7] Hình minh họa mơ hình thuật tốn SVM Hình 5: Mơ hình thuật tốn phân loại SVM (nguồn Internet) SVM thuật tốn học máy thuộc nhóm học có giám sát (Supervised Learning) sử dụng toán phân lớp liệu hay hồi quy Với liệu mẫu huấn luyện thuộc lớp cho trước, thuật tốn SVM xây dựng mơ hình để phân loại đối tượng vào lớp cho trước Mục tiêu thuật tốn tìm khơng gian F siêu phẳng định f F cho sai số phân loại thấp Việc phân lớp thực qua hàm định: f(x) = sign( + b) (3) Hàm f(x) thu việc thay đổi vectơ chuẩn w, vectơ để cực đại hóa khoảng cách tới siêu phẳng (Optimal hyperplane) Các điểm liệu cho trước nằm siêu phẳng song song gọi là Support Vector 196 Giải pháp kết nối chia sẻ hệ thống sở liệu phục vụ công tác đào tạo, quản lý lĩnh vực tài nguyên môi trường Trong không gian có nhiều điểm kí hiệu sau: yi: lớp chứa điểm liệu xi xi: vector thực nhiều chiều (p chiều) Mỗi siêu phẳng viết dạng tập điểm thỏa mãn w.x-b = w: vector pháp tuyến siêu phẳng b/||w||: xác định khoảng cách gốc tọa độ siêu phẳng theo hướng vectơ pháp tuyến w Trong Hình 5, ta có H2 là siêu phẳng cần tìm Lúc siêu phẳng xác định: w.x-b=1 và w.x-b=-1 3.4 Phương pháp đánh giá độ xác Ma trận nhầm lẫn (Confusion Matrix) phương pháp quan trọng phổ biến sử dụng để đánh giá độ xác, mơ tả độ xác phân loại nhầm lẫn lớp đối tượng Các thống kê cho ma trận nhầm lẫn bao gồm: Sai số tổng thể (Overall Accuracy - OA), Sai số người dùng (User’s Accuracy - UA), Sai số nhà sản xuất (Producer’s Accuracy - PA) hệ số Kappa Trong hệ số Kappa có giá trị từ 0.4 đến 0,6 đánh giá đạt kết trung bình, giá trị từ lớn 0,6 đến 0,8 tốt 0,8 đến 1,0 tốt [8] Kết nghiên cứu thảo luận Kết nghiên cứu bao gồm ba sản phẩm ảnh sau phân loại theo thuật toán Cart, RF SVM Mỗi ảnh sau phân loại bao gồm năm lớp phủ lớp phủ Đất trống, lớp phủ Mặt nước, lớp phủ Rừng, lớp phủ đất canh tác Nông nghiệp, lớp phủ Nhà cửa, cơng trình xây dựng Hình số minh họa sản phẩm ảnh sau phân loại khu vực nghiên cứu theo ba thuật toán nêu a Phân loại theo Cart b Phân loại theo RF c Phân loại theo SVM Đất trống Rừng Mặt nước Nông nghiệp Nhà cửa Hình 6: Ảnh sau phân loại: a Phân loại theo Cart; b Phân loại theo RF; c Phân loại theo SVM Các lớp phủ bề mặt khu vực huyện Ba Vì sau phân loại thể rõ ràng theo thuật tốn sử dụng Trong lớp phủ Rừng xác định tập trung, có mật độ cao chủ yếu phân bố khu vực Vườn quốc gia Ba Vì nằm phía Nam huyện Lớp Mặt nước có độ tập trung cao khu vực hồ Suối Hai sông bao quanh ranh giới huyện Các lớp Đất trống, Nơng Nghiệp, Nhà cửa có độ tập trung khơng cao, năm rải rác xen kẽ phân bố nhiều khu vực phía Bắc huyện Sự phân bố lớp phủ theo khu vực phù hợp với đặc điểm tự nhiên, phân bố dân cư, tập quán canh tác phát triển kinh tế - xã hội huyện Ba Vì Giải pháp kết nối chia sẻ hệ thống sở liệu phục vụ công tác đào tạo, quản lý lĩnh vực tài nguyên môi trường 197 a Nông nghiệp (Cart-RF) b Nông nghiệp (SVM-Cart) c Nơng nghiệp (SVM-RF) Khu vực có chênh lệch Khu vực khơng có chênh lệch Hình 7: Khác biệt lớp phủ đất Nông nghiệp cửa thuật toán Cart, RF, SVM Trong nghiên cứu này, kết phân loại theo thuật tốn Cart, RF, SVM có khác biệt diện tích khơng lớn từ khoảng 1-2 % hai lớp đất trống, mặt nước (Hình 8) Đối với hai lớp nêu trên, việc lấy mẫu phân loại thực rõ ràng thuận lợi (do hình ảnh mẫu rõ ràng, dễ phân biệt) so với việc lấy mẫu cho ba lớp cịn lại lớp nhà cửa, nơng nghiệp lớp phủ rừng a Vị trí điểm lấy mẫu b Nhà cửa (Cart-RF) c Đất trống (SVM-Cart) Khu vực có chênh lệch Khu vực khơng có chênh lệch Hình 8: Sơ đồ vị trí điểm lấy mẫu khu vực Ba Vì a So sánh kết phân loại lớp phủ b Tỷ lệ phần trăm theo diện tích tự nhiên Hình 9: Kết phân loại: a So sánh kết phân loại lớp phủ; b Tỷ lệ phần trăm theo diện tích tự nhiên 198 Giải pháp kết nối chia sẻ hệ thống sở liệu phục vụ công tác đào tạo, quản lý lĩnh vực tài nguyên môi trường Đối với ba lớp Nhà cửa, Nông nghiệp lớp phủ Rừng có kết khác biệt lớn so với khác biệt lớp lại lớp phủ Đất trồng, Mặt nước Kết việc sử dụng thuật toán khác để phân loại minh họa Hình 7, Hình Đối với thuật tốn RF việc phân loại lớp phủ Nơng nghiệp thể có độ nhạy cảm so với hai thuật toán Cart SVM, diện tích lớp phủ Nơng nghiệp phát chiếm tới 31,81 % tổng diện tích tự nhiên Trong đó, với thuật toán Cart SVM 27,17 % 28,83 % Như có khác biệt lớn thuật toán RF Cart 4,64 % phân loại lớp phủ Nông nghiệp Đối với lớp Nhà cửa, thuật tốn Cart tìm diện tích 17,13 %, thuật tốn RF 12,67 %, thuật toán SVM 13,28 % Kết cho thấy khác biệt lớn thuật toán Cart RF phân loại lớp phủ Nhà cửa 4,46 % Đối với lớp phủ Rừng, kết khác biệt lớn tìm thuật tốn Cart SVM 4,08 % Như kết khác biệt phân loại lớp Đất trống lớp Mặt nước tương đối thấp, % Đối với ba lớp lại lớp nhà cửa, nông nghiệp, rừng, kết khác biệt lớn hơn, đạt trung bình khoảng 4,39 % (Hình 9) Trong nghiên cứu này, 147 tổng số 460 điểm mẫu lựa chọn ngẫu nhiên để kiểm định xây dựng ma trận nhầm lẫn Tỷ lệ điểm kiểm tra tổng số điểm lấy mẫu 30 % 70 % Vị trí điểm lấy mẫu minh họa Hình 8a Kết độ xác sau phân loại tính tốn từ ma trận nhầm lẫn thể Bảng Trong đó, kết đánh giá theo thuật toán Cart RF gần tương đương (Kappa = 0,61 Kappa = 0,60), cịn với SVM có kết thấp (Kappa = 0,48) Theo đánh giá giá trị hệ số Kappa đạt từ 0,41 đến 0,60 có độ xác trung bình; Kappa từ 0,61 đến 0,80 có độ xác tốt; Kappa từ 0,81 đến 1,0 tốt, 0,40 độ xác Như vậy, độ xác phân loại theo Cart đạt loại tốt, theo RF đạt cận cao mức trung bình, cịn theo thuật tốn SVM đạt độ xác trung bình Bảng Độ xác phân loại ảnh Cart RF SVM Producer’s Accuracy (PA) 0,61 0,54 0,42 Overall Accuracy (OA) 0,69 0,68 0,59 Kappa 0,61 0,60 0,48 Phương pháp lấy mẫu sử dụng nghiên cứu lấy mẫu theo điểm, phương pháp có ưu điểm chi tiết so với phương pháp lấy mẫu theo vùng Đồng thời với phương pháp lấy mẫu trên, kết ảnh sau phân loại thể tương đối chi tiết, rõ ràng có pixel cụm pixel nhỏ phân bố xen kẽ lẫn loại lớp phủ phân bố thực tế Kết thể rõ lớp Nhà cửa ảnh sau phân loại Chất lượng mẫu huấn luyện sử dụng yếu tố quan trọng ảnh hưởng đến khả phân loại ảnh Trong nghiên cứu này, mẫu để huấn luyện có sai sót khơng thể tránh khỏi lớp phủ bề mặt đan xen lẫn lộn, khơng rõ ràng khó xác định xác Điều thể rõ lớp phủ nông nghiệp, lớp phủ mà lựa chọn lớp phủ có loại trồng khác đất, bao gồm nơi có bụi Do đó, số lớp định đất nông nghiệp nhà cửa thường thu độ xác PA UA 50 % thuật toán sử dụng để phân loại Độ xác thấp thu hai lớp giải thích chồng chéo lớp với đất bỏ hoang, bụi lớp thực vật khác, nông nghiệp thời điểm thu hoạch khu vực nghiên cứu Trong nghiên cứu này, chúng tơi có kết độ xác sau phân loại thuật toán Cart RF gần tương đương, cịn phân loại theo SVM có độ xác thấp Có thể xếp theo từ độ xác cao đến thấp ba thuật toán sử dụng theo thứ tự Cart, RF, SVM Trong số nghiên cứu khác cho kết khả phân loại tốt SVM, số nghiên cứu khác lại báo cáo ngược lại [9] Có nghiên cứu cho kết phân loại theo RF Giải pháp kết nối chia sẻ hệ thống sở liệu phục vụ công tác đào tạo, quản lý lĩnh vực tài nguyên môi trường 199 tốt so với thuật toán khác [10] Kết luận đề xuất Việc khai thác nguồn liệu ảnh vệ tinh GEE cách trực tuyến cho hiệu cao sử dụng nghiên cứu lĩnh vực quản lý đất đai, tài nguyên môi trường Việc sử dụng ảnh Landsat, nguồn tài nguyên miễn phí coi liệu đa thời gian, liên tục gần thời gian thực cho kết phân loại năm lớp phủ bề mặt đất Độ xác công tác phân loại đạt yêu cầu với hệ số kappa có giá trị 0,61; 0,60; 0,48 tương ứng với thuật toán Cart, RF SVM Việc sử dụng ngôn ngữ JavaScript GEE với thời gian xử lý liệu nhanh cho thấy hiệu suất cao kết đạt Cùng với đó, kết khu vực Ba Vì cho thấy độ xác phân loại ảnh vệ tinh Landsat theo thuật toán Cart (với năm lớp bản) đạt độ tin cậy cao nhất, sau RF cuối SVM ba thuật toán thử nghiệm Trong thuật toán trên, kết phân loại cho thấy khả nhạy cảm lớp phủ đất nơng nghiệp thuật tốn RF so với hai thuật toán Cart SVM Nghiên cứu phân loại ảnh với năm lớp phủ sử dụng ảnh vệ tinh Landsat theo nguồn miễn phí Để có kết chi tiết hơn, nghiên cứu sau phân loại nhiều lớp phủ chi tiết sử dụng nguồn tư liệu ảnh vệ tinh có độ phân giải khơng gian cao Ngồi ra, nhóm tác giả hy vọng kết nghiên cứu có khả đóng góp định cho việc phân tích, sử dụng liệu đầu vào cách hiệu có độ tin cậy cao cho cơng tác nghiên cứu phân tích, theo dõi biến động lớp phủ bề mặt, lớp phủ sử dụng đất quản lý đất đai, quản lý môi trường khu vực khác có điều kiện tương tự TÀI LIỆU THAM KHẢO [1] Vũ Hữu Long cộng (2019) Ứng dụng công nghệ xử lý ảnh viễn thám tảng điện toán đám mây (GEE) theo dõi biến động đường bờ sơng - Thí điểm sơng Cửu Long Tạp chí Khoa học Tự nhiên Cơng nghệ 16, 38 [2] Bùi Thị Hồng Thắm, Trịnh Thị Thu (2020) Phân loại đối tượng chiết tách lớp phủ bề mặt khu vực cơng viên địa chất tồn cầu Non nước Cao Bằng dựa tảng điện toán đám mây Tạp chí Khoa học Tài ngun Mơi trường 31, 65 [3] Nguyen B Luong (2020) Land cover change detection in northwestern Vietnam using Landsat images and Google Earth Engine Journal of Water and Land development 46, 162 [4] Breiman L and R Ihaka (1984) Nonlinear discriminant analysis via scaling and ACE Department of Statistics, University of California, Technical Report 40, [5] Breiman L J M l l (2001) Random forests Kluwer academic publishers Manufactured in the Netherlands 45, [6] Vapnik V N and A Y Chervonenkis (1971) On the uniform convergence of relative frequencies of events to their probabilities Measures of complexity Springer, 11 [7] Cortes C and V Vapnikl (1995) Support - vector networks J Machine learning, Kluwer academic publishers, Boston Manufactured in the Netherlands 20, 273 [8] Visa S., B Ramsay, A L Ralescu and E J M Van Der Knaapl (2011) Confusion matrix-based feature selection 710, 120 [9] Peng Y., Z Zhang, G He and M Weil (2019) An improved grabcut method based on a visual attention model for rare - earth ore mining area recognition with high - resolution remote sensing images Remote Sensing 11, 987 [10] Ray S S l (2019) Exploring machine learning classification algorithms for crop classification using sentinel data The international archives of the photogrammetry, Remote sensing and spatial information sciences XLII-3/W6, 573 Chấp nhận đăng: 10/12/2021; Người phản biện: TS Trần Xuân Biên 200 Giải pháp kết nối chia sẻ hệ thống sở liệu phục vụ công tác đào tạo, quản lý lĩnh vực tài nguyên môi trường ... loại; phân loại theo thuật toán Cart, RF SVM; thu nhận kết ảnh phân loại theo thuật tốn Cart, RF SVM; đánh giá độ xác ảnh sau phân loại theo thuật toán trên; so sánh kết ảnh sau phân loại thuật. .. sản phẩm ảnh sau phân loại theo thuật toán Cart, RF SVM Mỗi ảnh sau phân loại bao gồm năm lớp phủ lớp phủ Đất trống, lớp phủ Mặt nước, lớp phủ Rừng, lớp phủ đất canh tác Nông nghiệp, lớp phủ Nhà... trình phân loại ảnh Các thuật toán sử dụng phân loại nghiên cứu bao gồm Cart, RF SVM trình bày theo nội dung đây: 3.1 Thuật toán Cart Thuật toán Cart thuật toán học máy có giám sát hệ thống phân loại