3.5.3.1. Phân loại ảnh bằng phương pháp phân loại có kiểm định theo thuật toán xác suất cực đại ( Maximum likelihood )
Ứng dụng thuật toán Maximum likelihood để phân loại lớp ảnh dựa trên đặc trưng phổ của ảnh, quá trình phân loại được thực hiện theo các bước sau:
+ Bước 1: Định nghĩa các lớp, các mẫu lớp phủ ở trên mặt đất có sự khác biệt về phổ và cấu trúc tự nhiên. Vì vậy khi định nghĩa các lớp phải thỏa mãn với đặc trưng từng loại hình sử dụng đất.
Từ dữ liệu thu thập được bằng GPS cầm tay tiến hành chọn vùng mẫu trực tiếp trên tư liệu ảnh , số lượng vùng mẫu phải thỏa mãn yêu cầu là phân bố đều trên toàn bộ khu vực nghiên cứu và đặc trưng cho tính phổ của từng lớp.
+ Bước 3: Tiến hành phân loại bằng phương pháp có kiểm định theo thuật toán xác suất cực đại (Maximum likelihood).
3.5.3.2. Đánh giá độ chính xác phân loại
Dựa theo kết quả điều tra thực địa từ GPS cầm tay để đánh giá độ chính xác phân loại ảnh sử dụng hệ số kappa (κ) để đánh giá.
Do ảnh vệ tinh chụp tại thời điểm năm 2010 và 2018 và điều tra thực địa bằng GPS cầm tay tại thời điểm năm 2019, nên trước khi đi kiểm tra thực địa phải đánh dấu các vị trí cần kiểm tra ở những nơi không có biến động về sử dụng đất, nghi ngờ sai loại đất kết hợp với việc phỏng vấn cán bộ địa chính, hộ gia đình sử dụng đất để tìm hiểu tình hình sử dụng đất, thời vụ....phục vụ giải đoán ảnh tại 2 thời điểm ảnh năm 2010 và năm 2018.
Độ chính xác phân loại được đánh giá bằng 2 chỉ tiêu là độ chính xác tổng thể (overall accuracy) và chỉ số thống kê Kappa (κ). Đồng thời độ chính xác phân loại của từng lớp phân loại cũng được thể hiện chi tiết trên ma trận sai số.
Ma trận sai số là ma trận vuông với các giá trị ở trên hàng và cột biểu thị số lượng mẫu của từng lớp phân loại. Số liệu trên cột thể hiện dữ liệu kiểm chứng, số liệu trên hàng thể hiện kết quả phân loại của mẫu kiểm chứng. Các phần tử nằm trên đường chéo chính là số điểm phân loại đúng của các lớp đối tượng, các phần tử còn lại là số điểm bị phân loại nhầm sang lớp khác.
Độ chính xác sản xuất (Produce’s Accuracy) của từng lớp phân loại được tính bằng số điểm được phân loại đúng trên tổng số điểm kiểm chứng. Độ chính xác sử dụng (User’s Accuracy) của từng lớp bằng số điểm phân loại đúng trên tổng số điểm sau phân loại của lớp đó trong mẫu.
Độ chính xác tổng thể được tính bằng tỷ lệ phần trăm của số điểm được phân loại đúng trên tổng số điểm kiểm tra của mẫu kiểm chứng.
Để đánh giá độ tin cậy của kết quả phân loại, ta dùng chỉ số thống kê κ. Chỉ số κ được tính theo công thức của Jensen (1995):
r i i i r i r i i i ii x x N x x x N 1 2 1 1 ) . ( ) . ( Trong đó:
N: Tổng số điểm lấy mẫu r: Số lớp đối tượng phân loại xii: Số điểm đúng trong lớp thứ i xi+: Tổng số điểm lớp thứ i của mẫu
x+i: Tổng số điểm của lớp thứ i sau phân loại.
κ có giá trị từ 0 đến 1. Nếu κ lớn hơn hoặc bằng 0,8 cho thấy kết quả phân loại có độ tin cậy cao, nếu κ từ 0,4 đến dưới 0,8 kết quả phân loại có độ tin cậy trung bình, nếu κ nhỏ hơn 0,4 chứng tỏ kết quả phân loại có độ tin cậy thấp.