STT Loại đất Ảnh 2005 Ảnh 2014 Ảnh thực địa 1 Đất trồng lúa 2 Đất trồng màu 3 Đất xây dựng 4 Đất mặt nước
Sử dụng công cụ Signature Editor kết hợp với Polygon để chọn vùng mẫu
trên ảnh. Hộp thoại Signature Editor xuất hiện cho phép ta đánh tên từng loại hình
sử dụng đất cần lấy mẫu và tự động gán màu cho từng lớp.
Kết quả của xây dựng tệp mẫu đối với ảnh Landsat 8 năm 2014 ta tiến hành lựa chọn được 40 mẫu trong đó bao gồm: Đất trồng lúa nước (8 mẫu), đất trồng cây ăn quả (3 mẫu), đất trồng hoa (2 mẫu), đất trồng rau (3 mẫu), đất trồng nông nghiệp còn lại (2 mẫu), đất xây dựng nhà ở (4 mẫu), đất giao thông (2 mẫu), đất khu công nghiệp (2 mẫu), đất xây dựng trụ sở cơ quan (3 mẫu), đất an ninh – quốc phòng (2 mẫu), đất nuôi trồng thủy sản (2 mẫu), đất sông (5 mẫu), đất thủy lợi (2 mẫu) (Hình 4.7).
Từ tệp mẫu xây dựng được trên hai ảnh năm 2005, 2014 sử dụng công cụ
Merge để gộp thành 4 lớp, sau đó tiến hành xử lý và đổi mầu (Hình 4.8 và Hình 4.9).
Hình 4.8. Kết quả gộp lớp cho ảnh Landsat 5 – 2005
Hình 4.9. Kết quả gộp lớp cho ảnh Landsat 8 - 2014
4.3.5.3. Phân loại ảnh:
Có 02 phương pháp: phân loại không kiểm định và phân loại có kiểm định.
- Phương pháp phân loại không kiểm định: kỹ thuật phân loại này chỉ sử dụng thuần tuý thông tin phổ do ảnh cung cấp và đòi hỏi người phân tích phải có kinh nghiệm về việc chỉ định số cụm phổ ban đầu.
- Phương pháp phân loại có kiểm định: đây là một hình thức phân loại mà các chỉ tiêu phân loại được xác lập dựa trên các vùng mẫu và dùng luật quyết định dựa trên thuật toán thích hợp để gắn nhãn pixel ứng với từng vùng phủ cụ thể. Các
vùng mẫu là những khu vực trên ảnh tương ứng với từng loại mà người giải đoán biết được đặc trưng phổ. Dựa trên dữ liệu vùng mẫu thu được trên từng vùng mẫu, các tham số thống kê được xác định. Từ đó, các chỉ tiêu phân loại được sử dụng trong quá trình chỉ định pixel thuộc vào từng loại cụ thể.
Trong đề tài này, phương pháp được lựa chọn để phân loại ảnh là phương pháp phân loại có kiểm định theo thuật toán xác suất cực đại (Maximum likelihood).
Phân loại theo phương pháp Maximum likelihood coi số liệu thống kê của mỗi lớp trong mỗi kênh ảnh được phân tán một cách thông thường và phương pháp này có tính đến khả năng một pixel thuộc một lớp nhất định. Nếu không chọn một ngưỡng xác suất thì phải phân loại tất cả các pixel. Mỗi pixel được gán cho một lớp có độ xác suất cao nhất. Theo phương pháp này các band phổ có sự phân bố chuẩn và các pixel sẽ được phân loại vào lớp mà nó có xác suất cao nhất. Đây là phương pháp phân loại chính xác nhưng lại mất nhiều thời gian tính toán và phụ thuộc sự phân bố chuẩn của dữ liệu.
Từ menu cửa sổ chính của ErDAS sử dụng công cụ Supervised
Classification. Trên màn hình xuất hiện hộp thoại Supervised Classification cho phép lựa chọn ảnh cần phân loại, tệp mẫu xây dựng, tên và đường dẫn xuất của ảnh phân loại. Lựa chọn phương pháp phân loại theo thuật toán xác xuất cực đại (Maximum likelihood).
Hình 4.10. Kết quả phân loại và lọc nhiễu ảnh phân loại Landsat 5 – 2005
Sau khi có được ảnh phân loại năm 2005 và năm 2014, ta tiến hành lọc nhiễu
kết quả phân loại được. Sử dụng công cụ Neighborhood với pháp sử dụng ở đây là
Majority để gộp những pixel lẻ tẻ hoặc phân loại lẫn trong các lớp vào chính lớp chứa nó.
Hình 4.11. Kết quả lọc nhiễu ảnh phân loại Landsat 8 – 2014
4.3.5.4. Đánh giá độ chính xác phân loại ảnh
Độ chính xác phân loại ảnh không những phụ thuộc vào độ chính xác các vùng mẫu mà còn phụ thuộc vào mật độ và sự phân bố các ô mẫu. Sau khi phân loại dựa trên tệp mẫu đã đạt độ chính xác và kết quả là lớp phủ bề mặt. Vậy để đánh giá độ chính xác kết quả phân loại này, ta tiến hành làm như sau:
- Đối với kết quả ảnh phân loại năm 2014, tiến hành sử dụng thiết bị đo
GPS cầm tay của hãng Garmin đã được cài đặt hệ tọa độ WGS 84, phép chiếu UTM để đối soát thực địa 100 điểm đối với tất cả các loại đất phân bố ngẫu nhiên trên địa bàn huyện, sau đó lưu file dưới dạng *.txt.
- Đối với kết quả ảnh phân loại năm 2005, ta kết hợp điều tra thực địa và bản đồ hiện trạng sử dụng đất năm 2005 để xây dựng file tọa độ có định dạng *.txt với với 100 điểm. Trong đó cột 1 là số thứ tự, cột 2 là hoành độ X, cột 3 là tung độ Y tương ứng trên ảnh phân loại.
Kết quả đánh giá độ chính xác phân loại ảnh được thể hiện bằng ma trận sai số. Ma trận này thể hiện sai số nhầm lẫn sang lớp khác (được thể hiện theo hàng) và sai số do bỏ sót của lớp mẫu (được thể hiện theo cột). Do vậy để đánh giá hai nguồn sai số này có hai độ chính xác phân loại tương ứng: độ chính xác phân loại có tính đến sai số nhầm lẫn (do sai số nhầm lẫn gây nên) và độ chính xác phân loại có tính đến sai số bỏ sót (do sai số bỏ sót gây nên). Để đánh giá tính chất của các sai sót phạm phải trong quá trình phân loại người ta dựa vào chỉ số Kappa (κ), chỉ số này nằm trong phạm vi từ 0 đến 1 và biểu thị sự giảm theo tỷ lệ về sai số được thực hiện bằng một yếu tố phân loại hoàn toàn ngẫu nhiên
Hình 4.12. File tọa độ đánh giá phân loại ảnh - 2014 và 2005 ∑ ∑ ∑ ∑ = + + = = + + − − = r i i i r i r i i i ii x x N x x x N 1 2 1 1 ) . ( ) . ( κ
Trong đó: N - Tổng số điểm lấy mẫu; r - Số lớp đối tượng phân loại;
xii - Số điểm thực địa đúng trong lớp thứ 1;
xi+ - Tổng điểm thực địa của lớp thứ i của mẫu;
x+i - Tổng điểm thực địa của lớp thứ i sau phân loại.
Sử dụng kết quả ảnh phân loại sau khi lọc và file tọa độ đánh giá năm 2005
và 2014, tiến hành sử dụng chức năng Accurency Assesment để đánh giá độ chính
xác kết quả phân loại:
Hình 4.13. Hiển thị điểm thực địa lên ảnh phân loại Landsat 5 – 2005
Hình 4.15. Kết quả đánh giá độ chính xác ảnh phân loại Landsat 8 - 2014
Trên hình bao gồm các bảng:
- ERROR MATRIX (Bảng ma trận sai số), với:
+ Các số liệu trên đường chéo là số pixel phân loại đúng tương ứng của các loại đất, các số còn lại trong các hàng là số pixel phân loại nhầm sang loại đất khác;
+ Row Total (Tổng hàng): là tổng số điểm phân loại đúng và số điểm phân loại nhầm lẫn của các loại đất;
+ Column Total (Tổng cột): là tổng số điểm từng loại đất sau phân loại bao gồm số điểm phân loại đúng và số điểm bỏ sót.
- ACCURACY TOTALS (Bảng đánh giá độ chính xác theo chỉ số phần trăm (%)), trong đó:
+ Reference Totals: là tổng số điểm thực địa có được của mỗi loại đất trong file tọa độ đánh giá;
+ Classified Totals: là tổng số điểm thực địa có được tương ứng với mỗi loại đất trên ảnh phân loại;
+ Number Correct: là số điểm đúng trên tổng số điểm thực địa có được của mỗi loại đất trong file tọa độ đánh giá (Reference Totals);
+ Producers Accuracy: là chỉ số phần trăm đúng của số điểm đúng (Number Correct) trên tổng số điểm thực địa có được của mỗi loại đất trong file tọa độ đánh giá (Reference Totals);
+ Users Accuracy: là chỉ số phần trăm đúng của số điểm đúng (Number Correct) trên tổng số điểm thực địa có được tương ứng với mỗi loại đất trên ảnh phân loại (Classified Totals).
- KAPPA (K^) STATISTICS (Bảng thống kê chỉ số kappa), với:
+ Overall Kappa Statistics: là kết quả đánh giá độ chính xác ảnh phân loại; + Conditional Kappa for each Category: là kết quả đánh giá độ chính cho mỗi loại đất trên ảnh phân loại.
+ Đối với kết quả đánh giá độ chính xác của ảnh phân loại Landsat 8-2014: