Phần 4 Kết quả nghiên cứu
4.3. Xây dựng bản đồ lớp phủ ứng với thời điểm có ảnh
4.3.2. Xây dựng bản đồ sử dụng đất
4.3.2.1. Xử lý ảnh viễn thám
a. Nhập dữ liệu ảnh
Ảnh viễn thám sau khi tải về là một file gồm các ảnh đơn kênh. Tiến hành cộng gộp các kênh ảnh để được ảnh đa kênh bằng công cụ Layer Stacking trong phần mềm ENVI 4.7. Đối với ảnh của vệ tinh Landsat 5 lựa chọn kênh 4-3-2. Đối với ảnh của vệ tinh Landsat 8 lựa chọn kênh 5-4-3.
Hình 4.1. Cộng gộp kênh ảnh Landsat 5 năm 2010
b. Tăng cường chất lượng ảnh
Trước khi gộp ảnh thành ảnh hoàn chỉnh của khu vực nghiên cứu cần tiến hành xử lý ảnh sao cho tương đồng về độ sáng tối và giá trị phổ.
Đối với dữ liệu ảnh Landsat 5, lựa chọn phương pháp Equalization – cân bằng: Phương pháp này sẽ kéo dãn cân bằng đồ thị của dữ liệu được hiển thị. Với dữ liệu ảnh Landsat 8, lựa chọn phương pháp Linear – Tuyến tính, sử dụng giá trị nhỏ nhất và lớn nhất của ảnh để thực hiện phép giãn tuyến tính.
Ảnh chưa tăng cường Ảnh sau khi tăng cường
Hình 4.2. Tăng cường chất lượng ảnh
Tăng cường chất lượng ảnh làm cho ảnh rõ nét hơn, phục vụ cho quá trình giải đoán rõ ràng hơn..
c. Cắt ảnh
Ảnh Landsat thu nhận được từ trạm thu tại hai thời điểm đã được hiệu chỉnh hình học, khí quyển, bức xạ, khắc phục sai số do địa hình gây nên. Ảnh cũng đã được hiệu chỉnh phổ, hình học về hệ tọa độ quốc tế WGS-84, phép chiếu UTM, múi chiếu 480 . Vì vậy ảnh sau khi tăng cường được sử dụng luôn để phục vụ giải đoán.
Từ file ranh giới hành chính thành phố Thái Bình thu thập được có định dạng là *.shp tiến hành chuyển đổi sang định dạng *.evf, dùng chức năng cắt ảnh trong phần mềm Envi cắt ảnh theo địa giới hành chính thành phố Thái Bình.
Ảnh thành phố Thái Bình sau khi cắt được hiển thị theo tổ hợp màu kênh 5-4-3.
Hình 4.3. Ảnh cắt theo địa giới hành chính thành phố Thái Bình năm 2015
4.3.2.2. Xây dựng tệp mẫu các loại hình lớp phủ, đánh giá độ tin cậy tệp mẫu
a. Xây dựng mẫu phân loại
- Xác định các lớp: Trên cơ sở điều tra thực địa, từ dữ liệu ảnh vệ tinh đã xây dựng được tệp mẫu phân loại ảnh gồm 6 loại hình sử dụng đất cơ bản. Và được thể hiện trong bảng 4.3.
Bảng 4.3. Mô tả các lớp phân loại
TT Lớp phủ Mô tả
1 Đất trồng lúa Đất chuyên trồng lúa nước.
2 Đất cây hoa màu Đất trồng cây hoa màu: Lạc, đỗ, dưa lê, dưa hấu, bí… 3 Đất xây dựng
Đất ở, đất giao thông, đất khu công nghiệp, đất cơ sở sản xuất kinh doanh, đất công trình sự nghiệp, đất chợ, đình chùa, nghĩa trang, nghĩa địa…
4 Đất sông Đất sông, suối, kênh, mương.
5 Đất mặt nước Đất có mặt nước tự nhiên, đất nuôi trồng thủy sản
6 Đất khác Là khu vực trồng các loại cây hỗn tạp như đất trồng cây ăn quả , đất để hoang có cỏ..
Bảng 4.4. Mẫu ảnh vệ tinh năm 2010 và năm 20
STT Loại đất Mẫu ảnh 2010 Mẫu ảnh 2015 Ảnh thực địa
1 Đất lúa
2 Đất cây hoa màu
3 Đất xây dựng 4 Đất sông
5 Đất mặt nước
6 Đất khác
(Mẫu ảnh vệ tinh Landsat 5 – 2010 (tổ hợp màu: 3-2-1) và Landsat 8 –2015 (tổ hợp màu: 4-3-2))
- Chọn vùng mẫu: Việc chọn vùng mẫu có tính chất quyết định tới kết quả phân loại. Để đảm bảo độ chính xác khi lựa chọn vùng mẫu phải chú ý các yêu cầu sau:
+ Số lượng các vùng lấy mẫu của mỗi loại đối tượng cần phải phù hợp. Số lượng vùng mẫu quá ít sẽ không đảm bảo độ chính xác, ngược lại nếu nhiều quá sẽ làm tăng khối lượng tính toán lên rất nhiều đôi khi làm nhiễu kết quả tính toán.
+ Diện tích các vùng lấy mẫu đủ lớn, đồng thời các vùng mẫu không được nằm gần ranh giới giữa các lớp đối tượng với nhau.
Từ bản đồ hiện trạng sử dụng đất, số liệu điều tra thực địa và bảng mẫu giải đoán ta tiến hành chọn mẫu phân loại bằng cách khoanh vẽ trực tiếp lên ảnh cần phân loại.
Đây là bước quan trọng trong quá trình giải đoán ảnh. Các mẫu được lựa chọn phải đặc trưng cho từng loại hình lớp phủ. Việc lựa chọn vùng mẫu sẽ lặp lại cho đến khi tệp mẫu được chọn đạt độ chính xác.
Tiến hành chọn 70 mẫu trên ảnh viễn thám 2010 gồm: Đất lúa 25 mẫu; đất cây hoa màu 9 mẫu; đất xây dựng 25 mẫu; đất sông 3 mẫu; đất mặt nước 5 mẫu; đất khác 3 mẫu.
Tương tự chọn 78 mẫu với ảnh viễn thám 2015 gồm: Đất lúa 27 mẫu; đất cây hoa màu 6 mẫu; đất xây dựng 28 mẫu; đất sông 4 mẫu; đất mặt nước 5 mẫu; đất khác 8 mẫu.
b. Đánh giá độ chính xác của tệp mẫu.
Sau khi hoàn thành chọn mẫu phân loại. Sử dụng công cụ Options trên hộp thoại Roi tool để đánh giá sự khác biệt giữa các tệp mẫu
Theo J.A.Richards (1999), việc đánh giá sự tương quan của các mẫu huấn luyện vô cùng qua trọng, vì chúng cho thấy khả năng trùng lặp, gây sai số trong giai đoạn phân lớp các đối tượng. Đánh giá sự khác biệt mẫu là tính toán sự tương quan giá trị phổ giữa cặp mẫu huấn luyện được lựa chọn cho một tập tin đầu vào cho trước.
Kết quả đánh giá sự khác biệt giữa các tệp mẫu được thể hiện trong bảng.
Bảng 4.5. Bảng đánh giá sự khác biệt giữa các tệp mẫu năm 2010
Loại lớp phủ Đất trồng lúa Đất cây hoa màu Đất xây dựng Đất sông Đất mặt nước Đất khác Đất trồng lúa 0 1,9 1,9 1.9 1,9 1,9
Đất cây hoa màu 1,9 0 1,9 2,0 2,0 1,9
Đất xây dựng 1,9 1,9 0 1,9 1,9 1,9
Đất sông 1,9 2,0 1,9 0 1,9 2,0
Đât mặt nước 1,9 2,0 1,9 1,9 0 2,0
Đât khác 1,9 1,9 1,9 2,0 2,0 0
Bảng 4.6. Bảng đánh giá sự khác biệt giữa các tệp mẫu năm 2015
Loại lớp phủ Đất trồng lúa Đất cây hoa màu Đất xây dựng Đất sông Đất mặt nước Đất khác Đất trồng lúa 0 1,9 1,9 1,9 1,9 1,9
Đất cây hoa màu 1,9 0 1,9 2 2 1,9
Đất xây dựng 1,9 1,9 0 1,9 1,9 1,9
Đất sông 1,9 2 1,9 0 1,9 2
Đất mặt nước 1,9 2 1,9 1,9 0 2
Trong bảng 4.5 và 4.6, mỗi mẫu phân loại sẽ được so sánh lần lượt với các mẫu còn lại. Tại đường chéo của bảng có giá trị bằng 0 vì các mẫu được so sánh với chính nó.
Theo J.A.Richards (1999), những giá trị đánh giá khác biệt mẫu huấn luyện có khoảng giá trị từ 0 đến 2, chỉ ra sự riêng biệt giữa các cặp mẫu huấn luyện xét về mặt thống kê. Nếu giá trị lớn hơn 1,9 chỉ ra rằng cặp mẫu huấn luyện có sự khác biệt tuyệt đối. Đối với các cặp mẫu huấn luyện có giá trị thấp hơn, nên cải thiện hoặc chỉnh sửa mẫu huấn luyện. Trong trường hợp các cặp mẫu huấn luyện có giá trị phân biệt quá thấp (nhỏ hơn 1), nên gom chúng lại thành mẫu huấn luyện đơn.
Dựa vào bảng phân tích trên, có thể thấy các tệp mẫu đều có giá trị khác biệt (≥1,9). Điều này cho thấy không có sự nhầm lẫn giữa các cặp mẫu do vậy chấp nhận tệp mẫu này để phân loại.
4.3.2.3. Phân loại ảnh vệ tinh, đánh giá độ chính xác.
a. Phân loại ảnh
- Phân loại ảnh 2010
Mở ảnh cần phân loại năm 2010, từ menu cửa sổ chính của Envi, chọn Classification/Supervise và lựa chọn phương pháp phân loại phù hợp. Trong đề tài nghiên cứu sử dụng phương pháp phân loại có kiểm định Maximum likehood (nguyên tắc phân loại xác suất cực đại).
Hình 4.4. Kết phân loại ảnh Landsat 5 – 2010
- Phân loại ảnh 2015
Làm theo các bước tương tự như phân loại ảnh năm 2010. Mở ảnh cần phân loại năm 2015, từ menu cửa sổ chính của Envi, chọn Classification/Supervise và lựa chọn phương pháp phân loại có kiểm định Maximum likehood (nguyên tắc phân loại xác suất cực đại).
Hình 4.5. Kết phân loại ảnh Landsat 8 – 2015
b. Kiểm tra, đánh giá độ chính xác sau phân loại
Xác định độ chính xác phân loại thường được dùng để đánh giá chất lượng của ảnh vệ tinh được giải đoán, hoặc so sánh độ tin cậy của kết quả đạt được khi áp dụng các phương pháp khác nhau trong phân loại ảnh viễn thám. Kết quả của việc so sánh sự phù hợp giữa loại thực trên mặt đất và những loại giải đoán bằng một thuật toán phân loại thường được thể hiện dưới dạng ma trận sai số, trong đó chỉ số phần trăm đạt được của độ chính xác toàn bộ và sai số phân loại nhầm cho từng loại được xác định. Để thiết lập được ma trận sai số, người phân tích phải so sánh kết quả phân loại trên khu vực đã biết (bộ dữ liệu kiểm tra) trên cơ sở từng
pixel một và xác định mức độ chính xác như thế nào tại các vị trí được kiểm tra đó. Để đánh giá tính chất của các sai sót phạm phải trong quá trình phân loại người ta dựa vào chỉ số Kappa (κ), chỉ số này nằm trong phạm vi từ 0 đến 1 và biểu thị sự giảm theo tỷ lệ về sai số được thực hiện bằng một yếu tố phân loại hoàn toàn ngẫu nhiên.
Theo Jensen (1995), Chỉ số κ được tính theo công thức sau :
∑ ∑ ∑ = + + = = + + − − = r i i i r i r i i i ii x x N x x x N 1 2 1 1 ) . ( ) . ( κ
Trong đó: N - Tổng số điểm lấy mẫu; r - Số lớp đối tượng phân loại;
xii - Số điểm thực địa đúng trong lớp thứ 1; xi+ - Tổng điểm thực địa của lớp thứ i của mẫu; x+i - Tổng điểm thực địa của lớp thứ i sau phân loại
Để đánh giá độ chính xác kết quả sau phân loại ảnh, tiến hành sử dụng thiết bị đo GPS cầm tay của hãng Garmin đã được cài đặt hệ tọa độ WGS 84, phép chiếu UTM để đối soát thực địa.
Hình 4.6. Ảnh thực địa
- Ảnh năm 2010: Tổng số điểm GPS kiểm tra là 65 điểm. Kết quả đánh giá
độ chính xác các loại hình sử dụng đất năm 2010 được thể hiện cụ thể trong bảng 4.7
Bảng 4.7. Ma trận sai số phân loại ảnh năm 2010
Dữ liệu kiểm tra
Dữ liệu giải đoán
1 2 3 4 5 6 Tổng hàng
Độ tin cậy phân
loại (%)
Đất lúa (1) 23 0 0 0 0 0 23 100
Đất cây hoa màu (2) 0 4 0 0 1 2 7 57,14
Đất sông (3) 1 0 2 0 0 0 3 66,67 Đất mặt nước (4) 1 0 0 1 0 0 2 50 Đất xây dựng (5) 0 1 0 0 23 0 24 95,83 Đất khác (6) 0 1 0 0 2 3 6 50 Tổng cột 25 6 2 1 26 5 65 Độ tin cậy sử dụng (%) 92 66,67 100 100 88,46 60 Độ chính xác tổng thể: 86,15% Hệ số Kappa: 0,80 Trong đó:
- Tổng cột: Là số điểm của các đối tượng có trong tệp mẫu dùng để phân loại - Tổng hàng: Là tổng số điểm kiểm chứng trên mỗi lớp phân loại.
- Các phần tử nằm trên đường chéo chính là số điểm phân loại đúng của từng lớp đối tượng, các phần tử còn lại là số điểm bị phân loại nhầm sang lớp khác.
- Độ tin cậy phân loại: Là tỷ số giữa điểm phân loại đúng với số điểm của loại đất tương ứng trong dữ liệu kiểm tra.
- Độ tin cậy sử dụng : là tỷ số giữa điểm phân loại đúng với số điểm các loại đất tương ứng trong dữ liệu giải đoán.
Bảng 4.7 cho thấy lớp đất lúa và đất xây dựng có độ chính xác phân loại cao. Lớp đất lúa có 23 điểm phân loại đúng trên tổng 25 điểm, 1 điểm phân loại nhầm sang đất sông, 1 điểm phân loại nhầm sang đất mặt nước do thời điểm tháng 7 là mùa mưa, đây cũng là thời điểm bắt đầu gieo cấy vụ mùa trên đồng lúa có nhiều nước nên bị phân loại nhầm với đất sông và đất mặt nước. Tương tự như vậy, đất xây dựng có 23 điểm phân loại đúng trên tổng 26 điểm; 1 điểm phân loại nhầm sang đất cây hoa màu và 1 điểm phân loại nhầm sang đất khác do trong khu dân cư nông thôn có xen lẫn các khu vực trồng rau và cây ăn quả. Còn với các loại đất còn lại có sự nhầm lẫn do chúng có sự tương đồng về phổ : đất cây hoa màu – đất khác,...
Độ chính xác tổng thể ảnh sau phân loại năm 2010 là 86,15%, hệ số Kappa bằng 0,80. Như vậy ảnh phân loại đạt yêu cầu.
- Ảnh năm 2015: Tổng số điểm GPS kiểm tra là 59 điểm. Kết quả đánh giá độ chính xác các loại hình sử dụng đất năm 2015 được thể hiện cụ thể trong bảng.
Bảng 4.8. Ma trận sai số phân loại ảnh năm 2015
Dữ liệu kiểm tra
Dữ liệu giải đoán
1 2 3 4 5 6 Tổng hàng Độ tin cậy phân loại (%) Đất lúa (1) 24 0 0 0 0 0 24 100
Đất cây hoa màu (2) 0 3 0 0 1 2 6 50
Đất sông (3) 1 0 2 0 0 0 3 66,67 DĐất mặt nước 1 0 0 2 0 0 3 66,67 Đất xây dựng (4) 0 1 0 0 16 0 17 94,12 Đất khác (5) 0 1 0 0 1 4 6 66,67 Tổng cột 26 5 4 2 18 6 59 Độ tin cậy sử dụng % 92,31 60 100 100 88,89 66,67 Độ chính xác tổng thể: 86,44% Hệ số Kappa: 0,81 Trong đó:
- Tổng cột: Là số điểm của các đối tượng có trong tệp mẫu dùng để phân loại - Tổng hàng: Là tổng số điểm kiểm chứng trên mỗi lớp phân loại.
- Các phần tử nằm trên đường chéo chính là số điểm phân loại đúng của từng lớp đối tượng, các phần tử còn lại là số điểm bị phân loại nhầm sang lớp khác.
- Độ tin cậy phân loại: Là tỷ số giữa điểm phân loại đúng với số điểm của loại đất tương ứng trong dữ liệu kiểm tra.
- Độ tin cậy sử dụng : là tỷ số giữa điểm phân loại đúng với số điểm các loại đất tương ứng trong dữ liệu giải đoán.
Bảng 4.8 cho thấy lớp đất lúa và đất sông có độ chính xác cao nhất. Lớp đất lúa có 24 điểm phân loại đúng trên tổng 26 điểm trong đó có 2 điểm phân loại nhầm sang đất sông, 1 điểm phân loại nhầm sang đất mặt nước do có sự tương đồng về phổ. Lớp đất cây hoa màu có 3 điểm phân loại đúng trên tổng 5 điểm, trong đó 1 điểm phân loại nhầm sang đất khác do 2 loại này có sự tương đồng về phổ. Lớp đất xây dựng có 16 điểm phân loại đúng trên tổng 18 điểm trong đó có 1 điểm nhầm sang đất cây hoa màu;1 điểm phân loại nhầm sang đất khác do trong khu dân cư nông thôn có xen lẫn các khu vực trồng cây ăn quả và khu vườn trồng rau.
Độ chính xác tổng thể ảnh năm 2015 là 86,44%, Hệ số Kappa đạt 0,81. Như vậy ảnh phân loại đạt yêu cầu.
Các nguyên nhân dẫn đến kết quả phân loại có độ chính xác không cao là: - Độ phân giải của dữ liệu ảnh Landsat chỉ ở mức độ trung bình (30m) nên một số loại đất nhỏ lẻ phân bố manh mún không được ghi nhận trên ảnh.
- Do sai sót trong quá trình chọn mẫu, đây là quá trình sử dụng nhiều phương pháp, nhiều nguồn dữ liệu... nên trong quá trình xử lý vẫn tồn tại những sai sót ngoài ý muốn.
- Do sự chênh lệch về khoảng thời gian giữa dữ liệu nghiên cứu và thời điểm lấy mẫu.
Sau khi phân loại, ảnh cần được thực hiện quy trình xử lý hậu phân loại để tạo ra các lớp có khả năng xuất ra bản đồ bằng cách khái quát hóa thông tin. Sử dụng công cụ Classification/Post Classification chọn phương pháp phân tích đa số (Majority Analysis), kích thước cửa sổ lọc Kernel Size (3x3) dùng để gộp các pixel lẻ tẻ, được phân loại lẫn trong chính các lớp chứa nó hoặc lấy kết quả của pixel thiểu số trong cửa số lọc thay thế cho pixel trung tâm.
Kết quả xủa lý sau phân loại ảnh được thể hiện ở hình 4.7 và hình 4.8.