3. Nhận diện theo mẫu thời gian (temporal pattern recognition)
3.3.2. Quá trình phân loạ
3.3.2.1. Quy trình xây dựng ảnh phân loại (hình 3.4).
Hình 3.3. Sơ đồ xây dựng ảnh phân loại
Ảnh 2001 Ảnh 1989
1989
Kết quả phân loại Phân loại Khảo sát thực địa
Đánh giá sau PL Lấy mẫu
3.3.2.2. Các bước thực hiện a. Lấy mẫu
Trong luận văn sử dụng cách chiết xuất thông tin dựa trên phƣơng pháp giải đoán bằng mắt với lý do:
- Phân tích bằng mắt là công việc tổng hợp, kết hợp nhiều thông số của ảnh, bản đồ, tài liệu thực địa và kiến thức chuyên môn.
- Phân tích bằng mắt có thể áp dụng nhiều chuyên ngành khác nhau, trong những điều kiện trang thiết bị khác nhau.
Cơ sở để giải đoán là đƣa vào các dấu hiệu giải đoán trực tiếp hoặc gián tiếp nhƣ yếu tố ảnh, yếu tố địa kỹ thuật và chìa khoá giải đoán.
- Các yếu tố ảnh: Tone ảnh, cấu trúc ảnh, kích thƣớc, mẫu, kiến trúc, bóng, vị trí, màu.
- Các yếu tố địa mạo: địa hình, thực vật, hiện tƣợng sử dụng đất, mạng lƣới thuỷ văn- sông suối.
- Chìa khoá giải đoán ảnh: là tiêu chuẩn để phân biệt đối tƣợng với xác yếu tố giải đoán về đối tƣợng đó. Chìa khoá giải đoán dựa vào kinh nghiệm và kiến thức đƣợc thiết lập cùng những nghiên cứu trên một tấm ảnh cụ thể của ngƣời phân tích.
● Định nghĩa các lớp
Qua thông tin thực địa và khảo sát ảnh bằng mắt thƣờng xác định các lớp sau: nƣớc đục, nƣớc trong, đất trống, thực vật, khu dân cƣ mật độ thấp, khu dân cƣ mật độ cao, bãi cát, đất ẩm.
● Lấy mẫu
Mục đích chung của quá trình lấy mẫu là thu thập một tập hợp thống kê mô tả mẫu phổ cho mỗi loại lớp phủ mặt đất cần phân loại trong ảnh.
Để đảm bảo độ chính xác việc lựa chọn vùng mẫu cần phải thoả mãn những yêu cầu sau:
- Số lƣợng các vùng mẫu của mỗi đối tƣợng cần phải phù hợp về số lƣợng và chọn vùng mẫu nên phân bố đều khu vực nghiên cứu (nếu quá ít không đảm bảo độ chính xác, nếu quá nhiều dễ làm nhiễu).
- Diện tích các vùng mẫu phải đủ lớn, các vùng lấy mẫu không đƣợc gần ranh giới các đối tƣợng khác.
● Độ chính xác lấy mẫu
Độ chính xác lấy mẫu phụ thuộc nhiều vào độ phân tách của mẫu đƣợc lấy. Độ phân tách các mẫu thể hiện:
- Độ tách biệt tốt khi giá trị nằm trong khoảng từ 1.9 đến 2.0.
- Giá trị nằm trong khoảng từ 1.0 đến 1.9 việc lấy mẫu không đảm bảo, phải lấy lại - Giá trị nhỏ hơn 1.0 nên gộp hai mẫu đó lại với nhau.
- Độ phân tách mẫu của quá trình lấy mẫu ảnh 1989, 2001 và 2010 chi tiết tại (phụ lục 1) khẳng định việc lấy mẫu trên ba ảnh có độ tách biệt tốt.
b. Phân loại có kiểm định
Bản chất của quá trình phân loại là so sánh chƣa biết với mẫu phổ của các đối tƣợng đƣợc xây dựng ở giai đoạn lấy mẫu, sau đó quy các pixel này về các đối tƣợng mà chúng gần giống nhất.
Phƣơng pháp phân loại có kiểm định thƣờng dùng thuật toán sau:
- Thuật toán phân loại theo xác suất cực đại (Maximum likelihood). - Thuật toán phân loại theo khoảng cách ngắn nhất (Minimum distance). - Thuật toán phân loại hình hộp (Parallelepipied).
Thuật toán đƣợc dùng trong nghiên cứu này là thuật toán phân loại theo xác suất cực đại (Maximum likelihood) vì đây là phƣơng pháp dựa trên lý thuyết xác suất chặt chẽ, có độ chính xác cao và đƣợc sử dụng rộng rãi. Phƣơng pháp này dùng số liệu mẫu để xác định hàm mật độ phân bố xác suất của mỗi lớp cần phân loại, đỗi với mỗi Pixel đƣợc tính xác suất thuộc vào một lớp nào đó và nó đƣợc gán vào lớp mà xác suất thuộc lớp đó là lớn nhất.
Nguyên lý của phƣơng pháp này là: Mỗi pixel đƣợc tính xác suất tƣơng và nó đƣợc gán vào lớp mà xác suất thuộc lớp đó là lớn nhất.
Theo lý thuyết Bayes:
Gọi x là 1 vector phổ của 1 pixel đang xét. p(x,i) là xác suất để vector x thuộc lớp i. Nguyên tắc của Maximum Likelihood là:
x thuộc lớp i nếu: p(x,i) > p(x, j) với mọi j ≠ i.
Gọi p(x,i) là xác suất để với x cho trƣớc, lớp i chứa vector x. Gọi p(i) là xác suất để lớp i hiện hữu.
Theo định lý Bayes:
p(i/x) = p(x/i) p(i) / p(x).
Do đó, điều kiện chọn lớp cho vector x trở thành: p(x,i) p(i)> p(x, j) p(j).
Nếu đặt Di(x) = p(x,i) p(i).
Khi đó điều kiện để ra quyết định là: x thuộc lớp i nếu Di(x) >Dj(x) với j ≠ i.
Phƣơng pháp này sử dụng với độ chính xác tốt nhƣng khi sử dụng cần phải chú ý tới một số điểm sau:
- Số lƣợng, mật độ và diện tích của các khu vực lấy mẫu phải đủ lớn và hợp lý để giá trị trung bình cũng nhƣ ma trận phƣơng sai - hiệp phƣơng sai tính cho một lớp nào đó có giá trị đúng với thực tế.
- Khi độ tƣơng quan giữa các kênh phổ gần nhau quá cao thì ma trận nghịch đảo của ma trận phƣơng sai - hiệp phƣơng sẽ không ổn định. Vì vậy, trong trƣờng hợp này cần áp dụng những phƣơng pháp làm giảm số kênh phổ nhƣ phƣơng pháp phân tích thành phần chính (Nguyễn Ngọc Thạch, 2004).
c. Kiểm chứng thực địa
Kiểm chứng ảnh sau khi phân loại dựa vào kết quả điều tra thực địa. Mẫu kiểm chứng đƣợc phân bố đều theo các tuyến trên thực địa. Tổ chức đi thực địa theo các tuyến đƣờng giao thông trong khu vực.
Độ chính xác phân loại đƣợc đánh giá thể theo kết quả so sánh và đối chiếu với tài liệu thực tế. Phƣơng pháp đánh giá dựa vào ma trận đánh giá giữa kết quả phân loại với kết quả thực tế và thông qua hệ số thống kê Kappa thể hiện độ chính xác của kết quả phân loại, hệ số Kappa (K) đƣợc tính nhƣ sau:
Trong đó:
+ r : số hàng trong ma trận sai số + xii: các phần tử trên hàng chéo chính
+ xi+: tổng các phần tử trong hàng i kể từ đƣờng chéo chính sang phía phải + x+i: tổng các phần tử trong hàng i kể từ đƣờng chéo chính xuống phía dƣới + N : tổng số pixel của các mẫu kiểm chứng.