D- năng lượng phản xạ được tách và ghi nhận bởi bộ cảm biến
E- truyền dữ liệu về các trạm thu để xử lý F giải đốn và phân tích ảnh Viễn thám
2.3.4.2. Phân loại các đối tượng trên ảnh
Phân loại là quá trình tách hay gộp thơng tin dựa trên các tính chất phổ, khơng gian và thời gian cho bởi ảnh của đối tượng cần nghiên cứu. Mục tiêu của phân loại các đối tượng trên ảnh là làm phù hợp loại phổ của dữ liệu ảnh với loại thơng tin được yêu cầu bởi người giải đốn.
Phương pháp phân loại được thực hiện bằng cách gán tên loại (loại thơng tin) cho các khoảng cấp độ sáng nhất định (loại phổ) thuộc một nhĩm đối tượng nào đĩ cĩ các tính chất tương đối đồng nhất về phổ nhằm phân biệt các nhĩm đĩ với nhau trong khuơn khổ ảnh.
Các bước phân loại
- Bước 1: Xác định số loại thơng tin cần phân chia trong khu vực, các loại cần được định nghĩa rõ ràng về mặt chỉ tiêu, các chỉ tiêu này cần được lựa chọn
cĩ tính đến đặc thù của dữ liệu ảnh vệ tinh (thời gian thu nhận ảnh, độ phân giải khơng gian, phổ...)
- Bước 2: Tuyển chọn các đặc trưng bao gồm các đặc trưng về phổ của đối tượng (ảnh đa phổ) biến động về thời gian (ảnh đa thời gian) hoặc cấu trúc cụ thể của đối tượng nhằm thiết lập tiêu chuẩn cho phép phân biệt giữa các loại quan tâm (xử lý riêng lẻ hoặc phối hợp với nhau).
- Bước 3: Chọn vùng mẫu trên ảnh bao gồm dữ liệu tương ứng với vùng mẫu được khảo sát thuộc địa hoặc từ những dữ liệu cần thiết được lựa chọn dựa trên kết quả của bước 1 và bước 2. Các số liệu lấy được trên cơ sở vùng mẫu cĩ ý nghĩa quyết định trong việc thành lập các chỉ tiêu và luật quyết định trong phân loại, từ đĩ chọn thuật tốn thích hợp của một trong hai phương pháp phân loại (cĩ giám định và phi giám định).
- Bước 4: Ước tính thống kê vùng mẫu nhằm xác định các giá trị tương ứng với loại phổ trong khơng gian đặc trưng của đối tượng quan tâm, từ đĩ áp dụng nhiều phương pháp phân loại khác nhau ứng với vùng mẫu và so sánh kết quả đạt được nhằm tìm thuật tốn tối ưu nhất cho kết quả phân loại.
- Bước 5: Phân loại dựa trên luật quyết định và các chỉ tiêu đã thiết lập, các pixel sẽ được phân tuần tự vào các loại tương ứng đã xác định. Cĩ nhiều kỹ thuật phân loại khác nhau thường được sử dụng như:
+ Phân loại hình hộp
+ Phân loại theo khoảng cách ngắn nhất
+ Phân loại theo xác suất cực đại (gần đúng nhất)
+ Các kỹ thuật phân loại dựa trên lý thuyết Neural Networks, Fuzzy, hệ chuyên gia...
- Bước 6: Ảnh sau khi phân loại được làm trơn bởi các thuật tốn lọc, đây là giai đoạn hậu xử lý sau khi phân loại.
- Bước 7: Kiểm tra kết quả phân loại để đánh giá độ chính xác và mức độ tin cậy của ảnh sau khi được phân loại. Bằng cách tính tốn các chỉ số trong ma trận sai số phân loại và nếu các chỉ tiêu hay thuật tốn phân loại một cách phù hợp nhằm đạt được kết quả tốt hơn.
Sơ đồ 3: Các bước phân loại ảnh viễn thám
Các phương pháp phân loại
Phân loại cĩ giám định (phân loại cĩ giám sát) :
Phân loại cĩ giám định là một hình thức phân loại mà các chỉ tiêu phân loại được xác lập dựa trên các vùng mẫu và dùng luật quyết định dựa trên thuật tốn thích hợp để gán nhãn pixel ứng với từng vùng phủ cụ thể. Các vùng mẫu là những khu vực trên ảnh tương ứng với từng loại mà người giải đốn biết được đặc trưng phổ (hay đặc tính). Dựa trên dữ liệu huấn luyện thu được trên từng vùng
Xác định các loại mẫu cần phân chia
Tuyển chọn các đặc trưng vùng
Chọn vùng mẫu
Ước tính thống kê vùng mẫu
Phân loại (dựa trên luật quyết định và các chỉ tiêu đã thiết lập)
Hậu xử lý sau khi phân loại
mẫu, các tham số thống kê được xác định, từ đĩ các chỉ tiêu phân loại được sử dụng trong quá trình chỉ định pixel thuộc từng loại cụ thể.
Phân loại phi giám định (phân loại phi giám sát) :
Tại những khu vực khơng cĩ thơng tin về đối tượng cần phân loại, kỹ thuật phân loại này thường được sử dụng, nĩ chỉ sử dụng thuần túy thơng tin phổ do ảnh cung cấp và địi hỏi người phân tích phải cĩ kinh nghiệm về việc chỉ định số cụm phổ ban đầu. Trình tự thực hiện được tĩm tắt như sau:
- Từ các dữ liệu mẫu được chọn ngẫu nhiên, các pixel trên ảnh được gộp thành các nhĩm cĩ các đặc trưng phổ tương đối đồng nhất bằng kỹ thuật ghép nhĩm.
- Sau đĩ, loại ứng với từng nhĩm được xác định và sử dụng các nhĩm này ước tính các tham số thống kê cho quá trình phân loại tiếp theo.
Xác định các tham số thống kê vùng mẫu
Việc xác định các tham số thống kê vùng mẫu phụ thuộc cụ thể vào phương pháp phân loại sẽ sử dụng. Tuy nhiên, phần lớn các phương pháp phân loại đều sử dụng hàm mật độ xác suất và các tham số như giá trị trung bình vùng mẫu, ma trận phương sai – hiệp phương sai... của hàm phân bố chuẩn được tính như sau: Giá trị trung bình: ∑ = = n k k k BV n 1 1 µ
Ma trận phương sai – hiệp phương sai:
1 ) )( ( } ) )( {( 1 1 1 1 − − − = = − − = ∑ ∑ = n BV BV Cov X X E n i i k ik k t k µ µ µ µ
Trước khi sử dụng hàm phân bố chuẩn trong phân loại, cần phải kiểm tra xem sự phân bố của dữ liệu huấn luyện ứng với từng vùng mẫu cĩ phù hợp với luật phân bố chuẩn hay khơng.
Hình 4: Ước tính tham số thống kê phụ thuộc vùng mẫu a) Lấy mẫu khơng thích hợp; b) Lấy mẫu thích hợp
Nguyên lý phân loại ảnh vệ tinh
Phân loại cĩ giám định hay phi giám định là một hình thức phân loại mà các chỉ tiêu phân loại được xác lập dựa trên đặc trưng phổ của các vùng mẫu và dùng luật quyết định thích hợp để gán nhãn pixel ứng với từng vùng phủ cụ thể. Các vùng mẫu là những khu vực trên ảnh tương ứng với số loại mà người phân tích cần thành lập trên ảnh đã phân loại.
Phân loại cĩ giám định là phương pháp thường được sử dụng nhất hiện nay, cĩ nhiều thuật tốn được áp dụng, nhưng phương pháp phân loại gần đúng nhất
(Maximum Likelihood Classifier - MLC) được áp dụng khá phổ biến và được xem là thuật tốn chuẩn để so sánh với các thuật tốn khác. MLC được xây dựng trên cơ sở giả thuyết hàm mật độ xác suất tuân theo luật phân bố chuẩn. Mỗi pixel được tính xác suất thuộc vào một loại nào đĩ và nĩ được chỉ định gán tên loại mà xác suất thuộc vào loại đĩ là lớn nhất.