Phân loại không giám định có thể được dùng như một phương tiện để sơ bộ tìm hiểu sự chia lớp của một vùng sắp khảo sát hay trong trường hợp thông tin về các lớp phủ là không đầy đủ, hoặc thậm chí không có (ứng dụng trong nhận dạng không có training). Các giải thuật được sử dụng có tên chung là clustering (ghép nhóm). Trong giải thuật clustering, các lớp kết quả là không biết trước, và có thể cả số các lớp cũng không biết trước
Các phương pháp phân loại không kiểm định
Các phương pháp phân loại không kiểm định không yêu cầu phải sử dụng số liệu mẫu mà chỉ sử dụng thuần túy các thông tin phổ trên ảnh. Các pixel trên ảnh sẽ được nhóm (gộp) vào các lớp phổ khác nhau trên cơ sở các nhóm phổ tự nhiên biểu thị qua các giá trị độ xám của ảnh. Sau đó bằng cách xác minh thực địa (hoặc xác minh với các bản đồ khác), mỗi lớp phổ sẽ được phân thành các lớp tương ứng trên thực địa.
Các phương pháp phân loại không kiểm định rất đa dạng, dưới đây ta chỉ xét một số thuật toán thường sử dụng trong viễn thám.
*Phương pháp K giá trị trung bình (K – Mean)
Với phương pháp này số lớp cần phân loại phải được xác định từ trước. Khởi đầu, ta chọn ra K tâm ban đầu của các lớp. rồi tiến hành phân loại các điểm ảnh theo nguyên tắc khoảng cách tối thiểu. Sau đó xác định vị trí trung bình của tất cả các điểm ảnh thuộc lớp, để nhận làm tâm mới, rồi tiến hành phân loại lại tất cả các điểm ảnh. Quá trình này được lặp lại cho tới khi nào tâm của các lớp giữa hai lần lặp không còn thay đổi thì kết thúc.
Phương pháp này có thể được tóm tắt bằng 3 bước cơ bản sau:
Bước 1: Đầu tiên, chọn ra k vectơ làm tâm (mean) cho k lớp khởi đầu
Bước 2: Một vectơ pixel sẽ thuộc lớp mà khỏang cách (Euclide, chẳng hạn) từ nó
đến tâm của lớp là nhỏ nhất (thực hiện với tất cả các vecto trong 1 lần lặp)
Bước 3: Tính lại tâm của các lớp. Nếu tất cả các tâm giữ nguyên, thuật toán dừng;
nếu không quay lại bước 2
Phương pháp có ưu điểm là do các tâm lớp được điều chỉnh dần trong quá trình lặp nên kết quả phân lớp không phụ thuộc vào việc lựa chọn các tâm ban đầu cũng như trình
tự các điểm ảnh được xét và do vậy cho ta kết quả đáng tin cậy nếu số lượng các lớp được xác định đúng ngay từ đầu.
Tuy nhiên, nó có nhược điểm cơ bản là đòi hỏi người sử dụng phải xác định trước số lớp cần phân loại. Trong khi đó việc ước lượng số lớp phổ tồn tại trên ảnh lại hoàn toàn không đơn giản, nhất là đối với những ảnh có số lượng kênh phổ lớn.
* Phương pháp ISODATA (Interactive Self -Organizing Data Analysis)
Đây có thể coi như một cải biên của phương pháp K giá trị trung bình nhằm khắc phục nhược điểm đã nêu của phương pháp này bằng cách sau mỗi lần lặp tiến hành kiểm tra để nhóm gộp, loại bỏ hay tách lớp khi cần, nhờ đó tự điều chỉnh được số lớp trong kết quả phân loại. Thuật toán đòi hỏi người sử dụng phải biết ước lượng để lựa chọn các tham số điều khiển quá trình phân loại
ISODATA có thể coi là thuật toán đáng tin cậy nhất trong số các phương pháp phân loại không giám sát và được cài đặt trong hầu hết các phần mềm xử lý ảnh số. Tuy nhiên, ngoài nhược điểm đã nêu về yêu cầu đối với người sử dụng, thì thời gian xử lý cũng là một yếu điểm đáng kể của phương pháp này.