Một số phương pháp phân loại ảnh đa phổ

- Phân loại theo xác suất cực đại (Maximum likehood classifier - MLC)

Hình 2.3: Xác suất sai số PE cho phân loại theo xác suất cực đại

Phân loại theo xác suất cực đại được sử dụng nhiều trong xử lý ảnh viễn thám. Đây là phương pháp phân loại có kiểm định, mỗi pixel được tính xác suất thuộc vào một lớp nào đó và nó được gán vào lớp mà xác suất thuộc vào lớp đó là lớn nhất. Biến số x là điểm tương ứng với giá trị đặc trưng của pixel trên ảnh đen trắng một chiều, trở thành vector x trong k thành phần tương ứng.

Hình 2.3 thể hiện tập hợp độ xám các pixel trên tập hợp ảnh đa phổ. Hàm xác suất P(x/i) trở thành hàm đa biến và các lớp được chia ra bởi các đường cong trong không gian hai chiều. Các bề mặt trong mảng 3 chiều siêu bề mặt trong mảng k chiều xem như là kết quả của sự phân bố chuẩn và chỉ có hai tham số, giá trị trung bình lớp µ, phương sai σ2 chỉ rõ hàm số đủ.

Tương tự chỉ có các thông số của sự phân phối chuẩn hai chiều M và ma trận phương sai, hiệp phương sai ∑ chỉ ra các thông số sự phân bố chuẩn mảng hai chiều, giá trị µ1, µ2 là các giá trị trung bình của lớp giá trị phương

sai σ11 và σ22 là số hạng đường chéo của ma trận. Thành phần chính của ma trận phương sai - hiệp phương sai còn có các phần tử σ12 ,σ21.

[ ( ) − ]. [ ( ) − ] = ∑ 1 1 2 21 (2.1) 12 ( − ) =1

x1(I) và x2(I) là hai giá trị đặc trưng mẫu I.

Vector trung bình:

]

(2.2)

Ma trận phươ ng sai, hiệp phươ ng sai: ∑ = [1 12

2 21 2 Hệ số tương quan ρ = 12 (2.3) ( 1 2)1/2 2 11 12 1 12 ∑ = [ 21 22 ] = ∑ [ 21 2 2] (2.4)

Nếu σ12i = σ21i thì ma trận phương sai, hiệp phương sai là đối xứng.

σ11i = σ21i nó sẽ luôn dương và chỉ không dương nếu nguyên tố nằm ngoài đường chéo.

Ý nghĩa của số hạng nằm ngoài đường chéo của ma trận phương sai, hiệp phương sai được đánh giá theo sự xác định hệ số tương quan giữa hai chiều như:

12 =

( . )1/2

11 22

Trong dạng chuẩn hóa này 12icó thể nhận mang giá trị âm hoặc dương. Hình dáng của sự phân bố hai chiều bình thường cho các giá trị khác của ρ12i.

Vì vậy ρ12i ≈ 0 thì sự phụ thuộc giữa hai chiều là rất ít.

Dạng tổng quát đa biến cho sự phân bố chuẩn k chiều dương được mô tả: P(x/i) = 1 . [− 1( − ) . ∑−1( − )] (2.5) (∑ )1/2(2 ) /2 2 Trong đó: x: là vector ảnh

Mi: là vector trung bình của lớp i

=[1 2]

∑i: là ma trận phương sai, hiệp phương sai

∑i-1: là ma trận nghịch đảo của ma trận hiệp phương sai (∑i): là định thức của ma trận phương sai, hiệp phương sai k: là số kênh phổ.

Hàm biệt thức tốt nhất Bayes k chiều:

Di(x) = ln[ − ln(2 ) − 1[(∑ )] − 1( − )] (2.6)

( )

2 2 2

Hàm số biệt thức Bayer tốt nhất trong mảng k chiều được biểu diễn theo biểu thức (2.6) là phương trình của phương pháp phân loại theo xác suất cực đại. Biểu thức (2.5) là cơ ở toán học của phương pháp phân loại theo xác suất cực đại, dạng của nó phụ thuộc vào mối quan hệ giữa các trị trung bình và ma trận phương sai, hiệp phương sai của các lớp khác nhau.

- Phân loại theo phương pháp láng giềng gần nhất (K-Nearest neighbour Classifier)

Phân loại theo phương pháp láng giềng gần nhất được sử dụng để phân loại các đối tượng trong không gian phổ đa chiều. Khoảng cách giữa các pixel được sử dụng như thước đo đánh giá sự phụ thuộc về lớp nào đó của pixel đang khảo sát.

Với thuật toán này, mỗi giá trị pixel ẩn số của vector đặc trưng x sẽ được

phân về lớp có giá trị vector trung bình Mi gần với x. Thêm vào đó, sự xuất hiện

trực quan rõ ràng, tính toán đơn giản của sự tiếp cận này, nếu chúng ta giả sử rằng ma trận phương sai, hiệp phương sai của tất cả các lớp là bằng nhau.

∑i = ∑j = ∑0 (2.7)

Và xác suất tiên nghiệm bằng nhau:

P(i) = P(j) = P(0) (2.8) Hàm biệt thức sẽ là: Di(x) = A - 1 ( − ) . ∑−1( − ) (2.9) 2 0 Ở đây A là hằng số:

Và có thể bỏ đi sự so sánh của Di cho các lớp khác nhau và đại lượng dMi được tính như sau:

dMi = - 1

( − ) . ∑−1( − ) (2.11)

Khoảng cách này là khoảng cách Mahalanobis.

Khai triển của dạng phương trình này dẫn đến phương trình bậc hai của X dạng bậc hai này là dạng độc lập của i và vì vậy nó có thể được liên hợp với A.

Nếu các ma trận phương sai, hiệp phương sai được nén về dạng đường chéo, nghĩa là các đặc trưng không tương đương khi đó:

2 0 (2.12) ∑i = [ 0 ] 0 2 0 Di(x) = A- ( − ) .( − ) (2.13) 2.2 0

Đại lượng (X-Mi)T.(X-Mi) là vô hướng của tổng các số hạng bình phương: d2i2 = (X - Mi)T.(X - Mi) = (X1 – X1i)2 + (X2 – X2i)T + ... + (Xk – Mki) (2.14)

Đây là công thức bình phương khoảng cách Ơ cơ lít giữa vector X và Mi.

Công thức (2.14) biểu diễn hàm biệt thức của phương pháp phân loại

theo nguyên lý khoảng cách tối thiểu.

Di(x) sẽ lớn nhất đối với lớp i khi khoảng cách d2i nhỏ nhất trong lớp này, nghĩa là lớp này có giá trị trung bình gần nhất. Một cách sử dụng khác là khoảng cách (City Block), được xác định:

d1i = (|X1 – M1i| + |X2 – M2i| + ... + |Xk – Mki|) (2.15) Để mô tả sự khác nhau về suy đoán các đường biên bằng hai phương thức: khoảng cách tối thiểu và khoảng cách (City Block) với việc đo khoảng cách d1 và d2 theo tập hợp của 3 phân bố chuẩn trong mảng hai chiều.

Hình 2.4: Khoảng cách "City Block" (d1) và "Ocolit" trong mảng 2 chiều

Hàm mật độ xác suất có giá trị trung bình khác nhau và khác nhau các giá trị trung bình ngoài đường chéo của ma trận phương sai, hiệp phương sai nhưng xác suất tiên nghiệm lại bằng nhau. Ranh giới suy đoán từ các thuật toán khác nhau được nêu ra ở hình sau:

Hình 2.5: Ranh giới cho 3 lớp tập hợp hai chiều Nhận xét:

Phương pháp phân loại theo xác suất cực đại và khoảng cách ngắn nhất suy đoán ranh giới là hoàn toàn khác nhau. Chúng có thể được nhận ra nếu điều kiện đầu theo công thức (2.14) thỏa mãn.

Thuật toán khoảng cách ngắn nhất có những ranh giới suy đoán khác nhau với hai hàm khoảng cách d1 và d2. Khi sử dụng khoảng cách d1, các

đường ranh giới có dạng tuyến tính từng phần và xấp xỉ với ranh giới tuyến tính khi sử dụng khoảng cách d2.

Vùng tách rời được chia ra cho hai lớp. Trong trường hợp khoảng cách ngắn nhất chỉ ra rằng xác suất cho lớp 2 là lớn hơn trong vùng, nó chỉ ra sự cần thiết đối với ranh giới, loại bỏ sự phân loại không hợp lý của nguyên tắc chung, nghĩa là vector đặc trưng của pixel khác xa với bất kỳ vector trung bình của lớp xác định.

Tóm lại thuật toán khoảng cách ngắn nhất đưa đến thuật toán đơn giản có

thể lập trình hóa có kết quả, đặc biệt khi sử dụng khoảng cách d1. Tuy nhiên

không giống như phân loại theo xác suất cực đại, nó không được sử dụng trong

lý thuyết sai số. Phân loại trung bình tối thiểu chỉ sử dụng khoảng cách d2

(trường hợp ma trận phương sai, hiệp phương sai nén về dạng đường chéo).

-Phân loại hình hộp (Box Classfier)

Phân loại hình hộp thuộc vào nhóm phương pháp phân loại có kiểm định đơn giản nhất. Trong phương pháp này mỗi trục phổ được chia làm nhiều lớp dựa trên các giá trị tối đa, tối thiểu của tập mẫu tương ứng.

Nói cách khác trong không gian phổ này ta xác định các "hộp" bao bọc một nhóm cùng tính chất. Các pixel nằm trong "hộp" không gian giới hạn bởi các miền trên trục phổ, như vậy sẽ được phân loại vào nhóm tương ứng. Phương pháp này tốc độ thực hiện cao nhưng độ chính xác còn hạn chế. Bản chất hình học được mô tả như sau:

Hình 2.6: Bản chất hình học của phân loại hình hộp

Quá trình phân loại theo phương pháp hình "hộp" được tiến hành như sau:

+ Xác định đường bao cho tất cả các hộp đặc trưng theo các vùng liên tục (vùng lấy mẫu). Tức là vùng có đặc tính đặc trưng xác định như nước, đất, thực vật ... trên ảnh gốc và đã xác định nêu ở thực địa. Đối với từng lớp liên tục đó có giá trị trung bình (µ) có phương sai σ2 của sự phân

bố độ đen cần thiết để tính toán:

1 = ∑ =1 n i  n i 2 ni ∑X ijk2 −  ∑ X ijk  δij2 = k =1 k =1  (2.16) ni ( ni −1) Trong đó: (i = 1,2,...ni; j = 1,2,....NB) i: Số thứ tự của lớp trong tổng N lớp j: Số thứ tự của băng trong tổng NB băng k: Số thứ tự của pixel trong tổng Ni pixel.

( Xmin)ij = µij - kσij

(2.17)

( Xmax)ij = µij + kσij (2.18)

Ở đây k là hệ số tỷ lệ được lựa chọn, ( Xmin)ij , ( Xmax)ij là giới hạn thống nhất và cao nhất của vùng bao lớp i trên băng ảnh j.

+ Đối với các pixel bao trên ảnh gốc, việc giải đoán các đặc trưng sẽ thực hiện theo điều kiện sau: Nếu (Xmin)ij < Xik < (Xmax)ij, (j = 1, 2, ... NB) thì pixel k thuộc lớp j và ngược lại pixel k không thuộc lớp i.

Trong quá trình xử lý, kết quả phân loại ảnh có thể thứ tự lớp được gán cho từng pixel.

- Phương pháp phân loại theo cây quyết định (Decision Tree - DT)

Là phương pháp phân loại dựa trên cơ sở phân cấp. Người phân loại sẽ phải suất phát từ việc đánh giá khả năng phân tách các đối tượng dựa trên tri thức chuyên gia kết hợp với đặc tính phổ của vùng mẫu để tạo dựng ra sơ đồ phân loại. Trong thực tế, không có thuật toán tổng quát cho phương pháp phân loại này, do đó từng cây quyết định hay luật phân loại thường được thiết kế bởi chuyên gia sao cho khả năng phân biệt giữa các loại cao nhất. Hàm quyết định dựa vào việc so sánh giá trị của điểm đang xét với giá trị ngưỡng nào đó.

Có thể kết hợp các thông tin khác (như ảnh NDVI, slope ...) của ảnh trong phân lớp. Cấu trúc cây nhị phân tại mỗi node giá trị của một biểu thức được đánh giá (Yes/No) và các pixel được phân đôi theo biểu thức này. Tại mỗi nhánh có thể phân chia hay dừng lại nếu thấy đạt được tiêu chí phân loại.

- Phương pháp phân loại mạng neural LNN (Layered Neural Networks)

Những năm gần đây mạng neural đa lớp LNN đã được nghiên cứu áp dụng trong lĩnh vực nhận dạng và xử lý ảnh số. Cấu trúc của mạng

neural đa lớp bao gồm một lớp nhập, một lớp xuất và một lớp trung gian. Số lớp trong lớp nhập và xuất cố định và được quyết định bởi người sử dụng. Tín hiệu đi từ lớp nhập và xuất thông qua tuyến nối giữa các neuron và mỗi tuyến nối có giá trị trọng số, trọng số tương ứng gọi là trọng số nối. Vì neuron nhập chỉ nhận và truyền tín hiệu, còn các neuron ở lớp ẩn và xuất đều sử dụng cùng hàm kích hoạt. Do đó khi cấu trúc ổn định, xuất của mạng neuron đa lớp được xác định bởi giá trị của các trọng số nối. Huấn luyện khả năng nhận biết của LNN là quá trình điều chỉnh các giá trị trọng số, sao cho giá trị xuất của LNN phù hợp giá trị mong muốn. Để ứng dụng LNN trong phân loại ảnh vệ tinh, số neuron của lớp nhập tương ứng với số kênh phổ của ảnh, số neuron của lớp xuất tương ứng số loại cần xác định và số neuron sẽ do nhà phân tích quyết định.

Phương pháp LNN trong phân loại gọi là phương pháp phi tham số có khả năng ứng dụng rất tốt trong xử lý ảnh viễn thám. LNN thường được sử dụng để khắc phục thuật toán MLC nhằm nâng cao độ chính xác phân loại trong những trường hợp ảnh vệ tinh có sự tương quan giữa các kênh phổ. Vấn đề khó khăn cho người sử dụng là việc lựa chọn mô hình thích hợp để LNN nhận biết bộ dữ liệu mẫu sẵn có để phân loại chính xác các dữ liệu chưa biết trong phân loại.

-Phân loại mờ (fuzzy classificatio)

Lý luận mờ là một phương pháp toán học nhằm lượng hóa các phát biểu mơ hồ. Ý tưởng cơ bản là thay thế hai phát biểu lý luận nghiêm ngặt "có" và "không" bởi dãy liên tục [0...1], mà "0" có nghĩa là không chính xác và "1" là "chính xác". Mọi giá trị giữa 0 và 1 đại diện một phát biểu ít nhiều chắc chắn của "chính xác" và "không chính xác". Vì vậy các hệ phân loại mờ thích hợp tốt với việc xử lý hầu hết các vấn đề trong tách thông tin viễn thám. Do các loại thuộc lớp phủ mặt đất khá đa dạng nên việc chỉ định chính xác các pixel đến từng loại cụ thể không đơn giản.

Mục tiêu phân loại là tìm sự phù hợp 1-1 giữa thông tin phổ của pixel và thông tin loại tương ứng (dựa vào bộ dữ liệu mẫu) và mong muốn sự phân loại đạt độ chính xác cao nhất. Tuy nhiên trong thực tế nhiều trường hợp gặp phải bởi các phương pháp phân loại truyền thống đó là sự không phân biệt rõ ràng giữa "chính xác" và "không chính xác" như [7].

Một số phương pháp phân loại ảnh đa phổ

Nghiên cứu trên thế giới

Phương pháp xử lý thông tin viễn thám