Lμ việc phân loại thuần tuý theo tính chất phổ mμ khơng biết rõ tên hay tính chất của lớp phổ đó vμ việc đặt tên chỉ lμ tơng đối. Khác với phân loại có kiểm tra, phân loại khơng kiểm tra không tạo các vùng thử nghiệm mμ chỉ lμ việc phân lớp phổ (Chistens) vμ quá trình phân lớp phổ đồng thời lμ quá trình phân loại. Số lợng vμ tên các lớp đợc xác định một cách tơng đối khi sánh với tμi liệu mặt đất. Việc phân loại không kiểm tra cũng gần giống nh việc lọc ngỡng phổ (Density Slicing) đã nêu ở phần trên.
Bảng 8.4: Ma trận khác biệt chuyển đổi dùng để đánh giá cặp các lớp phân loại về
sự phân cách phổ (Theo Thomas M. Lillesand vμ Ralph W. Kiefer, 2000). Lớp phổ W1 W2 W3 C1 C2 C3 C4 H1 H2 W1 0 W2 1185 0 W3 1410 680 0 C1 1997 2000 1910 0 C2 1953 1890 1874 860 0 C3 1980 1953 1930 1340 1353 0 C4 1992 1997 2000 1700 1810 1749 0 H1 2000 1839 1911 1410 1123 860 1712 0 H2 1995 1967 1935 1563 1602 1197 1621 721 0
Hình 8.30:ảnh phân loại sử dụng đất huyện Từ Liêm ( ảnh trái ) lμ kết quả phân loại có giám sát của ảnh SPOT (ảnh phải )
Những nhóm phổ đợc chia ra theo phổ gần giống nhau của chúng dựa trên thuật tốn thống kê. Đối với ảnh số có cấu trúc số lμ 8 bit thì giá trị số của một kênh ảnh có khoảng giá trị từ 0-255. Trong khoảng giá trị số nμy sẽ chia ra những khoảng giá trị phổ khác nhau theo đặc tính đồng nhất của chúng. Số khoảng phổ đồng nhất nμy đợc gọi lμ số nhóm phổ, tơng ứng với các đối tợng không gian sẽ đợc phân loại. Trong qui trình chạy phân loại tự động, để có thể xác định một cách tơng đối số lợng các nhóm phổ, ta cần xem biểu đồ phân bố phổ (histogram) của từng kênh ảnh để có thể tạm thời xác định ra bao nhiêu nhóm phổ khác nhau. Trong phép phân loại khơng giám sát có các cách tùy chọn khác nhau. Cách tùy chọn đầu tiên lμ máy tự phân loại theo nhóm phổ. Cách tùy chọn thứ hai lμ dựa trên mẫu nhóm phổ của biểu đồ phân bố phổ mμ ngời giải đoán sẽ định ra số lợng nhóm phổ nhiều nhất trong phân loại. Phân loại khơng giám sát dựa trên nhóm phổ theo các khoảng giá trị phổ hay còn gọi lμ các chùm phổ trong ảnh. Sau khi phổ đã đợc phân loại tự động ngời giải đốn sẽ gắn từng nhóm phổ với đối tợng không gian thực vμ đặt tên cho chúng qua việc khảo sát thực địa hoặc đối sánh trên bản đồ.
.
Hình 8.33:ảnh vệ tinh Landsat Tm band3 vμ phân loại thμnh 5 lớp
Hình 8.31: Sự phân loại các đối tợng Hình 8.32:Kết quả phân loại ảnh theo ngỡng
Gía trị số kênh 3
Gía trị số kênh 3
Giá trị số kênh Giá trị số kênh 4 4
(a) (b)
Hình 8.34: Phân loại hình hộp (trái) nguyên tắc;
(phải) ứng dụng cho phân ranh giới theo bớc. x Các thuật toán phân loại trong xử lý ảnh số
Có nhiều thuật tốn phân loại khác nhau : iều thuật toán phân loại khác nhau :
1. Phân loại hình hộp : lμ phơng pháp có kiểm đị
1. Phân loại hình hộp : lμ phơng pháp có kiểm định đơn giản nhất. Bản
chất hơng pháp nμy mỗi trục
phủ đ
Phân loại khoảng cách ngắn nhất (mini
để phân loại các đối tợng trong khôn
Pk = [m , m , .. .m ], t - hμm chuyển vị Có nh
nh đơn giản nhất. Bản
chất hơng pháp nμy mỗi trục
phủ đ
Phân loại khoảng cách ngắn nhất (mini
để phân loại các đối tợng trong khôn
Pk = [m , m , .. .m ], t - hμm chuyển vị
hình học của nó đựơc mơ tả trên hình 8.31. Trong p hình học của nó đựơc mơ tả trên hình 8.31. Trong p
ợc chia thμnh nhiều lớp dựa trên các giá trị tối thiểu của tệp mẫu. Các pixel nằm trong không gian giới hạn bởi các miền xác định trên trục phủ nh vậy sẽ đợc phân loại vμ nhóm tơng ứng. Phơng pháp nμy rất đơn giản vμ rất dễ hiểu, tốc độ thực hiện trên máy tính cũng rất cao nhng độ chính xác vμ khả năng áp dụng nhiều khi còn bị hạn chế.
2. Phân loại khoảng cách ngắn nhất
ợc chia thμnh nhiều lớp dựa trên các giá trị tối thiểu của tệp mẫu. Các pixel nằm trong không gian giới hạn bởi các miền xác định trên trục phủ nh vậy sẽ đợc phân loại vμ nhóm tơng ứng. Phơng pháp nμy rất đơn giản vμ rất dễ hiểu, tốc độ thực hiện trên máy tính cũng rất cao nhng độ chính xác vμ khả năng áp dụng nhiều khi còn bị hạn chế.
2. Phân loại khoảng cách ngắn nhất
Giá trị số kênh
Giá tr
ị số kênh 3
Hình 8.35: Nguyên lý phân loại theo
khoảng cách ngắn nhất
mun distance classifer) đợc sử dụng
mun distance classifer) đợc sử dụng
g gian phổ đa chiều. Độ lớn của khoảng cách giữa các pixel đợc sử dụng nh thớc đo đánh giá sự thuộc về một lớp nμo đó
Pk -Vectơ trunh bình của lớp thứ k đợc tính theo cơng thức:
g gian phổ đa chiều. Độ lớn của khoảng cách giữa các pixel đợc sử dụng nh thớc đo đánh giá sự thuộc về một lớp nμo đó
Pk -Vectơ trunh bình của lớp thứ k đợc tính theo cơng thức:
1 2 n
3. Phân loại xác xuất cực đại (Gaussian Maximum Liklihood)
Phơng pháp phân loại theo xác xuất cực đại đợc sử dụng thờng xuyên trong xử lý ảnh viễn thám. Mỗi pixel đợc tính xác xuất thuộc vμo một lớp nμo đó vμ nó đợc gán vμo lớp mμ xác xuất thuộc vμo lớp đó lμ lớn nhất. Trên hình 8.33 thể hiện các nguyên lý phân loại phơng pháp xác xuất cực đại. Phơng pháp phân loại xác
ằằ ằ ằ ằ ẳ º ô ô ô ô ơ ê nn k V V V V ... ... 0 : : : : 0 ... 0 0 ... 0 22 11 Ma trận phơng sai: Ma trận phơng sai-hiệp phơng sai: Ư ằ ằ ằ ằ ẳ º ô ô ô ô ơ ê K nn n n n n V V V V V V V V V .... : : : : .... .... 2 1 2 22 21 1 12 11 Mật độ xác suất Xác suất lớp B: lớn Xác suất lớp A: nhỏ
Phân loại theo các lớp Kênh 1
Kênh 2
Giả sử các giá trị chính của phân bố chuẩn
Lớp A
Lớp B
Kênh 1
xuất cực đại có rất nhiều u việt xét theo quan điểm lý thuyến xác suất. Tuy vậy khi sử dụng nó cần chú ý tới các điểm sau:
ma trận p
tiễn.
h trong một số trờng hợp khi mμ độ tơng quan giữa các kênh phổ gần nhau quá cao.
Trong tr hổ đi ví dụ nh ph ân bố của các đối t phơng phá p về đờng cong phổ c hủng loại thực vậ
giới để giá trong
phân
mẫu phổ mới. Khi các mẫu phổ đợc xác định thì qui trình chạy phân loại đợc thực Xác suất
Cát
- Số lợng các khu vực lấy mẫu phải đủ lớn để các giá trị trung bình cũng nh hơng sai, hiệp phơng sai tính cho một lớp nμo đó có giá trị đúng với thực - Ma trận nghịch đảo của ma trận phơng sai hiệp phơng sai sẽ không ổn địn
ờng hợp nh vậy cần áp dụng các phơng pháp lμm giảm số kênh p ơng pháp phân tích thμnh phần chính. Trong trờng hợp hμm ph
ợng nghiên cứu khơng theo phân bố chuẩn gauss thì khơng nên sử dung p nμy.
Phân loại hỗn hợp phổ
Phân loại hỗn hợp dùng để đánh giá nơi có sự biến thiên phức tạ
ho một kiểu phủ hiện thời. Phân loại nμy thờng dùng trong việc phân loại lớp phủ thực vật. Sự biến thiên về phổ đặc trng bởi biến thiên do các c
t vμ điều kiện đất, độ dốc, hớng dốc...Trong phân loại nμy, việc vạch ra ranh m sát cho một loại đối tợng phổ không hoμn toμn đồng nhất nh
loại giám sát. Dữ liệu từ tất cả các vùng đμo tạo cho một đối tợng lớp sau đó đợc dùng trong phân loại khơng giám sát theo chùm để tạo ra các mẫu phổ, có thể đến 20 mẫu. Những mẫu phổ nμy đợc đánh giá, xem xét, loại bỏ những mẫu không cần thiết hoặc gộp một số mẫu có đặc tính phổ gần nhau, tạo nên một tổ hợp
Đô thị Ngô cỏ Giá trị số kênh 3 Rừng Đờng đẳng xác suất Giá trị số kênh 3 Giá trị số kênh 4 Nớc Giá trị số kênh 4
Hình 8.37: Biểu đồ mật độ xác suất xác định bởi xác suất cực đại A
hiện, có thể dùng xác suất cực đại để phân loại. Qui trình phân loại hỗn hợp có thể đợc liệt kê theo trình tự sau:
1. Khoanh vi vùng lấy mẫu phổ cho một lớp X
2. Phân tích chùm của tất cả các pixel thuộc X thμnh các phụ nhóm phổ X1, X2, ....Xn sử dụng phân loại tự động.
3. Xem xét các mẫu phổ vừa đợc tạo nên bằng phân loại tự động cho lớp X bằng việc xóa, gộp trên cơ sở hiển thị các phụ lớp trên mμn hình, đánh giá biểu đồ đa chiều cho mỗi chùm hoặc đo khoảng cách đa biến (xử dụng khác biệt chuyển đổi hoặc khoảng cách JM )
4. Lập lại qui trình từ 1-3 cho các lớp khác
5. Một lần nữa lại kiểm tra mẫu phổ vμ gộp hoặc xóa mẫu khơng cần thiết. 6. Thực hiện chạy phân loại
Phân loại các pixel hỗn hợp với nhiều loại t liệu
Phụ thuộc vμo độ phân giải của đầu ghi phổ, một pixel ảnh vệ tinh có thể chứa đựng thơng tin về một (nếu một kiểu hiện trạng dới đất phủ trong diện một pixel) hoặc
giới hạn trên mặt đất. Kết quả lμ sự tính tốn diện tích tơng đối của từng pixel trong từng lớp trên mặt đất. Nhiều ứng dụng đã sử dụng mơ hình tuyến
hơn một kiểu hiện trạng (nếu pixel phủ một vμi loại hiện trạng). Pixel hỗn tạp nμy rất khó phân loại, vì ta khơng biết ghép chính xác nó vμo lớp nμo. Có hai kiểu phân loại đợc thực hiện trong quá trình phân loại hỗn hợp lμ, phân loại hỗn tạp
phổ vμphân loại fuzzy. Chúng mang ý nghĩa lμ phân loại phụ pixel.
Phân loại hỗn tạp phổ
Phân loại phổ hỗn tạp bao gồm khoảng công nghệ so sánh các pixel hỗn tạp phổ với một tập hợp phổ mẫu đợc đo tại phịng thí nghiệm, ngoμi thực địa hoặc trên ảnh. Trong quan niệm rằng sự biến thiên phổ trên ảnh gây ra bởi sự pha trộn của một nhóm đối tợng có
tính trong phân tích pixel hỗn tạp. Theo mơ hình nμy, đờng cong phổ quan sát đợc từ một vùng trên mặt đất lμ xen tạp tuyến tính phổ của tất cả các kiểu phủ đất trong vùng. Mẫu phổ tham chiếu tuyệt đối nμy đợc coi lμ thμnh viên cuối, bởi lẽ, chúng đại diện cho trờng hợp lμ 100% của trờng nhìn phủ bởi một loại đối tợng. Trong mơ hình tuyến tính, phân phụ pixel cần thỏa mãn hai điều kiện cho một pixel ảnh. Điều kiện thứ nhất lμ tổng của hợp phần của tất cả các thμnh viên đại diện (cuối) tạo nên một pixel hỗn tạp phải bằng 1 vμ đợc xác định theo công thức:
trong 1 2 N n tạp.
ông thức sau:
tạp chứa trong pixel hỗn tạp; DNO, 1, DNO, 2, ... DNO, N lμ giá
trị số pixel thμnh viên cuối vμ EO lμ sai
số.
m lμ một pixel có thể tham gia v
ự liên hệ chung. Trong trờng hợp sử dụng phân loại fuzzi có giám sát, qui trình gần giống nh
u cầu. Ngun tắc đánh giá lμ so sánh giữa tμi liệu thực tế (Ground Truth) vμ kết quả phân loại. Phơng pháp phổ biến trong đánh giá lμ thμnh lập ma trận đánh giá theo phơng pháp Crossing giữa kết quả phân loại vμ bản đồ thực tế (bảng 8.5). 1 .... 3 2 1
đó: F , F vμ F lμ phần đại diện trong pixel hỗ
1
Ưn Fi F F F FN
i
Điều kiện thứ hai lμ, đối với một kênh phổ cho trớc với bớc sóng O giá trị số của pixel quan sát DN thể hiện tổng giá trị số đợc tính theo cO
DNO = F1DNO, 1 + F2DNO, 2 + ...+ FNDNO, N + EO
trong đó: DNO lμ giá trị tổ hợp số quan sát trên kênh O; F1, F2,, F3 ...FN lμ hợp phần của các thμnh viên hỗn
đợc quan sát nếu pixel chứa đựng trọn vẹn
Phân loại tập mờ (Fuzzy)
Phân loại theo phơng pháp nμy sử dụng quan niệ
μo hơn một loại. Một trong những quan niệm của phân loại nμy lμ chùm fuzzi. Phân loại fuzzi gần giống trong phân loại không giám sát sử dụng K-means. Sự khác biệt ở chỗ lμ các vùng fuzzi đợc tạo nên thay cho các ranh giới "cứng" giữa các lớp. Thay cho các vector đợc gắn cho các lớp trong phân loại khơng giám sát thì điểm giá trị của các pixel tham gia trong phân loại fuzzi đợc gắn cho giá trị trung bình của tất cả các lớp đợc phân loại vμ nó thể hiện sự gần gũi của mỗi pixel trong s
phân loại có giám sát thơng thờng sử dụng phép xác suất cực đại. Vector giá trị vμ ma trận tơng quan trong fuzzi đợc thực hiện từ dữ liệu vùng mấu có trọng số. Thay vì khoang vi các vùng đồng nhất trong phép phân loại giám sát, phân loại fuzzi sử dụng tổ hợp của vùng đồng nhất vμ vùng hỗn tạp
Sự pha trộn của các kiểu đối tợng đã biết quyết định trọng số các vùng mẫu trong fuzzi. Các pixel đợc phân loại sau đó đợc gắn điểm cho các pixel một cách tơng đối trong số các pixel của một lớp phân loại. Ví dụ, phân loại thực vật có thể chia ra với điểm lμ 0.68 cho rừng, 0.29 cho đờng vμ 0.03 cho cỏ. Tổng số điểm cho tất cả các lớplμ 1.
. Đánh giá độ chính xác trong phân loại ảnh số
-Đánh giá sai số của việc phân loại
Việc phân loại chỉ đợc coi lμ hoμn chỉnh một khi sự đánh giá về độ chính xác lμ đạt
Bảng 8.5: Bảng đánh giá kết quả phân loại vμ tμi liệu thực tế
Cát Rừng Đô thị Lúa Mây Ư
Nớc Nớc 480 0 5 0 0 0 485 Cát 0 52 0 20 0 0 72 Rừng 0 0 313 40 0 0 353 Đô thị 0 16 0 126 0 0 142 Lúa 0 0 0 38 342 79 459 Mây 0 0 38 24 60 359 481 Ư 480 68 356 248 402 438 1992
Ghi chú: Các pixel nằm trên đờng chéo lμ phân loại đúng.
Bảng 8.6: Bảng đánh giá kết quả phân loại Độ chính xác
của ảnh phân loại
Độ chính xác cho ngời sử dụng Nớc 480/480 = 100% 480/485 = 99% Cát 52/68 = 76% 52/72 = 72% Rừng 313/356 = 88% 313/353 = 87 % Đô thị 126/248 = 51% 126/142 = 89 % Lúa 342/402 = 85 % 342/459 = 74 % Mây 359/438 = 82 % 359/481 = 75 % Độ chính xác chung = (480-52-313-126-342-359)/1192 = 84%
Theo ma trận trên, ngời sử dụng có thể cân nhắc để hμi lịng với kết quả hoặc điều
ố của phân loại:
a phân loại lμ lập bảng ma o sánh giá trị sai số của từng lớp đợc phân
o dòng lμ giá trị các lớp phân loại đợc lấy mẫu để phân loại. Giá trị đúng chỉnh lại sự phân loại.
Việc đánh giá kết quả phân loại đảm bảo tính trung thực vμ giá trị của phân loại. Cần phải nhấn mạnh rằng việc phân loại ảnh số đợc gọi lμ kết thúc chỉ đến khi đạt đợc việc đánh giá độ chính xác của phân loại.
Ma trận sai s
Một trong những ý nghĩa thể hiện độ chính xác củ trận sai số. Bảng ma trận sai số trên cơ sở s
loại với giá trị của lớp đó đợc kiểm tra ngoμi thực địa. Ma trận nμy đợc lập với số dòng vμ số cột bằng nhau vμ bằng số lớp đợc phân loại vμ kiểm tra. Bảng 8.6. lμ ma trận sai số của phân loại thể hiện mức độ chính xác trong phân loại giám sát. Bảng nμy đợc xắp xếp theo cột lμ các giá trị của các lớp phân loại đã đợc biết vμ the
đợc nằm trên đờng chéo của bảng ma trận. Tất cả các giá trị khác nằm ngoμi
đờng chéo n lμm hai loại
sa số lμ bỏ sót ) số a m nc .
Bảng 8.7: Ma trận sai số của tổ hợp các pixel đợc lấy mẫu trong phân loại có giám sát.