Phân loại không kiểm định (Unsuppervice Classification)

Một phần của tài liệu bài giảng viễn thám cơ sở chương viii các phương pháp xử lý thông tin viễn thám (Trang 41 - 50)

Lμ việc phân loại thuần tuý theo tính chất phổ mμ khơng biết rõ tên hay tính chất của lớp phổ đó vμ việc đặt tên chỉ lμ t†ơng đối. Khác với phân loại có kiểm tra, phân loại khơng kiểm tra không tạo các vùng thử nghiệm mμ chỉ lμ việc phân lớp phổ (Chistens) vμ quá trình phân lớp phổ đồng thời lμ quá trình phân loại. Số l†ợng vμ tên các lớp đ†ợc xác định một cách t†ơng đối khi sánh với tμi liệu mặt đất. Việc phân loại không kiểm tra cũng gần giống nh† việc lọc ng†ỡng phổ (Density Slicing) đã nêu ở phần trên.

Bảng 8.4: Ma trận khác biệt chuyển đổi dùng để đánh giá cặp các lớp phân loại về

sự phân cách phổ (Theo Thomas M. Lillesand vμ Ralph W. Kiefer, 2000). Lớp phổ W1 W2 W3 C1 C2 C3 C4 H1 H2 W1 0 W2 1185 0 W3 1410 680 0 C1 1997 2000 1910 0 C2 1953 1890 1874 860 0 C3 1980 1953 1930 1340 1353 0 C4 1992 1997 2000 1700 1810 1749 0 H1 2000 1839 1911 1410 1123 860 1712 0 H2 1995 1967 1935 1563 1602 1197 1621 721 0

Hình 8.30:ảnh phân loại sử dụng đất huyện Từ Liêm ( ảnh trái ) lμ kết quả phân loại có giám sát của ảnh SPOT (ảnh phải )

Những nhóm phổ đ†ợc chia ra theo phổ gần giống nhau của chúng dựa trên thuật tốn thống kê. Đối với ảnh số có cấu trúc số lμ 8 bit thì giá trị số của một kênh ảnh có khoảng giá trị từ 0-255. Trong khoảng giá trị số nμy sẽ chia ra những khoảng giá trị phổ khác nhau theo đặc tính đồng nhất của chúng. Số khoảng phổ đồng nhất nμy đ†ợc gọi lμ số nhóm phổ, t†ơng ứng với các đối t†ợng không gian sẽ đ†ợc phân loại. Trong qui trình chạy phân loại tự động, để có thể xác định một cách t†ơng đối số l†ợng các nhóm phổ, ta cần xem biểu đồ phân bố phổ (histogram) của từng kênh ảnh để có thể tạm thời xác định ra bao nhiêu nhóm phổ khác nhau. Trong phép phân loại khơng giám sát có các cách tùy chọn khác nhau. Cách tùy chọn đầu tiên lμ máy tự phân loại theo nhóm phổ. Cách tùy chọn thứ hai lμ dựa trên mẫu nhóm phổ của biểu đồ phân bố phổ mμ ng†ời giải đoán sẽ định ra số l†ợng nhóm phổ nhiều nhất trong phân loại. Phân loại khơng giám sát dựa trên nhóm phổ theo các khoảng giá trị phổ hay còn gọi lμ các chùm phổ trong ảnh. Sau khi phổ đã đ†ợc phân loại tự động ng†ời giải đốn sẽ gắn từng nhóm phổ với đối t†ợng không gian thực vμ đặt tên cho chúng qua việc khảo sát thực địa hoặc đối sánh trên bản đồ.

.

Hình 8.33:ảnh vệ tinh Landsat Tm band3 vμ phân loại thμnh 5 lớp

Hình 8.31: Sự phân loại các đối t‡ợng Hình 8.32:Kết quả phân loại ảnh theo ng‡ỡng

Gía trị số kênh 3

Gía trị số kênh 3

Giá trị số kênh Giá trị số kênh 4 4

(a) (b)

Hình 8.34: Phân loại hình hộp (trái) nguyên tắc;

(phải) ứng dụng cho phân ranh giới theo b‡ớc. x Các thuật toán phân loại trong xử lý ảnh số

Có nhiều thuật tốn phân loại khác nhau : iều thuật toán phân loại khác nhau :

1. Phân loại hình hộp : lμ ph†ơng pháp có kiểm đị

1. Phân loại hình hộp : lμ ph†ơng pháp có kiểm định đơn giản nhất. Bản

chất h†ơng pháp nμy mỗi trục

phủ đ

Phân loại khoảng cách ngắn nhất (mini

để phân loại các đối t†ợng trong khôn

Pk = [m , m , .. .m ], t - hμm chuyển vị Có nh

nh đơn giản nhất. Bản

chất h†ơng pháp nμy mỗi trục

phủ đ

Phân loại khoảng cách ngắn nhất (mini

để phân loại các đối t†ợng trong khôn

Pk = [m , m , .. .m ], t - hμm chuyển vị

hình học của nó đựơc mơ tả trên hình 8.31. Trong p hình học của nó đựơc mơ tả trên hình 8.31. Trong p

†ợc chia thμnh nhiều lớp dựa trên các giá trị tối thiểu của tệp mẫu. Các pixel nằm trong không gian giới hạn bởi các miền xác định trên trục phủ nh† vậy sẽ đ†ợc phân loại vμ nhóm t†ơng ứng. Ph†ơng pháp nμy rất đơn giản vμ rất dễ hiểu, tốc độ thực hiện trên máy tính cũng rất cao nh†ng độ chính xác vμ khả năng áp dụng nhiều khi còn bị hạn chế.

2. Phân loại khoảng cách ngắn nhất

†ợc chia thμnh nhiều lớp dựa trên các giá trị tối thiểu của tệp mẫu. Các pixel nằm trong không gian giới hạn bởi các miền xác định trên trục phủ nh† vậy sẽ đ†ợc phân loại vμ nhóm t†ơng ứng. Ph†ơng pháp nμy rất đơn giản vμ rất dễ hiểu, tốc độ thực hiện trên máy tính cũng rất cao nh†ng độ chính xác vμ khả năng áp dụng nhiều khi còn bị hạn chế.

2. Phân loại khoảng cách ngắn nhất

Giá trị số kênh

Giá tr

ị số kênh 3

Hình 8.35: Nguyên lý phân loại theo

khoảng cách ngắn nhất

mun distance classifer) đ†ợc sử dụng

mun distance classifer) đ†ợc sử dụng

g gian phổ đa chiều. Độ lớn của khoảng cách giữa các pixel đ†ợc sử dụng nh† th†ớc đo đánh giá sự thuộc về một lớp nμo đó

Pk -Vectơ trunh bình của lớp thứ k đ†ợc tính theo cơng thức:

g gian phổ đa chiều. Độ lớn của khoảng cách giữa các pixel đ†ợc sử dụng nh† th†ớc đo đánh giá sự thuộc về một lớp nμo đó

Pk -Vectơ trunh bình của lớp thứ k đ†ợc tính theo cơng thức:

1 2 n

3. Phân loại xác xuất cực đại (Gaussian Maximum Liklihood)

Ph†ơng pháp phân loại theo xác xuất cực đại đ†ợc sử dụng th†ờng xuyên trong xử lý ảnh viễn thám. Mỗi pixel đ†ợc tính xác xuất thuộc vμo một lớp nμo đó vμ nó đ†ợc gán vμo lớp mμ xác xuất thuộc vμo lớp đó lμ lớn nhất. Trên hình 8.33 thể hiện các nguyên lý phân loại ph†ơng pháp xác xuất cực đại. Ph†ơng pháp phân loại xác

ằằ ằ ằ ằ ẳ º ô ô ô ô ơ ê nn k V V V V ... ... 0 : : : : 0 ... 0 0 ... 0 22 11 Ma trận ph‡ơng sai: Ma trận ph‡ơng sai-hiệp ph‡ơng sai: Ư ằ ằ ằ ằ ẳ º ô ô ô ô ơ ê K nn n n n n V V V V V V V V V .... : : : : .... .... 2 1 2 22 21 1 12 11 Mật độ xác suất Xác suất lớp B: lớn Xác suất lớp A: nhỏ

Phân loại theo các lớp Kênh 1

Kênh 2

Giả sử các giá trị chính của phân bố chuẩn

Lớp A

Lớp B

Kênh 1

xuất cực đại có rất nhiều †u việt xét theo quan điểm lý thuyến xác suất. Tuy vậy khi sử dụng nó cần chú ý tới các điểm sau:

† ma trận p

tiễn.

h trong một số tr†ờng hợp khi mμ độ t†ơng quan giữa các kênh phổ gần nhau quá cao.

Trong tr† hổ đi ví dụ nh† ph ân bố của các đối t† ph†ơng phá p về đ†ờng cong phổ c hủng loại thực vậ

giới để giá † trong

phân

mẫu phổ mới. Khi các mẫu phổ đ†ợc xác định thì qui trình chạy phân loại đ†ợc thực Xác suất

Cát

- Số l†ợng các khu vực lấy mẫu phải đủ lớn để các giá trị trung bình cũng nh h†ơng sai, hiệp ph†ơng sai tính cho một lớp nμo đó có giá trị đúng với thực - Ma trận nghịch đảo của ma trận ph†ơng sai hiệp ph†ơng sai sẽ không ổn địn

ờng hợp nh† vậy cần áp dụng các ph†ơng pháp lμm giảm số kênh p †ơng pháp phân tích thμnh phần chính. Trong tr†ờng hợp hμm ph

ợng nghiên cứu khơng theo phân bố chuẩn gauss thì khơng nên sử dung p nμy.

Phân loại hỗn hợp phổ

Phân loại hỗn hợp dùng để đánh giá nơi có sự biến thiên phức tạ

ho một kiểu phủ hiện thời. Phân loại nμy th†ờng dùng trong việc phân loại lớp phủ thực vật. Sự biến thiên về phổ đặc tr†ng bởi biến thiên do các c

t vμ điều kiện đất, độ dốc, h†ớng dốc...Trong phân loại nμy, việc vạch ra ranh m sát cho một loại đối t†ợng phổ không hoμn toμn đồng nhất nh

loại giám sát. Dữ liệu từ tất cả các vùng đμo tạo cho một đối t†ợng lớp sau đó đ†ợc dùng trong phân loại khơng giám sát theo chùm để tạo ra các mẫu phổ, có thể đến 20 mẫu. Những mẫu phổ nμy đ†ợc đánh giá, xem xét, loại bỏ những mẫu không cần thiết hoặc gộp một số mẫu có đặc tính phổ gần nhau, tạo nên một tổ hợp

Đô thị Ngô cỏ Giá trị số kênh 3 Rừng Їờng đẳng xác suất Giá trị số kênh 3 Giá trị số kênh 4 N‡ớc Giá trị số kênh 4

Hình 8.37: Biểu đồ mật độ xác suất xác định bởi xác suất cực đại A

hiện, có thể dùng xác suất cực đại để phân loại. Qui trình phân loại hỗn hợp có thể đ†ợc liệt kê theo trình tự sau:

1. Khoanh vi vùng lấy mẫu phổ cho một lớp X

2. Phân tích chùm của tất cả các pixel thuộc X thμnh các phụ nhóm phổ X1, X2, ....Xn sử dụng phân loại tự động.

3. Xem xét các mẫu phổ vừa đ†ợc tạo nên bằng phân loại tự động cho lớp X bằng việc xóa, gộp trên cơ sở hiển thị các phụ lớp trên mμn hình, đánh giá biểu đồ đa chiều cho mỗi chùm hoặc đo khoảng cách đa biến (xử dụng khác biệt chuyển đổi hoặc khoảng cách JM )

4. Lập lại qui trình từ 1-3 cho các lớp khác

5. Một lần nữa lại kiểm tra mẫu phổ vμ gộp hoặc xóa mẫu khơng cần thiết. 6. Thực hiện chạy phân loại

Phân loại các pixel hỗn hợp với nhiều loại t† liệu

Phụ thuộc vμo độ phân giải của đầu ghi phổ, một pixel ảnh vệ tinh có thể chứa đựng thơng tin về một (nếu một kiểu hiện trạng d†ới đất phủ trong diện một pixel) hoặc

giới hạn trên mặt đất. Kết quả lμ sự tính tốn diện tích t†ơng đối của từng pixel trong từng lớp trên mặt đất. Nhiều ứng dụng đã sử dụng mơ hình tuyến

hơn một kiểu hiện trạng (nếu pixel phủ một vμi loại hiện trạng). Pixel hỗn tạp nμy rất khó phân loại, vì ta khơng biết ghép chính xác nó vμo lớp nμo. Có hai kiểu phân loại đ†ợc thực hiện trong quá trình phân loại hỗn hợp lμ, phân loại hỗn tạp

phổ vμphân loại fuzzy. Chúng mang ý nghĩa lμ phân loại phụ pixel.

Phân loại hỗn tạp phổ

Phân loại phổ hỗn tạp bao gồm khoảng công nghệ so sánh các pixel hỗn tạp phổ với một tập hợp phổ mẫu đ†ợc đo tại phịng thí nghiệm, ngoμi thực địa hoặc trên ảnh. Trong quan niệm rằng sự biến thiên phổ trên ảnh gây ra bởi sự pha trộn của một nhóm đối t†ợng có

tính trong phân tích pixel hỗn tạp. Theo mơ hình nμy, đ†ờng cong phổ quan sát đ†ợc từ một vùng trên mặt đất lμ xen tạp tuyến tính phổ của tất cả các kiểu phủ đất trong vùng. Mẫu phổ tham chiếu tuyệt đối nμy đ†ợc coi lμ thμnh viên cuối, bởi lẽ, chúng đại diện cho tr†ờng hợp lμ 100% của tr†ờng nhìn phủ bởi một loại đối t†ợng. Trong mơ hình tuyến tính, phân phụ pixel cần thỏa mãn hai điều kiện cho một pixel ảnh. Điều kiện thứ nhất lμ tổng của hợp phần của tất cả các thμnh viên đại diện (cuối) tạo nên một pixel hỗn tạp phải bằng 1 vμ đ†ợc xác định theo công thức:

trong 1 2 N n tạp.

ông thức sau:

tạp chứa trong pixel hỗn tạp; DNO, 1, DNO, 2, ... DNO, N lμ giá

trị số pixel thμnh viên cuối vμ EO lμ sai

số.

m lμ một pixel có thể tham gia v

ự liên hệ chung. Trong tr†ờng hợp sử dụng phân loại fuzzi có giám sát, qui trình gần giống nh

u cầu. Ngun tắc đánh giá lμ so sánh giữa tμi liệu thực tế (Ground Truth) vμ kết quả phân loại. Ph†ơng pháp phổ biến trong đánh giá lμ thμnh lập ma trận đánh giá theo ph†ơng pháp Crossing giữa kết quả phân loại vμ bản đồ thực tế (bảng 8.5). 1 .... 3 2 1

đó: F , F vμ F lμ phần đại diện trong pixel hỗ

1

Ưn Fi F F F FN

i

Điều kiện thứ hai lμ, đối với một kênh phổ cho tr†ớc với b†ớc sóng O giá trị số của pixel quan sát DN thể hiện tổng giá trị số đ†ợc tính theo cO

DNO = F1DNO, 1 + F2DNO, 2 + ...+ FNDNO, N + EO

trong đó: DNO lμ giá trị tổ hợp số quan sát trên kênh O; F1, F2,, F3 ...FN lμ hợp phần của các thμnh viên hỗn

đ†ợc quan sát nếu pixel chứa đựng trọn vẹn

Phân loại tập mờ (Fuzzy)

Phân loại theo ph†ơng pháp nμy sử dụng quan niệ

μo hơn một loại. Một trong những quan niệm của phân loại nμy lμ chùm fuzzi. Phân loại fuzzi gần giống trong phân loại không giám sát sử dụng K-means. Sự khác biệt ở chỗ lμ các vùng fuzzi đ†ợc tạo nên thay cho các ranh giới "cứng" giữa các lớp. Thay cho các vector đ†ợc gắn cho các lớp trong phân loại khơng giám sát thì điểm giá trị của các pixel tham gia trong phân loại fuzzi đ†ợc gắn cho giá trị trung bình của tất cả các lớp đ†ợc phân loại vμ nó thể hiện sự gần gũi của mỗi pixel trong s

† phân loại có giám sát thơng th†ờng sử dụng phép xác suất cực đại. Vector giá trị vμ ma trận t†ơng quan trong fuzzi đ†ợc thực hiện từ dữ liệu vùng mấu có trọng số. Thay vì khoang vi các vùng đồng nhất trong phép phân loại giám sát, phân loại fuzzi sử dụng tổ hợp của vùng đồng nhất vμ vùng hỗn tạp

Sự pha trộn của các kiểu đối t†ợng đã biết quyết định trọng số các vùng mẫu trong fuzzi. Các pixel đ†ợc phân loại sau đó đ†ợc gắn điểm cho các pixel một cách t†ơng đối trong số các pixel của một lớp phân loại. Ví dụ, phân loại thực vật có thể chia ra với điểm lμ 0.68 cho rừng, 0.29 cho đ†ờng vμ 0.03 cho cỏ. Tổng số điểm cho tất cả các lớplμ 1.

. Đánh giá độ chính xác trong phân loại ảnh số

-Đánh giá sai số của việc phân loại

Việc phân loại chỉ đ†ợc coi lμ hoμn chỉnh một khi sự đánh giá về độ chính xác lμ đạt

Bảng 8.5: Bảng đánh giá kết quả phân loại vμ tμi liệu thực tế

Cát Rừng Đô thị Lúa Mây Ư

N‡ớc N†ớc 480 0 5 0 0 0 485 Cát 0 52 0 20 0 0 72 Rừng 0 0 313 40 0 0 353 Đô thị 0 16 0 126 0 0 142 Lúa 0 0 0 38 342 79 459 Mây 0 0 38 24 60 359 481 Ư 480 68 356 248 402 438 1992

Ghi chú: Các pixel nằm trên đ†ờng chéo lμ phân loại đúng.

Bảng 8.6: Bảng đánh giá kết quả phân loại Độ chính xác

của ảnh phân loại

Độ chính xác cho ngời sử dụng N†ớc 480/480 = 100% 480/485 = 99% Cát 52/68 = 76% 52/72 = 72% Rừng 313/356 = 88% 313/353 = 87 % Đô thị 126/248 = 51% 126/142 = 89 % Lúa 342/402 = 85 % 342/459 = 74 % Mây 359/438 = 82 % 359/481 = 75 % Độ chính xác chung = (480-52-313-126-342-359)/1192 = 84%

Theo ma trận trên, ng†ời sử dụng có thể cân nhắc để hμi lịng với kết quả hoặc điều

ố của phân loại:

a phân loại lμ lập bảng ma o sánh giá trị sai số của từng lớp đ†ợc phân

o dòng lμ giá trị các lớp phân loại đ†ợc lấy mẫu để phân loại. Giá trị đúng chỉnh lại sự phân loại.

Việc đánh giá kết quả phân loại đảm bảo tính trung thực vμ giá trị của phân loại. Cần phải nhấn mạnh rằng việc phân loại ảnh số đ†ợc gọi lμ kết thúc chỉ đến khi đạt đ†ợc việc đánh giá độ chính xác của phân loại.

Ma trận sai s

Một trong những ý nghĩa thể hiện độ chính xác củ trận sai số. Bảng ma trận sai số trên cơ sở s

loại với giá trị của lớp đó đ†ợc kiểm tra ngoμi thực địa. Ma trận nμy đ†ợc lập với số dòng vμ số cột bằng nhau vμ bằng số lớp đ†ợc phân loại vμ kiểm tra. Bảng 8.6. lμ ma trận sai số của phân loại thể hiện mức độ chính xác trong phân loại giám sát. Bảng nμy đ†ợc xắp xếp theo cột lμ các giá trị của các lớp phân loại đã đ†ợc biết vμ the

đ†ợc nằm trên đ†ờng chéo của bảng ma trận. Tất cả các giá trị khác nằm ngoμi

đ†ờng chéo n lμm hai loại

sa số lμ bỏ sót ) số a m nc .

Bảng 8.7: Ma trận sai số của tổ hợp các pixel đ‡ợc lấy mẫu trong phân loại có giám sát.

Một phần của tài liệu bài giảng viễn thám cơ sở chương viii các phương pháp xử lý thông tin viễn thám (Trang 41 - 50)

Tải bản đầy đủ (PDF)

(69 trang)