4. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
1.1.3. So sánh sự khác biệt giữa phương pháp phân loại dựa trên pixel (pixel-
classification) và phương pháp phân loại dựa trên định hướng đối tượng (object- oriented classification)
1.1.3.1. Phương pháp phân loại dựa trên pixel (pixel-classification)
Phân loại ảnh viễn thám dựa trên pixel nghĩa là nhận biết các nhóm pixel mà có các đặc trưng quang phổ tương tự nhau để quyết định các dạng che phủ khác nhau. Đây là phương pháp phân loại được sử dụng phổ biến trong quá trình giải đoán ảnh viễn thám.
Có nhiều phương pháp phân loại ảnh số khác nhau. Các phương pháp phân loại thường căn cứ vào các giá trị thống kê cũng như các cách tính thống kê khác nhau. Phương pháp phân loại ảnh số là một phương pháp phân loại hiện đại, cho kết quả nhanh và ít nhiều mang tính khách quan.
Phân loại ảnh dựa trên pixel sử dụng thông tin quang phổ để tạo ra một ảnh và phân loại mỗi một pixel dựa trên đặc điểm vùng quan phổ của nó. Kết quả phân loại là tất cả các pixels có đặc điểm quang phổ tương tự nhau trong một ảnh được gán cho một loại cụ thể. Có hai phương pháp dùng để sử dụng phân loại: phân loại không kiểm định và phân loại có kiểm định.
a. Phân loại không kiểm định
Số pixels được kiểm tra thông qua các phần mềm xử lý ảnh và được phân loại theo các lớp quang phổ. Phương pháp này các pixel trên ảnh đầu tiên được gộp thành các nhóm có các đặc trưng phổ tương đối đồng nhất bằng kỹ thuật ghép lớp (clustering). Sau đó các nhóm lớp như vậy được sử dụng để tính các tham số thống kê cho quá trình phân loại tiếp theo.
Để phân loại không kiểm định, người phân tích phải quyết định số lượng phân loại và sau đó máy tính sẽ sử dụng các thuật toán để tìm các pixels có thuộc tính quang phổ tương tự nhau và gộp chúng thành một nhóm hay một dạng che phủ.
Phân loại không kiểm định có thể được dùng như một phương tiện để sơ bộ tìm hiểu sự phân chia loại của một vùng. Phương pháp này thường được sử dụng để nhận dạng các mẫu phân loại cho phân loại có sự giám định.
Phân loại không kiểm định được chia làm 2 loại: Phân loại K-mean và phân loại ISODATA.
Phân loại K-mean: Phương pháp phân loại này sử dụng thuật toán K trung bình (K-mean).
Giả thuyết phương pháp này có số loại là K. Phân loại bao gồm các bước sau: Bước 1: Đầu tiên chọn ra K vector làm tâm (mean) cho K loại khởi đầu.
Bước 2: Một vector pixel sẽ thuộc loại mà khoảng cách (Euclide chẳng hạn) từ đó đến tâm của loại là nhỏ nhất (thực hiện với tất cả các vector trong một lần lặp).
Bước 3: Tính lại tâm của các loại.
Bước 4: Nếu tất cả các tâm giữ nguyên thuật toán sẽ dừng lại, nếu không sẽ quay lại bước hai.
Phân loại ISODATA: Phương pháp phân loại này sử dụng thuật toán
ISODATA, phương pháp này khá mềm dẽo, tự nhiên, không cần cố định các loại. Phân loại thực hiện theo từng thủ tục sau:
Bước 1: Phân loại ban đầu mỗi pixel là một loại.
Bước 2: Liên tiếp nhập lại, tách ra các loại bằng cách so sánh khoảng cách giữa các tâm và ngưỡng cho trước.
Bước 3: Quá trình phân loại dừng khi phân loại thỏa mãn các tiêu chí đặt ra.
b. Phân loại có kiểm định
Phân loại có kiểm định được thực hiện dựa trên ưu tiên của các loại trong một ảnh để nhận biết các mẫu đại diện của các dạng che phủ bề mặt khác nhau. Mẫu đại diện này được thành lập để nhận biết đặc điểm của mỗi loại được quan tâm. Các mẫu lựa chọn là khu vực trên ảnh người giải đoán biết chắc chắn thuộc vào một lớp trong các lớp cần tìm. Dựa trên vùng mẫu chọn, các thông số thống kê được xác định và đó chính là các chỉ tiêu thống kê sử dụng trong quá trình phân loại về sau. Lựa chọn và quyết định mẫu phân loại dựa trên hiểu biết của người phân tích ảnh về một vùng địa lý và các dạng che phủ bề mặt thể hiện trong ảnh.
Phân loại có kiểm định được thực hiện theo các bước sau:
Bước 1: Xác định số lượng lớp phân loại hay khung phân loại tức là chọn trước tập hợp các lớp mà sau đó ảnh sẽ được phân lớp.
Bước 2: Chọn một tập hợp các pixel tiêu biểu cho mỗi lớp gọi là mẫu phân loại (samples hay trainning data). Mẫu phân loại có thể lấy từ đi thực địa, từ bản đồ hoặc từ hình ảnh khác.
Bước 3: Ước lượng thống kê chung (Estimation of universal statistics): Kỹ thuật phân loại khác nhau sẽ được so sánh với mẫu phân loại để quyết định quy luật phân lớp phù hợp.
Bước 4: Phân loại (Classification): Tùy thuộc vào phương pháp phân loại lựa chọn, tất các các pixel được phân loại trong một lớp.
Bước 5: Thẩm định kết quả (Verification of Results): Phân loại sẽ được kiểm tra và thẩm định để đảm bảo độ tin tưởng chính xác của phân lớp.
Bước 6: Tạo bản đồ (ảnh) phân lớp, tính toán các thống kê của phân lớp.
Phương pháp phân loại có kiểm định bao gồm: Phân loại hình hộp, phân loại theo cây quyết định, phân loại theo khoảng cách cực tiểu, phân loại gần đúng nhất.
Phân loại hình hộp
Là phương pháp đơn giản nhất; trên mỗi trục không gian phổ từng loại được xác định dựa trên giá trị max và min ứng với từng loại. Các giá trị max và min này sẽ xác định hình hộp trong không gian đặc trưng (nên gọi là phân loại hình hộp), số hộp phụ thuộc vào số loại cần xác định. Phương pháp này còn được gọi là parallelepiped classifier vì các cạnh đối diện của hình hộp là song song nhau. Các pixel có giá trị nằm trong không gian giới hạn bởi các miền xác định (hộp) trên trục phổ như vậy sẽ được phân loại vào loại tương ứng, những pixel có giá trị nằm ngoài tất cả các hộp sẽ được gán nhãn là loại khác (ngoài các loại được quan tâm).
Để hiểu rõ nguyên lý phân loại hình hộp, ta giả sử ảnh vệ tinh được chụp với 3 kênh phổ, cần được phân thành 6 loại: nước, đất trống, rừng, đất nông nghiệp, đô thị và đất cát.
Hình 1.10. Phương pháp phân loại hình hộp sử dụng 3 kênh
Phương pháp thực hiện dựa trên dữ liệu mẫu ứng với 6 loại và dùng điều tra histogram của từng thành phân phổ ứng với các kênh riêng biệt (hoặc ước tính giá trị thống kê vùng mẫu) để xác định giá trị max và min của giá trị độ sáng thể hiện cho 6 loại. Sau đó xây dựng hộp ứng với từng loại trên trục 3 chiều có gán tên loại và kết quả sẽ nhận được 6 hộp tương ứng với 6 loại được tạo ra như thể hiện bởi hình 2.10.
Từng pixel trên ảnh được đánh giá trong hệ trục không gian 3 chiều và nếu pixel thuộc vào hộp nào sẽ gán tên của pixel ứng với loại đó. Ngược lại pixel có giá trị nằm ngoài tất cả các hộp sẽ được gán nhãn và loại khác (loại thứ 7 – unknown class). Phương pháp này có:
Ưu điểm: Đơn giản và dễ hiểu, tốc độ phân loại cũng khá cao so với phương
pháp khác.
Nhược điểm: Độ chính xác giảm nếu có sự tương quan các kênh và khả năng áp
dụng nhiều khi còn bị hạn chế khi có khoảng cách đáng kể giữa các hộp, những pixels nằm trong vùng này sẽ không được phân loại. Trường hợp có sự trùng lắp phần nào giữa hai hộp thì phương pháp này thường sẽ chỉ định pixel vào hộp đầu tiên.
Phân loại theo cây quyết định
Là phương pháp phân loại dựa trên cơ sở phân cấp. Người phân loại sẽ phải xuất phát từ việc đánh giá khả năng phân tách các đối tượng dựa trên tri thức chuyên gia kết hợp với đặc tính phổ của vùng mẫu để tạo dựng ra sơ đồ phân loại. Trong thực tế không có thuật toán tổng quát nào cho phương pháp phân loại này, do đó từng cây quyết định hay luật phân loại thường thiết kế bởi chuyên gia cho khả năng phân biệt giữa các loại là cao nhất.
Hình 1.11 thể hiện cây quyết định chỉ cho hai nhánh xuất phát ứng với từng giai đoạn (cây nhị phân) được sử dụng để xác định 9 loại trên ảnh có 3 kênh phổ tương ứng. Cây được thiết kế dựa vào các đặc trưng như giá trị phổ của pixel; các chỉ số được tính từ giá trị phổ... để hình thành luật quyết định gán tên cho từng loại pixel trên ảnh.
Phân loại theo khoảng cách ngắn nhất
Hình 1.12. Nguyên lý phân loại theo khoảng cách ngắn nhất
Là phương pháp dùng để phân loại các đối tượng trong không phổ đa chiều, khoảng cách không gian phổ từ pixel được xét đến vector đặc trưng của trung bình từng loại được sử dụng như chỉ số đánh giá xác định sự thuộc về một loại nào đó. Hình 1.12 mô tả nguyên lý phân loại theo khoảng cách ngắn nhất, trong đó pixel trên ảnh thu nhận với hai kênh phổ sẽ được xét theo khoảng cách phổ đến ba loại A, B, C và khoảng cách dA, dB và dC được minh họa bởi các đường nối từ pixel đến giá trị trung bình ứng với từng loại A, B và C. Bằng phương pháp này, pixel minh họa được phân vào loại B vì có dB là nhỏ nhất.
Phân loại gần đúng nhất (Maximum Likehood classifier)
Là phương pháp thông dụng nhất trong phương pháp phân loại kiểm định. Một pixel có xác suất tối đa được phân ra một loại tương ứng. Phương pháp này sử dụng các thống kê như trung bình, phương sai trong không gian phổ để xây dựng các thuật toán. Likehood được định nghĩa như xác suất của một pixel thuộc một loại nào đó. Hình 1.13 minh họa pixel được phân vào loại B vì xác suất thuộc vào loại B lớn hơn xác suất thuộc vào loại A [23].
1.1.3.2. Phương pháp phân loại dựa trên đối tượng (object-oriented classification)
Phương pháp phân loại truyền thống dựa trên điểm ảnh (pixel) có hiệu quả đối với ảnh có độ phân giải thấp và trung bình. Tuy nhiên, khi xử lý ảnh có độ phân giải không gian cao và rất cao thì phương pháp này có sự hạn chế do mối quan hệ tỷ lệ nghịch giữa độ phân giải và độ phân giải phổ.
Phân loại định hướng đối tượng không chỉ dựa vào đặc trưng phổ phản xạ của đối tượng phân loại mà còn sử dụng những thông tin khác như cấu trúc, kích thước và hình dạng. Ngoài ra, sự phát triển của công nghệ tính toán, đặc biệt là phần mềm giải đoán ảnh eCognition đã góp phần làm hoàn thiện hơn phương pháp này.
a. Một số vấn đề nguyên lý
Nguyên lý của phương pháp này được xây dựng dựa trên khái niệm cho rằng tập hợp các pixel của ảnh sẽ hình thành nhiều đối tượng chuyên đề mà mắt ta có thể nhận biết được. Bước xử lý cơ bản trong phân tích đối tượng ảnh là các phân mảnh ảnh (segment) chứ không phải pixel. Để mắt người nhận biết được đối tượng đã được phân mảnh (segmentation) thì hàng loạt thông tin đã được xử lý. Các thông tin này dùng để mô tả một số đặc điểm hình dạng (shape), kiến trúc ảnh (texture), các quan hệ không gian (topology) của đối tượng được phân loại và cách tích hợp các thông tin này chính là các quy tắc cần được xây dựng để phần mềm có thể phân biệt các đối tượng.
Trong quá trình phân loại chúng ta còn có thể sử dụng các lớp thông tin chuyên đề ngoài dữ liệu viễn thám như mô hình số độ cao, bản đồ thổ nhưỡng, bản đồ địa chất, bản đồ sử dụng đất v.v. Việc tích hợp các thông tin nói trên trong phân loại định hướng đối tượng (PLĐHĐT) dựa chủ yếu vào logic mờ (fuzzy logic). Đây chính là quá trình xây dựng cơ sở tri thức trong PLĐHĐT. Với cơ sở tri thức này, mỗi đối tượng có thể được phân loại bằng một thuật toán khác nhau chứ không phải bằng một thuật toán thống nhất như trong phân loại Pixel-based.
Một đặc điểm nữa của PLĐHĐT là nguyên lý phân cấp (hierarchy) đối tượng. Ví dụ: các đối tượng thực vật được gộp lại thành một lớp (class) và dưới lớp là các phụ lớp (subclass) thực vật cụ thể. Lấy ví dụ: lớp cây trồng bao gồm hai phụ lớp: lúa và màu; bản thân phụ lớp màu lại chia thành các phụ lớp ngô, đậu tương. Trong ví dụ này, phụ lớp màu vừa là phụ lớp của lớp cây trồng vừa là cấp trên của phụ lớp đậu
tương và ngô v.v. Cách phân chia như vậy nhằm đảm bảo rằng mỗi đối tượng được phân loại theo một thuật toán khác nhau nhưng các đối tượng thuộc một nhóm sẽ có thể kế thừa các đặc trưng chung của nhóm.
b. Vấn đề chọn và phối hợp tỷ lệ
Tỷ lệ là vấn đề quan trọng trong việc lý giải thông tin trên ảnh và thường được hiểu trên cơ sở kích thước pixel. Tuy nhiên, trong thực tế bản thân các đối tượng đã có sẵn tỷ lệ của nó và việc định ra tỷ lệ phân tích sẽ quyết định số lượng các lớp của phép phân loại. Cũng chính vì vậy mà chúng ta sẽ dựa vào mục đích phân loại để xác định tỷ lệ sẽ sử dụng để chiết tách các đối tượng khác nhau.
Cần phân biệt rõ sự khác nhau giữa độ phân giải và tỷ lệ khi phân loại. Độ phân giải là khoảng cách giữa hai lần đo xung liên tục của bộ cảm hay còn được hiểu là kích thước của một pixel. Trong khi đó, tỷ lệ lại là quy mô hay mức độ khái quát đối tượng mà chúng ta cần mô tả và phụ thuộc đồng thời vào mục đích phân loại và hiện trạng của khu vực nghiên cứu.
Hình 1.14 dưới đây là ví dụ so sánh kết quả phân mảnh ảnh với các tỷ lệ 20 và 30.
Hình 1.14. So sánh kết quả phân mảnh với các tỷ lệ khác nhau
Khi ta thay đổi thông số tỷ lệ thì kết quả sẽ cho các đối tượng ảnh có mức độ khái quát khác nhau.
Cần nhấn mạnh là việc thay đổi tỷ lệ phân mảnh ảnh không hề giống với việc thay đổi độ phân giải không gian của pixel và đó cũng là ưu thế của PLĐHĐT. Các tỷ lệ này sẽ được phối hợp với nhau để chiết xuất đối tượng theo nhận biết của mắt thường và theo hiểu biết của chúng ta về đối tượng, gần nhất với đối tượng đó trong thực tế. Trong quá trình phân mảnh ảnh, tại mỗi tỷ lệ thì ta đều có khả năng điều chỉnh các tham số liên quan đến tính chất hình thức của đối tượng như hình dạng.
c. Ý nghĩa chuyên đề của đối tượng và quan hệ qua lại giữa các đối tượng
Như đã trình bày ở trên, trong PLĐHĐT, việc tính đến bối cảnh là rất quan trọng; các đối tượng có cùng đặc trưng bức xạ lại có thể có ý nghĩa chuyên đề khác nhau tùy thuộc vào bối cảnh. Với phương pháp PLĐHĐT thì sự nhận biết đối tượng bằng mắt thường là quan trọng vì căn cứ vào các nhận định về bối cảnh mà người giải đoán sẽ quyết định các thông số sử dụng trong phân loại để phân loại lớp đó về lớp chuyên đề nào. Ví dụ khi phân loại thực vật: có hai dải thực vật cùng có đặc điểm về hình dạng và về màu sắc giống hệt nhau, nhưng dải nằm dưới đồng bằng phẳng, mịn, dọc ven sông sẽ là rau màu, còn dải nằm ven biển ở ngoài đê biển phẳng mịn là rừng ngập mặn.
d. Hình dạng của đối tượng
Đây là một đặc trưng quan trọng của đối tượng giúp chúng ta nhận dạng đối tượng nhanh chóng và hiểu biết của chúng ta về hình dạng đối tượng sẽ được dùng để tạo các quy tắc phân loại. Các đặc trưng được nói đến ở đây là kích thước, tỷ lệ chiều rộng - chiều dài, số cạnh của đối tượng v.v. Nhờ sự khác biệt về hình dạng mà nhiều đối tượng có cùng đặc trưng phổ có thể được tách ra một cách dễ dàng. Ví dụ hình 1.15: hai đối tượng nếu có đặc trưng phổ của nước nhưng có kích thước khác nhau sẽ thuộc lớp sông hoặc lớp hồ, ao.
Hình 1.15. So sánh đặc trưng hình dạng sông suối và ao hồ
Sông, suối
e. Đặc trưng về quan hệ không gian của đối tượng
Hình 1.16. Quan hệ topo và khái niệm khoảng cách trong phân loại định hướng đối tượng