- Sự cố tràn dầu
b. Nguyên nhân gây ra méo ảnh
2.2.7.4 Phân lọai ảnh
- Phân loại ảnh viễn thám là (1):
+ Chuyển các giá trị đo sang các giá trị mang tính chuyên đề + Chuyển dữ liệu thành thông tin bản đồ, thông tin thống kê - Phân loại ảnh viễn thám là (2):
+ Tập hợp các pixel có cùng một số thông số thống kê phổ thành một lớp có ý nghĩa chuyên đề,
+ Tập hợp các đói tượng có chung một số thuộc tính vào một lớp có ý nghĩa chuyên đề
Ta có sơ đồ các bước phân loại ảnh đã thực hiện trong đồ án
Trong phân loại ảnh có hai cách đó là:
- Phân loại có kiểm định: Sử dụng các mẫu phân loại
- Phân loại không kiểm định: chia ảnh thành các cluster và gộp nhóm các cluster đó.
Sơ đồ sau thể hiện các bước phân loại chính Chọn thuật toán
Khảo sát các đặc trưng thống kê của toàn cảnh Thu thập các dữ liệu GIS liên quan đến khu
vực và chuyên đề nghiên cứu
chạy chương trình phân loại
Đánh giá chất lượng phân loại
Xử lý sau phân loại
Chuyển kết quả sang GIS Đánh giá thống kê các mẫu
Chọn mẫu trên máy tính
Đối với phân loại có kiểm định
ảnh Chọn mẫu có kiểm định gán nhãn cho các pixel đánh giá độ chính xác
Đối với phân loại không có kiểm định
ảnh Phân tích cluster Cluster và gộp nhóm cluster Đánh giá độ chính xác
Để hiểu rõ sự khác biệt giữa phân loại có kiểm định và không có kiểm định, ta cần biết đến hai khái niệm: lớp thông tin và lớp phổ
- Lớp thông tin (Information Class): lớp được người phân tích ảnh xác định liên quan đến thông tin được chiết tách
- Lớp phổ (Spectral Class): lớp bao gồm các vectơ có mức xám độ tương tự nhau trong không gian đa phổ.
Trong nhiệm vụ chiết tách thông tin một cách lý tưởng, ta có thể trực tiếp sắp xếp một lớp phổ vào một lớp thông tin.
Ví dụ, ta nằm trong không gian hai chiều gồm ba lớp: nước, thực vật, và các bề mặt bê tông.
Hình 2.12: gán nhãn cho lớp trong quá trình phân loại
Bằng cách xác định ranh giới giữa ba nhóm vectơ xám độ trong không gian hai chiều NIR và R, chúng ta có thể phân biệt được ba lớp thông tin này.
Một trong những khác biệt giữa phân loại có kiểm định và không có kiểm định là các cách sắp xếp mỗi lớp phổ vào một lớp thông tin. Trong phân loại có kiểm định, ta bắt đầu bằng việc xác định một lớp thông tin trên ảnh. Khi đó ta sử dụng một thuật toán để tóm lược thông tin đa phổ từ các vùng xác định trên ảnh tạo thành các lớp dấu hiệu. Quá trình này được gọi là tạo mẫu có kiểm định. Trong khi đó, với phân loại không có kiểm
định, ta sử dụng một thuật toán cho cả ảnh trước, tạo thành các lớp phổ (còn gọi là cluster). Từ đó, người phân tích ảnh sẽ sắp xếp lớp phổ vào lớp thông tin cần tạo.
Các đường cong tương tứng trong hình 1 sẽ được biểu diễn bằng các điểm nằm kề nhau trong hình 2. (hai đường cong nét đứt trong hình 1 được biểu diễn là các điểm hình tròn rỗng trong hình 2. Từ hình 2 ta có thể dễ dàng nhận thấy khoảng cách có thể được sử dụng làm phép đo tính tương tự trong phân loại. Hai điểm càng gần nhau, càng có khả năng nằm cùng một lớp.
Chúng ta có thể sử dụng nhiều loại khoảng cách khác nhau để tính mức tương tự tạo thành các thuật toán phân loại như phân loại khoảng cách nhỏ nhất, phân loại khoảng cách lớn nhất...
Đồ án đã sử dụng phương pháp phân loại có kiểm định do: giá trị phổ của ảnh mà sensor thu nhận được thông qua sự bức xạ của các đối tượng lớp phủ
bề mặt. Đôi khi những đối tượng khác nhau nhưng lại cho giá trị phản xạ phổ giống nhau, do đó thông tin nhận được bị sai, đây là điểm hạn chế của ảnh vệ tinh mà ta cần khắc phục. Chính vì vậy ta cần phải kiểm tra từ những nguồn tư liệu khác nữa, rồi lấy thông tin đó để chọn mẫu cho các đối tượng.
Trong phân lọai có kiểm định có các phương pháp sau: Khoảng cách tối thiểu (Minnimum Distance) Khoảng cách Mahalanobis
Phân loại theo hình hộp (Parallelepiped)
Phân loại theo xác suất lớn nhất (Maximum likelihood) (MLC) MLC là phương pháp phân loại phổ biến nhất trong xử lý ảnh viễn thám. Trong đồ án đã sử dụng phương pháp phân loại theo xác suất lớn nhất để thực hiện đề tài, vì vậy dưới đây sẽ trình bày rõ hơn về lý thuyết của riêng phương pháp này.
MLC được xây dựng dựa theo hàm phân tách Bayesian P(Ci|x) = p(x|Ci) x P(Ci)/P(x)
Giả sử ta có C = (C1, C2, ..., Cnc) là một tập hợp các lớp, trong đó nc là tổng số lớp. Với mỗi pixel cho trước có vector xám độ x,
xác suất để x thuộc về lớp ci là P (Ci|x), i = 1, 2, ... , nc.
Nếu ta biết được xác suất P (Ci|x) cho mỗi lớp, ta sẽ xác định được cần phân loại x thuộc về lớp nào. Việc này có thể thực hiện bằng cách so sánh các P (Ci|x), với i = 1, 2, ... , nc. Kênh 3 Kênh 1 Kênh 2 ++ + + + + +
x => ci, nếu P (Ci|x) > P (cj|x) với mọi j # i
Hình 2.13: Ngưỡng quyếtđịnh theo xác suất
Hình trên đã giải thích rất rõ ràng về phân loại theo xác suất lớn nhất. Khi x được phân loại theo xác suất p(x|Ci) x P(Ci). x1 được phân loại vào lớp C1, x2 được phân loại vào lớp C2. Ranh giới lớp được xác định tại nơi có xác suất bằng nhau.
Hình 2.14: Ranh giới các lớp được xác định theo ngưỡng quyết định trên không gian phổ
Trong không gian hai chiều, ta không dễ dàng xác định được ranh giới các lớp. Do vậy chúng ta không sử dụng phương pháp phân loại xác suất lớn nhất mà thay vào đó, ta so sánh các xác suất.
Thực chất của MLC (phân loại theo xác suất lớn nhất):Với mục đích đơn giản tính toán, ta thường tính loga của p(x|Ci).P(Ci)
( ) ( ) log( ( )) 2 1 log 2 1 2 log . 2 / ) ( . ( log p xCi p Ci nb Vi xi TVi1 xi P Ci
Do : –nb/2.log2 là hằng số nên công thức trên có thể được giản lược thành: )) ( log( ) ( ) ( 2 1 log 2 1 ) (x Vi x i TVi 1 x i P Ci g
Thông thường, ta giả thiết P(Ci) không đổi với mỗi lớp. Dođó, ta có thể giảnước phương trình: ) ( ) ( log ) (x Vi x i TVi 1 x i g g(x) là hàm phân biệt. Khi so sánh g(x)’s ta có thể xếp x vào đúng lớp.
Trong phân loại xác suất cực đại, sai số do phân loại sai chắc chắn sẽ là nhỏ nhất nếu p(x|Ci) phân bố chuẩn.
Trong thực tế, không phải lúc nào cũng có phân bố chuẩn. Để sử dụng phép phân loại xác suất cực đại hữu ích nhất, ta cần phải đảm bảo các mẫu phân loại sẽ tạo ra phân bố xác suất càng gần với phân bố chuẩn càng tốt. Vậy, một mẫu phân loại có kích cỡ như thế nào? Thông thường, ta cần 10 x nb hoặc 100 x nb pixel cho mỗi lớp. (Swain và Davis, 1978).
MLC là phép phân loại tương đối mạnh, tuy nhiên nó cũng có hạn chế khi xử lý các dữ liệu ở thang định danh hoặc tỉ lệ. Mức độ tính toán cũng sẽ phức tạp hơn khi dung lượng ảnh tăng (ảnh nhiều kênh, nhiều chiều).