3.2.1.1. Khái niệm về phân ngưỡng ảnh
Phân ngưỡng ảnh là phương pháp tách ảnh đầu vào thành nhiều đối tượng khác nhau dựa trên các ngưỡng cấp độ xám cho trước. Đây là một ứng dụng phổ biến trong phân tích ảnh. Hiện nay, có hai phương pháp phân ngưỡng chính đó là
phương pháp phân ngưỡng tổng thể (global thresholding) và phương pháp phân ngưỡng thích ứng (local thresholding).
Phương pháp phân ngưỡng tổng thể là phương pháp phân ngưỡng chọn một giá trị ngưỡng T cố định cho toàn ảnh. Ngưỡng T được lựa chọn thỏa mãn tách được các đối tượng (trong trường hợp này là vết dầu) với vùng nền xung quanh (mặt biển). Với các pixel có tọa độ (x, y) và giá trị độ xám của pixel là f x y( , )T
thì được gọi là vùng nền, ngược lại thì được gọi là vết dầu theo công thức (3.7). Sau quá trình phân ngưỡng sẽ tạo ra ảnh g x y( , ) ở dạng nhị phân với hai giá trị 0 và 1.
1 ( , ) ( , ) 0 ( , ) f x y T g x y f x y T (3.7)
Tuy nhiên, phương pháp phân ngưỡng tổng thể có thể không tách được hoàn toàn các vết dầu ra khỏi ảnh SAR nếu các vết dầu gồm nhiều giá trị ngưỡng độ xám khác nhau tương ứng với mỗi vị trí khác nhau trên ảnh.
Phương pháp phân ngưỡng thích ứng hạn chế được những nhược điểm của phương pháp phân ngưỡng tổng thể. Các giá trị ngưỡng trong phương pháp phân ngưỡng thích ứng sẽ không cố định cho toàn ảnh mà thay đổi tùy theo cửa sổ xử lý. Trong phương pháp này, giá trị độ xám của pixel là f x y( , ) sẽ được so sánh với giá trị ngưỡng biến đổi theo một hàm T x y( , ) và ảnh phân ngưỡng được định nghĩa theo công thức sau: 1 ( , ) , ( , ) 0 ( , ) , f x y T x y g x y f x y T x y (3.8) Trong đó: T x y( , ) f x yo( , )To
Giá trị f x yo( , ) là kết quả phân tích biểu đồ mật độ của f và hằng số To là kết quả phân ngưỡng tổng thể đối với ảnh sau khi phân tích hình thái fo. Tuy nhiên, quá trình tính toán bằng thuật toán phân ngưỡng thích ứng sẽ phức tạp hơn do phải tính toán ngưỡng trên từng cửa sổ.
3.2.1.2. Thuật toán tự động phân ngưỡng Huang
chia các pixel trên ảnh thành hai vùng là vùng vết dầu và vùng biển. Quá trình tìm kiếm ngưỡng T sẽ dựa vào phân tích biểu đồ mật độ của ảnh. Nhìn chung, vị trí chọn ngưỡng T thường là vùng thung lũng của biểu đồ mật độ. Tuy nhiên, đôi khi vùng thung lũng trên biểu đồ mật độ không rõ ràng sẽ gây khó khăn để xác định ngưỡng. Các thuật toán tự động phân ngưỡng được nghiên cứu để tìm kiếm vị trí ngưỡng T tốt nhất trên biểu đồ mật độ. Trong luận án, nghiên cứu sinh đề xuất sử dụng thuật toán tự động phân ngưỡng của tác giả Huang (gọi tắt là thuật toán tự động phân ngưỡng Huang) để tách vết đen trên ảnh siêu cao tần sau khi ảnh đã thực hiện quá trình tiền xử lý ảnh.
Thuật toán tự động phân ngưỡng Huang xác định ngưỡng dựa trên khái niệm về độ mờ nhỏ nhất trên ảnh (Minimizing the measures of fuzziness) [22]. Giá trị ngưỡng được xác định dựa trên tập mờ của ảnh. Tập mờ của ảnh được phân tích thông qua một hàm tương ứng của pixel được định nghĩa bởi sự khác biệt tuyệt đối giữa mức độ xám của pixel và mức độ xám trung bình theo từng vùng, tùy thuộc là vùng đối tượng hay vùng nền. Sự khác biệt càng lớn thì mức độ tương ứng với vùng sẽ càng nhỏ [22].
Xét một ảnh X có kích thước MxN với L mức độ xám và kí hiệu xmn là mức độ xám của pixel có tọa độ (m, n) trong X. Giá trị tương ứng của pixel được kí hiệu là x xmn . Đồng thời, giá trị x xmn cũng đặc trưng cho một đặc tính xác định của pixel (m, n) trong ảnh X. Tập mờ của một ảnh X được đặc trưng bởi giá trị trong khoảng [0, 1] và được định nghĩa theo công thức sau [22]:
mn, mn
X x x (3.9)
Trong đó: 0x xmn 1 với m = 0,…, M-1 và n = 0,…, N-1 x xmn - Giá trị độ xám của pixel x m n ,
Hàm tương thích x xmn có thể được xem như một hàm đặc trưng cho độ mờ của pixel (m, n) trong ảnh X. Xét h(g) là số lần xuất hiện của mức độ xám g trong ảnh đầu vào. Với một ngưỡng t xác định, giá trị độ xám trung bình của vùng
nền là 0, của vùng đối tượng là 1 và được xác định theo công thức (3.10) và (3.11) [22]: 0 0 0 ( ) t t g g gh g h g (3.10) 1 1 1 1 1 ( ) L L g t g t gh g h g (3.11)
Trong đó: 0- Giá trị độ xám trung bình của vùng nền 1- Giá trị độ xám trung bình của vùng đối tượng g- mức độ xám của ảnh đầu vào
h(g) – Số lần xuất hiện của mức độ xám g t – giá trị ngưỡng
L – Mức độ xám có trong ảnh đầu vào
Giá trị độ xám trung bình 0 và 1 có thể được xem như là giá trị mục tiêu của vùng nền và vùng đối tượng với ngưỡng xét t. Mối quan hệ giữa một pixel trong vùng xét X với vùng tương ứng phụ thuộc vào sự khác biệt mức độ xám của bản thân pixel và giá trị mục tiêu của vùng tương ứng. Do vậy, ta có định nghĩa về hàm tương thích của một pixel (m, n) theo công thức (3.12) và (3.13) như sau:
0 1 1 X mn mn x x C nếu xmn t (3.12) 1 1 1 X mn mn x x C nếu xmn t (3.13)
C là một giá trị hằng số và được xác định bằng công thức:
ax min
m
C g g Trong đó: gmaxvà gmin là giá trị ngưỡng độ xám lớn nhất và giá trị ngưỡng độ xám nhỏ nhất được xác định trên ảnh X.
0
- Giá trị độ xám trung bình của vùng nền
1
- Giá trị độ xám trung bình của vùng đối tượng
mn
Từ khái niệm về hàm tương ứng, tác giả Huang đã sử dụng hàm Shannon để xác định độ mờ trên ảnh thông qua giá trị entropy. Entropy trong lý thuyết thông tin thường được sử dụng như một đại lượng đo độ mờ trên ảnh tương tự. Dựa trên hàm Shannon, De Luca và Termini đã định nghĩa entropy của một tập mờ A theo công thức sau [22]: 1 ( ) ln 2 i A i E A S x n , i1, 2, ,n (3.14) Trong đó: A x - Hàm tương thích của x trong tập mờ A
Với hàm Shannon được xác định theo công thức sau:
A i A i ln A i
S x x x
1 A xi ln 1A xi (3.15)
Mở rộng với ảnh 2 chiều, giá trị entropy của một ảnh X được mô tả theo công thức sau: 1 ln 2 m n X mn E X S x MN (3.16) Trong đó: m0,1, ,M 1 và n0,1, ,N1
X xmn - Hàm tương thích của pixel x m n , trong ảnh X
Sử dụng thông tin từ biểu đồ mật độ, công thức (3.16) có thể viết lại theo công thức sau: 1 ln 2 g X E X S g h g MN 0,1, , 1 g L (3.17)
Trong đó: g- mức độ xám của ảnh đầu vào
h(g) – Số lần xuất hiện của mức độ xám g
SX g - Hàm Shannon của hàm tương thích X g
Lưu ý trong hàm Shannon trong công thức (3.17) là tăng tuyến tính trong khoảng từ [0,0.5] và giảm tuyến tính từ [0.5,0]. Khi X xmn 0.5 với tất cả m và n thì entropy E sẽ là độ mờ lớn nhất. Vì vậy, entropy có các đặc điểm sau:
(1) 0E X 1
(2) E X sẽ có giá trị nhỏ nhất bằng 0 nếu X xmn 0 hoặc 1 với tất cả (m,n) (3) E X có giá trị lớn nhất là 1 nếu X xmn 0.5 với tất cả (m,n)
(4) E X E X nếu ảnh X rõ nét hơn ảnh X
(5) E X E X trong đó X là phần bù của X
Quá trình đo độ mờ bằng công thức (3.17) được tính toán lặp lại với t t 1 và cho tới khi t g max 1. Giá trị ngưỡng tối ưu sẽ được xác định bằng giá trị độ mờ nhỏ nhất (tham khảo phụ lục 0 ).
Các kết quả thể hiện trong Hình 3.15, Hình 3.16 và Hình 3.17 đã chứng minh giá trị ngưỡng độ xám được xác định theo phương pháp Huang là phù hợp với dữ liệu ảnh SAR phục vụ việc nhận dạng và phân loại vết dầu trên biển. Thuật toán tự động phân ngưỡng Huang cho phép tách được tất cả các vết đen trên ảnh SAR (Hình 3.15) và bảo toàn được hình dạng của vết đen (Hình 3.16).
Hình 3.15. Kết quả phân ngưỡng bằng thuật toán Huang
Kết quả phân ngưỡng giá trị độ xám tự động theo thuật toán Huang được so sánh với kết quả phân ngưỡng bằng việc lựa chọn ngưỡng trực tiếp trên ảnh (Bảng 3.1). Ngưỡng giá trị độ xám được xác định trực tiếp trên ảnh là giá trị tại vị trí thung lũng trên biểu đồ mật độ của ảnh (Hình 3.16a và Hình 3.17a). Ngưỡng giá trị độ xám được xác định theo thuật toán Huang cho phép tách hoàn toàn được vết đen
trên ảnh SAR, hình dạng vết đen được bảo toàn hơn kết quả phân ngưỡng được lựa chọn trực tiếp trên ảnh (Hình 3.16c và Hình 3.16d).
(a)
(b) (c) (d)
Hình 3.16. Phân ngưỡng ảnh PALSAR (ERSDAC) thu nhận 20/04/2008 (a) Biểu đồ mật độ;
(b) Ảnh gốc;
(c) Lựa chọn ngưỡng trên ảnh; (d) Sử dụng thuật toán Huang
(a)
(b) (c) (d)
Hình 3.17. Phân ngưỡng ảnh PALSAR (JAXA) thu nhận 18/04/2007 (a) Biểu đồ mật độ;
(b) Ảnh gốc;
(c) Lựa chọn ngưỡng trên ảnh; (d) Sử dụng thuật toán Huang
Bảng 3.1. So sánh kết quả phân ngƣỡng trên ảnh PALSAR
TT Phƣơng pháp Ngƣỡng độ xám/
Ảnh 20/04/2008
Ngƣỡng độ xám/ Ảnh 18/04/2007
1 Lựa chọn ngưỡng trên ảnh 18 30
2 Sử dụng thuật toán Huang 29 33
Dữ liệu ảnh thử nghiệm tự động phân ngưỡng tách vết đen trên ảnh SAR là ảnh đã được hiệu chỉnh ảnh hưởng xa-gần nguồn phát sóng và đã được tiến hành lọc nhiễu theo thuật toán trung vị.