(a) Ảnh phóng to của ảnh 2-23(f); (b) Sau khi được phân ngưỡng thấp; (c) Sau khi phân ngưỡng cao ; (d) Sau khi phân ngưỡng trễ.
2.3.2. Phương pháp Shen - Castan
Như đã nói ở trên, Canny đã định nghĩa một tập hợp các tiêu chuẩn dành cho việc dò tìm biên và các tiêu chuẩn này là hợp lý và đầy đủ. Tuy nhiên không có một lý do gì để nghĩ rằng đó là phương pháp tối ưu nhất. Điều này có nghĩa rằng khái niệm tối ưu chỉ là một khái niệm tương đối và rất có thể có một phương pháp tốt hơn. Sau đây chúng ta sẽ khảo sát một thuật toán cũng chạy tốt trong nhiều trường hợp khác nhau của ảnh đó là phương pháp dò tìm biên Shen-Castan.
Shen và Castan có cùng quan điểm với Canny về một mẫu chung trong việc phát hiện biên, đó là: nhân xoắn ảnh với một mặt nạ làm mịn, sau đó tìm
điểm biên. Tuy nhiên, những phân tích của họ lại tạo ra một hàm khác để tối
ưu, đó là họ đề xuất cực tiểu hoá hàm sau (trong không gian một chiều):
C2N = ) 0 ( ) ( . ) ( 4 4 0 0 2 ' 2 f dx x f dx x f ∫ ∫ ∞ ∞ (2.3.2.1) Nói một cách khác hàm mà làm cực tiểu CN là bộ lọc mịn tối ưu cho việc tìm biên. Tuy nhiên, Shen và Castan lại không đề cập đến việc thuật toán sẽ nhận ra nhiều điểm biên trong khi chỉ có một biên tồn taị.
Xây dựng bộ lọc tối ưu
Hàm lọc tối ưu mà họ đạt được là bộ lọc số mũ đối xứng vô cùng Infinite Symmetric Exponential Filter (ISEF):
f(x) = pe−px
2 (2.3.2.2)
Shen-Castan cho rằng bộ lọc này đem lại tỷ lệ giữa tín hiệu và nhiễu tốt hơn bộ lọc của Canny và cung cấp sự định vị tốt hơn. Điều này là rất có thể
bởi vì trong thuật toán Canny bộ lọc tối ưu được xấp xỉ bằng đạo hàm của bộ
tiếp, hoặc có thể do những tiêu chuẩn tối ưu mà Canny đề xuất không có tính thực tế. Tuy nhiên Shen-Castan lại không đưa ra tiêu chuẩn để đáp ứng (multiple-response) nên rất có thể phương pháp của họ sẽ sinh ra nhiễu và làm mờ biên.
Trong không gian hai chiều, ISEF là:
F(x,y) = a.e-p(|x|+|y|) (2.3.2.3)
Hàm lọc này là hàm thực liên tục. Công thức này có thể được áp dụng vào ảnh theo cách tương tự đã làm với đạo hàm của bộ lọc Gauss, như là lọc theo hướng x và hướng y. Tuy nhiên Shen và Castan đã cải tiến thêm một bước khi đưa ra bộ lọc của họ như một hàm lọc đệ quy một chiều.
Trong trường hợp không liên tục, hàm lọc có dạng:
f[i,j] = b b b x y + − + 1 ) 1 ( (2.3.2.4) với b là tham số lọc (0≤b≤1).
Để nhân xoắn một ảnh cùng với hàm lọc này thì việc lọc đệ qui được làm trước tạo r[i,j]: y1 = b b + − 1 1
I[i,j] + by1[i,j-1]; (j=1...N, i=1...M) y2 = b b + − 1 1
I[i,j] + by1[i,j+1]; (j=1...N, i=1...M) (2.3.2.5) r[i,j] = y1[i,j] + y2[i,j+1]
cùng các điều kiện sau:
I[i,0] = 0
y1[i,0] = 0 (2.3.2.6)
y2 [i,M+1]= 0
Sau đó việc lọc được lọc theo hướng y, những tính toán trên r[i,j] sẽ tạo ra kết quả y[i,j]:
y1 = b b + − 1 1
I[i,j] + by1[i-1,j]; (i=1..M, j=1...N) y2 = b. b b + − 1 1
I[i,j] + by1[i+1,j]; (i=1...M, j=1...N) (2.3.2.7) y[i,j] = y1[i,j] + y2[i+1,j]
cùng với các điều kiện: I[0,i] = 0
y1[0,j] = 0 (2.3.2.8)
y2[N+1,j] = 0
Sử dụng lọc đệ quy làm tăng tốc độ nhân xoắn lên nhiều.
Sau khi được ảnh lọc, vấn đềđặt ra là phải phát hiện được các điểm biên. Biên được nhận dạng bằng việc tìm các giao điểm không trong đạo hàm bậc hai (của toán tử Laplace), những điểm ảnh tại vị trí này được đánh dấu.
Giao điểm không tại điểm ảnh P có nghĩa rằng hai điểm láng giềng đối nhau qua giao điểm không có tín hiệu khác nhau. Ví dụ, nếu biên đi qua P là dọc thì điểm ảnh bên trái P sẽ có tín hiệu khác so với điểm ảnh ở bên phải P. Do vậy, có 4 trường hợp để kiểm tra đó là: trên/dưới, trái/phải, và hai đường chéo. Sự kiểm tra này được thực hiện bằng hàm đổi dấu. Sau đó, thực hiện quá trình phân ngưỡng.
* Mô tả thuật toán: Dựa trên những phân tích ở trên ta có thể đưa ra một thuật toán dò tìm biên Shen – Castan gồm các bước chủ yếu sau:
1. Đọc ảnh từ tệp để xử lý.
2. Lọc ảnh bằng phương pháp lọc đệ quy theo công thức (2.3.2.4) -> (2.3.2.8)
3. Tìm các giao điểm không sau khi áp dụng toán tử Laplace. 4. Thực hiện quá trình phân ngưỡng.
+ Phương pháp thứ nhất là phương pháp loại bỏ giao điểm không lồi: Phương pháp này tương đương với việc thực hiện khử nhiễu trong Canny. Tại mỗi điểm được coi là điểm biên, đạo hàm bậc hai tại điểm này sẽ là giao điểm bằng không. Tức là Gradient tại điểm đó hoặc là max hoặc là min. Nếu dấu
đạo hàm bậc hai thay đổi từ (+) sang (-) thì giao điểm không đó được gọi là giao điểm không dương, và nếu nó thay đổi từ (-) sang (+) thì được gọi là giao
điểm không âm. Giả thiết rằng những giao điểm không dương sẽ có Gradient dương, những giao điểm không âm sẽ có Gradient âm. Tất cả các giao điểm không khác đều là sai và không được coi là điểm cạnh. Việc làm này được thực hiện bởi hàm để lấy giá trị duy nhất.
+ Phương pháp thứ hai là thực hiện phân ngưỡng phù hợp Gradient: Trong trường hợp ảnh ban đầu rất nhiễu, phương pháp phân ngưỡng thông thường có thể là không đầy đủ. Các điểm biên có thể được phân ngưỡng bằng việc sử dụng phân ngưỡng toàn cục áp dụng vào Gradient, nhưng Shen và Castan đề xuất ra một phương pháp khác đó là phù hợp Gradient. Một cửa sổ
với độ rộng cố định w được đặt bao xung quanh các điểm được coi là điểm biên ở trong ảnh nhị phân (BLI). Nếu đó thực sự là các điểm biên thì cửa sổ
sẽđược chia làm hai vùng có cấp xám khác bởi một biên. Ước lượng Gradient tốt nhất là độ lệch cấp xám giữa hai vùng trong ảnh nhị phân (BLI), một vùng tương ứng với các điểm có giá trị 0 còn vùng kia tương ứng với các điểm có giá trị là 1, hàm cho kết quả thích ứng thực hiện việc này.
CHƯƠNG 3 - PHÁT HIỆN BIÊN DỰA VÀO WAVELET
3.1. PHƯƠNG PHÁP PHÁT HIỆN BIÊN
Những phần đã trình bày ở trên cho ta thấy rằng: Ranh giới của một đối tượng thường được coi như là đường biên của chúng, ranh giới thường được bao phủ bởi phần có sự thay đổi cường độảnh nhanh chóng. Hầu hết các hàm dò tìm biên thường tìm kiếm các phần trong ảnh có sự thay đổi cường độ ảnh một cách nhanh chóng bằng cách định vị các vùng có đạo hàm bậc một của cường độ lớn hơn một ngưỡng nào đó hoặc tìm các vùng có đạo hàm bậc hai của cường độ có giao điểm bằng không. Có rất nhiều loại thuật toán dò tìm biên: Gradient edge-detectors, Laplacian of Gaussian (LoG), Zero crossing, and Gaussian edge-detectors. Các thuật toán như Sobel, Prewitt và Robert là thuật toán theo phương pháp Gradient. Marr and Hildreth[14] đã chỉ ra hướng tiếp cận Laplacian of Gaussian (LoG). Cuối cùng các phương pháp dò biên Gaussian đối xứng theo biên và giảm lỗi bằng cách làm trơn ảnh. Một trong những phương pháp được sử dụng rộng rãi nhất là Canny.
Một trong hai thuộc tính cơ bản là liên tục và gián đoạn làm cơ sở cho hầu hết các thuật toán phân đoạn ảnh hiện tại đối với ảnh đơn sắc. Các mẫu tương tự phân vùng một ảnh thành các vùng tương tự như một tập các tiêu chuẩn được định nghĩa trước. Cách tiếp cận của thuật toán tìm các điểm không liên tục là phân vùng một ảnh dựa trên sự thay đổi bất ngờ của cường
độ. Các bộ lọc Low_pass, High_pass đối với việc biến đổi Wavelet rời rạc một tín hiệu tương tự (low_pass) và rời rạc hóa/biến đổi nhanh chóng các tín hiệu thành phần (high_pass). Nó có hiệu quả khi kết hợp hai thuộc tính cơ bản trong một hướng tiếp cận.
Hình 3-2: Xác định biên của con chó nằm trên bậc thang.
Hình 3-3: Biên ảnh của Filopodia.
3.2. SỬ DỤNG WAVELET ĐỂ PHÁT HIỆN BIÊN
Phương pháp này sử dụng biến đổi Wavelet rời rạc (Discrete Wavelet Transform) để phân tích ảnh thành nhiều ảnh có chi tiết và xấp xỉ. Xấp xỉ
Hình 3-4: Dùng DWT cho biến đổi Neurite.
Xem hình 3-4 cho thấy, đặc điểm ảnh chứa thông tin biên. Ngoài ra xấp xỉ chứa nhiều thông tin biên hơn. Câu hỏi đặt ra: Tại sao không dùng xấp xỉ
như là ảnh và áp dụng đệ quy DWT hai hoặc ba lần, bởi xấp xỉ cũng chứa thông tin biên, ta áp dụng đệ quy DWT cho sáu mức phân giải, nó gọi là đa phân giải. Kỹ thuật nổi trội nhất là đa phân giải, trong Wavelet, ta gọi kết quả
của một lần biến đổi Wavelet rời rạc là một octave. Trong 2-D biến đổi Wavelet có thể phân chia kích thước, nghĩa là có thể sử dụng WDT 1-D để áp dụng cho chiều ngang, chiều dọc. Để thực hiện WDT 1-D, ta chia tín hiệu đầu vào 1-D thành hai đường vào và bộ lọc. Bộ lọc là quy trình cơ bản xử lý tín hiệu số trong đó tín hiệu đầu vào là co lại với tập hệ số. Việc co lại được miêu tả bởi công thức:
output[n] = ∑− input[n-m] x coefficient[m]
= 1
0
M m
Đầu vào sẽ thông báo, nó có thể tính toán với phép nhân và phép cộng. Bộ lọc chấp nhận liên quan với mỗi hệ số như là thỏa mãn tiêu chuẩn khôi phục lại đầy đủ.
thấp, trong khi một số biến đổi nhanh là tuân theo kênh qua bộ lọc mức cao. Biên trong ảnh xuất hiện như sự biến đổi đột ngột, vì vậy lúc này quy trình là riêng biệt, tín hiệu có thể khôi phục lại bởi sự biến đổi. Xấp xỉ giống như ảnh gốc, khi đó ta bổ xung thêm nội dung, ta quay lại nơi ta bắt đầu.
Với biến đổi 2-D, ta có thể lọc theo hàng, thành hai ảnh phụ tương tự, mỗi phần là nửa ảnh gốc. Chiều cao như ảnh gốc nhưng ảnh con có độ rộng bằng nửa. Ta lọc ảnh con với bộ lọc mức thấp và mức cao theo theo cột, tạo ra hai ảnh nữa thành bốn ảnh con. Ta gắn nhãn kết quả ảnh con từ biến đổi của DWT là LL(xấp xỉ), LH, HL và HH, theo bộ lọc dùng tạo ra ảnh con. Ví dụ, HL nghĩa là ta sử dụng qua bộ lọc cao theo hàng và qua bộ lọc thấp theo cột, cứ thế có thể lặp lại với LL. Làm với sáu phép biến đổi, kiểm tra phương pháp, đặc điểm tại mỗi phép biến đổi tiếp theo là một đến bốn kích thước của biến đổi liền trước. Quan sát hình 3-6 là một ảnh con là tìm được biên ngang, trong khi cần tìm một biên dọc nữa và đặc điểm cuối cùng của ảnh con là
đường chéo, ta kết hợp ba đặc điểm ảnh con của mỗi phép biến đổi để xây dựng toàn bộ đặc điểm ảnh cho một phép biến đổi. Thực hiện việc đồng dạng chứa nội dung ảnh mang lại cho ta đường biên tốt của nội dung đối tượng ảnh. Dữ liệu thể hiện ở hình 3-4 đã biến đổi từ quan sát ảnh con. Một lần áp dụng DWT, dữ liệu đó không phải là số nguyên rõ ràng từ 0 đến 255 nữa, chúng không thay đổi mức xám nữa. Ta thường dùng độ lệnh chuẩn gán giá trịđiểm ảnh như hình 3-5 và hình 3-6. Màu đen miêu tả năm độ lệnh chuẩn từ
giá trị trung bình và màu trắng dùng cho giá trị còn lại. Qua thực nghiệm ta thấy rằng năm độ lệch chuẩn cung cấp kết quả tốt, những điểm ảnh trong phạm vi lớn tương ứng với đặc điểm ảnh con trong trị số lớn. Như vậy, độ
Hình 3-5: Đặc điểm thấy được ở một hộp đơn.
Hình 3-6: Các đặc điểm thấy được từ ảnh con chó nằm ở bậc thang.
Khi dùng DWT, ở đó một Wavelet được chọn (Ta thay đổi Wavelet
đơn bằng thay đổi hệ số bộ lọc). Ảnh gốc nhằm mục đích là thực thi DWT và tỷ lệ liên quan dò tìm biên, sau đó dùng Daubechies Wavelet và tìm ra kết quả
tốt nhất, ngoài ra ta sử dụng Biorthogonal Wavelet. Bởi vậy, ta sử dụng Daubechies Wavelet hệ số 4 và Biorthogonal Spline Wavelet 2.2.
Bởi vì việc biến đổi Wavelet sử dụng đa giải pháp, cũng có các giải pháp kết hợp được lựa chọn để tìm ra giá trị thực của phương pháp. Điều này dường như rất tự nhiên từ tổng hợp kết quả đầu ra nhiều octave. Một phương pháp đã tìm ra nđặc tính ánh xạ : ví dụ thông qua hàng ngang, gọi 6 octave và tìm được nhiều hơn (n) hoặc nếu thông thường 2 hoặc 3 điểm ảnh. Như vậy sẽ
thu được biên rõ nét, hình 3-7 và hình 3-8 chỉ ra kết quả của phương pháp này. Một phương pháp khác đã được kiểm nghiệm việc tự liên kết. Trong
phương pháp này các biên rõ nét trong mỗi ảnh được phóng đại , cho phép tự động nhận dạng các vùng cần thiết. Hình 3-9, 3-10, 3-11 minh họa ảnh kết quả từ việc kết hợp ba octave sử dụng tự liên kết. Phương pháp này đưa ra hầu hết các kết quả trong các ảnh. Bảng 3-1 đưa ra kết quả kiểm tra một tập các ảnh.
Hình 3-7: Sử dụng 3 trong 5 tiêu chuẩn cho ảnh con chó nằm bậc thang.
Hình 3-8: Sử dụng 3 tiêu chuẩn cho ảnh của Filopodia.
Bởi vì Wavelet được phân chia một cách tự nhiên, số các octave được giải quyết một cách phù hợp. Trong thực nghiệm, octave đầu tiên chứa nhiều thông tin chi tiết nhưng chỉ một số ít được sử dụng, octave thứ 2 và thứ 3
dường như chỉ phù hợp riêng với ứng dụng, từ khi chúng chứa các thông tin chi tiết thì nó chưa đề cập tới hầu hết các thay đổi nhỏ.
Hình 3-9: Sử dụng tự liên kết trong ảnh hộp đơn.
Hình 3-10: Sử dụng tự liên kết trong ảnh con chó nằm bậc thang.
Thực tế, công việc là biến đổi DWT thành 6 octave tuy nhiên chỉ cần 3 octave là đủ. Mỗi ảnh được thực hiện vì có một nguyên nhân khác nhau, Hình 3-1 là một hộp đơn, nó được thực nghiệm bởi vì thẳng và phẳng. Nó cũng
được sử dụng để kiểm tra kết quả thực nghiệm có đúng và chính xác không, hơn nữa ảnh hộp đơn đưa ra đường biên chính xác. Hai ảnh này được thực nghiệm bằng chương trình tốt hơn bằng tay. Ảnh hộp đơn còn là ảnh kết quả
với những ảnh có kích cỡ 640 x 480 pixel. Khi một octave của DWT thực hiện đưa ra 4 ảnh con có chiều cao và chiều rộng bằng một nửa của octave bên trên, kích cỡ phù hợp của ảnh con là 20 x15 tại 6 octave. Ảnh tiếp theo Dog on Porch được đưa ra ở hình 3-2 được thực hiện vì nó đổ bóng và chi tiết. Đường biên chính xác của ảnh được tạo bằng tay. Ảnh này có kích cỡ là 256 x256 và kích cỡ phù hợp của ảnh con tại 6 octave là 8 x8. Cuối cùng, ảnh Neurite được thực nghiệm (ảnh này như là cấu trúc tóc, hay như là những ngón tay xòe ra). Hiện tại kích thước ảnh thường được làm bằng tay, một nhà nghiên cứu đã đưa ra ảnh đáp ứng chính xác. Trong ảnh này chỉ có các vị trí của filopodia phù hợp được thể hiện. Ảnh đáp ứng có kích thước là 480 x 640 pixel.
Trong tất cả các ảnh được sử dụng bởi 6 octave thì các thông tin hữu ích là ảnh mờ hoàn chỉnh. Trên thực tế, ta tìm thấy bằng thực nghiệm kết quả
tốt chỉ bằng ba octave đầu tiên. Thông tin biên dường như là tín hiệu của