SỬ DỤNG WAVELET ĐỂ PHÁT HIỆN BIÊN

Một phần của tài liệu Phương pháp phát hiện biên ảnh (Trang 72)

Phương pháp này sử dụng biến đổi Wavelet rời rạc (Discrete Wavelet Transform) để phân tích ảnh thành nhiều ảnh có chi tiết và xấp xỉ. Xấp xỉ

Hình 3-4: Dùng DWT cho biến đổi Neurite.

Xem hình 3-4 cho thấy, đặc điểm ảnh chứa thông tin biên. Ngoài ra xấp xỉ chứa nhiều thông tin biên hơn. Câu hỏi đặt ra: Tại sao không dùng xấp xỉ

như là ảnh và áp dụng đệ quy DWT hai hoặc ba lần, bởi xấp xỉ cũng chứa thông tin biên, ta áp dụng đệ quy DWT cho sáu mức phân giải, nó gọi là đa phân giải. Kỹ thuật nổi trội nhất là đa phân giải, trong Wavelet, ta gọi kết quả

của một lần biến đổi Wavelet rời rạc là một octave. Trong 2-D biến đổi Wavelet có thể phân chia kích thước, nghĩa là có thể sử dụng WDT 1-D để áp dụng cho chiều ngang, chiều dọc. Để thực hiện WDT 1-D, ta chia tín hiệu đầu vào 1-D thành hai đường vào và bộ lọc. Bộ lọc là quy trình cơ bản xử lý tín hiệu số trong đó tín hiệu đầu vào là co lại với tập hệ số. Việc co lại được miêu tả bởi công thức:

output[n] = ∑− input[n-m] x coefficient[m]

=

1

0

M m

Đầu vào sẽ thông báo, nó có thể tính toán với phép nhân và phép cộng. Bộ lọc chấp nhận liên quan với mỗi hệ số như là thỏa mãn tiêu chuẩn khôi phục lại đầy đủ.

thấp, trong khi một số biến đổi nhanh là tuân theo kênh qua bộ lọc mức cao. Biên trong ảnh xuất hiện như sự biến đổi đột ngột, vì vậy lúc này quy trình là riêng biệt, tín hiệu có thể khôi phục lại bởi sự biến đổi. Xấp xỉ giống như ảnh gốc, khi đó ta bổ xung thêm nội dung, ta quay lại nơi ta bắt đầu.

Với biến đổi 2-D, ta có thể lọc theo hàng, thành hai ảnh phụ tương tự, mỗi phần là nửa ảnh gốc. Chiều cao như ảnh gốc nhưng ảnh con có độ rộng bằng nửa. Ta lọc ảnh con với bộ lọc mức thấp và mức cao theo theo cột, tạo ra hai ảnh nữa thành bốn ảnh con. Ta gắn nhãn kết quả ảnh con từ biến đổi của DWT là LL(xấp xỉ), LH, HL và HH, theo bộ lọc dùng tạo ra ảnh con. Ví dụ, HL nghĩa là ta sử dụng qua bộ lọc cao theo hàng và qua bộ lọc thấp theo cột, cứ thế có thể lặp lại với LL. Làm với sáu phép biến đổi, kiểm tra phương pháp, đặc điểm tại mỗi phép biến đổi tiếp theo là một đến bốn kích thước của biến đổi liền trước. Quan sát hình 3-6 là một ảnh con là tìm được biên ngang, trong khi cần tìm một biên dọc nữa và đặc điểm cuối cùng của ảnh con là

đường chéo, ta kết hợp ba đặc điểm ảnh con của mỗi phép biến đổi để xây dựng toàn bộ đặc điểm ảnh cho một phép biến đổi. Thực hiện việc đồng dạng chứa nội dung ảnh mang lại cho ta đường biên tốt của nội dung đối tượng ảnh. Dữ liệu thể hiện ở hình 3-4 đã biến đổi từ quan sát ảnh con. Một lần áp dụng DWT, dữ liệu đó không phải là số nguyên rõ ràng từ 0 đến 255 nữa, chúng không thay đổi mức xám nữa. Ta thường dùng độ lệnh chuẩn gán giá trịđiểm ảnh như hình 3-5 và hình 3-6. Màu đen miêu tả năm độ lệnh chuẩn từ

giá trị trung bình và màu trắng dùng cho giá trị còn lại. Qua thực nghiệm ta thấy rằng năm độ lệch chuẩn cung cấp kết quả tốt, những điểm ảnh trong phạm vi lớn tương ứng với đặc điểm ảnh con trong trị số lớn. Như vậy, độ

Hình 3-5: Đặc điểm thấy được ở một hộp đơn.

Hình 3-6: Các đặc điểm thấy được từ ảnh con chó nằm ở bậc thang.

Khi dùng DWT, ở đó một Wavelet được chọn (Ta thay đổi Wavelet

đơn bằng thay đổi hệ số bộ lọc). Ảnh gốc nhằm mục đích là thực thi DWT và tỷ lệ liên quan dò tìm biên, sau đó dùng Daubechies Wavelet và tìm ra kết quả

tốt nhất, ngoài ra ta sử dụng Biorthogonal Wavelet. Bởi vậy, ta sử dụng Daubechies Wavelet hệ số 4 và Biorthogonal Spline Wavelet 2.2.

Bởi vì việc biến đổi Wavelet sử dụng đa giải pháp, cũng có các giải pháp kết hợp được lựa chọn để tìm ra giá trị thực của phương pháp. Điều này dường như rất tự nhiên từ tổng hợp kết quả đầu ra nhiều octave. Một phương pháp đã tìm ra nđặc tính ánh xạ : ví dụ thông qua hàng ngang, gọi 6 octave và tìm được nhiều hơn (n) hoặc nếu thông thường 2 hoặc 3 điểm ảnh. Như vậy sẽ

thu được biên rõ nét, hình 3-7 và hình 3-8 chỉ ra kết quả của phương pháp này. Một phương pháp khác đã được kiểm nghiệm việc tự liên kết. Trong

phương pháp này các biên rõ nét trong mỗi ảnh được phóng đại , cho phép tự động nhận dạng các vùng cần thiết. Hình 3-9, 3-10, 3-11 minh họa ảnh kết quả từ việc kết hợp ba octave sử dụng tự liên kết. Phương pháp này đưa ra hầu hết các kết quả trong các ảnh. Bảng 3-1 đưa ra kết quả kiểm tra một tập các ảnh.

Hình 3-7: Sử dụng 3 trong 5 tiêu chuẩn cho ảnh con chó nằm bậc thang.

Hình 3-8: Sử dụng 3 tiêu chuẩn cho ảnh của Filopodia.

Bởi vì Wavelet được phân chia một cách tự nhiên, số các octave được giải quyết một cách phù hợp. Trong thực nghiệm, octave đầu tiên chứa nhiều thông tin chi tiết nhưng chỉ một số ít được sử dụng, octave thứ 2 và thứ 3

dường như chỉ phù hợp riêng với ứng dụng, từ khi chúng chứa các thông tin chi tiết thì nó chưa đề cập tới hầu hết các thay đổi nhỏ.

Hình 3-9: Sử dụng tự liên kết trong ảnh hộp đơn.

Hình 3-10: Sử dụng tự liên kết trong ảnh con chó nằm bậc thang.

Thực tế, công việc là biến đổi DWT thành 6 octave tuy nhiên chỉ cần 3 octave là đủ. Mỗi ảnh được thực hiện vì có một nguyên nhân khác nhau, Hình 3-1 là một hộp đơn, nó được thực nghiệm bởi vì thẳng và phẳng. Nó cũng

được sử dụng để kiểm tra kết quả thực nghiệm có đúng và chính xác không, hơn nữa ảnh hộp đơn đưa ra đường biên chính xác. Hai ảnh này được thực nghiệm bằng chương trình tốt hơn bằng tay. Ảnh hộp đơn còn là ảnh kết quả (adsbygoogle = window.adsbygoogle || []).push({});

với những ảnh có kích cỡ 640 x 480 pixel. Khi một octave của DWT thực hiện đưa ra 4 ảnh con có chiều cao và chiều rộng bằng một nửa của octave bên trên, kích cỡ phù hợp của ảnh con là 20 x15 tại 6 octave. Ảnh tiếp theo Dog on Porch được đưa ra ở hình 3-2 được thực hiện vì nó đổ bóng và chi tiết. Đường biên chính xác của ảnh được tạo bằng tay. Ảnh này có kích cỡ là 256 x256 và kích cỡ phù hợp của ảnh con tại 6 octave là 8 x8. Cuối cùng, ảnh Neurite được thực nghiệm (ảnh này như là cấu trúc tóc, hay như là những ngón tay xòe ra). Hiện tại kích thước ảnh thường được làm bằng tay, một nhà nghiên cứu đã đưa ra ảnh đáp ứng chính xác. Trong ảnh này chỉ có các vị trí của filopodia phù hợp được thể hiện. Ảnh đáp ứng có kích thước là 480 x 640 pixel.

Trong tất cả các ảnh được sử dụng bởi 6 octave thì các thông tin hữu ích là ảnh mờ hoàn chỉnh. Trên thực tế, ta tìm thấy bằng thực nghiệm kết quả

tốt chỉ bằng ba octave đầu tiên. Thông tin biên dường như là tín hiệu của những biến đổi chính trong ảnh nó đã được đưa ra trong các phép biến đổi trước đó.

Một phần của tài liệu Phương pháp phát hiện biên ảnh (Trang 72)