Các băng lọc

Hình 1.9 trên mơ tả một băng lọc phân tích với một ngõ vào x(n) và hai ngõ ra x0(n) và x1(n). Tín hiệu ngõ vào x(n) được xử lý theo hai nhánh. Ở nhánh trên, x(n) đi qua bộ lọc thơng thấp H0(ejw) và giảm tốc độ lấy mẫu cho 2. Ở nhánh dưới, x(n) đi qua bộ lọc thơng cao H1(ejw) và cũng giảm tốc độ lấy mẫu cho 2. Giả sử tín hiệu x(n) cĩ số mẫu N là số chẳn và x(n) là tín hiệu tuần hồn. Lúc đĩ, tín hiệu ở mỗi ngõ ra cùng tuần hồn và cĩ chu kỳ là N/2 mẫu. Vì vậy, băng lọc phân tích được xem như là phép biến đổi ánh xạ tập hợp N mẫu tín hiệu ban đầu {x(n)} vào một tập hợp mới N mẫu {x0(n), x1(n)}.

Hình 1.10 biểu diễn một băng lọc tổng hợp. Ơû đây cĩ hai ngõ vào y0(n) và y1(n), và một ngõ ra y(n). Ngõ vào y0(n) được tăng tốc độ lấy mẫu và đưa qua bộ lọc thơng thấp G0(ejw). Ngõ vào y1(n) cũng được xử lý tương tự nhưng được đưa

↓2 H0(ejw)

x(n)

x0(n)

Hình 1.9. Băng lọc phân tích, với bộ lọc thơng thấp H0(ejw) và bộ lọc thơng cao H1(ejw)

↓2

ra y(n). Giả sử hai tín hiệu y0(n) và y1(n) đều là hai tín hiệu tuần hồn cĩ chu kỳ N/2. Tín hiệu ngõ ra y(n) cũng sẽ là tín hiệu tuần hồn nhưng cĩ chu kỳ là N. Vì vậy, băng lọc tổng hợp được xem như là phép biến đổi ánh xạ tập hợp N mẫu ban đầu {y0(n), y1(n)} vào một tập hợp mới N mẫu {y(n)}.

Khi ta đưa các ngõ ra x0(n), x1(n) của băng lọc phân tích vào các ngõ vào của băng lọc tổng hợp, với một số điều kiện xác định cụ thể của bốn bộ lọc H0(ejw), H1(ejw), G0(ejw), G1(ejw) thì ngõ ra y(n) của hệ thống phân tích/tổng hợp trên giống với ngõ vào x(n) của nĩ. Điều kiện này gọi là điều kiện khơi phục lý

tưởng. Ví dụ: h0(n) và g1(n) là các xung đơn vị và h1(n) và g0(n) là bộ trễ 1 đơn vị.

Trong trường hợp này, dễ dàng chứng minh được ngõ ra là y(n) = x(n-1).

Với thêm một số điều kiện của các bộ lọc, phép biến đổi phân tích và tổng hợp của các băng lọc là trực chuẩn. Trực chuẩn cĩ ý nghĩa bao hàm năng lượng của các mẫu được bão tồn. Nếu những điều kiện trên được thõa mãn, các bộ lọc sẽ cĩ đặc điểm nổi bật như sau: các bộ lọc tổng hợp là đảo thời gian (time- reversed) của các bộ lọc phân tích, các bộ lọc thơng cao là phiên bản được điều chỉnh từ những bộ lọc thơng thấp, g0(n) = (-1)nh1(n), g1(n) = (-1)n+1h0(n) và h1(n) = (-1)-nh0(K-n), với K là một số tự nhiên. Các bộ lọc này được biết như là các bộ

y(n)

↑ 2 G0(ejw) y0(n)

Hình 1.10. Băng lọc tổng hợp, với bộ lọc thơng thấp G0(ejw) và bộ lọc thơng cao G1(ejw)

↑ 2 G1(ejw) y1(n)

lọc phản chiếu vuơng gĩc QMF (quadrature mirror filter) hay là các bộ lọc liên hợp vuơng gĩc CQF (conjugate quadrature filters), hay là các bộ lọc bù cơng suất PCF (power-complementary filters) bởi vì cả hai bộ lọc thơng thấp (hoặc tương tự là thơng cao) đều cĩ đáp tuyến tần số giống nhau và đáp tuyến tần số của các bộ lọc thơng thấp và thơng cao liên hệ nhau theo đặc điểm bù cơng suất | H0(ejw) |2 + | H1(ejw) |2 = 2. Bộ lọc h0(n) được xem là bộ lọc mẫu bởi vì nĩ tự quyết định ba bộ lọc cịn lại.

Nếu bộ lọc mẫu H0(ejw) bằng 0 tại tần số w = π, các bộ lọc này được gọi là các bộ lọc wavelet hay các bộ lọc chính quy. Ví dụ, ta cĩ bộ lọc mẫu bốn bước do GS. Daubechies [3] đưa ra:

h0(n) = (1 3,3 3,3 3,1 3) 2 4 1 − − + + 1.5.3 Phân rã wavelet x(n1, n2) LL

Hình 1.11. Cơ chế phân rã theo wavelet.

↓2 H0(ejw) ↓2 H1(ejw) H0(ejw) ↓2 ↓2 H1(ejw) ↓2 H0(ejw) ↓2 H1(ejw) LH HL HH

Băng lọc phân tích phân rã tín hiệu 1-D thành các thành phần tần số thấp và thành phần tần số cao. Chúng ta cĩ thể thực hiện phân rã tương tự trên ảnh bằng cách áp dụng lọc 1-D theo các hàng của ảnh và sau đĩ theo các cột, hoặc ngược lại. Phép tốn này được thực hiện như hình 1.11.

Lọc theo chiều ngang và chiều đứng sử dụng cùng bộ lọc H0(ejw) và H1(ejw). Ngõ ra của hệ thống phân tích gồm cĩ bốn ảnh con gọi là các băng con (subband): LL (low low), LH (low high), HL (high low) và HH (high high) tương ứng với các băng tần tần số khác nhau trong ảnh. Biễu diễn phân rã hình một chú chim thành bốn băng con được trình bày ở hình 1.12.

Hình 1.12 Aûnh gốc và các ảnh phân rã sử dụng wavelet Daubechies.

Quan sát, ta thấy ảnh con LL là phiên bản thơ (độ phân giải thấp) của ảnh gốc. Các ảnh con HL, LH, HH lần lượt chứa các chi tiết theo chiều dọc, chiều ngang và đường chéo. Tổng số pixel của bốn ảnh con bằng với số pixel của ảnh gốc.

Để thực hiện phân rã wavelet một ảnh, chúng ta áp dụng sơ đồ hình 1.11lặp đi lặp lại với các ảnh con LL. Mỗi lần như vậy lại tạo ra một phiên bản ảnh thơ

hơn và ba ảnh chi tiết mới. Hình 1.13cho thấy các bộ lọc ghép nối tiếp thực hiện phân rã wavelet và hình 1.13 (c)cho thấy một phân rã wavelet ba mức. Ở đây cĩ tất cả bảy băng con. Mỗi băng con cĩ độ phân giải và hướng khác nhau.

Phân rã Laplacian và wavelet đều cĩ một phiên bản thơ của ảnh (coarse x(n1,n2) LL LH HL HH LLLL LLLH LHLL LHLH LLLL LLLH LHLL LHLH LH LL HL HH x(n1,n2)

Phân rã wavelet của ảnh ngõ

vào x(n1,n2) Tái tạo ảnh x(nsố wavelet của nĩ 1, n2) từ các hệ

HL LH HH LHLH LLLH LHLL LLLL

Phân bố của các băng con đối với biễu diễn phân rã3 mức

Hình 1.13 Thực hiện phân rã ảnh bằng wavelet sử dụng các bộ lọc ghép nối tiếp

theo wavelet khơng gây dư thừa pixel và cịn cung cấp thơng tin về các thành phần ảnh theo những hướng khơng gian khác nhau.

Trong khi những khái niệm kinh điển trong xử lý tín hiệu cho chúng ta hiểu biết hoạt động của hệ thống ghép nối tiếp các bộ lọc. Ở đây cĩ một sợi dây liên lạc trong cơng việc của tốn học ứng dụng và trong tâm sinh lý học cung cấp một hiểu biết sâu sắc về phân rã wavelet và vị trí của chúng trong xử lý ảnh. Đứng từ quan điểm tốn học, phân rã wavelet tương đương như phép chiếu tín hiệu lên một cơ sở wavelet. Đứng từ khía cạnh tâm sinh lý, mỗi giai đoạn xử lý thơng tin trong hệ thống thị giác cĩ liên quan đến phân rã các ảnh trên võng mạc thành một tập hợp các ảnh con tương ứng với những độ phân giải và hướng khác nhau. Điều này cho thấy phân rã ảnh đa phân giải là hết sức tự nhiên và cĩ hiệu quả trong xử lý ảnh.

1.5.4 Ma trận biến đổi wavelet rời rạc

Trong thực tế, chúng ta thường làm việc với tín hiệu (hàm) đã được lấy mẫu (rời rạc hĩa). Trong những trường hợp này, rất cĩ lợi nếu xem biến đổi wavelet như là phép nhân ma trận. Vì vậy, nếu fn; n ∈ [0, N – 1] là các mẫu của hàm f, biến đổi wavelet rời rạc của f là

∧

=f f W

trong đĩ f là vector biễu diễn chuỗi fn và W là một ma trận đường chéo xuất phát từ các hệ số của bộ lọc wavelet và cĩ dạng như hình 1.14.

Đây là dạng ma trận wavelet tương ứng với bộ lọc wavelet Daubechies 4-hệ số. Đối với các bộ lọc dài hơn, cấu trúc ma trận cũng hồn tồn tương tự. Cấu trúc {c0 c1 c2 c3 } được gọi là bộ lọc làm trơn bởi vì nĩ tính trọng số tổng trên

bốn mẫu trong vector fn. Cấu trúc {c3 -c2 c1 -c0 } được gọi là bộ lọc chi tiết bởi vì nĩ tính trọng số khác biệt trên bốn mẫu trong fn.

Từ cấu trúc của ma trận, cĩ thể thấy rõ là một vector cĩ chiều dài N, sau khi nhân với ma trận W, sẽ chia thành hai các vector xen kẽ nhau, mỗi vector cĩ chiều dài N/2. Những hàng lẻ cho biết “tổng” và những hàng chẳn cho biết “sự khác nhau” trong fn. Chính xác hơn, tích của W và fn là một vector cột cĩ dạng như sau: [ 1 ] N/2 1 N/2 1 1 1 1 1 0 1 0 d s d ... s d s

Các hệ số s1’s trong vector trên tương ứng với các kết quả tính tốn của bộ lọc làm trơn và các hệ số d1’s tương ứng với kết quả tính tốn của bộ lọc chi tiết. Theo ngơn ngữ của phân tích đa phân giải, các hệ số s1’s biễu diễn phép chiếu của fn vào khơng gian V0 và các hệ số d1’s biểu diễn phép chiếu fn vào khơng gian W0. Bây giờ, ma trận W tiếp tục được sử dụng để chiếu các hệ số s1’s vào các khơng gian con V-1 và W-1. Cuối cùng, ta được s0log N và d0log N biểu diễn hệ số wavelet ở mức thơ nhất. Tiến trình này kết thúc tùy thuộc vào số lượng các mẫu

c0 c1 c2 c3 c3 –c2 c1 -c0 c0 c1 c2 c3 c3 –c2 c1 -c0 . . . . . . . . . c0 c1 c2 c3 c3 –c2 c1 -c0 c2 c3 c0 c1 c1 -c0 c3 –c2 W =

Hàm gốc f cĩ thể được tái tạo chính xác bằng cách đảo ngược tiến trình nhân ma trận. Chúng ta bắt đầu từ mức thơ nhất và nhân vector hệ số đã biến đổi với ma trận W-1 và tái tạo chuổi s’s ngày càng dài. Ở mức thơ nhất, một s và một d kết hợp thành hai s ở độ phân giải mịn hơn. Ở mức phân giải mịn hơn này, hai s’s và d’s kết hợp thành bốn s’s và cứ thế tiếp tục. Các hệ số ci’s được chọn sao cho W là ma trận cĩ WT = W-1.

1.5.5 Liên hệ với hệ thống thị giác con người

Những thí nghiệm trên hệ thống thị giác con người HVS (human visual system) cho thấy độ nhạy của mắt người đối với một tác nhân kích thích phụ thuộc rất nhiều vào thành phần tần số của tác nhân kích thích. Những kết quả tương tự cũng đạt được trên những lồi động vật cĩ vú khác. Nhiều thí nghiệm khác cịn cho thấy một ảnh được cảm nhận bởi mắt được phân rã thành nhiều kênh thơng dải (bandpass channel) khi chúng chuyển động về phía chúng ta và truyền đến hệ thống thần kinh thị giác trên võ não. Các thành phần bandpass này tương ứng với những hướng và độ phân giải khác nhau. Trong khi biễu diễn Laplacian chỉ cung cấp một phân rã ở một độ phân giải thì biến đổi wavelet cho phép phân biệt các thành phần theo những hướng khác nhau. Ơû mỗi độ phân giải, cĩ ba kênh tương ứng với các hướng ngang, dọc và chéo. Điều này chưa đủ để giống như các giai đoạn xử lý thơng tin phức tạp của hệ thống thị giác con người, nhưng xấp xỉ như vậy rất hữu ích. Theo G.S Mallat thì mục tiêu của xử lý ảnh đa phân giải khơng phải là thiết kế một phép biến đổi bắt chước theo HVS. Thay vào đĩ, sự tương tự như HVS thúc đẩy việc xử dụng phân rã ảnh đa phân giải như là bước tiền xử lý trong các giải thuật xử lý ảnh phức tạp.

1.5.6 Ứng dụng

Phân rã wavelet được ứng dụng trong nén ảnh và video, khử nhiễu. Cĩ những ứng dụng khác mà wavelet đưa ra một giải pháp hợp lý hơn so với những kỹ thuật phân rã đa phân giải khác. Ví dụ như phân đoạn ảnh và phân tích cấu trúc ảnh, nhận dạng chữ ký viết tay, tái tạo ảnh trong y học.

1.6 Những đa phân giải khác

1.6.1 Biến đổi wavelet khơng giảm tốc độ lấy mẫu

Aûnh và ảnh đã dịch chuyển (translate) nĩi chung sẽ tạo ra những hệ số wavelet khác nhau. Như vậy, phép biến đổi wavelet là khơng bất biến đối với dịch ảnh ngõ vào. Đây là điều bất lợi trong các ứng dụng như làm nổi đường biên và nhận dạng ảnh nĩi chung. Việc thiếu đặc tính bất biến dịch chuyển (translation invariance) cĩ thể tránh được nếu ngõ ra của các băng lọc khơng bị giảm tốc độ lấy mẫu. Biến đổi wavelet khơng giảm tốc độ lấy mẫu tạo ra một tập hợp các ảnh cĩ cùng kích thước với ảnh ban đầu (N x M).

1.6.2 Wavelet packet

Mặc dù biến đổi wavelet thường cung cấp một biễu diễn ảnh thưa nhưng một số ảnh cĩ đặc tính tần số khơng phù hợp với cách biểu diễn wavelet. Trong trường hợp các ảnh dấu vân tay, các lằn vân tay là những đường khá hẹp. Một cách biễu diễn thưa hơn các ảnh như vậy cĩ thể thực hiện bằng cách chia các băng con thích hợp theo cách đệ quy. Cơ chế này được gọi là phân rã băng con (subband decomposition). Cách tiếp cận này đã được phát triển trong xử lý tín

đã phát triển một giải thuật khéo léo tìm ra phân rã băng con cho biễu diễn ảnh thơ nhất. Yù tưởng này được mở rộng để tìm phân rã tốt nhất cho nén ảnh.

CHƯƠNG 2:

PHÂN ĐOẠN ẢNH MÀU ĐA PHÂN GIẢI

2.1 Các tiêu chuẩn đánh giá kết quả của phân đoạn ảnh

Phân đoạn ảnh là một quá trình trong đĩ ảnh ban đầu được chia thành các vùng cĩ ý nghĩa. Nĩi chung, việc nhận ra các vùng như vậy là rất khĩ.

Sau đây là nhiều tiêu chuẩn dùng để đánh giá một kết quả phân đoạn là tốt hay khơng tốt :

1) Các vùng của ảnh đã phân đoạn phải đồng nhất về một số đặc điểm như màu hoặc cấu trúc.

2) Các vùng phải đơn giản và khơng chứa nhiều các lỗ (là các vùng nhỏ lốm đốm).

3) Các vùng lân cận phải cĩ các đặc điểm khác nhau đáng kể.

4) Các đường biên của mỗi vùng phải đơn giản, khơng rời rạc và phải chính xác về khơng gian.

Thỏa mãn tất cả các tính chất trên là rất khĩ bởi vì nếu thỏa mãn một cách nghiêm ngặt những vùng đồng nhất thì lại thường chứa nhiều lỗ và cĩ các đường biên rời rạc. Nếu cứ nhất định thỏa mãn tính chất các vùng lân cận phải khác nhau một cách đáng kể thì cĩ thể làm cho các vùng bị hội tụ và các biên bị mất. Vì vậy, phải luơn cĩ một sự ước lượng, thỏa hiệp để đạt được một kết quả phân đoạn tốt.

Bởi vì các ảnh màu chứa nhiều thơng tin hơn so với ảnh trắng đen nên việc sử dụng một cách hữu ích thơng tin màu là một trong những quan tâm chính trong phân đoạn ảnh màu.

2.2 Phân loại các cách phân đoạn ảnh màu

Các kỹ thuật phân đoạn ảnh màu cĩ thể phân loại thành ba nhĩm là phân đoạn dựa vào histogram, phân đoạn dựa vào vùng lân cận và phân đoạn theo tính chất vật lý.

2.2.1 Phân đoạn dựa vào histogram

Phân đoạn dựa vào histogram sử dụng phương pháp clustering (nhĩm lại, gĩp lại) để xác định rõ một partition (một vùng được phân chia) trong khơng gian đo đạc. Mỗi pixel được gán một nhãn. Một vùng ảnh (region) được xác định là một tập hợp kết nối các pixel cĩ cùng một nhãn.

Phương pháp phân đoạn dựa vào histogram thừa nhận các đối tượng đồng nhất trong ảnh biểu thị như là các cluster trong khơng gian đo đạc. Aûnh phân đoạn được thực hiện bằng cách ánh xạ cluster trở lại ảnh. Các cluster được ánh xạ ngược lại ảnh tạo nên các vùng ảnh. Đối với ảnh đen trắng, việc tính tốn histogram được thực hiện trực tiếp. Việc phân nhĩm trong khơng gian đo đạc cĩ thể được thực hiện bằng cách xác định các ngưỡng trong histogram và khẳng định các cluster là các khoảng giá trị ở giữa các ngưỡng.

Nhược điểm là cách tiếp cận chấp nhận thiếu tin tức về khơng gian cục bộ. Hậu quả là các vùng tạo ra cĩ biên khơng trơn và thường cĩ nhiều lỗ, gọi là hiệu ứng nhiễu “muối tiêu” (salt-and-pepper).

Các phương pháp thống kê được sử dụng khá phổ biến trong phân đoạn ảnh. Tuy nhiên, những phương pháp này yêu cầu phải cho biết trước những thơng tin tồn cục về nội dung và cấu trúc của ảnh.

Trường ngẫu nhiên Markov MRF (Markov Random Fields), do S. Geman và D. Geman [8] đưa ra năm 1984, cung cấp một phương tiện để xác định mối liên hệ giữa các lân cận và thể hiện sự phụ thuộc lẫn nhau giữa các pixel. Với việc sử dụng mối liên hệ giữa các lân cận, chúng ta khơng cần biết trước thơng tin tồn cục của ảnh. MRFs đã được ứng dụng trong khơi phục và phân đoạn ảnh.

MRF (Markov Random Fields) đưa ra nhiều đặc điểm rất cĩ lợi trong phân đoạn ảnh màu. Những yêu cầu như độ trơn và độ liên lục của các vùng màu trên tồn bộ ảnh cĩ thể được đáp ứng nghiêm ngặt nếu chỉ sử dụng sự phụ thuộc giữa

Phân đoạn theo tính chất vật lý

Nhận xét, giải pháp đề xuất