Từ đó thế hệ thứ hai của phép biến đổi Wavelet ra đời với mong muốn giữ lại được các thuộc tính “tốt đẹp” của thế hệ đầu tiên, đông thời nâng cao được hiệu suất, giảm độ phức tạp tính to
Trang 1LỜI CAM ĐOAN
Luận văn này được hoàn thành sau một thời gian nghiên cứu và tìm hiểu các nguồn tài liệu đã học, sách báo chuyên ngành cũng như các thông tin trên Internet mà theo tôi là hoàn toàn tin cậy Tôi xin cam đoan luận văn này không giống với bất kỳ công trình nghiên cứu hay luận văn nào trước đây mà tôi đã biết
Hà Nội, ngày 27 tháng 10 năm 2015
Người thực hiện
Doãn Hữu Phúc
Trang 2L ời nói đầu
Khoảng hơn mười năm trở lại đây, phần cứng máy tính và các thiết bị liên quan đã
có sự tiến bộ vượt bậc về tốc độ tính toán, dung lượng chứa, khả năng xử lý v.v và giá
cả đã giảm đến mức máy tính và các thiết bị liên quan đến xử lý ảnh đã không còn là thiết
bị chuyên dụng nữa Khái niệm ảnh số đã trở nên thông dụng với hầu hết mọi người trong
xã hội và việc thu nhận ảnh số bằng các thiết bị cá nhân hay chuyên dụng cùng với việc đưa vào máy tính xử lý đã trở nên đơn giản
Trong hoàn cảnh đó, xử lý ảnh là một lĩnh vực đang được quan tâm và đã trở thành môn học chuyên ngành của sinh viên ngành công nghệ thông tin - điện tử viễn thông trong nhiều trường đại học trên cả nước Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận
Xử lý ảnh bao gồm các vấn đề cơ bản như nắn chỉnh biến dạng , khử nhiễu , chỉnh
mức xám , trích chọn đặc điểm , nhận dạng , nén ảnh … Đã có nhiều thuật toán khác nhau được sử dụng trong các quá trình xử lý ảnh nói chung và mỗi thuật toán này đều có
những ưu điểm và nhược điểm riêng Nổi bật lên trong các phương pháp đó, phương pháp biến đổi Wavelet được biết đến như một công cụ mạnh và hiệu quả trong việc xử lý ảnh Tuy nhiên thế hệ đầu tiên của phép biến đổi Wavelet còn gặp phải một vài thiếu sot
do chính cấu trúc của nó Các hạn chế chính là các wavelet thế hệ đầu tiên hoạt động tốt cho các tín hiệu vô hạn hoặc định kỳ nhưng với một miền tín hiệu giới hạn thig điều này
là không rõ ràng, đồng thời độ phức tạp tính toán còn lớn, công suất tiêu thụ còn cao Từ
đó thế hệ thứ hai của phép biến đổi Wavelet ra đời với mong muốn giữ lại được các thuộc tính “tốt đẹp” của thế hệ đầu tiên, đông thời nâng cao được hiệu suất, giảm độ phức tạp tính toán cũng như nâng cao được tính đa dang trong việc xử lý các dạng tín hiệu Trong khuôn khổ đồ án này, em xin phép được giới thiệu những vấn đề cơ bản của phép biến
Trang 3đổi Wavelet thế hệ đầu tiên (wavelet transform) và đi sâu vào phương thức biến đổi Wavelet thế hệ thứ 2 ( The Second Generation Wavelets) và một ứng dụng của nó trong
việc xử lý ảnh bằng cách sử dụng biến đổi Wavelet phức cây kép (Dual Tree Complex Wavelet)
Trong quá trình thực hiện báo cáo không tránh khỏi nhiều thiếu sót, em mong
nhận được nhiều ý kiến đóng góp của thầy cô giáo, các bạn để báo cáo được hoàn thiện
và mang tính thực tế hơn
Qua lời mở đầu, em xin được gửi lời trân trọng cảm ơn PSG.TS Nguyễn Hữu Trung và TS Nguyễn Thuý Anh đã tận tình giúp đỡ, hướng dẫn và tạo điều kiện cho em hoàn thành tốt bản luận văn này
Trang 4M ỤC LỤC
Lời nói đầu 1
Chương 1: Lý thuyết Wavelet 7
1.1 L ịch sử hình thành lý thuyết Wavelet 7
1.2 Bi ến đổi Fourier và biến đổi Wavelet 10
1.2.1 Biến đổi Fourier 10
1.2.2 Biến đổi Fourier nhanh (STFT) 10
1.2.3 Biến đổi Wavelet 13
1.2.4 So sánh biến đổi Wavelet và biến đổi Fourier 14
1.2.4.1 Sự giống nhau 14
1.2.4.2 Sự khác nhau 14
1.3 Bi ến đổi Wavelet liên tục (CWT) 16
1.3.1 Cơ sở toán học 16
1.3.2 Tính chất của CWT 18
1.4 Biến đổi Wavelet rời rạc (Discrete wavelet transform) 20
1.4.1 Cơ sở toán học 21
1.4.2 Tính chất của DWT 22
1.5 Bi ến đổi Wavelet rời rạc và băng lọc 23
1.5.1 Phân tích đa phân giải (Multiresolution Analysis) 23
1.5.2 Phân tích đa phân giải sử dụng băng lọc 26
1.5.3 Biểu diễn ma trận DWT 30
Chương 2: The Second Generation Wavelets 35
2.1 Gi ới thiệu 35
2.2 Cây kép (Dual tree) và khung lifting 37
2.3 Thu ật toán 46
CHƯƠNG 3: MÔ PHỎNG, ĐÁNH GIÁ VÀ KẾT LUẬN 50
3.1 Gi ới thiệu 50
3.2 Bi ến dịch chuyển gần của DWT cây kép 51
3.3 Tính ch ọn hướng trong xử lý ảnh 57
3.4 Bi ểu diễn biên với DWT 2 chiều 58
3.5 Kh ử nhiễu ảnh 61
3.6 K ết luận 67
Trang 5Danh m ục hình
Hình 1.1: Cửa sổ Fourier hẹp, rộng và độ phân giải trên mặt phẳng tần số-thời gian
Hình 1.2: Độ phân giải trên mặt phẳng thời gian - tần số Trục hoành biểu diễn thời gian,
trục tung biểu diễn tần số
Hình 1.3: Biểu diễn CWT theo biểu thức (1.6)
Hình 1.4: Các hàm Fourier cơ sở, ô ngói thời gian - tần số, và sự hội tụ trên mặt phẳng
diễn toàn bộ không gian V j biểu diễn một không gian con, Wj biểu diễn chi tiết
Hình 1.7: Thuật toán hình chóp hay thuật toán mã hoá băng con
(a) Quá trình phân tích (b) Quá trình tổng hợp
Hình 1.8: Phân tích wavelet sử dụng ký hiệu toán tử
Hình 1.9: Băng lọc hai kênh
Hình 2.1(a): Biến đổi wavelet cây thực
Hình 2.1(b): Biến đổi wavelet cây ảo
Hình 2.2: Mô tả các bước lifting
Hình 2.3: Biến đổi wavelet nhanh bằng cách sử dụng cấu trúc lifting
Hình 2.4: Cấu trúc lifting (a) cây thực (b) cây ảo: đầu tiên là phương pháp lọc băng sóng con cổ điển sau đó dịch chuyển băng con thông thấp với sự giúp đỡ của băng con thông cao
Trang 6Hình 2.5: Cấu trúc lifting kép (a) cây thực (b) cây wavelet ảo Đầu tiên lọc băng sóng con cổ điển và sau đó dịch băng sóng con thông cao với sự giúp đỡ của băng sóng con thông thấp
Hình 2.6a: Biến đổi wavelet xuôi sử dụng cấu trúc lifting
hình 2.6b: Biến đổi wavelet ngược sử dụng cấu trúc lifting
Hình 3.1: So sánh thay đổi trong tín hiệu DWT và DWT cây kép
Hình 3.2: Tín hiệu ECG
Hình 3.3: Tín hiệu ban đầu và các hệ số wavelet bậc 2 và 3
Hình 3.4: Tín hiệu ban đầu và các hệ số cây kép bậc 2 và 3
Hình 3.5: Sự thay đổi năng lượng tại hệ số bậc 3 và 4 với CS DWT
Hình 3.6: Sự thay đổi năng lượng tại hệ số bậc 3 và 4 với CDT DWT
Hình 3.7: Các wavelet phân giải 2-D DWT lấy mẫu đánh giá
Hình 3.8: Các wavelet 2-D cây kép định hướng phức
Hình 3.9: Ảnh biên thẳng ban đầu
Hình 3.10: Biên khôi phục sử dụng 2-D CODT DWT và DWT
Hình 3.11: Ảnh biên hypebol ban đầu
Hình 3.12: Kết quả trên các đường cong kỳ dị
Hình 3.18: RMSE và PSNR của ảnh rubic
Hình 3.19: Kết quả khử nhiễu với 3 ảnh thực nghiệm
Trang 7Chương 1: Lý thuyết Wavelet
Wavelet là công c ụ toán học để phân chia dữ liệu thành những thành phần tần số khác nhau, sau đó nghiên cứu mỗi thành phần đó với độ phân giải tương ứng với thang tỷ
l ệ của thành phần phổ đó
Ý tưởng cơ bản của Wavelet là phân tích theo tỷ lệ Các hàm Wavelet thoả mãn các yêu cầu về mặt toán học được sử dụng để biểu diễn dữ liệu hay các hàm khác.Ý tưởng về phép xấp xỉ sử dụng các hàm xếp chồng đã tồn tại từ đầu thế kỉ 18 khi Joseph Fourier phát hiện ra có thể xếp chồng các hàm sin và cosin với nhau để biểu diễn một hàm khác Tuy nhiên, trong phân tích Wavelet, tỷ lệ được sử dụng để phân tích dữ liệu theo một cách đặc biệt Các thuật toán Wavelet xử lý dữ liệu theo các tỷ lệ khác nhau
hoặc các độ phân giải khác nhau Khi quan sát tín hiệu với một cửa sổ lớn, chúng ta sẽ
nhận được các đặc điểm chung Tương tự, nếu chúng ta quan sát dữ liệu với một cửa sổ
nhỏ hơn, chúng ta sẽ nhận ra những đặc điểm chi tiết hơn
Quy trình phân tích wavelet là chọn một hàm Wavelet nguyên mẫu, được gọi là
Wavelet phân tích (analyzing wavelet) hay Wavelet m ẹ (mother wavelet) Phân tích thời gian được thực hiện với dạng (version) co lại, tần số cao của Wavelet mẹ, trong khi phân
tích tần số được thực hiện với dạng giãn ra, tần số thấp của cùng Wavelet mẹ Vì tín hiệu nguyên bản hay hàm có thể được biểu diễn dưới dạng một khai triển Wavelet (sử dụng các hệ số trong tổ hợp tuyến tính của các hàm Wavelet), các tính toán dữ liệu có thể được
thực hiện sử dụng các hệ số Wavelet tương ứng Và nếu như chọn được Wavelet phù hợp
với dữ liệu, hay bỏ bớt các hệ số dưới một ngưỡng nào đó, chúng ta thu được dữ liệu
được biểu diễn rời rạc Mã hoá rời rạc (sparse coding) làm cho Wavelet trở thành một
công cụ tuyệt vời trong lĩnh vực nén dữ liệu
Trang 8Các lĩnh vực ứng dụng khác sử dụng Wavelet bao gồm thiên văn học, âm học, kỹ thuật hạt nhân, mã hoá băng con, xử lý tín hiệu và xử lý ảnh, bệnh học thần kinh, âm
nhạc, ảnh cộng hưởng từ (magnetic resonance imaging), quang học, fractals, turbulence,
dự báo động đất, radar, và các ứng dụng thuần tuý toán học như giải phương trình vi
phân từng phần (partial differential equation)
Hầu hết các nghiên cứu về Wavelet được thực hiện vào những năm 1930, tuy nhiên ở thời điểm đó, các nỗ lực riêng biệt đã không đưa ra được một lý thuyết chặt chẽ,
0
1( ) ,2
giải tích tỷ lệ (scale analysis) Ý tưởng cơ bản là xây dựng một hàm gốc, dịch và thay đổi
tỷ lệ hàm này, áp dụng chúng với cùng tín hiệu để thu được một xấp xỉ mới của tín hiệu
đó Người ta nhận ra rằng, dạng phân tích tỷ lệ ít nhạy cảm với nhiễu vì phân tích tỷ lệ tính sự biến đổi trung bình của tín hiệu ở các tỷ lệ khác nhau Khái niệm Wavelet xuất
hiện đầu tiên trong phụ lục của lý thuyết của A Haar (1909) Wavelet Haar triệt tiêu bên ngoài một khoảng hữu hạn Và Wavelet Haar không khả vi liên tục, điều này làm hạn chế các ứng dụng của Wavelet Haar
Trang 9Trong thập kỉ 1930, một vài nhóm các nhà toán học đã độc lập nghiên cứu sự biểu
diễn hàm sử dụng các hàm cơ sở tỷ lệ thay đổi Bằng cách sử dụng hàm cơ sở tỷ lệ thay đổi gọi là hàm gốc Haar, Paul Levy, một nhà vật lý đã nghiên cứu chuyển động Brownian, một dạng tín hiệu ngẫu nhiên Paul Levy nhận thấy hàm gốc Haar tốt hơn các hàm cơ sở Fourier khi nghiên cứu các chi tiết nhỏ phức tạp trong chuyển động Brownian
Và một nghiên cứu khác trong những năm 1930 do Littlewood, Paley, và Stein thực hiện yêu cầu tính toán năng lượng của hàm f (x):
Từ năm 1960 đến 1980, các nhà toàn học Guido Weiss và Ronald R.Coifman đã nghiên cứu các phần tử đơn giản nhất của không gian hàm, gọi là atom (nguyên tử), với
mục đích tìm ra các nguyên tử cho hàm chung và tìm ra quy tắc tập hợp “assembly rules”
cho phép tái xây dựng các yếu tố của không gian hàm sử dụng các atoms Năm 1980,
Grossman và Morlet, một nhà vật lý và một kỹ sư, đã định nghĩa chung Wavelets trong lĩnh vực vật lý lượng tử Hai nhà nghiên cứu này đã đưa ra một cách quan niệm Wavelet
dựa trên cơ sở vật lý
Năm 1985, Stephane Mallat đã tạo ra một bước nhảy vọt trong nghiên cứu Wavelet với các công trình nghiên cứu trong lĩnh vực xử lý tín hiệu số Stephane Mallat
đã khám phá ra mối liên hệ giữa các bộ lọc (quadrature mirror filters), các thuật toán hình chóp (pyramid algorithm), và các cơ sở Wavelet trực chuẩn Dựa trên những kết quả này, Y.Meyer đã xây dựng Wavelet Y.Meyer Khác với Wavelet Haar, Wavelet Meyer là
khả vi liên tục Sau đó một vài năm, Ingrid Daubechies đã ứng dụng các nghiên cứu của Mallat để xây dựng một tập hợp các hàm cơ sở trực chuẩn Wavelet, là cơ sở cho các ứng
dụng Wavelet ngày nay
Trang 101.2 Bi ến đổi Fourier và biến đổi Wavelet
1.2.1 Bi ến đổi Fourier
Thế kỉ 19, nhà toán học người Pháp J.Fourier đã chứng minh rằng một hàm tuần hoàn bất kỳ có thể biễu diễn như là một tổng xác định của các hàm mũ phức Nhiều năm sau, Fourier đã khám phá tính chất đặc biệt của các hàm, đầu tiên ý tưởng của ông đã được tổng quát hoá với các hàm không tuần hoàn, và sau đó cho các tín hiệu tuần hoàn và không tuần hoàn rời rạc theo thời gian Sau đó tổng kết này trở thành một công cụ hoàn toàn phù hợp cho các tính toán máy tính Năm 1965, một thuật toán mới được gọi là biến
đổi Fourier nhanh FFT (Fast Fourier Transform) được phát triển và biến đổi FT (Fourier
Transform) trở thành một công cụ phổ biến
Thông tin được chia bởi khoảng tương ứng với toàn bộ trục thời gian vì tích phân
từ -∝ tới +∝ Do đó biến đổi Fourier không phù hợp với tín hiệu có tần số thay đổi theo
thời gian, ví dụ tín hiệu không dừng (non-stationary) Điều đó có nghĩa là biến đổi
Fourier chỉ có thể cho biết có hay không sự tồn tại của các thành phần tần số nào đó, tuy nhiên thông tin này độc lập với thời điểm xuất hiện thành phần phổ đó
1.2.2 Bi ến đổi Fourier nhanh (STFT)
Biến đổi Fourier nhanh STFT (Short Time Fourier Transform) là biểu diễn tần số -
thời gian tuyến tính Trong biến đổi STFT, tín hiệu được chia thành các đoạn đủ nhỏ, do
vậy tín hiệu trên từng đoạn được phân chia có thể coi là dừng (stationary) Với mục đích
này, hàm cửa sổ được lựa chọn Độ rộng của cửa sổ phải bằng với đoạn tín hiệu mà giả thiết về sự dừng của tín hiệu là phù hợp
Trang 11Một đặc điểm quan trọng của biến đổi STFT là độ rộng của cửa sổ được sử dụng
Cửa sổ càng hẹp thì độ phân giải thời gian càng tốt và sự thừa nhận tính dừng của tín hiệu càng hợp lý, nhưng độ phân giải tần số kém hơn và ngược lại
Hình 1.1: Cửa sổ Fourier hẹp, rộng và độ phân giải trên mặt phẳng tần số-thời gian
Vấn đề với biến đổi STFT là sự chính xác của độ phân giải thời gian và tần số bị
giới hạn bởi nguyên lý bất định Heisenberg Các phương trình cơ bản không thể đưa ra
biểu diễn thời gian-tần số chính xác của tín hiệu, ví dụ không thể biết được các thành
phần phổ tồn tại ở khoảng thời gian nào, và không thể biết chắc chắn khoảng thời nào trong đó dải tần số chắc chắn tồn tại
Do vậy, vấn đề là chọn hàm cửa sổ và sử dụng cửa sổ này cho toàn bộ phân tích, tuy nhiên việc lựa chọn hàm cửa sổ phụ thuộc ứng dụng Nếu như các thành phần tần số tách biệt với nhau trong tín hiệu nguyên bản, thì chúng ta có thể hy sinh độ phân giải tần
số và do vậy có độ phân giải thời gian tốt Tuy nhiên, trong trường hợp các thành phần
phổ không tách biệt với nhau thì việc lựa chọn cửa sổ phù hợp là khó khăn
Trang 12Mặc dù vấn đề độ phân giải thời gian và tần số là kết quả của hiện tượng vật lý (nguyên lý bất định Heisenberg) và luôn tồn tại dù sử dụng bất kỳ biến đổi nào, tuy nhiên người ta có thể khắc phục vấn đề này khi phân tích tín hiệu bất kỳ nhờ sử dụng phép tính
gần đúng luân phiên được gọi là biến đổi Wavelet (WT_Wavelet Transform) Biến đổi
Wavelet phân tích tín hiệu thành các tần số khác nhau với những độ phân giải khác nhau Trong biến đổi Wavelet mỗi thành phần phổ không được phân tích ngang bằng như trong trường hợp biến đổi STFT
Hình 1.2: Độ phân giải trên mặt phẳng thời gian - tần số Trục hoành biểu diễn thời gian, trục
tung biểu diễn tần số
Biến đổi WT được xây dựng để đưa ra độ phân giải thời gian tốt và độ phân giải
tần số kém hơn ở tần số cao; độ phân giải tần số tốt và độ phân giải thời gian kém hơn ở
tần số thấp Phép tính gần đúng này có ý nghĩa đặc biệt khi tín hiệu gốc có các thành
phần tần số cao với khoảng thời gian tồn tại ngắn và các thành phần tần số thấp với khoảng thời gian tồn tại dài, đó là trường hợp của hầu hết các tín hiệu y sinh: tín hiệu
điện não đồ EEG (electroencephalogram), điện cơ đồ EMG (electromyogram), và điện tâm đồ ECG (electrocardiogram)
Trang 131.2.3 Bi ến đổi Wavelet
Biến đổi Wavelet liên tục (CWT) được định nghĩa (Daubechies92):
* ,
là hàm cửa sổ còn được gọi là Wavelet mẹ (mother wavelet), a là tỷ lệ và b là khoảng
dịch, ψ*(t) là liên hợp phức của hàm Wavelet ψ(t) Thuật ngữ Wavelet nghĩa là sóng nhỏ Hàm Wavelet gốc là nguyên mẫu đầu tiên để tạo nên các hàm cửa sổ
Thuật ngữ dịch (translation) liên quan với vị trí của cửa sổ, như là cửa sổ được
dịch chuyển trên tín hiệu Thuật ngữ này rõ ràng tương ứng với thông tin thời gian trong
miền khai triển (transform domain) Tuy nhiên, chúng ta không có tham số tần số như
trong biến đổi STFT Thay thế cho tham số tần số, chúng ta có khái niệm tỷ lệ, là phép toán mở rộng hoặc nén tín hiệu Các tỷ lệ nhỏ tương ứng với mở rộng hay giãn các tín
hiệu và các tỷ lệ lớn tương ứng để nén tín hiệu Việc lấy tỷ lệ Wavelet mẹ cho phép so sánh và rút ra đặc điểm chính xác của tín hiệu Các Wavelet có tỷ lệ bé có khả năng trích được phần biến thiên nhanh, có tần số cao (phần tinh), còn khi tỷ lệ lớn trích được phần
biến thiên chậm, tần số thấp (phần thô) của tín hiệu
Thuật toán CWT có thể được mô tả như sau – xem hình 1.3:
Chọn Wavelet và so sánh với phần đầu của tín hiệu nguyên bản
• Tính hệ số C(a,b), thể hiện mức độ tương quan giữa wavelet và phần của
tín hiệu Hệ số C càng cao thì sự tương tự là lớn Chú ý kết quả sẽ phụ thuộc vào hình dạng của Wavelet đã chọn
• Dịch Wavelet về phía phải và lặp lại bước 1 và 2 cho đến khi bao phủ toàn
bộ tín hiệu
• Lấy tỷ lệ Wavelet và lặp lại từ bước 1 đến bước 3
Trang 14Hình 1.3: Biểu diễn CWT theo biểu thức (1.6)
1.2.4 So sánh bi ến đổi Wavelet và biến đổi Fourier
1.2.4.1 Sự giống nhau
Biến đổi Fourier nhanh (FFT) và biến đổi Wavelet rời rạc (DWT) đều là phép toán tuyến tính sinh ra cấu trúc dữ liệu bao gồm các đoạn log2n độ dài thay đổi, điền đầy và
biến đổi chúng thành các vectơ dữ liệu với độ dài 2n
Đặc điểm toán học của các ma trận liên quan trong các biến đổi FFT và DWT là tương tự nhau Ma trận biến đổi ngược của cả FFT và DWT là ma trận chuyển vị của ma
trận nguyên gốc Và kết quả là, cả hai biến đổi có thể xem như là một phép quay không gian hàm tới một miền khác Với FFT, miền mới này bao gồm các hàm cơ sở đó là sin và cosin Với biến đổi wavelet, miền mới này bao gồm các hàm cơ sở phức tạp hơn được gọi
là các Wavelet, Wavelet gốc (mother wavelet) hay Wavelet phân tích (analyzing wavelet)
Cả hai biến đổi còn có những điểm tương đồng khác, các hàm cơ sở được phân bố theo tần số, các công cụ toán học như phổ và biểu đồ tỷ lệ có thể được sử dụng để phân
biệt các tần số và tính phân bố công suất
Trang 15số, làm cho các hàm và các phép toán sử dụng Wavelet được rải rác ra “sparse” khi biến
đổi sang miền Wavelet Sự rải rác này, dẫn đến một số ứng dụng hữu ích như là nén dữ
liệu, tách các điểm đặc trưng của ảnh, và khử nhiễu
Một phương pháp để xem xét sự khác biệt về độ phân giải thời gian-tần số giữa
biến đổi Fourier và biến đổi Wavelet là xem sự hội tụ hàm cơ sở trên mặt phẳng thời gian-tần số Vì một cửa sổ duy nhất được sử dụng với mọi tần số trong FT, độ phân giải
của phân tích là giống nhau ở mọi khu vực trên mặt phẳng thời gian-tần số
Hình 1.4: Các hàm Fourier cơ sở, ô ngói thời gian - tần số, và sự hội tụ trên mặt phẳng thời gian -
t ần số
Một ưu điểm của biến đổi Wavelet là các cửa sổ có thể thay đổi Để tách các điểm gián đoạn của tín hiệu, người ta có các hàm cơ sở rất ngắn và cùng thời điểm đó để có được các phân tích tần số chi tiết người ta cần các hàm cơ sở rất dài
Trang 16Hình 1.5:Các hàm cơ sở Wavelet Daubechies, ô ngói thời gian - tần số, và sự hội tụ trên mặt
phẳng thời gian - tần số
Một điểm cần ghi nhớ rằng các biến đổi Wavelet không chỉ gồm một tập hợp đơn
của các hàm cơ sở như biến đổi Fourier với hàm sin và cosin Thay vào đó, các biến đổi Wavelet có một tập hợp vô hạn của các hàm cơ sở khả năng Do vậy, phân tích Wavelet đưa ra một phương pháp phân tích trực tiếp, mang lại kết quả tốt hơn so với các phương pháp thời gian- tần số truyền thống như biến đổi Fourier
1.3.1 Cơ sở toán học
Biến đổi Wavelet liên tục (CWT) được định nghĩa:
* ,
W( , )a b f t( ) a b( )t dt
(1.8)
với a là hệ số tỷ lệ (scaling) và b là hệ số dịch (translation), với ψ*a,b(t) là liên hợp
phức của hàm wavelet ψa,b(t) Các phiên bản khác nhau của hàm Wavelet a b, ( )t có thể thu được từ Wavelet cơ bản:
Trang 171 2 , ( )
Hàm Wavelet a b, ( )t có dạng bất biến trong không gian L2(R)
của các hàm tích phân bình phương vì có hệ số chuẩn hoá a12
Tín hiệu có thể được khôi phục nhờ biến đổi Wavelet ngược:
1( ) ( , ) a b( )dadb
Trang 18Một chuỗi Wavelet có được nhờ gián đoạn hoá CWT Sự gián đoạn hoá CWT được thực hiện nhờ lấy mẫu trên mặt phẳng thời gian-tỷ lệ Tốc độ lấy mẫu có thể thay đổi theo sự thay đổi tỷ lệ với điều kiện không vi phạm tiêu chuẩn Nyquist Tiêu chuẩn Nyquist: tốc độ lấy mẫu tối thiểu cho phép tái xây dựng lại tín hiệu nguyên bản là 2f, với
f là tần số lớn nhất của tín hiệu Do vậy, khi tỷ lệ cao lên (tần số thấp đi) tốc độ lấy mẫu
có thể giảm như vậy số lượng phép tính giảm
và do vậy phải có dạng dao động Nói cách khác, ( )t phải là dạng sóng
Người ta sử dụng các điều kiện thêm (additional condition) của các hàm Wavelet
để làm cho biến đổi Wavelet giảm nhanh chóng cùng với sự giảm tỷ lệ a Đó là điều kiện
điều chỉnh (regularity condition) và điều kiện này yêu cầu hàm Wavelet phải trơn và tập
Trang 19trung trong cả miền thời thời gian và tần số Regularity là một khái niệm phức tạp và
chúng ta sẽ giải thích điều kiện này sử dụng khái niệm momen triệt tiêu (vanishing moment)
Nếu khai triển biến đổi Wavelet (1.8) thành chuỗi Taylor ở t = 0 cho tới bậc n (dễ dàng rút b = 0), ta có:
p p
Ở đây ƒp có nghĩa là đạo hàm bậc p của ƒ và O(n + 1) nghĩa là phần dư của biểu
thức Bây giờ nếu đặt các momen của Wavelet bằng Mp:
p p
M t t dt (1.18) thì có thể viết lại (1.16) thành khai triển hữu hạn:
Từ điều kiện admissibility có momen M0 = 0 do vậy số hạng đầu tiên bên vế phải
là bằng 0 Nếu chúng ta tìm được cách làm cho các momen khác và momen Mn cũng
bằng 0, thì các hệ số biến đổi Wavelet W(a,b) sẽ phân rã nhanh như an + 2
cho tín hiệu trơn
ƒ(t) Đó là lý thuyết về momen triệt tiêu hay bậc xấp xỉ Nếu Wavelet có momen triệt tiêu
N, thì bậc xấp xỉ cho biến đổi Wavelet cũng là N Trên thực tế, nghiên cứu thực nghiệm đưa ra nhận định rằng số momen yêu cầu phụ thuộc lớn vào ứng dụng
Trang 20Tính chất tỷ lệ làm cho biến đổi wavelet thực sự phù hợp để phân tích các cấu trúc
dạng bậc Nó như là một kính hiển vi toán học với các đặc tính không phụ thuộc vào sự phóng đại
Tính b ảo toàn năng lượng
Biến đổi wavelet liên tục cũng có tính chất bảo toàn năng lượng giống như công
thức Parseval của biến đổi Fourier
Định lý: Nếu hàm f t( )L R2( )và có biến đổi Wavelet liên tục là Wf(a,b) thì:
Biến đổi Wavelet liên tục có tính định vị tốt, đặc biệt là với những thay đổi đột
ngột trong miền thời gian ở tần số cao (hay tỷ lệ thấp), đây là một ưu điểm so với các phép biến đổi truyền thống
1.4 Biến đổi Wavelet rời rạc (Discrete wavelet transform)
Vì những hàm Wavelet a b, được định nghĩa đối với mọi điểm trong không gian (a, b) nên rõ ràng việc áp dụng những cơ sở Wavelet a b, rất dư thừa Do vậy, để
giảm bớt sự dư thừa đó biến đổi Wavelet rời rạc (DWT) được giới thiệu Biến đổi DWT
Trang 21dựa trên cơ sở mã hoá băng con, có thể được thực hiện dễ dàng, giảm thời gian tính toán
và tài nguyên yêu cầu
Cơ sở của DWT được xây dựng từ năm 1976, khi các kỹ thuật phân tích tín hiệu
rời rạc được phát triển Các nghiên cứu về DWT cũng được thực hiện trong lĩnh vực mã hóa tín hiệu tiếng nói còn được gọi là mã hoá băng con (sub-band coding) Năm 1983,
các kỹ thuật tương tự kỹ thuật mã hoá băng con được phát triển được gọi là mã hoá hình
chóp (pyramidal coding) và dẫn đến sơ đồ phân tích đa phân giải (MRA)
Trong biến đổi Wavelet liên tục, tín hiệu được phân tích sử dụng một tập hợp hàm
cơ sở liên quan với nhau bởi hệ số tỷ lệ (a) và hệ số tịnh tiến (b) Trong DWT, biểu diễn
thời gian-tỷ lệ của tín hiệu số thu được nhờ sử dụng các kỹ thuật lọc số Tín hiệu được phân tích qua các bộ lọc với tần số cắt khác nhau ở các tỷ lệ khác nhau
22
Trang 22Biến đổi ngược được xác định như sau:
Đây là tổng vô hạn theo cả chỉ số thời gian k và chỉ số tỷ lệ j Tuy nhiên tổng này
có thể được tính hữu hạn với sai số rất nhỏ trong trường hợp các hàm Wavelet với toàn
bộ năng lượng tập trung trong một khoảng nào đó, như vậy phép tổng hữu hạn (1.28) theo k là đúng với một số xấp xỉ
Để tìm hiểu tại sao phép tổng (1.28) theo j là hữu hạn với một số xấp xỉ, phần tiếp theo của chương sẽ đưa ra khái niệm đa phân giải MRA Khái niệm MRA được phát triển
bởi Mallat và Meyer, đây là nền tảng lý thuyết để xây dựng các Wavelet sau này
1.4.2 Tính ch ất của DWT
Wavelet được xác định bởi một số xác định các hệ số khác không M Số hệ số này
đại diện cho số momen triệt tiêu (vanishing moments) được xác định như sau: Nếu x
là khả vi M lần và phân rã đủ nhanh, thì M-1 mômen Wavelet đầu tiên triệt tiêu, nghĩa là:
Trang 23Như vậy, có thể kết luận rằng mọi tính chất của Wavelet được quyết định bởi dãy
h(k) và để biểu diễn sự phân tích và khôi phục Wavelet chúng ta chỉ cần các hệ số của bộ
lọc h(k)
1.5.1 Phân tích đa phân giải (Multiresolution Analysis)
Định nghĩa: Không gian L2
= L2(R) là không gian của các tín hiệu tương tự Phân tích đa phân giải MRA của L2
là một họ các không gian con 2
Trang 24• f t V j f 2t V j1 ,jZ (1.38c)
• f t V0 f t k V k0 , Z (1.38d)
• tk k Z xác định một cơ sở trực chuẩn cho V0 (1.38e) Như vậy họ t k,kZ tạo thành một cơ sở trực giao cho không gian tham chiếu V0 Các không gian V j lồng vào nhau Không gian L2(R) đóng kín tập hợp mọi V j
Hình 1.6: Không gian và các không gian con trong đa phân giải Không gian L 2 biểu diễn toàn
b ộ không gian V j bi ểu diễn một không gian con, W j bi ểu diễn chi tiết
Trang 25Họ j k, :kZ tạo thành một cơ sở trực chuẩn cho Wn
Theo định nghĩa đa phân giải, ta có phương trình tỷ lệ:
k
(1.41)
Đặt không gian Wjlà phần bù của V j với V j1, V j1V j Wj Các hàm j k, là một
cơ sở trực chuẩn của Wj
Với các tín hiệu thực tế có dải thông giới hạn, có một tỷ số j = J cho các hệ số wavelet w j k, là đủ nhỏ Do đó có thể viết hàm f J V J thành f J t k s J k, J k, t Tương tự như vậy hàm Wj có thể được viết thành dạng d J t k w J k, J k, t
với j0là độ phân giải nhỏ nhất được chọn trong phân tích
Vì W0V1, và 2tk là một cơ sở trực chuẩn của V1, có thể được viết thành:
k
(1.44) được gọi là phương trình Wavelet
Trang 26Các hệ số h k và g k từ các phương trình tỷ lệ và phương trình Wavelet tương ứng với các bộ lọc thông thấp (xấp xỉ) và thông cao (chi tiết) Những bộ lọc này được sử
dụng trong thuật toán Mallat
1.5.2 Phân tích đa phân giải sử dụng băng lọc
Trong lĩnh vực xử lý tín hiệu các bộ lọc được sử dụng phổ biến Wavelet có thể được thực hiện bởi các bộ lọc lặp đi lặp lại với tỷ lệ thay đổi Độ phân giải của tín hiệu là tiêu chuẩn để đánh giá lượng thông tin chi tiết trong tín hiệu Độ phân giải của tín hiệu
được xác định bởi các quá trình lọc, và tỷ lệ được xác định bởi sự phân chia (upsampling)
và nội suy (downsampling) còn gọi là quá trình lấy mẫu con (subsampling)
Biến đổi Wavelet rời rạc được tính toán bởi quá trình lọc thông thấp và thông cao liên tiếp của tín hiệu rời rạc theo thời gian, được gọi là thuật toán Mallat hay sự phân tích
cây Mallat (Mallat-tree decomposition) Ý nghĩa quan trọng của thuật toán Mallat là thuật toán này đã kết nối sự đa phân giải liên tục theo thời gian với các bộ lọc rời rạc
Thu ật toán DWT:
Kh ởi đầu: Chiếu tín hiệu lên V J, với J được xác định bởi tần số lấy mẫu Trong
thực tế, thực hiện thay thế các hệ số tỷ lệ với các giá trị mẫu
1 Chia các hệ số xấp xỉ thành hai phần xấp xỉ và chi tiết nhờ sử dụng h k và g k
2 Thay đổi tỷ lệ các hệ số xấp xỉ
3 Ti ếp tục chia phần xấp xỉ thành hai phần xấp xỉ và chi tiết như bước (1)
4 L ặp lại bước (2) và (3) cho đến khi đạt được kết quả thoả mãn
Trang 27Hình 1.7: Thuật toán hình chóp hay thuật toán mã hoá băng con
(a) Quá trình phân tích (b) Quá trình tổng hợp Trong hình vẽ 1.9a, tín hiệu được được biểu thị bởi dãy x[n], với n là số nguyên
Bộ lọc thông cao được biểu thị bởi G, trong khi bộ lọc thông thấp được biểu thị bởi H Ở
mỗi mức, bộ lọc thông cao G đưa ra thông tin chi tiết d[n], trong khi bộ lọc thông thấp H
kết hợp với hàm tỷ lệ đưa ra các xấp xỉ thô a[n]
Ở mỗi mức phân tích, các bộ lọc nửa dải (half band filter) đưa ra các tín hiệu kéo
dài duy nhất nửa băng tần Các bộ lọc này làm tăng độ phân giải tần số lên gấp đôi vì tính
bất định của tần số được giảm đi một nửa Theo luật Nyquist nếu như tín hiệu nguyên bản
có tần số góc cao nhất ω rad/s yêu cầu tần số góc lấy mẫu là 2ω rad/s, vậy khi tần số góc
Trang 28cao nhất là ω/2 rad/s thì tần số góc lấy mẫu sẽ là ω rad/s, do vậy loại bỏ một nửa số mẫu
cần lấy mà không gây ra sự mất mát thông tin Việc lấy mẫu con với hệ số chia 2 làm
giảm một nửa độ phân giải thời gian vì toàn bộ tín hiệu bây giờ được biểu diễn trên chỉ
một nửa số lượng mẫu
Như vậy, độ phân giải thời gian đạt được tốt ở các tần số cao, trong khi độ phân
giải tần số lại trở nên tốt hơn ở các tần số thấp Quá trình lọc và phân chia là liên tiếp nhau cho đến khi đạt được mức yêu cầu Số lượng tối đa các mức phụ thuộc vào độ dài
của tín hiệu Biến đổi Wavelet rời rạc của tín hiệu thu được nhờ sự xâu chuỗi
(concatenating) các hệ số a[n] và d[n], bắt đầu từ mức cuối cùng của quá trình phân tích
Hình 1.9b biểu diễn quá trình khôi phục tín hiệu nguyên bản từ các hệ số Wavelet
Về cơ bản, quá trình khôi phục là sự đảo ngược của của quá trình phân tích Các hệ số
xấp xỉ và các hệ số chi tiết ở mọi mức được nội suy bởi hệ số 2, qua các bộ lọc tổng hợp thông thấp và thông cao và sau đó được gộp vào với nhau Quá trình tiếp tục cho đến đạt được cùng số mức thu được trong quá trình phân tích tín hiệu nguyên bản
Phương pháp tốt nhất để mô tả quy trình trên cũng như đưa ra một quy trình hiệu
quả để xác định các hệ số wavelet là biểu diễn phép toán của các bộ lọc
Trở lại hai biểu thức (1.41) và (1.44) trong phần trước, dãy l2
h k ,kZvà
g k ,kZ là các bộ lọc gương vuông góc (quadrature mirror filters) trong xử lý tín
hiệu Mỗi liên hệ giữa g và h:
1n 1
g k h n (1.45) Dãy h(k) được biết đến như là bộ lọc thông thấp trong khi dãy g(k) là bộ lọc thông cao Các bộ lọc thuộc họ các bộ lọc đáp ứng xung hữu hạn (FIR)
Các tính chất sau có thể được chứng minh sử dụng biến đổi Fourier và tính trực giao:
Trang 29 2, 0
Với dãy f f n đại diện cho tín hiệu rời rạc cần được phân tích và các toán tử H
và G được xác định bởi các biểu thức:
Các biểu thức (1.47), (1.48) biễu diễn phép lọc tín hiệu qua các bộ lọc số h(k), g(k)
tương ứng với các phép toán tích chập với đáp ứng xung của các bộ lọc Hệ số 2k đại
diện cho phép phân chia (downsampling) Các toán tử H và G tương ứng với bước trong
Trang 30Quy trình khôi phục tín hiệu cũng tương tự như phân tích Tín hiệu ở mọi mức
được nội suy (upsampled) với hệ số 2, qua các bộ lọc tổng hợp ký hiệu G H, (thông cao
và thông thấp tương ứng), sau đó được cộng với nhau Các toán tử G H, được xác định như sau:
n k
Hf h n k f n (1.51)
n k
cơ bản của thuật toán hình chóp
Hình 1.9: Băng lọc hai kênh
Trang 31Cấu trúc trên bao gồm bốn bộ lọc, có thể chia băng lọc hai kênh thành hai băng lọc
cơ bản là băng lọc phân tích và băng lọc tổng hợp Băng lọc phân tích có bộ lọc thông
thấp H(z) và bộ lọc thông cao G( z) Đầu ra y gvà y h từ các bộ lọc này được phân chia và
giữ lại các thành phần chẵn
Phép toán thứ nhất là tích chập Sự chuyển đổi tuyến tính được biểu diễn bởi ma
trận Toeplitz (ma trận đường chéo không đổi) Các hệ số h(k) xuất hiện trên đường chéo
phụ Vectơ đầu vào x là rất dài trong thực tế và vô hạn trong lý thuyết, như vậy ma trận
Khi kết hợp hai bộ lọc phân tích H và G nhờ chèn vào các hàng của ma trận chúng
ta có ma trận Toeplitz biểu diễn băng lọc phân tích:
h g
Trang 32h g
Đặc điểm quan trọng của các ma trận này là chúng đều được nhóm lại, hay các bộ
lọc này đều là các bộ lọc có đáp ứng xung hữu hạn FIR
Điều kiện để khôi phục tín hiệu hoàn hảo:
GHGHI (1.62) Trong trường hợp băng lọc hai kênh là trực chuẩn:
T
GH (1.63)
Do vậy, khai triển gián đoạn thời gian được cho bởi đáp ứng xung của bộ lọc tổng
hợp Trong phần trước chung ta đã đề cập đến thuật toán hình chóp, cấu trúc dạng băng
lọc dải bát độ (octave-band filter bank), hình 1.9 biểu diễn các băng lọc cấu trúc cây
Chúng ta thấy rằng tín hiệu ban đầu được chia ra qua băng lọc hai kênh, sau đó phiên bản thông thấp lại được phân sử dụng cùng băng lọc và tiếp tục như vậy Nếu như băng lọc
Trang 33hai kênh là trực chuẩn, băng lọc này thực hiện một chuỗi Wavelet gián đoạn thời gian
trực chuẩn
Nếu như tín hiệu qua bộ lọc G(z) sau nội suy với hệ số 2 là tương đương với tín
hiệu được nội suy hệ số 2 sau khi qua bộ lọc G( z2), chúng ta có thể biến đổi bất kỳ băng
lọc bát độ nào với các tầng J thành một kênh J Ví dụ, băng lọc bốn kênh với các bộ lọc thông thấp và thông cao G( z), H( z), chúng ta thu được các bộ lọc tương đương:
1
G GH GH H như được thực hiện trong (1.57) Ma trận WTa biểu diễn
ma trận biến đổi Wavelet
Trang 34T ổng kết tính chất của một số Wavelet: