Luận văn cao học ĐTVT 2004 - 2006Đỗ Ngọc Anh Human Visual System Joint Photographic Experts Group MRA Phân tích đa phân giải Multi Resolution Analysis PCM Điều xung mã Pulse Code Modulat
Trang 1Người hướng dẫn khoa học: PGS.TS Nguyễn Đức Thuận
NÉN ẢNH SỬ DỤNG BIÉN ĐỎI WAVELET VÀ ỨNG
DỤNG TRONG CÁC DỊCH vụ DỮ LIỆU ĐA
• • • • PHƯƠNG TIỆN DI ĐỘNG
NGHÀNH: ĐIỆN TỬ VIỄN THÔNG
ĐỖ NGỌC ANH
Trang 2Luận văn cao học ĐTVT 2004 - 2006
Đỗ Ngọc Anh
Trang 3Luận văn cao học ĐTVT 2004 - 2006
Đỗ Ngọc Anh
MỤC LỤC
CÁC HÌNH VẼ, BẢNG BIỂU TRONG LUẬN VĂN 5
THUẬT NGỮ TIẾNG ANH 7
LỜI GIỚI THIỆU 8
CHƯƠNG 1: MỞ ĐẨU 9
1.1 Cơ sở nghiên cứu và mục đích của luận văn 9
1.2 Tổ chức luận văn 10
CHƯƠNG 2:TỔNG QUAN CÁC KỸ THUẬT NÉN TRONG MÃ HOÁ ẢNH .11
2.1 Giới thiệu chung về nén ảnh số 11
2.2 Phân loại các kỹ thuật nén 13
2.2.1 Nén tổn hao và không tổn hao 13
2.2.2 Mã hoá dự đoán và mã hoá dựa trên phép biến đổi 13
2.2.3 Mã hoá băng con 14
2.3 Tiêu chuẩn đánh giá chất lượng mã hoá ảnh 14
2.4 Các kỹ thuật nén có tổn hao 15 2.4.1 Kỹ thuật mã hoá băng con 15
2.4.2 Kỹ thuật mã hoá dựa trên phép biến đổi 19
2.4.2.1 Kỹ thuật mã hoá dựa trên phép biến đổi DCT 19
2.4.2.2 Kỹ thuật mã hoá dựa trên phép biến đổi DWT 25
CHƯƠNG 3:CƠ SỞ LÝ THUYẾT BIẾN ĐỒI WAVELET 30
3.1 Cơ sở toán học 30
3.1.1 Biến đổi Wavelet liên tục 30
3.1.2 Biến đổi Wavelet ròi rạc 32
3.2 Tính chất của biến đổi Wavelet 33
3.3 Giới thiệu một số họ Wavelet 37
3.3.1 Biến đổi Wavelet Haar 37
Trang 4Luận văn cao học ĐTVT 2004 - 2006
Đỗ Ngọc Anh
3.3.2 Biến đổi Wavelet Meyer 38
3.3.3 Biến đổi Wavelet Daubechies 38
3.4 Một số ứng dụng nổi bật của Wavelet 39
3.4.1 Nén tín hiệu 39
3.4.2 Khử nhiễu 40
3.4.3 Mã hoá nguồn và mã hoá kênh 40
CHƯƠNG 4:CHUẨN NÉN ẢNH TĨNH DựA TRÊN BIẾN ĐỔI WAVELET -JPEG2000 41
4.1 Lịch sử ra đời và phát triển chuẩn JPEG2000 41
4.2 Các tính năng của JPEG2000 41
4.3 Các bước thực hiện nén ảnh theo chuẩn JPEG2000 42
4.3.1 Xử lý trước biến đổi 42
4.3.2 Biến đổi liên thành phần 42
4.3.3 Biến đổi riêng thành phần (biến đổi Wavelet) 43
4.3.4 Lượng tử hoá - Giải lượng tử hoá 44 4.3.5 Mã hoá và kết họp dòng dữ liệu sau mã hoá 45
4.3.6 Phương pháp mã hoá SPIHT 45
4.3.7 Phương pháp mã hoá EZW 47
4.4 So sánh chuẩn JPEG2000 với JPEG và các chuẩn nén ảnh tĩnh khác 49
CHƯƠNG 5:ỨNG DỤNG WAVELET TRONG CÁC DỊCH vụ DỮ LIỆU ĐA PHƯƠNG TIỆN TRONG THÔNG TIN DI ĐỘNG 54
5.1 Nén ảnh bang Wavelet 54
5.2.1 Sơ đồ khối tổng quát 54
5.1.2 Biến đổi Wavelet 55
5.1.3 Tính toán năng lượng tiêu hao 56
5.2 Thuật toán nén ảnh bằng Wavelet hiệu năng - EEW 58
Trang 5Luận văn cao học ĐTVT 2004 - 2006
Đỗ Ngọc Anh
5.2.1 Hiệu năng của các kỹ thuật loại bỏ 60
5.3.2 Các kết quả thực nghiệm 62
5.3.2.1 Ảnh hưởng đến năng lượng tính toán và chất lượng ảnh 62 5.3.2.2 Ảnh hưởng đến năng lượng truyền thông và chất lượng ảnh 62 5.4 Các tham số nén ảnh bang Wavelet 62
5.4.1 Thay đổi mức biến đổi Wavelet 62
5.4.2 Thay đổi các mức lượng tử 62
5.5 Truyền ảnh trên mạng 62
5.5.1 Phương pháp lựa chọn tham số động 62
5.5.2 Kết quả thực nghiệm 62
KẾT LUẬN 63
Kết quả đạt được và ứng dụng của luận văn 63
Hướng phát triển nghiên cứu 63
PHỤ LỤC 65
TÀI LIỆU THAM KHẢO 66
CÁC HÌNH VË, BANG BIËU TRONG LUẬN VĂN Hình 2.1 Sơ đồ bộ khái quát hệ thống nén ảnh 12
Hình 2.2 Sơ đồ minh hoạ kỹ thuật mã hoá băng con - M băng con 16
Hình 2.3 Minh hoạ quá trình phân ly băng con cây bát phân 17
Hình 2.4 Phân ly hai ảnh mẫu thành bốn băng con 18
Hình 2.5 Sơ đồ bộ mã hoá theo chuẩn JPEG 23
Hình 2.6 Sắp xếp Zigzag các hệ số DCT ở bộ mã hoá 23
Hình 2.7 Sơ đồ khối bộ giải mã theo chuẩn JPEG 23
Hình 2.8 Bank lọc khôi phục lý thuyết sử dụng DWT 1D 28
Hình 2.9 Minh hoạ DWThai chiều cho ảnh 28
Hình 2.10(a) Minh hoạ DWTkiểu dyadic mức 3 để nén ảnh 28
Hình 2.10(b) Minh hoạ DWTkizu dyadic mức 3 để nén ảnh 29
Hình 3.1 Minh hoạ lưới nhị to dyadic vói các giá trị của m và n 33
Trang 6Luận văn cao học ĐTVT 2004 - 2006
Đỗ Ngọc Anh
Hình 3.2 Phân tích đa phân giải áp dụng cho biểu diễn tín hiệu 36
Hình 3.3 Hàm y/ịt) của biến đổi Haar 38
Hình 3.4: Hàm y/(t) của biến đổi Meyer 38
Hình 3.5 Hàm y/(t) của họ biến đổi Daubechies n vói n=2, 3, 7, 8 39
Hình 4.1 : Trình tự mã hoá (a) và giải mã JPEG2000 (b) 42
Hình 4.2: Minh hoạ ảnh với RGB và YCrCb 43
Hình 4.3: Phương pháp Lifting ID dùng tính toán biến đổi Wavelet 44
Hình 4.4: Minh hoạ cây tứ phân (a) và sự phân mức (b) 47
Hình 4.5: Hai cách sắp xếp thứ tự các hệ số biến đổi 48
Hình 4.6: So sánh JPEG và JPEG2000 50
Bảng 4.1: So sánh JPEG và JPEG2000 51
Hình 4.7: Minh hoạ tính năng ROI 52
Bảng 4.2: So sánh tính năng của JPEG2000 với các chuẩn nén ảnh tĩnh khác 53
Hình 5.1 Sơ đồ khối quá trình nén ảnh bang Wavelet 54
Hình 5.2 (a) Biến đổi Wavelet 2D mức 3 và (b) Minh hoạ bằng ảnh “CASTLE” 56
Hình 5.3 Phân bố số học các hệ số thông cao sau phép biến đổi Wavelet mức 2 59
Hình 5.4: Dữ liệu sau phép biến đổi Wavelet với hai kỹ thuật loại bỏ HH và H* .61
THUẬT NGỮ TIÉNG ANH
CWT Biến đổi Wavelet liên tục (Continuous Wavelet Transform)
DPCM Điều xung mã vi sai (Differized Pulse Code Modulation)
EZW Wavelet cây zero (Embedded Zerotree Wavelet)
Trang 7Luận văn cao học ĐTVT 2004 - 2006
Đỗ Ngọc Anh
(Human Visual System)
(Joint Photographic Experts Group)
MRA Phân tích đa phân giải (Multi Resolution Analysis)
PCM Điều xung mã (Pulse Code Modulation)
QMF Lọc gương cầu tứ phương (Quardrature Mirror Filters)
tính năng mới nổi bật của JPEG2000
(Setpartitioning in hierarchical trees)
Transform)
Wavelet Decomposition Cây phân giải Wavelet Tree
LỜI GIỚI THIỆU
Mục đích của luận văn là trình bầy một kỹ thuật nén ảnh sử dụng biến đổi
Wavelet cho ảnh tĩnh và đặc biệt là ảnh tĩnh trong các dịch vụ dữ liệu đa phương
tiện trong mạng di động So với các kỹ thuật nén sử dụng phép biến đổi trước
đây như biến đổi Fourier (FT), biến đổi cosine rời rạc (DCT'), biến đổi xếp
Trang 8Luận văn cao học ĐTVT 2004 - 2006
Đỗ Ngọc Anh
chồng (LT), , biến đổi Wavelet (DWT) có nhiều ưu điểm không chỉ trong xử lý
ảnh mà còn nhiều ứng dụng khác Bằng chứng là sự ra đòi của chuẩn nén
JPEG2000 (dựa trên DWT) có tính năng vượt trội so với JPEG (DCT) Tuy
nhiên chuẩn JPEG, MPEG hay ngay cả JPEG2000 cũng chỉ tập trung vào hiệu
quả nén (tỉ số nén) và chất lượng ảnh mà không chú ý đến năng lượng tiêu haotrong quá trình xử lý và truyền trên mạng Trong luận văn đã trình bầy một kỹ
thuật nén ảnh trong mạng di động sử dụng biến đổi Wavelet hiệu năng không chỉ
đem lại hiệu quả nén, chất lượng hình ảnh mà còn tiết kiệm năng lượng xử lýcủa hệ thống Điều này hứa hẹn có thể xây dựng một bộ mã hoá ảnh tiết kiệmnăng lượng xử lý, thời gian truyền mà vẫn phù họp vói điều kiện băng thôngthấp, ràng buộc về chất lượng dữ liệu trong các mạng thông tin di động
CHƯƠNG 1: MỞ ĐẦU
1.1 Cơ sở nghiên cứu và mục đích của luận văn
Đẻ có thể sử dụng các dịch vụ Internet không dây cũng như nhiều dịch vụ
dữ liệu khác trên nền các ứng dụng di động cần có một kỹ thuật then chốt để cóthể hỗ trợ truyền thông nhiều dạng dữ liệu trong thông tin di động tế bào như:thoại, văn bản, hình ảnh và video Tuy nhiên vấn đề truyền thông nội dung đa
phương tiện trong thông tin di động gặp một số khó khăn: băng thông của mạng
di động tế bào, nhiễu kênh, giới hạn của pin cho các ứng dụng, tỉnh tương thích
dữ liệu giữa các thuê bao Trong khi việc cải thiện băng thông di động cần một
công nghệ mói của tương lai còn việc cải thiện giới hạn của pin không đáp ứngđược sự phát triển của các dịch vụ tương lai, thì phương pháp giảm kích thước
dữ liệu bằng các kỹ thuật nén là một cách tiếp cận hiệu quả giải quyết các khókhăn trên
Mặc dù cho đến nay có rất nhiều kỹ thuật nén dữ liệu đa phương tiện
như: chuẩn JPEG (dựa trên biến đổi DCT), chuẩn JPEG2000 (dựa trên biến đổi
Wavelet) và chuẩn MPEG, tuy nhiên những kỹ thuật này chỉ tập trung vào hiệu
quả nén và cố gắng đánh mất chất lượng ảnh ít vì thế chúng bỏ qua vấn đề tiêu
Trang 9Luận văn cao học ĐTVT 2004 - 2006
Đỗ Ngọc Anh
hao năng lượng trong quá trình nén và truyền RF (trong thông tin động) Luận
văn này trình bầy một kỹ thuật hiệu quả để khắc phục những khó khăn trên choloại dữ liệu đa phương tiện điển hình trong thông tin di động là ảnh tĩnh Đó là
kỹ thuật nén ảnh sử dụng biến đổi Wavelet thích nghi và hiệu năng cho dữ liệu
đa phương tiện trong thông tin di động
1.2 Tổ chức luận văn
Luận văn được trình bầy thành 5 chương và 1 phụ lục Chương 1, tác giảtrình bày tóm tắt cơ sở nghiên cứu và mục đích cũng như tổ chức của luận văn
Chương 2 trình bầy khái quát các kỹ thuật nén ảnh, phân loại các nguyên
lý nén và định nghĩa một số thuật ngữ được sử dụng rộng rãi như MSE, PSNR và
SNR Chương này cũng trình bầy cơ sở lý thuyết của các nguyên lý nén có tổn
hao điển hình như: mã hoá băng con; mã hoá dựa trên biến đổi cosine rời rạc
(DCT), biến đổi xếp chồng (LT), biến đổi Wavelet rời rạc (DWT).
Chương 3 trình bầy cơ sở toán học, tính chất của biến đồi Wavelet Nội dung của chương này là lý thuết nền tảng cho các ứng dụng Wavelet Chương này cũng đưa ra một số họ Wavelet phổ biến và giói thiệu một số ứng dụng nổi bật của Wavelet ngoài ứng dụng để nén ảnh.
Chương 4 giới thiệu tổng quan về chuẩn nén JPEG2000 dựa trên biến đổi
Wavelet Mục đích không chỉ là giói thiệu một chuẩn nén vượt trội so với chuẩn JPEG dựa trên biến đổi DCT mà còn đưa ra một lựa chọn giải quyết bài toán đặt
ra trong luận văn JPEG2000 đang từng bước được tổ chức ISO công nhận nên
chắc chắn sẽ trở thành một chuẩn nén phổ biến trong các ứng dụng di độngtương lai Cũng trong chương này, tác giả trình bầy tóm tắt các bước thực hiện
nén ảnh theo JPEG200 và so sánh nó với chuẩn JPEG và các chuẩn nén ảnh tĩnh
khác
Chương 5 cũng là chương quan trọng nhất Dựa trên kỹ thuật nén ảnh
bang Wavelet, luận văn đưa ra một thuật toán biến đổi ảnh bằng Wavelet hiệu
năng làm giảm đáng kể năng lượng tính toán và truyền thông cần thiết cho ảnh
Trang 10Luận văn cao học ĐTVT 2004 - 2006
2.1 Giới thiệu chung về nén ảnh số
Nén ảnh số là một đề tài nghiên cứu rất phổ biến trong lĩnh vực xử lý dữliệu đa phương tiện Mục đích là làm thế nào để lưu trữ bức ảnh dưới dạng cókích thước nhỏ hơn hay dưới dạng biểu diễn mà chỉ yêu cầu số bít mã hoá ít hon
so với bức ảnh gốc Nén ảnh thực hiện được là do một thực tế: thông tin trongbức ảnh không phải là ngẫu nhiên mà có trật tự, có tồ chức Vì thế nếu bóc táchđược tính trật tự, cấu trúc đó thì sẽ biết được phần thông tin nào quan trọng nhấttrong bức ảnh để biểu diễn và truyền đi vói số lượng bít ít hơn so với ảnh gốc màvẫn đảm bảo tính đầy đủ thông tin Ở phía thu, quá trình giải mã sẽ tổ chức, sắpxếp lại được bức ảnh xấp xỉ gần chính xác so vói ảnh gốc nhưng vẫn thoả mãnchất lượng yêu cầu, đảm bảo đủ thông tin cần thiết
Tóm lại, tín hiệu ảnh, video hay audio đều có thể nén lại bởi chúng cónhững tính chất như sau:
• Có sự tương quan (dư thừa) thông tin về không gian: Trong phạm vi mộtbức ảnh hay một khung video tồn tại sự tương quan đáng kể (dư thừa)giữa các điểm ảnh lân cận
• Có sự tương quan (dư thừa) thông tin về phổ: Các dữ liệu thu được từ các
bộ cảm biến của thiết bị thu nhận ảnh tồn tại sự tương quan đáng kể giữacác mẫu thu, đây chính là sự tương quan về phổ
• Có sự tương quan (dư thừa) thông tin về thời gian: Trong một chuỗi ảnhvideo, tồn tại sự tương quan giữa các điểm ảnh của các khung video
(frame).
Trang 11Luận văn cao học ĐTVT 2004 - 2006
Đỗ Ngọc Anh
Sơ đồ của một hệ thống nén dữ liệu tổng quát như sau:
Trong hình 2.1, bộ mã hoá dữ liệu thực hiện quá trình nén bằng cách giảmkích thước dữ liệu ảnh gốc đến một mức phù họp với việc lưu trữ và truyền dẫntrên kênh Tốc độ bít đầu ra của bộ mã hoá được tính là số bít cho một mẫu(điểm ảnh) Bộ mã hoá kênh thực hiện việc chuyển đổi luồng bít đã được nénthành dạng tín hiệu phù họp cả cho việc lưu trữ và truyền dẫn, thường bộ mã hoá
kênh sử dụng các kỹ thuật: mã hoá có độ dài thay đổi - RLC (Run Length
Coding)[4], mã hoả Huffman[4], mã hoả so học [4] Bộ giải mã thực hiện quá
trình ngược lại so vói bộ mã hoá
Trong các hệ thống nén, tỉ số nén chính là tham số quan trọng đánh giákhả năng nén của hệ thống, công thức được tính như sau:
Tỉ số nén = Kích thước dữ liệu gốc/ Kích thước dữ liệu nén Đối vói ảnh tĩnh, kích thước chính là số bít để biểu diễn toàn bộ bức ảnh Đối vói ảnh
video, kích thước chính là số bít để biểu diễn một khung hình video (video
frame).
Hình 2.1 Sơ đồ bộ khái quát hệ thống nén ảnh
Trang 12Luận văn cao học ĐTVT 2004 - 2006
Đỗ Ngọc Anh
2.2 Phân loại các kỹ thuật nén
Các kỹ thuật nén chủ yếu được phân loại như sau:
2.2.1 Nén tổn hao và không tổn hao
Trong các kỹ thuật nén không tổn hao (losses compression), ảnh khôi phục
giống hoàn toàn so với ảnh gốc Tuy nhiên, nén không tổn hao chỉ đạt được hiệu
quả nén rất nhỏ Trái lại, các kỹ thuật nén có tổn hao (lossy compression) có thể
đạt được hiệu quả nén cao hơn rất nhiều mà ở điều kiện cảm nhận hình ảnhthông thường sự mất mát thông tin không cảm nhận được và vì thế vẫn đảm bảochất lượng ảnh Một số kỹ thuật nén có tổn hao gồm: điều xung mã vi sai -
DPCM, điều xung mã - PCM, lượng tử hoá véctơ - VQ, mã hoá biến đổi và băng
con Ảnh khôi phục trong hệ thống nén có tổn hao luôn có sự suy giảm thông tin
so với ảnh gốc bởi vì: phương pháp nén này đã loại bỏ những thông tin dư thừakhông cần thiết
2.2.2 Mã hoá dự đoán và mã hoá dựa trên phép biến đổi
Đối vói mã hoá dự đoán (predictive coding) các giá trị mang thông tin đã được
gửi hay đang sẵn có sẽ được sử dụng để dự đoán các giá trị khác, và chỉ mã hoá
sự sai lệch giữa chúng Phương pháp này đơn giản và rất phù họp vói việc khai
thác các đặc tính cục bộ của bức ảnh Kỹ thuật DPCM chính là một ví dụ điển
hình của phương pháp này Trong khi đó, mã hoá dựa trên phép biến đổi
(transform based coding) thì lại thực hiện như sau: trước tiên thực hiện phép
biến đổi vói ảnh để chuyển sự biểu diễn ảnh từ miền không gian sang một miền
biểu diễn khác Các phép biến đổi thường dùng là: DCT - biến đổi Cosine rời rạc, DWT - biến đổi Wavelet rời rạc, LT - biến đổi trồng (lapped) , tiếp đó thực
hiện mã hoá đối với các hệ sộ biến đổi Phương pháp này có hiệu suất nén caohon rất nhiều so vói phương pháp nén dự đoán bởi vì chính các phép biến đổi(sử dụng các thuộc tính nén năng lượng của mình) đã gói gọn toàn bộ nănglượng bức ảnh chỉ bằng một số ít các hệ số, số lớn các hệ số còn lại ít có ý nghĩahon sẽ bị loại bỏ sau khi lượng tử hoá và như vậy lượng dữ liệu phải truyền nhỏ
Trang 13Luận văn cao học ĐTVT 2004 - 2006
Đỗ Ngọc Anh
đi rất nhiều Trong phương pháp mã hoá dự đoán, sai lệch giữa ảnh gốc và ảnh
dự đoán vẫn có ý nghĩa (còn sử dụng ở bước tiếp theo) sau khi lượng tử hoá,chính điều này làm cho phương pháp mã hoá dự đoán có nhiều dữ liệu đượctruyền đi hơn so với phương pháp mã hoá biến đổi
2.2.3 Mã hoá băng con
Bản chất của kỹ thuật mã hoá băng con (subband coding) là chia băng tần của tín hiệu (ảnh) thành nhiều băng con (subband) Để mã hoá cho mỗi băng con,
chúng ta sử dụng một bộ mã hoá và một tốc độ bít tương ứng với tính chất thống
kê của băng con
2.3 Tiêu chuẩn đánh giá chất lượng mã hoá ảnh
Đẻ đánh giá chất lượng của bức ảnh (hay khung ảnh video) ở đầu ra của
bộ mã hoá, người ta thường sử dụng hai tham số: Sai số bình phương trung bình
- MSE (mean square error) và tỉ số tín hiệu trên nhiễu đỉnh - PSNR (peak to
signal to noise ratio) MSE thường được gọi là phương sai lượng tử - ơ 2 (quantization error variance) MSE giữa ảnh
gốc và ảnh khôi phục được tính như sau:
N j*
Trong đó tổng lấy theo j, k tính cho tổng tất cả các điểm ảnh trong ảnh và N là số điểm ảnh trong ảnh Còn PSNR giữa hai ảnh (b bít cho mỗi điểm ảnh, RMSE là căn bậc 2 của MSE) đước tính theo công thức dB như sau:
A 1
Thông thường, nếu PSNR > 40dB thì hệ thống mắt người gần như không phân
biệt được giữa ảnh gốc và ảnh khôi phục
Một tham số khác hay sử dụng trong các hệ thông viễn thông đó là tỉ số tín hiệu
trên nhiễu - SNR , tuy vậy SNR sử dụng cho một hệ thống né ảnh cũng có công thức dB như sau:
energy
Trang 14Luận văn cao học ĐTVT 2004 - 2006
Đỗ Ngọc Anh
2.4 Các kỹ thuật nén có tổn hao
Trong phần này, tác giả lựa chọn trình bày hai kỹ thuật nén tổn hao cho
nén ảnh tĩnh và ảnh động đó là: mã hoá băng con (subband coding) và mã hoá
sử dụng phép biến đổi (transform coding) Đây là hai kỹ thuật nén điển hình và
cho hiểu quả nén cũng như chất lượng ảnh cao
2.4.1 Kỹ thuật mã hoá băng con
Tư tưởng chính của kỹ thuật mã hoá băng con là: các ảnh được lấy mẫu ởđầu vào được phân ly thành các băng tần khác nhau (gọi là các tín hiệu băngcon) Yêu cầu của kỹ thuật này là làm thế nào các băng con không bị chồng chéo
lên nhau Đe có thể phân ly tín hiệu ở bộ mã hoá (encoder) thành các băng con, ảnh được cho qua một bank lọc (filter bank) gọi là bank lọc phân tích và mỗi đầu
ra của bank lọc băng con được lấy mẫu xuống hệ số 2 Các đầu ra băng con tần
số được lẫy mẫu xuống sẽ lần lượt được: lượng tử hoả độc lập bằng các bộ lọc
vô hướng khác nhau, mã hoá entropy, lưu trữ và truyền đi Ở phía bộ giải mã (decoder), quá trình được thực hiện ngược lại: giải lượng tử băng con tần số, lấy
mẫu lên với hệ số 2, cho đi qua bank lọc băng con tổng họp rồi cộng tất cả cácđầu ra của bộ lọc để khôi phục lại ảnh
Các bộ lọc băng con thường được thiết kế xấp xỉ thoả mãn tiêu chuẩn củacác đáp ứng tần số không chồng chéo Mục đích là để giải tương quan các hệ sốtần số kết quả Đây chính là tính chất quan trọng mà quá trình lọc băng con cốgắng đạt được Các bộ lọc băng con được thiết kế để là các xấp xỉ với các bộ lọcchọn tần số lý tưởng, trong đó đáp ứng tổng họp từ tất cả các bộ lọc bao trùm tất
cả băng tần của ảnh Tuy nhiên trong thực tế, sự tương quan tổng không bao giờđạt được do những bộ lọc này chỉ xấp xỉ với các bộ lọc lý tưởng
Trang 15Luận văn cao học ĐTVT 2004 - 2006
Đỗ Ngọc Anh
Các bộ lọc sử dụng trong mã hoá băng con là các bộ lọc gương tử
phương - QMF (quardrature mirror filters), do vậy chúng ta chỉ cần thiết kế các
bộ lọc thông thấp có đáp ứng H(co) còn đáp ứng của các bộ lọc thông cao là
H(co+7r) chỉ là sự dịch pha 180° so vói bộ lọc thông thấp Sự chính xác của bộ
lọc phụ thuộc vào số các hệ số của bộ lọc
Một trong các phương pháp mã hoá băng con đó là áp dụng sự phân ly cây bátphân để phân ly dữ liệu ảnh thành các băng tần khác nhau Ý tưởng của phươngpháp này là: trước tiên lọc và lược bỏ ảnh để phân ly ảnh thành các băng con tần
số cao và thấp, sau đó tiếp tục phân ly nhưng chỉ áp dụng cho băng con tần sốthấp để tạo thành các băng con tần số cao và thấp để tiếp tục lược bỏ Kỹ thuậtnày rất phổ biến và cũng được áp dụng trong các bộ mã sử dụng biến đổi
Wavelet Đầu ra của các băng con sau khi đã giản lược sẽ được lượng tử hoá và
Hình 2.2 dưới đây là sơ đồ tổng quát giải thích kỹ thuật mã hoá băng con
Bandpass synthesis filter bank Hình 2.2 Sơ đồ minh hoạ kỹ thuật mã hoá băng con - M băng con
Trang 16Luận văn cao học ĐTVT 2004 - 2006
Trong các hệ thống mã hoá băng con hai chiều thực tế, người ta chia miền tần số
- không gian hai chiều của ảnh gốc thành các băng khác nhau ở bất kỳ mức nào
Hình 2.4 dưới đây minh hoạ việc phân ly 2 ảnh mẫu thành 4 băng con LL, HL,
LH và HH ở mức đầu tiên.
Hình 2.3 Minh hoạ quá trình phân ly băng con cây bát phân
Trang 17■PiSMI bmihnI jflrw Ui
Hình 2.4 Phân ly hai ảnh mẫu thành bốn băng con
Nhược điểm của kỹ thuật mã hoá băng con:
Một trong những vấn để chủ yếu của kỹthuật mã hoá băng con đó là giải quyết bài toáncấp phát bít (là số bít cấp cho mỗi băng con) để
Trang 18đạt được hiệu suất cao nhất Một trong nhữngcách thực hiện là sử dụng ý tưởng cấp phát bíttối ưu cho mỗi đầu ra băng con đã được lượng
tử hoá Tuy nhiên cách này chủ yếu thích hợpcho trường họp tốc độ cao (>1 bít/mẫu)
Trước khi đi vào nghiên cứu kỹ thuật mãhoá dựa trên phép biến đổi, chúng ta sẽ tổngkết một số nhược điểm của kỹ thuật mã hoábăng con như sau:
Kỹ thuật mã hoá băng con không xác địnhđược hệ thống mã hoá tối ưu cho các ứng dụngtốc độ bít thấp
Việc cấp phát bít tối ưu sẽ thay đổi khitốc độ bít tổng thay đổi, điều này làm quá trình
mã hoá phải lặp lại hoàn toàn cho mỗi tốc độbít xác định
Trang 19Không hoàn toàn giải tương quan cho tất cả các băng tần, đấy là do các
bộ lọc không phải là lý tưởng và có sự chồng chéo nhỏ giữa các băng tần liền
kề Do vậy luôn luôn tồn tại một sự tương quan nhỏ giữa các băng tần kềnhau và dữ liệu sẽ không được nén hoàn toàn
Kỹ thuật mã hoá băng con không hiệu quả khi thực hiện bù chuyển độngtrong video vì rất khó để thực hiện đánh giá chuyển động ở các băng con (sai
số dự đoán là rất lớn)
2.4.2 Kỹ thuật mã hoá dựa trên phép biến đổi
Một phép biến đổi là một hàm toán học được sử dụng để biến đổi mộttập các giá trị này thành một tập giá trị khác và tạo ra một cách biểu diễn mớicho cùng một nguồn tin Tất cả các phép biến đổi mà chúng ta định trình bầy
dưới đây đều là không tổn hao (lossless); với sự chính xác của các phép toán
số học thì các phép biến đổi vẫn bảo tồn được độ chính xác ở bất kỳ mức độnào Nhưng hầu hết các kỹ thuật mã hoá đều có tổn hao ở bước lượng tử hoá
do có sự làm tròn giá trị cho các hệ số phép biến đổi
Phần này chúng ta sẽ trình bầy các kỹ thuật mã hoá dựa trên phép biến đổiđược sử dụng trong nén ảnh
(a) Kỹ thuật mã hoá dựa trên phép biến đổi cosine ròi rạc - DCT
(b) Kỹ thuật mã hoá dựa trên phép biến đổi chồng - LT
(c) Kỹ thuật mã hoá dựa trên phép biến đổi DWT
2.4.2.1 Kỹ thuật mã hoá dựa trên phép biến đổi DCT
Phép biến đổi cosine rời rạc - DCT (Discrete Cosine Transform) biến
đổi thông tin ảnh từ miền không gian sang miền tần số để có thể biểu diễn
dưới dạng gọn hơn Tính chất của nó tương tự như biến đổi Fourier, coi ảnh
đầu vào (tín hiệu audio hoặc video) là các tín hiệu ổn định bất biến theo thòi
gian Đe hiểu rõ kỹ thuật này trước hết ta cần tìm hiểu biến đổi Fourier.
Biến đổi Fourier - FT
Trang 20Biến đổi Fourier - FT (Fourier Transform) là một phép biến đổi thuận
nghịch, nó cho phép sự chuyển đổi thuận - nghịch giữa thông tin gốc (miềnkhông gian hoặc thời gian) và tín hiệu được xử lý (được biến đổi) Tuy nhiên
ở một thời điểm bất kỳ chỉ tồn tại một miền thông tin được thể hiện Nghĩa làtín hiệu trong miền không gian không có sự xuất hiện thông tin về tần số và
tín hiệu sau biến đổi Fourier không có sự xuất hiện thông tin về thời gian.
FT cho biết thông tin tần số của tín hiệu, cho biết những tần số nào có
trong tín hiệu, tuy nhiên nó không cho biết tần số đó xuất hiện khi nào trong
tín hiệu Neu như tín hiệu là ổn định (stationary - có các thành phần tần số
không thay đổi theo thòi gian) thì việc xác định các thành phần tần số xuấthiện khi nào trong tín hiệu là không cần thiết
Phép biến đổi FT thuận và nghịch được định nghĩa như sau:
—00 00
x(t) = Ịxư)e ỈM ‘df ( 2 5 )
—00
Phép biến đổi FT cũng có thể được áp dụng cho tín hiệu không ổn định
(non-statỉonary) nếu như chúng ta chỉ quan tâm đến thành phần phổ nào có trong
tín hiệu mà không quan tâm đến nó xuất hiện khi nào trong tín hiệu Tuynhiên, nếu thông tin về thời gian xuất hiện của phổ trong tín hiệu là cần thiết,
thì phép biến đổi FT không có khả năng đáp ứng được yêu cầu này, đây cũng
là hạn chế của phép biến đổi này
Đe có biến đổi Fourier rời rạc -DFT (Discrete Fourier Transform) thì ở phép tích phân trong biểu thức toán học của biến đổi FT, ta thay bằng phép tổng và
tính toán nó với các mẫu hữu hạn
Trang 21, k= 0,1, ,N-1 (2.8) ,n=0,l, ,N-1 (2.9)
2N (2 n + X)kn 2N
Hệ số phép biến đổi DFT thứ k của một chuỗi gồm N mẫu Ịx(n)} được định
nghĩa:
n=0
Trong đó W N = e~ jmỉN = COS (2ft/N) -j sin (27ĩ/N), còn chuỗi fx(n)} có thể
khôi phục bang DFT ngược như sau:
N tó
Định nghĩa và các tính chất của biến đổi DCT
Biến đổi DCT thuận và ngược một chiều gồm N mẫu được định nghĩa như
thành các biến đổi một chiều Tính chất trực giao ở đây nghĩa là nếu các ma
trận của DCT \ầ ỈDCT là không bất thường (non-sỉngular) và thực thì biến đổi ngược của chúng có thể đạt được bằng cách áp dụng toán tử hoán vị Cũng như biến đổi FT, DCT cũng coi dữ liệu đầu vào là tín hiệu ổn định (bất
biến)
Trong các chuẩn nén ảnh tĩnh vào video, người ta thường sử dụng DCT và
IDCT có kích thước 8 mẫu Bức ảnh hoặc khung ảnh video kích thước NxN
được chia thành các khối không chồng chéo nhau hai chiều gọi là các ảnh con
kích thước 8x8 rồi áp dụng biến đổi DCT hai chiều ở bộ mã hoá và áp dụng biến đổi IDCT ở bộ giải mã.
Trang 22Biến đổi DCT và IDCT 8 mẫu tạo thành các ma trận 8x8 theo công thức:
Trang 23cho hàng rồi đến cột của ma trận.
So sánh DCTxầKLT
Hiệu quả của biến đổi DCT trong việc giải tương quan tín hiệu ảnh tương
đương với biến đổi Karhunen-Loeve (KLT) KLT là phép biến đổi theo khối
tối ưu nhất cho nén dữ liệu ở khía cạnh thống kê bởi: nó có thể giải tươngquan một cách tối ưu tín hiệu ảnh trong miền phép biến đổi (bằng cách tậptrung hầu hết thông tin ảnh vào một số hệ số của phép biến đổi) và so với các
phép biến đổi khác nó có thể tối thiểu hoá MSE giữa ảnh khôi phục và ảnh
gốc
Nén và giải nén ảnh dựa theo phép biến đỗi DCT trong JPEG
JPEG là chuẩn nén số quốc tế đầu tiên cho các ảnh tĩnh có tông màu
liên tục gồm cả ảnh đon sắc và ảnh màu Trong kỹ thuật này các khối ảnh
kích thước 8x8 được áp dụng để thực hiện DCT, sau đó lượng tử hoá các hệ
số rồi mã hoá entropy sau lượng tử
Đối với những ảnh màu RGB, để áp dụng kỹ thuật nén này, trước hết phải chuyển sang chế độ màu YUV (7 là thành phần chói, u và V là 2 thành
phần màu) Thành phần độ chói là ảnh đon sắc xám Hai thành phần màu còn
lại chứa thông tin về màu Việc mã hoá và giải mã ảnh trong JPEG ở được
thực hiện cho thành phần chói rồi màu
Trang 24Sơ đồ khối bộ mã hoá và giải mã của JPEG như sau:
Quá trình xử lý thành phần độ chói ở phía mã hoá được giải thích như sau:
(a) Ảnh gốc được chia thành các khối ảnh (block) nhỏ kích thước 8x8 không
chồng chéo lên nhau Tiếp theo, giá trị của mỗi điểm ảnh ở
mỗi khỗi khối ảnh sẽ được trừ đi 128 Lý do là do giá trị các điểm ảnh cógiá trị từ 0 đến 255 (được mã hoá bởi 8 bít không dấu), áp dụng biến đổiDCT sẽ tạo ra các hệ số AC có dải giá trị từ -1023 đến +1023 (có thể được
Hình 2.5 Sơ đồ bộ mã hoá theo chuẩn JPEG
Hình 2.7 Sơ đồ khối bộ giải mã theo chuẩn JPEG
ề
Hình 2.6 Sắp xếp Zigzag các hệ số DCT ở bộ mã hoá
Trang 25mã hoá bởi 11 bít có dấu) Nhưng hệ số DC lại có giải giá trị từ 0 đến
2040 (được mã hoá bởi 11 bít không dấu) và cần cách xử lý khác ở phầncứng hoặc phần mềm so với các hệ số AC Chính vì thế việc trừ giá trịmỗi điểm ảnh đi 128 là để sau khi biến đổi DCT cả các hệ số DC và AC
có cùng dải giá trị thuận lợi cho việc xử lý và biểu diễn
(b) Ở mỗi khối ảnh hai chiều kích thước 8x8, áp dụng biến đổi DCT để tạo ramảng hai chiều các hệ số biến đổi Hệ số có tương ứng vói tần số khônggian thấp nhất nhưng lại có giá trị lớn nhất được gọi là hệ số DC (mộtchiều), nó tỉ lệ vói độ chói trung bình của cả khối ảnh 8x8 Các hệ số cònlại gọi là các hệ số AC (xoay chiều) Theo lý thuyết, biến đổi DCT khôngđem lại sự mất mát thông tin ảnh, mà đon giản nó chỉ chuyển thông tinảnh sang miền không gian mói thuật lợi hon cho mã hoá ở bước tiếp theo.(c) Mảng hai chiều các hệ số biến đổi được lượng tử hoá sử dụng bộ lượng tửhóa tỉ lệ đồng nhất Nghĩa là các hệ số sẽ được lượng tử hoá riêng lẻ vàđộc lập Quá trình lượng tử hoá là dựa trên sinh lý của hệ thống mắtngười: cảm nhận hình ảnh có độ nhậy kém hon ở các hệ số tần số cao và
có độ nhậy tốt hơn ở các hệ số có tần số thấp Vì thế các hệ số được chọnsao cho thực hiện lượng tử hoá thô đối vói các hệ số tần số cao và lượng
tử hoá tinh đối với các hệ số có tần số thấp Bảng lượng tử hoá được lấy tỉ
lệ để tạo ra các mức nén thay đổi tuỳ theo tốc độ bít và chất lượng ảnh.Việc lượng tử hoá sẽ tạo ra rất nhiều giá trị 0, đặc biệt là ở tần số cao Quátrình làm tròn trong khi lượng tử hoá chính là nguyên nhân chính gây ra
sự tổn hao nhưng lại là nhân tố chính đem lại hiệu suất nén
(d) Để tận dụng ưu điểm của các hệ số đã được lượng tử có giá trị gần bằng
0, mảng hai chiều các hệ số đã được lượng tử sẽ được sắp xếp theo hìnhZigzag tạo thành mảng một chiều Cách sắp xếp này cho phép giảm thiểunăng lượng tổn hao trung bình và tạo ra dãy các giá trị bằng 0 liên tiếp.Cũng theo cách sắp xếp này, các hệ số DC được tách khỏi các hệ so AC
và sử dụng kỹ thuật mã hoá điều xung mã vi sai - DPCM
Trang 26(e) Bước cuối cùng của bộ mã hoá là sử dụng mã hoá entropy chẳng hạn mãhoá Huffman cho các AC và DC (sau khi đã mã hoá DPCM) để tăngthêm hiệu quả nén cũng như giảm thiểu lỗi.
Ở phía giải mã, luồng bít mã hoá được giải mã entropy, sau đó mảng haichiều các hệ số DCT đã được lượng tử hoá được giải sắp xếp Zigzag và giảilượng tử Mảng hai chiều các hệ số DCT kết quả sẽ được biến đổi ГОСТ rồicộng mỗi giá trị với 128 để xấp xỉ tạo thành các khối ảnh con kích thước 8x8.Chú ý là bảng lượng tử hoá và mã hoá entropy ở cá phía mã hoá và giải mã làđồng nhất
Hai thành phần màu cũng được mã hoá tương tự như thành phần chói ngoạitrừ khác biệt là chúng được lấy mẫu xuống hệ số 2 hoặc 4 ở cả chiều ngang
và dọc trước khi biến đổi DCT Ở phía giải mã , thành phần màu sẽ được nộisuy thành kích thước gốc
2Л.2.2 Kỹ thuật mã hoá dựa trên phép biến đổi DWT
Mối quan hệ giữa biến đổi Wavelet và Fourier
Không giống như biến đổi Fourier chỉ thích hợp khi phân tích những tín hiệu
ồn định (stationary), Wavelet là phép biến đổi được sử dụng để phân tích các tín hiệu không ổn định (non-statỉonary) - là những tín hiệu có đáp ứng tần số
thay đổi theo thời gian
Đe khắc phục những hạn chế của biến đổi FT, phép biến đổi Fourier thòi gian ngắn - STFT được đề xuất Chỉ có một sự khác biệt nhỏ giữa STFT và
FT: Trong biến đổi STFT, tín hiệu được chia thành các khoảng nhỏ và trong
khoảng đó tín hiệu được giả định là tín hiệu ổn định Đe thực hiện kỹ thuật
này cần chọn một hàm cửa so w sao cho độ dài của cửa sổ đúng bằng các khoảng tín hiệu phân chia Với phép biến đổi STFT, chúng ta có thể thu được đáp ứng tần số - thời gian của tín hiệu đồng thời mà vói phép biến đổi FT ta
không thực hiện được
Biến đổi STFT đối với tín hiệu liên tục thực được định nghĩa như sau:
Trang 27X(f,t) = j[x(t)w (t-T)']e- Ỉ M > dt (2.12)
—00
Trong đó độ dài thời gian của cửa sổ là (t-ĩ), chúng ta có thể dịch chuyển vị trí của cửa sổ bằng cách thay đổi giá trị t và để thu được các đáp ứng tần số khác nhau của đoạn tín hiệu ta thay đổi giá trị T.
Giải thích biến đổi STFT bằng nguyên lý bất định Heỉssenber, nguyên lý này phát biểu là: Không thể biết được chỉnh xác được biểu diễn thời gian - tần so
của một tín hiệu (hay không thể biết các thành phần pho của tín hiệu ở một thời điếm nhất định) Cái mà ta có thế biết là trong một khoảng thòi gian nhất
định tín hiệu có những băng tần nào Đây được gọi là bài toán phân giải, vấn
đề này liên quan đến độ rộng của hàm cửa sổ mà chúng ta sử dụng Neu hàmcửa sổ càng hẹp thì độ phân giải càng tốt hon và giả định tín hiệu là ổn địnhcàng có độ chính xác nhưng độ phân giải tần số lại kém đi Ta có các hệ quảsau:
Cửa sổ hẹp -> phân giải thời gian tốt, phân giải tần so kém
Cửa sổ rộng -> phân giải tan so tốt, phân giải thời gian kém
Trên cơ sở cách tiếp cận biến đổi STFT, biến đổi Wavelet được phát triển để
giải quyết vấn đề về độ phân giải tín hiệu (miền thòi gian hoặc tần số) mà
STFT vẫn còn hạn chế Biến đổi Wavelet được thực hiện theo cách: tín hiệu
được nhân vói hàm Wavelet (tương tự như nhân với hàm cửa sổ trong biến đổi STFT), rồi thực hiện biến đổi riêng rẽ cho các khoảng tín hiệu khác nhau
trong miền thời gian tại các tần số khác nhau Cách tiếp cận như vậy còn được
gọi là: phân tích đa phân giải - MRA (Multỉ Resolution Analysis)', phân tích
tín hiệu ở các tần so khác nhau và cho các độ phân giải khác nhau.
MRA khi phân tích tín hiệu cho phép: phân giải thời gian tốt và phân giải tần
so kém ở các tần so cao; phân giải tần số tốt và phân giải thời gian kém ở các tần so thấp Như vậy kỹ thuật này rất thích họp với những tín hiệu: có các
thành phần tần số cao xuất hiện trong khoảng thời gian ngắn, các thành phần
Trang 28tần số thấp xuất hiện trong khoảng thời gian dài chẳng hạn như ảnh và khungảnh video.
Cơ sở toán học cũng như các tính chất của biến đổi Wavelet liên tục sẽ được
trình bầy chi tiết trong chương 3
Biến đổi Wavelet ròi rạc -DWT
Bước này có thể hiểu phép biến đồi DWT như là áp dụng một tập các bộ lọc:
thông cao và thông thấp Thiết kế các bộ lọc này tương đương như kỹ thuật
mã hoá băng con (subband coding) nghĩa là: chỉ cần thiết kế các bộ lọc thông
thấp, còn các bộ lọc thông cao chính là các bộ lọc thông thấp dịch pha đi một
góc 180° Tuy nhiên khác với mã hoá băng con, các bộ lọc trong DWT được thiết kế phải có đáp ứng phổ phảng, trơn và trực giao.
Hình 2.11 dưới đây minh hoạ dạng tổng quát của biến đổi DWT một chiều Theo đó tín hiệu được cho đi qua các bộ lọc thông cao và thông thấp H và G rồi được lấy mẫu xuống (down sampling) hệ số 2 tạo thành biến đổi DWTmức
1 Biến đổi ngược thì thực hiện ngược lại: lấy mẫu lên (up sampling) hệ số 2 rồi sử dụng các bộ lọc khôi phục H’, G’ (lý tưởng là H’ và ơ ’ chính là H, G).
Từ biến đổi DWT một chiều có thể mở rộng định nghĩa biến đổi DWT hai chiều theo cách: Sử dụng các bộ lọc riêng biệt, thực hiện biến đổi DWT một
chiều dữ liệu vào (ảnh) theo hàng rồi thực hiện theo cột Theo cách này nếu
thực hiện biến đổi DWT ở mức 1, sẽ tạo ra 4 nhóm hệ số biến đổi Quá trình biến đổi DWT hai chiều có thể minh hoạ như hình 2.12 dưới đây, trong đó 4
Hình 2.8 Bank lọc khôi phục lý thuyết sử dụng DWT 1D
Trang 29nhóm hệ số là: LL, HL, LH, HH (chữ cái đầu tiên tương ứng đã thực hiện lọc
theo hàng, chữ cái thứ hai tương ứng đã thực hiện lọc theo cột)
Hình 2.10(b) Minh hoạ DWT\ùều dyadic mức 3 để nén ảnh
Hai thuật toán nén sử AxmgDWT điển hình
So với biến phép biến đổi DCT sử dụng trong chuẩn nén JPEG ra đòi
1992, nén ảnh dựa trên biến đổi DWT đã có những cải tiến đáng kể Tuy
Trang 30nhiên cải tiến mang tính đột phá sử dụng DWT để nén ảnh bắt đầu là kỹ thuật
mã hoá - EZW (embedded zero-tree wavelet).
Thuật toán EZW dựa trên khả năng khai thác các thuộc tính đa phân giải của biến đổi Wavelet để đưa ra một thuật toán ít phức tạp trong tính toán
mà vẫn cho hiệu quả nén cao Những cải tiến và nâng cấp của EZW về sau đã
ra đời một số thuật toán tương tự như: SPIHT (set partitatỉonỉng ỉn
hierarchical tree - cây phân cấp phân tập) và ZTE (zero-tree entropy coding
- mã hoá entropy cây zero).
Gần đây còn có thêm một thuật toán nữa được đề xuất đó là LS (lifting
scheme) sử dụng để tạo các biến đổi Wavelet số nguyên Kỹ thuật này sử
dụng các bộ lọc Wavelet trực giao đem lại hiệu quả rất cao cho các ứng dụng
nén ảnh có tổn hao Chúng ta sẽ trình bầy 3 thuật toán điển mình này ởchương 3
CHƯƠNG 3:CƠ SỞ LÝ THUYẾT BIỂN ĐỐI
hoặc phức liên tục nào thoả mãn các tính chất sau đây:
Tích phân suy rộng trên toàn bộ trục t của hàm y/(t) là bằng 0 Tức là:
J \ự(t)dt- 0 (3.1)
-00
Tích phân năng lượng của hàm trên toàn bộ trục t là một số hữu hạn,
tức là:
Trang 31J |^(í)|2 dt < 00 (3.2)
-00
Điều kiện (3.2) có nghĩa là hàm y/(t) phải là một hàm bình phương khả tích nghĩa là hàm y/(t) thuộc không gian £2(^) các hàm bình phương khả tích
Sau khi hàm Wavelet y/(t) được lựa chọn, biến đổi Wavelet liên tục của
một hàm bình phương khả tích /(t) được tính theo công thức:
Theo toán học ta gọi đây là tích vô hướng của hai hàm f(t) và ụ/ ah (t) Giá trị —
ỊLr là hệ số chuẩn hoá để đảm bảo rằng tích phân năng lượng của
’ л/м
hàm ụ/ a h (í) sẽ độc lập vói a và b :
J \ V a j b (0| 2 d t = \ \ v (0| 2 d t (3 -6)
—00 —00
Với mỗi giá trị của a thì \ị/ ft(í) là một bản sao của \ự 0(í) được
dịch đi b đơn vị trên trục thời gian Do đó b được gọi là tham số dịch Đặt tham số dịch b = 0 ta thu được:
Trang 32Khi a > 1 thì hàm Wavelet sẽ được trải rộng còn khi 0 < a < 1 thì hàm
sẽ được co lại Sau đây chúng ta sẽ định nghĩa phép biến đổi ngược của biến đổi Wavelet liên tục Gọi Ч'(й)) là biến đổi Fourier của y/(t):
-00
Nếu w(a,b) là biến đổi CWT của /(/) bằng hàm Wavelet thì biến đổi
ngược của biến đổi CWT sẽ được tính như sau:
/ w = Г ĩV^ịt)dadb
(3.9) a
vói giá trị của С được định nghĩa là:
C= ự\ỵụặ_ dc0 (3 10 J J ^° \ơ)\
Biến đổi CWT chỉ tồn tại nếu с dương và hữu hạn Do đó с được gọi là điều
kiện tồn tại của biến đổi Wavelet Cùng với hai điều kiện đã
nêu ở trên, đây là điều kiện thứ 3 mà một hàm cần phải thoả mãn để có thể
được lựa chọn làm hàm Wavelet Chúng ta có thể xem biến đổi CWT như là
một ma trận hai chiều các kết quả của phép tính tích vô hướng giữa hai hàm
f(t) và y/ a h (í) Các hàng của ma trận tương ứng với các giá
trị của a và các cột tương ứng với các giá trị của b do cách tính biến đổi
Wavelet theo tích vô hướng đã trình bày ở trên:
{ f ( t ) , g ( t ) ) = ị l s f ( t ) g ' { t ) d t ^ ( f ( t ) , ụ , i i h ( t ) ) = Ị ^ f { t ) v / l , l l ( i ) d t (3-11)
3.1.2 Biến đổi Wavelet ròi rạc
Việc tính toán các hệ so Wavelet tại tất cả các tỉ lệ là một công việc hết
sức phức tạp Neu tính toán như vậy sẽ tạo ra một lượng dữ liệu khổng lồ Đegiảm thiểu công việc tính toán người ta chỉ chọn ra một tập nhỏ các giá trị tỉ
lệ và các vị trí để tiến hành tính toán Hơn nữa nếu việc tính toán được tiến
hành tại các tỷ lệ và các vị trí trên cơ sở luỹ thừa cơ số 2 thì kết quả thu được
sẽ hiệu quả và chính xác hon rất nhiều Quá trình chọn các tỷ lệ và các vị trí
để tính toán như trên tạo thành lưới nhị tố (dyadic) Một phân tích như trên
Trang 33hoàn toàn có thể thực hiện được nhờ biến đổi Wavelet rời rạc (.DWT) Do đó, việc tính toán biến đổi DWT thực chất là sự rời rạc hoá biến đổi Wavelet liên tục (CWT); việc rời rạc hoá được thực hiện vói sự lựa chọn các hệ số a và b
như sau: a = 2 m ;b = 2 m n; m,neZ (3.12)
Việc tính toán hệ số của biến đổi Wavelet có thể dễ dàng thực hiện bằng các băng lọc số nhiều nhịp đa kênh, một lý thuyết rất quen thuộc trong
xử lý tín hiệu
Hình 3.1 Minh hoạ lưói nhị tố dyadic với các giá trị của m và n
3.2 Tính chất của biến đổi Wavelet
Tất cả chúng ta đều biết rằng biến đổi Fourier là một biến đổi đã và
đang được áp dụng rộng rãi trong nhiều ngành khoa học và kỹ thuật khác
nhau Biến đổi Fourier chuyển một hàm tín hiệu từ miền thời gian sang miền tần số Sử dụng biến đổi Fourier ta có thể biết được trong tín hiệu f(t) có các thành phần tần số nào Tuy nhiên biến đổi Fourier có
một nhược điểm cơ bản là vói một tín hiệu f(t) ta không thể biết được
rằng tại một thòi điểm t thì tín hiệu có các thành phần tần số nào Một phép biến đổi tốt hon biến đổi Fourier phải là phép biến đổi có đầy đủ tính năng của biến đổi Fourier và có khả năng xác định xem tại một thời điểm t bất kỳ trong tín hiệu f(t) có thành phần tần số nào Phép biến đổi
Wavelet ra đời đã khắc phục được các nhược điểm của biến đổi Fourier trong
phân tích tín hiệu Biến đổi Wavelet dù chỉ làm việc với các tín hiệu một