Luận văn cao học Điện tử viễn thông Đề tài : Nén ảnh sử dụng biến đổi WAVELET và ứng dụng trong các dịch vụ dữ liệu đa phương tiện đi động
Luận văn cao học ĐTVT 2004 – 2006 Đỗ Ngọc Anh BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SỸ KHOA HỌC NÉN ẢNH SỬ DỤNG BIẾN ĐỔI WAVELET VÀ ỨNG DỤNG TRONG CÁC DỊCH VỤ DỮ LIỆU ĐA PHƯƠNG TIỆN DI ĐỘNG NGHÀNH: ĐIỆN TỬ VIỄN THÔNG ĐỖ NGỌC ANH Người hướng dẫn khoa học: PGS.TS. Nguyễn Đức Thuận HÀ NỘI 2006 Luận văn cao học ĐTVT 2004 – 2006 Đỗ Ngọc Anh MỤC LỤC CÁC HÌNH VẼ, BẢNG BIỂU TRONG LUẬN VĂN 5 THUẬT NGỮ TIẾNG ANH 7 LỜI GIỚI THIỆU 8 CHƯƠNG 1: MỞ ĐẦU 9 1.1. Cơ sở nghiên cứu và mục đích của luận văn 9 1.2. Tổ chức luận văn 10 CHƯƠNG 2:TỔNG QUAN CÁC KỸ THUẬT NÉN TRONG MÃ HOÁ ẢNH 11 2.1. Giới thiệu chung về nén ảnh số 11 2.2. Phân loại các kỹ thuật nén 13 2.2.1. Nén tổn hao và không tổn hao 13 2.2.2. Mã hoá dự đoán và mã hoá dựa trên phép biến đổi 13 2.2.3. Mã hoá băng con 14 2.3. Tiêu chuẩn đánh giá chất lượng mã hoá ảnh 14 2.4.Các kỹ thuật nén có tổn hao 15 2.4.1. Kỹ thuật mã hoá băng con 15 2.4.2. Kỹ thuật mã hoá dựa trên phép biến đổi 19 2.4.2.1. Kỹ thuật mã hoá dựa trên phép biến đổi DCT 19 2.4.2.2. Kỹ thuật mã hoá dựa trên phép biến đổi DWT 25 CHƯƠNG 3:CƠ SỞ LÝ THUYẾT BIẾN ĐỔI WAVELET 30 3.1. Cơ sở toán học 30 3.1.1. Biến đổi Wavelet liên tục 30 3.1.2. Biến đổi Wavelet rời rạc 32 3.2. Tính chất của biến đổi Wavelet 33 3.3. Giới thiệu một số họ Wavelet 37 3.3.1. Biến đổi Wavelet Haar 37 3.3.2. Biến đổi Wavelet Meyer 38 Luận văn cao học ĐTVT 2004 – 2006 Đỗ Ngọc Anh 3.3.3. Biến đổi Wavelet Daubechies 38 3.4. Một số ứng dụng nổi bật của Wavelet 39 3.4.1. Nén tín hiệu 39 3.4.2. Khử nhiễu 40 3.4.3. Mã hoá nguồn và mã hoá kênh 40 CHƯƠNG 4:CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI WAVELET – JPEG2000 41 4.1. Lịch sử ra đời và phát triển chuẩn JPEG2000 41 4.2. Các tính năng của JPEG2000 41 4.3. Các bước thực hiện nén ảnh theo chuẩn JPEG2000 42 4.3.1. Xử lý trước biến đổi 42 4.3.2. Biến đổi liên thành phần 42 4.3.3. Biến đổi riêng thành phần (biến đổi Wavelet) 43 4.3.4.Lượng tử hoá - Giải lượng tử hoá 44 4.3.5. Mã hoá và kết hợp dòng dữ liệu sau mã hoá 45 4.3.6. Phương pháp mã hoá SPIHT 45 4.3.7. Phương pháp mã hoá EZW 47 4.4. So sánh chuẩn JPEG2000 với JPEG và các chuẩn nén ảnh tĩnh khác 49 CHƯƠNG 5:ỨNG DỤNG WAVELET TRONG CÁC DỊCH VỤ DỮ LIỆU ĐA PHƯƠNG TIỆN TRONG THÔNG TIN DI ĐỘNG 54 5.1. Nén ảnh bằng Wavelet 54 5.2.1. Sơ đồ khối tổng quát 54 5.1.2. Biến đổi Wavelet 55 5.1.3. Tính toán năng lượng tiêu hao 56 5.2. Thuật toán nén ảnh bằng Wavelet hiệu năng - EEW 58 5.2.1. Hiệu năng của các kỹ thuật loại bỏ 60 5.3.2. Các kết quả thực nghiệm 62 5.3.2.1. Ảnh hưởng đến năng lượng tính toán và chất lượng ảnh 62 Luận văn cao học ĐTVT 2004 – 2006 Đỗ Ngọc Anh 5.3.2.2. Ảnh hưởng đến năng lượng truyền thông và chất lượng ảnh 62 5.4. Các tham số nén ảnh bằng Wavelet 62 5.4.1. Thay đổi mức biến đổi Wavelet 62 5.4.2. Thay đổi các mức lượng tử 62 5.5. Truyền ảnh trên mạng 62 5.5.1. Phương pháp lựa chọn tham số động 62 5.5.2. Kết quả thực nghiệm 62 KẾT LUẬN 63 Kết quả đạt được và ứng dụng của luận văn 63 Hướng phát triển nghiên cứu 63 PHỤ LỤC 65 TÀI LIỆU THAM KHẢO 66 Luận văn cao học ĐTVT 2004 – 2006 Đỗ Ngọc Anh CÁC HÌNH VẼ, BẢNG BIỂU TRONG LUẬN VĂN Hình 2.1 Sơ đồ bộ khái quát hệ thống nén ảnh 12 Hình 2.2. Sơ đồ minh hoạ kỹ thuật mã hoá băng con – M băng con 16 Hình 2.3 Minh hoạ quá trình phân ly băng con cây bát phân 17 Hình 2.4. Phân ly hai ảnh mẫu thành bốn băng con 18 Hình 2.5. Sơ đồ bộ mã hoá theo chuẩn JPEG 23 Hình 2.6. Sắp xếp Zigzag các hệ số DCT ở bộ mã hoá 23 Hình 2.7. Sơ đồ khối bộ giải mã theo chuẩn JPEG 23 Hình 2.8. Bank lọc khôi phục lý thuyết sử dụng DWT 1D 28 Hình 2.9. Minh hoạ DWT hai chiều cho ảnh 28 Hình 2.10(a). Minh hoạ DWT kiểu dyadic mức 3 để nén ảnh 28 Hình 2.10(b). Minh hoạ DWT kiểu dyadic mức 3 để nén ảnh 29 Hình 3.1. Minh hoạ lưới nhị tố dyadic với các giá trị của m và n 33 Hình 3.2. Phân tích đa phân giải áp dụng cho biểu diễn tín hiệu 36 Hình 3.3. Hàm () t ψ của biến đổi Haar 38 Hình 3.4: Hàm ( ) t ψ của biến đổi Meyer 38 Hình 3.5. Hàm () t ψ của họ biến đổi Daubechies n với n=2, 3, 7, 8 39 Hình 4.1: Trình tự mã hoá (a) và giải mã JPEG2000 (b) 42 Hình 4.2: Minh hoạ ảnh với RGB và YCrCb 43 Hình 4.3: Phương pháp Lifting 1D dùng tính toán biến đổi Wavelet 44 Hình 4.4: Minh hoạ cây tứ phân (a) và sự phân mức (b) 47 Hình 4.5: Hai cách sắp xếp thứ tự các hệ số biến đổi 48 Hình 4.6: So sánh JPEG và JPEG2000 50 Bảng 4.1: So sánh JPEG và JPEG2000 51 Hình 4.7: Minh hoạ tính năng ROI 52 Bảng 4.2: So sánh tính năng của JPEG2000 với các chuẩn nén ảnh tĩnh khác 53 Hình 5.1. Sơ đồ khối quá trình nén ảnh bằng Wavelet 54 Luận văn cao học ĐTVT 2004 – 2006 Đỗ Ngọc Anh Hình 5.2. (a) Biến đổi Wavelet 2D mức 3 và (b) Minh hoạ bằng ảnh “CASTLE” 56 Hình 5.3. Phân bố số học các hệ số thông cao sau phép biến đổi Wavelet mức 2 59 Hình 5.4: Dữ liệu sau phép biến đổi Wavelet với hai kỹ thuật loại bỏ HH và H* 61 Luận văn cao học ĐTVT 2004 – 2006 Đỗ Ngọc Anh THUẬT NGỮ TIẾNG ANH CWT Biến đổi Wavelet liên tục (Continuous Wavelet Transform) DCT Biến đổi Cosine rời rạc (Discrete Cosine Transform) DFT Biến đổi Fourier rời rạc (Discrete Fourier Transform) DPCM Điều xung mã vi sai (Differized Pulse Code Modulation) DWT Biến đổi Wavelet rời rạc (Discrete Wavelet Transform) EZW Wavelet cây zero (Embedded Zerotree Wavelet) HVS Hệ thống cảm nhận hình ảnh của mắt người (Human Visual System) IDWT Biến đổi Wavelet rời rạc ngược JPEG Chuẩn nén ảnh của ủy ban JPEG quốc tế (Joint Photographic Experts Group) JPEG2000 Chuẩn nén ảnh JPEG2000 Lossless Compression Kỹ thuật nén ảnh không tổn hao (không mất dữ liệu) Lossy Compression Kỹ thuật nén ảnh có tổn hao (có mất dữ liệu) MRA Phân tích đa phân giải (Multi Resolution Analysis) MSE Sai số bình phương trung bình (Mean Square Error) PCM Điều xung mã (Pulse Code Modulation) PSNR Tỷ số tín hiệu đỉnh trên nhiễu (Peak Signal to Noise Ratio) QMF Lọc gương cầu tứ phương (Quardrature Mirror Filters) RLC Mã hoá loạt dài (Run Length Coding) ROI Kỹ thuật mã hóa ảnh theo vùng (Region Of Interest) – Một tính năng mới nổi bật của JPEG2000 SPIHT Phương pháp mã hoá phân cấp theo vùng (Set partitioning in hierarchical trees) STFT Biến đổi Fourier thời gian ngắn (Short Time Fourier Transform) Wavelet Biến đổi băng con Wavelet Wavelet Decomposition Tree Cây phân giải Wavelet Luận văn cao học ĐTVT 2004 – 2006 Đỗ Ngọc Anh LỜI GIỚI THIỆU Trong những năm gần đây, nhu cầu các dịch vụ dữ liệu trên mạng di động, nhất là dữ liệu đa phương tiện là rất lớn. Cùng với nhu cầu đó, vấn đề đặt ra là làm thế nào tìm được một kỹ thuật mã hoá dữ liệu then chốt (chuẩn), có hiệu quả để truyền các dữ liệu này trên mạng di động. Mục đích của luận văn là trình bầ y một kỹ thuật nén ảnh sử dụng biến đổi Wavelet cho ảnh tĩnh và đặc biệt là ảnh tĩnh trong các dịch vụ dữ liệu đa phương tiện trong mạng di động. So với các kỹ thuật nén sử dụng phép biến đổi trước đây như biến đổi Fourier (FT), biến đổi cosine rời rạc (DCT), biến đổi xếp chồng (LT), , biế n đổi Wavelet (DWT) có nhiều ưu điểm không chỉ trong xử lý ảnh mà còn nhiều ứng dụng khác. Bằng chứng là sự ra đời của chuẩn nén JPEG2000 (dựa trên DWT) có tính năng vượt trội so với JPEG (DCT). Tuy nhiên chuẩn JPEG, MPEG hay ngay cả JPEG2000 cũng chỉ tập trung vào hiệu quả nén (tỉ số nén) và chất lượng ảnh mà không chú ý đến năng lượng tiêu hao trong quá trình xử lý và truyền trên mạ ng. Trong luận văn đã trình bầy một kỹ thuật nén ảnh trong mạng di động sử dụng biến đổi Wavelet hiệu năng không chỉ đem lại hiệu quả nén, chất lượng hình ảnh mà còn tiết kiệm năng lượng xử lý của hệ thống. Điều này hứa hẹn có thể xây dựng một bộ mã hoá ảnh tiết kiệm năng lượng xử lý, thời gian truy ền mà vẫn phù hợp với điều kiện băng thông thấp, ràng buộc về chất lượng dữ liệu trong các mạng thông tin di động. Luận văn cao học ĐTVT 2004 – 2006 Đỗ Ngọc Anh CHƯƠNG 1: MỞ ĐẦU 1.1. Cơ sở nghiên cứu và mục đích của luận văn Để có thể sử dụng các dịch vụ Internet không dây cũng như nhiều dịch vụ dữ liệu khác trên nền các ứng dụng di động cần có một kỹ thuật then chốt để có thể hỗ trợ truyền thông nhiều dạng dữ liệu trong thông tin di động tế bào như: thoại, văn bản, hình ảnh và video. Tuy nhiên vấn đề truyền thông nội dung đa phương tiện trong thông tin di động gặp một số khó khăn : băng thông của mạng di động tế bào, nhiễu kênh, giới hạn của pin cho các ứng dụng, tính tương thích dữ liệu giữa các thuê bao. Trong khi việc cải thiện băng thông di động cần một công nghệ mới của tương lai còn việc cải thiện giới hạn của pin không đáp ứng được sự phát tri ển của các dịch vụ tương lai, thì phương pháp giảm kích thước dữ liệu bằng các kỹ thuật nén là một cách tiếp cận hiệu quả giải quyết các khó khăn trên. Mặc dù cho đến nay có rất nhiều kỹ thuật nén dữ liệu đa phương tiện như: chuẩn JPEG (dựa trên biến đổi DCT), chuẩn JPEG2000 (dựa trên biến đổi Wavelet) và chuẩn MPEG, tuy nhiên nhữ ng kỹ thuật này chỉ tập trung vào hiệu quả nén và cố gắng đánh mất chất lượng ảnh ít vì thế chúng bỏ qua vấn đề tiêu hao năng lượng trong quá trình nén và truyền RF (trong thông tin động). Luận văn này trình bầy một kỹ thuật hiệu quả để khắc phục những khó khăn trên cho loại dữ liệu đa phương tiện điển hình trong thông tin di động là ảnh tĩnh. Đó là kỹ thu ật nén ảnh sử dụng biến đổi Wavelet thích nghi và hiệu năng cho dữ liệu đa phương tiện trong thông tin di động. Luận văn cao học ĐTVT 2004 – 2006 Đỗ Ngọc Anh 1.2. Tổ chức luận văn Luận văn được trình bầy thành 5 chương và 1 phụ lục. Chương 1, tác giả trình bày tóm tắt cơ sở nghiên cứu và mục đích cũng như tổ chức của luận văn. Chương 2 trình bầy khái quát các kỹ thuật nén ảnh, phân loại các nguyên lý nén và định nghĩa một số thuật ngữ được sử dụng rộng rãi như MSE, PSNR và SNR. Chương này cũng trình bầ y cơ sở lý thuyết của các nguyên lý nén có tổn hao điển hình như: mã hoá băng con; mã hoá dựa trên biến đổi cosine rời rạc (DCT), biến đổi xếp chồng (LT), biến đổi Wavelet rời rạc (DWT). Chương 3 trình bầy cơ sở toán học, tính chất của biến đổi Wavelet. Nội dung của chương này là lý thuết nền tảng cho các ứng dụng Wavelet. Chương này cũng đư a ra một số họ Wavelet phổ biến và giới thiệu một số ứng dụng nổi bật của Wavelet ngoài ứng dụng để nén ảnh. Chương 4 giới thiệu tổng quan về chuẩn nén JPEG2000 dựa trên biến đổi Wavelet. Mục đích không chỉ là giới thiệu một chuẩn nén vượt trội so với chuẩn JPEG dựa trên biến đổi DCT mà còn đưa ra mộ t lựa chọn giải quyết bài toán đặt ra trong luận văn. JPEG2000 đang từng bước được tổ chức ISO công nhận nên chắc chắn sẽ trở thành một chuẩn nén phổ biến trong các ứng dụng di động tương lai. Cũng trong chương này, tác giả trình bầy tóm tắt các bước thực hiện nén ảnh theo JPEG200 và so sánh nó với chuẩn JPEG và các chuẩn nén ảnh tĩnh khác. Chương 5 cũng là chương quan trọng nhấ t. Dựa trên kỹ thuật nén ảnh bằng Wavelet, luận văn đưa ra một thuật toán biến đổi ảnh bằng Wavelet hiệu năng làm giảm đáng kể năng lượng tính toán và truyền thông cần thiết cho ảnh mà vẫn đảm bảo được chất lượng bức ảnh (và như vậy giảm được giá thành dịch vụ). [...]... Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 Hình 2.5 Sơ đồ bộ mã hoá theo chuẩn JPEG Hình 2.6 Sắp xếp Zigzag các hệ số DCT ở bộ mã hoá Hình 2.7 Sơ đồ khối bộ giải mã theo chuẩn JPEG Quá trình xử lý thành phần độ chói ở phía mã hoá được giải thích như sau: (a) Ảnh gốc được chia thành các khối ảnh (block) nhỏ kích thước 8x8 không chồng chéo lên nhau Tiếp theo, giá trị của mỗi điểm ảnh ở Đỗ Ngọc Anh Luận... / Kích thước dữ liệu nén Đối với ảnh tĩnh, kích thước chính là số bít để biểu diễn toàn bộ bức ảnh Đối với ảnh video, kích thước chính là số bít để biểu diễn một khung hình video (video frame) Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 2.2 Phân loại các kỹ thuật nén Các kỹ thuật nén chủ yếu được phân loại như sau: 2.2.1 Nén tổn hao và không tổn hao Trong các kỹ thuật nén không tổn hao (losses compression),... lượng của mình) đã gói gọn toàn bộ năng lượng bức ảnh chỉ bằng một số ít các hệ số, số lớn các hệ số còn lại ít có ý nghĩa hơn sẽ bị loại bỏ sau khi lượng tử hoá và như vậy lượng dữ liệu phải Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 truyền nhỏ đi rất nhiều Trong phương pháp mã hoá dự đoán, sai lệch giữa ảnh gốc và ảnh dự đoán vẫn có ý nghĩa (còn sử dụng ở bước tiếp theo) sau khi lượng tử hoá,... gốc và ảnh khôi phục Một tham số khác hay sử dụng trong các hệ thông viễn thông đó là tỉ số tín hiệu trên nhiễu - SNR , tuy vậy SNR sử dụng cho một hệ thống né ảnh cũng có công thức dB như sau: Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 SNR = 10log10 Encoder input energy Noise energy (2.3) 2.4.Các kỹ thuật nén có tổn hao Trong phần này, tác giả lựa chọn trình bày hai kỹ thuật nén tổn hao cho nén ảnh... đáp ứng tổng hợp từ tất cả các bộ lọc bao trùm tất cả băng tần của ảnh Tuy nhiên trong thực tế, sự tương quan tổng không bao giờ đạt được do những bộ lọc này chỉ xấp xỉ với các bộ lọc lý tưởng Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 Hình 2.2 dưới đây là sơ đồ tổng quát giải thích kỹ thuật mã hoá băng con Hình 2.2 Sơ đồ minh hoạ kỹ thuật mã hoá băng con – M băng con Các bộ lọc sử dụng trong mã... con tần số cao và thấp, sau đó tiếp tục phân ly nhưng chỉ áp dụng cho băng con tần số thấp để tạo thành các băng con tần số cao và thấp để tiếp tục lược bỏ Kỹ thuật này rất phổ biến và cũng được Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 áp dụng trong các bộ mã sử dụng biến đổi Wavelet Đầu ra của các băng con sau khi đã giản lược sẽ được lượng tử hoá và mã hoá độc lập Mỗi băng con sẽ sử dụng bộ lượng... chia miền tần số - không gian hai chiều của ảnh gốc thành các băng khác nhau ở bất kỳ mức nào Hình 2.4 dưới đây minh hoạ việc phân ly 2 ảnh mẫu thành 4 băng con LL, HL, LH và HH ở mức đầu tiên Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 Hình 2.4 Phân ly hai ảnh mẫu thành bốn băng con Nhược điểm của kỹ thuật mã hoá băng con: Một trong những vấn để chủ yếu của kỹ thuật mã hoá băng con đó là giải quyết... hoá tối ưu cho các ứng dụng tốc độ bít thấp Việc cấp phát bít tối ưu sẽ thay đổi khi tốc độ bít tổng thay đổi, điều này làm quá trình mã hoá phải lặp lại hoàn toàn cho mỗi tốc độ bít xác định Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 Không hoàn toàn giải tương quan cho tất cả các băng tần, đấy là do các bộ lọc không phải là lý tưởng và có sự chồng chéo nhỏ giữa các băng tần liền kề Do vậy luôn... từ miền không gian sang miền tần số để có thể biểu diễn dưới dạng gọn hơn Tính chất của nó tương tự như biến đổi Fourier, coi ảnh đầu vào (tín hiệu audio hoặc video) là các tín hiệu ổn định bất Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 biến theo thời gian Để hiểu rõ kỹ thuật này trước hết ta cần tìm hiểu biến đổi Fourier Biến đổi Fourier – FT Biến đổi Fourier – FT (Fourier Transform) là một phép... đổi này Để có biến đổi Fourier rời rạc –DFT (Discrete Fourier Transform) thì ở phép tích phân trong biểu thức toán học của biến đổi FT, ta thay bằng phép tổng và tính toán nó với các mẫu hữu hạn Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 Hệ số phép biến đổi DFT thứ k của một chuỗi gồm N mẫu {x(n)} được định nghĩa: X(k) = N −1 ∑ x(n)W n =0 kn N , k=0,………., N-1 (2.6) Trong đó WN = e − j 2Π / N = cos