Nghiên cứu một số kỹ thuật nén dữ liệu dựa trên phép biến đổi sóng nhỏ rời rạc và ứng dụng trong máy ảnh kỹ thuật số
Trang 1=-=.LỜI CẢM ƠN
Tôi xin bày tỏ lòng biết ơn sâu sắc đến TS Bùi Thế Hồng đã tận tình hướng dẫn, chỉ bảo và hết lòng giúp đỡ để tôi có thể hoàn thành luận văn của mình
Xin cảm ơn Khoa Công nghệ thông tin – Đại học Thái Nguyên đã tạo điều kiện giúp đỡ tôi trong suốt quá trình làm luận văn nghiên cứu
Thái Nguyên, ngày tháng năm 2009
Tác giả luận văn
DỤNG TRONG MÁY ẢNH KỸ THUẬT SỐ
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
THÁI NGUYÊN - 2009
Trang 2ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN
NGUYỄN HỒNGN NGỌC
NGHIÊN CỨU MỘT SỐ KỸ THUẬT NÉN DỮ LIỆU DỰA TRÊN PHÉP BIẾN ĐỔI SÓNG NHỎ RỜI RẠC VÀ ỨNG
DỤNG TRONG MÁY ẢNH KỸ THUẬT SỐ
Chuyên ngành: Khoa học máy tính Mã số: 60.48.01
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS BÙI THẾ HỒNG
THÁI NGUYÊN - 2009
Trang 3LỜI CẢM ƠN
Tôi xin bày tỏ lòng biết ơn sâu sắc đến thày giáo TS Bùi Thế Hồng -
Viện Công nghệ Thông tin thuộc Viện Khoa học và Công nghệ Việt Nam là người đã trực tiếp hướng dẫn, chỉ bảo tận tình và hết lòng giúp đỡ tôi trong suốt thời gian làm luận văn này
Xin cảm ơn các thày giáo, cô giáo, công tác tại Phòng Cơ sở dữ liệu – Viện Công nghệ thông tin, các thầy cô giáo công tác tại Khoa công nghệ thông tin – ĐHTN, cùng tập thể các bạn học viên lớp cao học Khóa 6 đã luôn giúp đỡ, động viên và nhiệt tình chia sẻ với tôi những kinh nghiệm học tập, nghiên cứu trong suốt khoá học
Xin được cảm ơn Ban lãnh đạo Trường CĐCN Việt đức, cùng toàn thể các bạn đồng nghiệp trong Khoa CNTT đã nhiệt tình tạo điều kiện giúp đỡ cả về thời gian, vật chất và tinh thần để tôi hoàn thành được khóa học của mình
Thái Nguyên, ngày 10 tháng 11 năm 2009
Học viên
Nguyễn Hồng Ngọc
Trang 4LỜI CAM ĐOAN
Tôi xin cam đoan toàn bộ nội dung bản luận văn này là do tôi tự sưu tầm, tra cứu và sắp xếp cho phù hợp với nội dung yêu cầu của đề tài
Nội dung luận văn này chưa từng được công bố hay xuất bản dưới bất kỳ hình thức nào và cũng không được sao chép từ bất kỳ một công trình nghiên cứu nào
Tất cả phần mã nguồn của chương trình đều do tôi tự thiết kế và xây dựng, trong đó có sử dụng một số thư viện chuẩn và các thuật toán được các tác giả xuất bản công khai và miễn phí trên mạng Internet
Nếu sai tôi xin tôi xin hoàn toàn chịu trách nhiệm
Thái Nguyên, ngày 10 tháng 11 năm 2009 Người cam đoan
Nguyễn Hồng Ngọc
Trang 5MỤC LỤC
CHƯƠNG 1 4
TỔNG QUAN VỀ CÁC KỸ THUẬT NÉN ẢNH 4
1.1 Giới thiệu chung về nén ảnh số 4
1.2 Phân loại các kỹ thuật nén 6
1.2.1 Nén tổn hao và không tổn hao 6
1.2.2 Mã hoá dự đoán và mã hoá dựa trên phép biến đổi 6
1.2.3 Mã hoá băng con 7
1.3 Tiêu chuẩn đánh giá chất lượng mã hoá ảnh 7
1.4 Các kỹ thuật nén có tổn hao 7
1.4.1 Kỹ thuật mã hoá băng con 7
1.4.2 Kỹ thuật mã hóa dựa trên phép biến đổi 9
1.4.2.1 Kỹ thuật mã hóa dựa trên phép biến đổi DCT 9
1.4.2.2 Kỹ thuật mã hoá dựa trên phép biến đổi DWT Mối quan hệ giữa biến đổi Wavelet và Fourier 10
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT CỦA BIẾN ĐỔI WAVELET 13
2.1 Cơ sở toán học 13
2.1.1 Biến đổi Wavelet liên tục 13
2.1.2 Biến đổi Wavelet rời rạc 13
2.1.3 Tính chất của biến đổi Wavelet 14
2.2 Giới thiệu một số họ Wavelet 15
2.2.1 Biến đổi Wavelet Haar 15
2.2.2 Biến đổi Wavelet Meyer 15
2.2.3 Biến đổi Wavelet Daubechies 16
2.3 Một số ứng dụng nổi bật của Wavelet 16
2.3.1 Nén tín hiệu 16
2.3.2 Khử nhiễu 17
Trang 62.3.3 Mã hoá nguồn và mã hoá kênh 17
CHƯƠNG 3 CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI WAVELET JPEG2000 18
3.1 Lịch sử ra đời và phát triển chuẩn JPEG2000 18
3.2 Các tính năng của JPEG2000 18
3.3 Các bước thực hiện nén ảnh theo chuẩn JPEG2000 19
3.3.1 Xử lý trước biến đổi 19
3.3.2 Biến đổi liên thành phần 19
3.3.3 Biến đổi riêng thành phần (biến đổi Wavelet) 20
3.3.4 Lượng tử hoá - Giải lượng tử hoá 20
3.3.5 Mã hoá và kết hợp dòng dữ liệu sau mã hoá 21
3.3.6 Phương pháp mã hoá SPIHT 21
3.3.7 Phương pháp mã hoá EZW 23
3.4 So sánh chuẩn JPEG2000 với JPEG và các chuẩn nén ảnh tĩnh khác 24
CHƯƠNG 4 ỨNG DỤNG THỦY VÂN TRONG MÁY ẢNH KỸ THUẬT SỐ 27
4.1 Giới thiệu về máy ảnh kỹ thuật số 27
4.2 Kỹ thuật thuỷ vân sử dụng phép biến đổi DWT 28
4.3 Đề xuất qui trình nén và thủy vân ảnh trong máy ảnh số 42
Trang 7CÁC HÌNH VẼ, BẢNG BIỂU TRONG LUẬN VĂN
Hình 1.2 Sơ đồ minh hoạ kỹ thuật mã hoá băng con – M băng con 8
Hình 2.1 Minh hoạ lưới nhị tố dyadic với các giá trị của m và n 14
Hình 3.1: Trình tự mã hoá (a) và giải mã JPEG2000 (b) 19
Hình 4.1 Lược đồ chung cho quá trình giấu tin 28 Hình 4.2 Lược đồ chung cho quá trình giải mã 29
Trang 8THUẬT NGỮ TIẾNG ANH
JPEG2000 MRA
MSE
PCM PSNR
RLC SPIHT
STFT
Wavelet
Wavelet Decomposition Tree
Biến đổi Wavelet liên tục (Continuous Wavelet Transform)
Biến đổi Cosine rời rạc (Discrete Cosine Transform)
Điều xung mã vi sai (Differized Pulse Code Modulation)
Biến đổi Wavelet rời rạc (Discrete Wavelet Transform)
Wavelet cây zero (Embedded Zerotree Wavelet)
Biến đổi Wavelet rời rạc ngược
Chuẩn nén ảnh của ủy ban JPEG quốc tế
(Joint Photographic Experts Group)
Mã hoá loạt dài (Run Length Coding)
Phương pháp mã hoá phân cấp theo vùng
(Set partitioning in hierarchical trees)
Biến đổi Fourier thời gian ngắn (Short Time Fourier Transform)
Biến đổi băng con Wavelet
Cây phân giải Wavelet
Trang 9MỞ ĐẦU
Trong thời đại của Internet, thông tin ngày càng được sử dụng rộng rãi và lượng thông tin được trao đổi qua mạng càng lớn mạnh Tuy nhiên, với lượng thông tin lớn như vậy thì nguy cơ truy cập dữ liệu trái phép cũng tăng lên Vì thế, nhu cầu đảm bảo an toàn và bảo vệ bản quyền và sở hữu trí tuệ sản phẩm đang là một nhu cầu cấp thiết Một trong những giải pháp hữu hiệu cho vấn đề này là giấu thông điệp vào những phương tiện chứa Phương tiện chứa được dùng phổ biến là các bức ảnh
Ngày nay, hầu hết các bức ảnh đều được chụp bằng các máy ảnh kỹ thuật số Để thu gọn độ lớn của các files ảnh, người ta đã sử dụng các kỹ thuật nén dữ liệu khác nhau và phát sinh ra các định dạng ảnh tương ứng Các kỹ thuật này có thể được nhúng trực tiếp vào trong ảnh và là một khâu trong qui trình tạo ảnh
Luận văn này nghiên cứu và đề xuất một kỹ thuật thủy vân các bức ảnh số ngay trong qui trình tạo ảnh được nén bằng kỹ thuật sóng nhỏ rời rạc DWT như là một minh chứng cho bản quyền tác giả khi cần thiết So với các kỹ thuật nén sử dụng phép biến đổi như biến đổi Fourier (FT), biến đổi cosine rời rạc (DCT), biến đổi xếp chồng (LT), , biến đổi Wavelet (DWT) có nhiều ưu điểm không chỉ trong xử lý ảnh mà còn nhiều ứng dụng khác Bằng chứng là sự ra đời của chuẩn nén JPEG2000 (dựa trên DWT) có tính năng vượt trội so với JPEG (DCT) Tuy nhiên chuẩn JPEG, MPEG hay ngay cả JPEG2000 cũng chỉ tập trung vào hiệu quả nén (tỉ số nén) và chất lượng Trong luận văn trình bầy một kỹ thuật nén ảnh sử dụng biến đổi Wavelet hiệu năng đem lại hiệu quả nén, chất lượng hình ảnh
Trang 10 Cơ sở nghiên cứu và mục đích của luận văn
Để có thể sử dụng các dịch vụ Internet và các thông tin số rộng rãi cần có một kỹ thuật, một công nghệ mang lại nhiều hứa hẹn trong ứng dụng bảo vệ bản quyền, không bị biến dạng, điều khiển truy cập đối với các dữ liệu đa phương tiện Phương pháp giảm kích thước dữ liệu bằng các kỹ thuật nén là một cách tiếp cận hiệu quả giải quyết các khó khăn trên
Mặc dù cho đến nay có rất nhiều kỹ thuật nén dữ liệu đa phương tiện
như: chuẩn JPEG (dựa trên biến đổi DCT), chuẩn JPEG2000 (dựa trên biến đổi Wavelet) và chuẩn MPEG, tuy nhiên những kỹ thuật này chỉ tập
trung vào hiệu quả nén và cố gắng đánh mất chất lượng ảnh ít vì thế chúng
bỏ qua vấn đề tiêu hao năng lượng trong quá trình nén và truyền Luận văn
này trình bầy một kỹ thuật hiệu quả để khắc phục những khó khăn trên cho
dữ liệu đa phương tiện Đó là kỹ thuật nén ảnh sử dụng biến đổi Wavelet
thích nghi, hiệu năng cho dữ liệu đa phương tiện trong thông tin và kỹ thuật nhúng thủy vân vào sản phẩm mà không ảnh hưởng đến chất lượng và bảo vệ bản quyền tác giả, đây là ứng dụng cơ bản bản nhất của kỹ thuật thủy vân số Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả gọi là thủy vân sẽ được nhúng vào trong các sản phẩm, thủy vân đó chỉ một mình người chủ sở hữu hợp pháp các sản phẩm đó có và được dùng làm minh chứng cho bản quyền sản phẩm
Tổ chức luận văn
Luận văn được trình bầy thành 4 chương và 1 phụ lục
Chương 1 trình bầy khái quát các kỹ thuật nén ảnh, phân loại các nguyên lý nén và định nghĩa một số thuật ngữ được sử dụng rộng rãi như
MSE, PSNR và SNR Chương này cũng trình bầy cơ sở lý thuyết của các
Trang 11nguyên lý nén có tổn hao điển hình như: mã hoá băng con; mã hoá dựa
trên biến đổi cosine rời rạc (DCT), biến đổi xếp chồng (LT), biến đổi Wavelet rời rạc (DWT)
Chương 2, trình bầy cơ sở toán học, tính chất của biến đổi Wavelet Nội dung của chương này là lý thuyết nền tảng cho các ứng dụng Wavelet
Chương 3, giới thiệu tổng quan về chuẩn nén JPEG2000 dựa trên biến đổi Wavelet Và trong chương này, trình bầy tóm tắt các bước thực hiện nén ảnh theo JPEG200 và so sánh nó với chuẩn JPEG và các chuẩn nén
ảnh tĩnh khác
Chương 4, t rình bày ứng dụng thủy vân trong máy ảnh kỹ thuật số
Trang 12CHƯƠNG 1
TỔNG QUAN VỀ CÁC KỸ THUẬT NÉN ẢNH
1.1 Giới thiệu chung về nén ảnh số
Nén ảnh số là một đề tài nghiên cứu rất phổ biến trong lĩnh vực xử lý dữ liệu đa phương tiện Mục đích là làm thế nào để lưu trữ bức ảnh dưới dạng có kích thước nhỏ hơn hay dưới dạng biểu diễn mà chỉ yêu cầu số bít mã hoá ít hơn so với bức ảnh gốc Nén ảnh thực hiện được là do một thực tế: thông tin trong bức ảnh không phải là ngẫu nhiên mà có trật tự, có tổ chức Vì thế nếu bóc tách được tính trật tự, cấu trúc đó thì sẽ biết được phần thông tin nào quan trọng nhất trong bức ảnh để biểu diễn và truyền đi với số lượng bít ít hơn so với ảnh gốc mà vẫn đảm bảo tính đầy đủ thông tin Ở phía thu, quá trình giải mã sẽ tổ chức, sắp xếp lại được bức ảnh xấp xỉ gần chính xác so với ảnh gốc nhưng vẫn thoả mãn chất lượng yêu cầu, đảm bảo đủ thông tin cần thiết
Tóm lại, tín hiệu ảnh, video hay audio đều có thể nén lại bởi chúng có những tính chất như sau:
Có sự tương quan (dư thừa) thông tin về không gian: Trong phạm vi một bức ảnh hay một khung video tồn tại sự tương quan đáng kể (dư thừa) giữa các điểm ảnh lân cận
Có sự tương quan (dư thừa) thông tin về phổ: Các dữ liệu thu được từ các bộ cảm biến của thiết bị thu nhận ảnh tồn tại sự tương quan đáng kể giữa các mẫu thu, đây chính là sự tương quan về phổ
Có sự tương quan (dư thừa) thông tin về thời gian: Trong một chuỗi ảnh video, tồn tại sự tương quan giữa các điểm ảnh của các
Trang 13khung video (frame)
Sơ đồ của một hệ thống nén dữ liệu tổng quát như sau:
Hình 1.1 Sơ đồ bộ khái quát hệ thống nén ảnh
Trong hình1.1, bộ mã hoá dữ liệu thực hiện quá trình nén bằng cách giảm kích thước dữ liệu ảnh gốc đến một mức phù hợp với việc lưu trữ và truyền dẫn trên kênh Tốc độ bít đầu ra của bộ mã hoá được tính là số bít cho một mẫu (điểm ảnh) Bộ mã hoá kênh thực hiện việc chuyển đổi luồng bít đã được nén thành dạng tín hiệu phù hợp cả cho việc lưu trữ và truyền
dẫn, thường bộ mã hoá kênh sử dụng các kỹ thuật: mã hoá có độ dài thay đổi – RLC (Run Length Coding)[4], mã hoá Huffman[4], mã hoá số học [4] Bộ giải mã thực hiện quá trình ngược lại so với bộ mã hoá
Trong các hệ thống nén, tỉ số nén chính là tham số quan trọng đánh giá khả năng nén của hệ thống, công thức được tính như sau:
Tỉ số nén = Kích thước dữ liệu gốc / Kích thước dữ liệu nén
Đối với ảnh tĩnh, kích thước chính là số bít để biểu diễn toàn bộ bức ảnh Đối với ảnh video, kích thước chính là số bít để biểu diễn một
khung hình video (video frame)
Trang 141.2 Phân loại các kỹ thuật nén
Các kỹ thuật nén chủ yếu được phân loại như sau:
1.2.1 Nén tổn hao và không tổn hao
Trong các kỹ thuật nén không tổn hao (losses compression), ảnh
khôi phục giống hoàn toàn so với ảnh gốc Tuy nhiên, nén không tổn hao
chỉ đạt được hiệu quả nén rất nhỏ Trái lại, các kỹ thuật nén có tổn hao (lossy compression) có thể đạt được hiệu quả nén cao hơn rất nhiều mà ở điều
kiện cảm nhận hình ảnh thông thường sự mất mát thông tin không cảm nhận được và vì thế vẫn đảm bảo chất lượng ảnh Một số kỹ thuật nén có tổn
hao gồm: điều xung mã vi sai – DPCM, điều xung mã – PCM, lượng tử hoá véctơ – VQ, mã hoá biến đổi và băng con Ảnh khôi phục trong hệ thống nén
có tổn hao luôn có sự suy giảm thông tin so với ảnh gốc bởi vì: phương pháp nén này đã loại bỏ những thông tin dư thừa không cần thiết
1.2.2 Mã hoá dự đoán và mã hoá dựa trên phép biến đổi
Đối với mã hoá dự đoán (predictive coding) các giá trị mang thông tin
đã được gửi hay đang sẵn có sẽ được sử dụng để dự đoán các giá trị khác, và chỉ mã hoá sự sai lệch giữa chúng Phương pháp này đơn giản và rất phù
hợp với việc khai thác các đặc tính cục bộ của bức ảnh Kỹ thuật DPCM
chính là một ví dụ điển hình của phương pháp này Trong khi đó, mã hoá
dựa trên phép biến đổi (transform based coding) thì lại thực hiện như sau:
trước tiên thực hiện phép biến đổi với ảnh để chuyển sự biểu diễn ảnh từ miền không gian sang một miền biểu diễn khác Các phép biến đổi
thường dùng là: DCT - biến đổi Cosine rời rạc, DWT - biến đổi Wavelet rời rạc, LT - biến đổi trồng (lapped) , tiếp đó thực hiện mã hoá đối với các hệ số
biến đổi Phương pháp này có hiệu suất nén cao hơn rất nhiều so với
Trang 15phương pháp nén dự đoán bởi vì chính các phép biến đổi (sử dụng các thuộc tính nén năng lượng của mình) đã gói gọn toàn bộ năng lượng bức ảnh chỉ bằng một số ít các hệ số, số lớn các hệ số còn lại ít có ý nghĩa hơn sẽ bị loại bỏ sau khi lượng tử hoá
1.2.3 Mã hoá băng con
Bản chất của kỹ thuật mã hoá băng con (subband coding) là chia băng tần của tín hiệu (ảnh) thành nhiều băng con (subband) Để mã hoá cho mỗi băng con, chúng ta sử dụng một bộ mã hoá và một tốc độ bít tương ứng với tính chất thống kê của băng con
1.3 Tiêu chuẩn đánh giá chất lượng mã hoá ảnh
Để đánh giá chất lượng của bức ảnh (hay khung ảnh video) ở đầu ra của bộ mã hoá, người ta thường sử dụng hai tham số: Sai số bình phương trung bình – MSE (mean square error) và tỉ số tín hiệu trên nhiễu đỉnh – PSNR (peak to signal to noise ratio) MSE thường được gọi là phương sai lượng tử
Một tham số khác hay sử dụng trong các hệ thông viễn thông đó là tỉ số tín hiệu trên nhiễu - SNR
1.4 Các kỹ thuật nén có tổn hao
Trong phần này, trình bày hai kỹ thuật nén tổn hao cho nén ảnh tĩnh và ảnh động đó là: mã hoá băng con (subband coding) và mã hoá sử dụng phép biến đổi (transform coding) Đây là hai kỹ thuật nén điển hình và cho hiệu quả nén cũng như chất lượng ảnh cao
1.4.1 Kỹ thuật mã hoá băng con
Tư tưởng chính của kỹ thuật mã hoá băng con là: các ảnh được lấy mẫu ở đầu vào được phân ly thành các băng tần khác nhau (gọi là các tín hiệu băng
Trang 16con) Yêu cầu của kỹ thuật này là làm thế nào các băng con không bị chồng chéo lên nhau Để có thể phân ly tín hiệu ở bộ mã hoá (encoder) thành các băng con, ảnh được cho qua một bank lọc (filter bank) gọi là bank lọc phân tích và mỗi đầu ra của bank lọc băng con được lấy mẫu xuống hệ số 2 Các đầu ra băng con tần số được lẫy mẫu xuống sẽ lần lượt được: lượng tử hoá độc lập bằng các bộ lọc vô hướng khác nhau, mã hoá entropy, lưu trữ và truyền đi Ở phía bộ giải mã (decoder), quá trình được thực hiện ngược lại: giải lượng tử băng con tần số, lấy mẫu lên với hệ số 2, cho đi qua bank lọc băng con tổng hợp rồi cộng tất cả các đầu ra của bộ lọc để khôi phục lại ảnh
Hình 1.2 dưới đây là sơ đồ tổng quát giải thích kỹ thuật mã hoá băng con
Hình 1.2 Sơ đồ minh hoạ kỹ thuật mã hoá băng con – M băng con
Trong các hệ thống mã hóa băng con hai chiều thực tế, người ta chia miền tần số - không gian hai chiều của ảnh gốc thành các băng khác nhau ở bất kỳ mức nào
Trang 171.4.2 Kỹ thuật mã hóa dựa trên phép biến đổi
Một phép biến đổi là một hàm toán học được sử dụng để biến đổi một tập các giá trị này thành một tập giá trị khác và tạo ra một cách biểu diễn mới cho cùng một nguồn tin Tất cả các phép biến đổi trình bầy dưới đây đều là không tổn hao (lossless); với sự chính xác của các phép toán số học thì các phép biến đổi vẫn bảo tồn được độ chính xác ở bất kỳ mức độ nào Nhưng hầu hết các kỹ thuật mã hoá đều có tổn hao ở bước lượng tử hóa do có sự làm tròn giá trị cho các hệ số phép biến đổi
1.4.2.1 Kỹ thuật mã hóa dựa trên phép biến đổi DCT
Phép biến đổi cosine rời rạc – DCT (Discrete Cosine Transform) biến đổi thông tin ảnh từ miền không gian sang miền tần số để có thể biểu diễn dưới dạng gọn hơn Để hiểu rõ kỹ thuật này trước hết ta cần tìm hiểu biến đổi Fourier
* Biến đổi Fourier – FT
Biến đổi Fourier – FT (Fourier Transform) là một phép biến đổi thuận nghịch, nó cho phép sự chuyển đổi thuận – nghịch giữa thông tin và tín hiệu được xử lý Phép biến đổi FT cũng có thể được áp dụng cho tín hiệu không ổn định (non-stationary) nếu chỉ quan tâm đến thành phần phổ nào có trong tín hiệu mà không quan tâm đến khi nào xuất hiện trong tín hiệu Tuy nhiên, nếu thông tin về thời gian xuất hiện của phổ trong tín hiệu là cần thiết, thì phép biến đổi FT không có khả năng đáp ứng được yêu cầu này, đây là hạn chế của phép biến đổi này
* Nén và giải nén ảnh dựa theo phép biến đổi DCT trong JPEG
JPEG là chuẩn nén số quốc tế đầu tiên cho các ảnh tĩnh có tông màu liên tục gồm cả ảnh đơn sắc và ảnh màu Trong kỹ thuật này các khối ảnh kích
Trang 18thước 8x8 được áp dụng để thực hiện DCT, sau đó lượng tử hoá các hệ số rồi mã hoá entropy sau lượng tử
Đối với những ảnh màu RGB, để áp dụng kỹ thuật nén này, trước hết phải chuyển sang chế độ màu YUV (Y là thành phần chói, U và V là 2 thành phần màu) Thành phần độ chói là ảnh đơn sắc xám Hai thành phần màu còn lại chứa thông tin về màu Sơ đồ khối bộ mã hoá và giải mã của JPEG như sau:
Hình 1.3 Sơ đồ bộ mã hoá theo chuẩn JPEG
1.4.2.2 Kỹ thuật mã hoá dựa trên phép biến đổi DWT Mối quan hệ giữa
biến đổi Wavelet và Fourier
Wavelet là phép biến đổi được sử dụng để phân tích các tín hiệu không ổn định (non-stationary) – là những tín hiệu có đáp ứng tần số thay đổi theo thời gian
Để khắc phục những hạn chế của biến đổi FT, phép biến đổi Fourier thời gian ngắn – STFT được đề xuất
Trên cơ sở cách tiếp cận biến đổi STFT, biến đổi Wavelet được phát triển để giải quyết vấn đề về độ phân giải tín hiệu mà STFT vẫn còn hạn chế
Trang 19Biến đổi Wavelet được thực hiện theo cách: tín hiệu được nhân với hàm Wavelet rồi thực hiện biến đổi riêng rẽ cho các khoảng tín hiệu khác nhau trong miền thời gian tại các tần số khác nhau Cách tiếp cận như vậy còn
được gọi là: phân tích đa phân giải – MRA (Multi Resolution Analysis): phân tích tín hiệu ở các tần số khác nhau và cho các độ phân giải khác nhau
MRA khi phân tích tín hiệu cho phép: phân giải thời gian tốt và phân giải tần số kém ở các tần số cao; phân giải tần số tốt và phân giải thời gian kém ở các tần số thấp
* Biến đổi Wavelet rời rạc – DWT
Bước này có thể hiểu phép biến đổi DWT như là áp dụng một tập các
bộ lọc: thông cao và thông thấp Thiết kế các bộ lọc này tương đương như kỹ
thuật mã hoá băng con (subband coding) Tuy nhiên khác với mã hoá băng con, các bộ lọc trong DWT được thiết kế phải có đáp ứng phổ phẳng, trơn và trực giao
Từ biến đổi DWT một chiều có thể mở rộng định nghĩa biến đổi DWT
hai chiều theo cách: Sử dụng các bộ lọc riêng biệt, thực hiện biến đổi
DWT một chiều dữ liệu vào (ảnh) theo hàng rồi thực hiện theo cột Theo cách này nếu thực hiện biến đổi DWT ở mức 1, sẽ tạo ra 4 nhóm hệ số
biến đổi
* Hai thuật toán nén sử dụng DWT điển hình
Nén ảnh dựa trên biến đổi DWT đã có những cải tiến đáng kể, đó là bước đột phá sử dụng DWT để nén ảnh bắt đầu là kỹ thuật mã hoá – EZW (embedded zero-tree wavelet)
Thuật toán EZW dựa trên khả năng khai thác các thuộc tính đa phân giải của biến đổi Wavelet để đưa ra một thuật toán ít phức tạp trong
Trang 20tính toán mà vẫn cho hiệu quả nén cao Những cải tiến và nâng cấp của
EZW về sau đã ra đời một số thuật toán tương tự như: SPIHT (set partitationing in hierarchical tree – cây phân cấp phân tập) và ZTE (zero-tree entropy coding – mã hoá entropy cây zero)
Gần đây còn có thêm một thuật toán nữa được đề xuất đó là LS (lifting scheme) sử dụng để tạo các biến đổi Wavelet số nguyên Kỹ thuật này sử dụng các bộ lọc Wavelet trực giao đem lại hiệu quả rất cao cho các
ứng dụng nén ảnh có tổn hao
Trang 21CHƯƠNG 2
CƠ SỞ LÝ THUYẾT CỦA BIẾN ĐỔI WAVELET
2.1 Cơ sở toán học
2.1.1 Biến đổi Wavelet liên tục
Biến đổi Wavelet liên tục (Continuous Wavelet Transform - CWT) của một
hàm f tđược bắt đầu từ một hàm Wavelet mẹ (mother Wavelet) t Hàm
Wavelet mẹ tcó thể là bất kỳ một hàm số thực hoặc phức liên tục nào thoả mãn các tính chất sau đây:
- Tích phân suy rộng trên toàn bộ trục t của hàmt là bằng 0
- Tích phân năng lượng của hàm trên toàn bộ trục t là một số hữu
hạn
2.1.2 Biến đổi Wavelet rời rạc
Việc tính toán các hệ số Wavelet tại tất cả các tỉ lệ là một công việc hết
sức phức tạp Để giảm thiểu công việc tính toán người ta chỉ chọn ra một tập nhỏ các giá trị tỉ lệ và các vị trí để tiến hành tính toán Quá trình chọn các tỷ lệ và các vị trí để tính toán như trên tạo thành lưới nhị tố
(dyadic) Một phân tích như trên hoàn toàn có thể thực hiện được nhờ biến đổi Wavelet rời rạc (DWT) Do đó, việc tính toán biến đổi DWT thực chất là sự rời rạc hoá biến đổi Wavelet liên tục (CWT); việc rời rạc hoá được thực hiện với sự lựa chọn các hệ số a và b như sau:
a 2m ; b 2m n; m, n Z (2.1)
Việc tính toán hệ số của biến đổi Wavelet có thể dễ dàng thực hiện bằng các băng lọc số nhiều nhịp đa kênh, một lý thuyết rất quen thuộc trong xử lý tín
Trang 22hiệu
Hình 2.1 Minh hoạ lưới nhị tố dyadic với các giá trị của m và n
2.1.3 Tính chất của biến đổi Wavelet
Biến đổi Fourier là một biến đổi đã và đang được áp dụng rộng rãi trong nhiều ngành khoa học và kỹ thuật khác nhau Biến đổi Fourier
chuyển một hàm tín hiệu từ miền thời gian sang miền tần số Sử dụng biến
đổi Fourier ta có thể biết được trong tín hiệu f(t)có các thành phần tần số nào Tuy nhiên biến đổi Fourier có một nhược điểm cơ bản là với một tín hiệu f(t) ta không thể biết được rằng tại một thời điểm t thì tín hiệu có các thành phần tần số nào Một phép biến đổi tốt hơn biến đổi Fourier phải là phép biến đổi có đầy đủ tính năng của biến đổi Fourier và có khả năng xác định xem tại một thời điểm t bất kỳ trong tín hiệu f(t) có thành phần tần số nào Phép biến đổi Wavelet ra đời đã khắc phục được các nhược điểm của biến đổi Fourier trong phân tích tín hiệu Biến đổi Wavelet dù chỉ làm việc
với các tín hiệu một chiều (liên tục hoặc rời rạc) nhưng sau khi biến đổi
xong ta thu được một hàm số hai biến hoặc một tập các cặp giá trị W a, b
minh họa các thành phần tần số khác nhau của tín hiệu xảy ra tại thời
điểm t Các giá trị W ai , b tạo thành một cột (i=1, 2, , n) cho biết một thành phần tần số có trong những thời điểm t nào và các giá trị W a, bi tạo
thành hàng cho biết tại một thời điểm t của tín hiệu f(t) có các thành phần
Trang 23tần số nào
Tham số b trong biến đổi Wavelet cho biết khoảng dịch của hàm Wavelet mẹ và độ phân giải các tần số khác nhau của f t được minh họa bởi hệ tỷ lệ chính là a Biến đổi Wavelet ngày càng được áp dụng rộng rãi đặc biệt là
trong xử lý tiếng nói, xử lý ảnh số Xử lý tín hiệu ảnh số là xử lý tín hiệu hai chiều và do đặc điểm của ảnh số là bao giờ cũng có tính định hướng và tính định vị Tính định hướng của một ảnh nghĩa là trong ảnh bao giờ cũng có một số ít các thành phần tần số nhưng các thành phần tần số này trải rộng trên toàn bộ không gian ảnh còn tính định vị của ảnh chính là tính chất biểu thị rằng tại một vùng của ảnh có thể có rất nhiều thành phần tần số Ảnh biểu thị tính định vị rõ nhất chính là ảnh có nhiều biên vùng phân tách rõ rệt, tại các đường biên bao giờ cũng có nhiều thành phần tần số khác nhau, còn hầu hết các ảnh có tông liên tục đều là những ảnh có tính định hướng
2.2 Giới thiệu một số họ Wavelet 2.2.1 Biến đổi Wavelet Haar
Biến đổi Haar Wavelet là biến đổi đơn giản nhất trong các phép biến đổi Wavelet Hình vẽ 2 3 cho thấy dạng của hàm t với biến đổi
Haar Do tính chất đơn giản của biến đổi Haar mà nó được ứng dụng
tương đối nhiều trong nén ảnh, khi áp dụng biến đổi này để nén ảnh thì thuật toán nén ảnh trên máy tính có một số điểm khác với công thức toán
học của biến đổi Haar
2.2.2 Biến đổi Wavelet Meyer
Yves Meyer là một trong những nhà khoa học đã đặt nền móng cho phép biến đổi Wavelet Phép biến đổi Wavelet mang tên Meyer cũng là
một phép biến đổi thông dụng, biến đổi này có khả năng phân tích tín
Trang 24hiệu tốt hơn nhiều so với biến đổi Haar
2.2.3 Biến đổi Wavelet Daubechies
Giống như Meyer, Daubechies cũng là một nhà khoa học có công lao to lớn trong việc nghiên cứu phát triển phép biến đổi Wavelet Biến
đổi Daubechies là một trong những phép biến đổi phức tạp nhất trong
biến đổi Wavelet Họ biến đổi này được ứng dụng hết sức rộng rãi, biến đổi Wavelet áp dụng trong JPEG2000 là một biến đổi trong họ biến đổi Wavelet Daubechies
2.3 Một số ứng dụng nổi bật của Wavelet
Phần này chỉ nêu ra các lĩnh vực mang tính chất tổng quát các ứng
dụng của Wavelet với tính chất giới thiệu và gợi mở
2.3.1 Nén tín hiệu
Do đặc điểm của mình, Wavelet đặc biệt tốt khi sử dụng để nén hay
phân tích các tín hiệu không dừng; đặc biệt là tín hiệu ảnh số và các ứng dụng nén tiếng nói, nén dữ liệu Việc sử dụng các phép mã hoá băng con,
băng lọc số nhiều nhịp và biến đổi Wavelet rời rạc tương ứng với loại tín
hiệu cần phân tích có thể mang lại những hiệu quả rất rõ rệt trong nén tín hiệu Do tính chất chỉ tồn tại trong các khoảng thời gian rất ngắn (khi phân tích tín hiệu trong miền thời gian tần số) mà các hệ số của biến đổi
Wavelet có khả năng tập trung năng lượng rất tốt vào các hệ số biến đổi Các hệ số mang thông tin chi tiết của biến đổi Wavelet thường rất nhỏ và có
thể bỏ qua mà không ảnh hưởng tới việc mã hoá dữ liệu (trong phương pháp mã hoá ảnh hay tiếng nói là những tín hiệu cho phép mã hoá có tổn thất thông tin)
Trang 252.3.2 Khử nhiễu
Tính chất của biến đổi Wavelet mà chúng ta đã xét tới trong phần ứng
dụng cho nén tín hiệu được mở rộng bởi Iain Johnstone và David Donohos trong các ứng dụng khủ nhiễu cho tín hiệu Phương pháp khử
nhiễu này được gọi là Wavelet Shrinkage Denoising (WSD) Ý tưởng cơ bản của WSD dựa trên việc tín hiệu nhiễu sẽ lộ rõ khi phân tích bằng biến đổi Wavelet ở các hệ số biến đổi bậc cao Việc áp dụng các ngưỡng loại bỏ tương ứng với các bậc cao hơn của hệ số Wavelet sẽ có thể dễ dàng loại
bỏ nhiễu trong tín hiệu
2.3.3 Mã hoá nguồn và mã hoá kênh
Sở dĩ Wavelet được ứng dụng trong mã hoá nguồn và mã hoá kênh vì
trong mã hoá nguồn thì chúng ta cần khả năng nén với tỷ lệ nén cao còn
trong mã hoá kênh thì cần khả năng chống nhiễu tốt Biến đổi Wavelet kết hợp với một số phương pháp mã hoá như mã hoá Huffman hay mã hoá
số học có thể thực hiện được cả hai điều trên
Trang 26CHƯƠNG 3
CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI WAVELET JPEG2000
3.1 Lịch sử ra đời và phát triển chuẩn JPEG2000
Như chúng ta đã biết, sự ra đời của JPEG mang lại nhiều lợi ích to lớn về nhiều mặt JPEG có thể giảm nhỏ kích thước ảnh, giảm thời gian
truyền và làm giảm chi phí xử lý ảnh trong khi chất lượng ảnh là khá tốt
Để việc nén ảnh có hiệu quả hơn, Ủy ban JPEG đã đưa ra một chuẩn nén ảnh mới là JPEG2000 JPEG2000 sử dụng biến đổi Wavelet và các phương pháp mã hoá đặc biệt để có được ảnh nén ưu việt hơn hẳn JPEG JPEG2000 hiện vẫn đang tiếp tục được phát triển, nhưng phần I đã được tổ chức ISO chấp nhận là chuẩn nén ảnh quốc tế áp dụng cho ảnh tĩnh
Chuẩn nén ảnh JPEG2000 mà xương sống là biến đổi Wavelet với tính năng vượt trội so với JPEG chắc chắn sẽ được sử dụng trong các
ứng dụng
3.2 Các tính năng của JPEG2000
JPEG2000 có nhiều chức năng đặc biệt hơn mọi chuẩn nén ảnh tĩnh khác như JPEG hay GIF Dưới đây là các chức năng ưu việt của JPEG2000 so với các chuẩn nén ảnh tĩnh khác
Cho chất lượng ảnh tốt nhất khi áp dụng nén ảnh tĩnh có tổn thất Sử dụng được với truyền dẫn và hiển thị luỹ tiến về chất lượng, độ
phân giải, các thành phần màu và có tính định vị không gian Sử dụng cùng một cơ chế nén ảnh cho cả hai dạng thức nén