II.6.3.5. Mó hoỏ và kết hợp dũng dữ liệu sau mó hoỏ

Một phần của tài liệu Đề án tốt nghiệp: Tìm hiểu một số phương pháp nén ảnh ppt (Trang 58 - 66)

Ch-ơng II: Các ph-ơng pháp nén ảnh

II.6.3.5. Mó hoỏ và kết hợp dũng dữ liệu sau mó hoỏ

Do biến đổi Wavelet 5/3 là biến đổi thuận nghịch nờn cú thể ỏp dụng cho nộn ảnh theo cả hai phương phỏp, cú tổn thất và khụng tổn thất trong khi biến đổi 9/7 chỉ ỏp dụng cho nộn ảnh theo phương phỏp cú tổn thất thụng tin.

II.6.3.4. Lượng tử hoỏ - Giải lượng tử hoỏ :

Cỏc hệ số của phộp biến đổi sẽ được tiến hành lượng tử hoỏ. Quỏ trỡnh lượng tử hoỏ cho phộp đạt tỷ lệ nộn cao hơn bằng cỏch thể hiện cỏc giỏ

trị biến đổi với độ chớnh xỏc tương ứng cần thiết với mức chi tiết của ảnh cần nộn. Cỏc hệ số biến đổi sẽ được lượng tử hoỏ theo phộp lượng tử hoỏ vụ hướng. Cỏc hàm lượng tử hoỏ khỏc nhau sẽ được ỏp dụng cho cỏc băng con khỏc nhau và được thực theo biểu thức:

V(x,y) = |U(x,y)| sgnU(x,y)     

với Δ là bước lượng tử, U(x,y) là giỏ trị băng con đầu vào; V(x,y) là giỏ trị sau lượng tử hoỏ. Trong dạng biến đổi nguyờn, đặt bước lượng tử bằng 1.Với dạng biến đổi thực thỡ bước lượng tử sẽ được chọn tương ứng cho từng băng con riờng rẽ. Bước lượng tử của mỗi băng do đú phải cú ở trong dũng bớt truyền đi để phớa thu cú thể giải lượng tử cho ảnh. Cụng thức giải lượng tử hoỏ là:

U(x,y) = V(x,y)rsgnV(x,y)

r là một tham số xỏc định dấu và làm trũn, cỏc giỏ trị ( U x,y);V(x,y) tương ứng là cỏc giỏ trị khụi phục và giỏ trị lượng tử hoỏ nhận được. JPEG2000

khụng cho trước r tuy nhiờn thường chọn r =1/ 2 .

II.6.3.5. Mó hoỏ và kết hợp dũng dữ liệu sau mó hoỏ:

JPEG2000 theo khuyến nghị của uỷ ban JPEG quốc tế cú thể sử dụng nhiều phương phỏp mó hoỏ khỏc nhau cũng như nhiều cỏch biến đổi

Wavelet khỏc nhau để cú thể thu được chất lượng ảnh tương ứng với ứng

dụng cần xử lý. Điều này giỳp cho JPEG2000 mềm dẻo hơn nhiều so với

JPEG. Việc ỏp dụng cỏc phương phỏp mó hoỏ khỏc nhau cũng được mở rộng sang lĩnh vực nộn ảnh động bằng biến đổi Wavelet. Trong thực tế cỏc

phương phỏp mó hoỏ ảnh được ỏp dụng khi nộn ảnh bằng biến đổi Wavelet

cũng như JPEG2000 thỡ cú hai phương phỏp được coi là cơ sở và được ỏp

JPEG2000 vẫn được ỏp dụng mó hoỏ bằng hai phương phỏp này và một phương phỏp phỏt triển từ hai phương phỏp này là phương phỏp mó hoỏ mặt phẳng bớt. Vỡ thế ở đõy chỳng ta sẽ xem xột hai phương phỏp này. Việc kết hợp dũng dữ liệu sau mó hoỏ của JPEG2000 thực chất là để thực hiện cỏc tớnh năng đặc biệt của JPEG2000 như tớnh năng ROI v.v...

II.6.3.6. Phương phỏp mó hoỏ SPIHT:

Cú thể thấy rằng dự ỏp dụng biến đổi Wavelet nào hay cựng với nú là một phộp phõn giải ảnh nào thỡ trong cỏc băng con cú số thứ tự thấp cũng là những thành phần tần số cao (mang thụng tin chi tiết của ảnh) trong khi những băng con cú số thứ tự cao hơn thỡ sẽ chứa những thành phần tần số thấp (mang thụng tin chớnh về ảnh). Điều đú nghĩa là cỏc hệ số chi tiết sẽ

giảm dần từ băng con mức thấp (HH1 chẳng hạn) (ứng với thành phần tần

số cao) xuống băng con mức cao (ứng với thành phần tần số thấp) và cú tớnh tương tự về khụng gian giữa cỏc băng con, vớ dụ như một đường biờn của hỡnh vẽ trong ảnh sẽ tồn tại ở cựng một vị trớ trờn cỏc băng con đú (tương ứng với mức độ phõn giải của băng con ấy). Điều này đó dẫn tới sự ra đời của phương phỏp SPIHT (Set partitioning in hierarchical trees - phương

phỏp mó hoỏ phõn cấp theo phõn vựng). Phương phỏp SPIHT được thiết kế

tối ưu cho truyền dẫn luỹ tiến. Điều này cú nghĩa là tại mọi thời điểm trong quỏ trỡnh giải nộn ảnh theo phương phỏp mó hoỏ này thỡ chất lượng ảnh hiển thị tại thời điểm ấy là tốt nhất cú thể đạt được với một số lượng bớt đưa vào giải mó tớnh cho tới thời điểm ấy. Ngoài ra, phương phỏp này sử dụng kỹ thuật embedded coding; điều đú cú nghĩa là một ảnh sau nộn với kớch cỡ (lưu trữ) lớn (tỷ lệ nộn thấp) sẽ chứa chớnh dữ liệu sau nộn của ảnh cú kớch cỡ (lưu trữ) nhỏ (tỷ lệ nộn cao). Bộ mó hoỏ chỉ cần nộn một lần nhưng cú thể giải nộn ra nhiều mức chất lượng khỏc nhau. Giả sử gọi cỏc pixel trong

một ảnh p cần mó hoỏ là pi, j. Áp dụng một phộp biến đổi Wavelet T nào đú cho cỏc pixel trong ảnh để tạo ra cỏc hệ số của phộp biến đổi Wavelet ci, j. Cỏc hệ số này tạo ra một ảnh biến đổi là C. Phộp biến đổi này được viết dưới dạng toỏn tử như sau: C=T(p). Trong phương phỏp truyền dẫn luỹ tiến với ảnh thỡ bộ mó hoỏ sẽ bắt đầu quỏ trỡnh khụi phục (giải nộn) ảnh bằng cỏch đặt cỏc giỏ trị của ảnh khụi phục từ cỏc hệ số biến đổi là cˆ . Sử dụng cỏc giỏ trị giải mó của cỏc hệ số biến đổi để tạo ra một ảnh khụi phục (vẫn chưa ỏp dụng biến đổi ngược Wavelet) là cˆ và sau đú ỏp dụng biến đổi ngược Wavelet để tạo ra ảnh cuối cựng là pˆ . Chỳng ta cú thể viết dưới dạng toỏn tử như sau: pˆ =T−1 (cˆ). Nguyờn tắc quan trọng của phương phỏp truyền dẫn ảnh theo kiểu luỹ tiến chớnh là phương phỏp này luụn truyền đi cỏc giỏ trị mang thụng tin quan trọng hơn của ảnh đi trước. Sở dĩ làm như vậy là do cỏc thụng tin đú chớnh là cỏc thụng tin sẽ làm giảm thiểu nhiều nhất độ mộo dạng của ảnh (sự sai khỏc giữa ảnh gốc và ảnh khụi phục). Đõy chớnh là lý do tại sao phương phỏp SPIHT luụn truyền đi cỏc hệ số lớn trước và cũng là một nguyờn tắc quan trọng của phương phỏp này. Một nguyờn tắc nữa là cỏc bớt cú trọng số lớn bao giờ cũng mang thụng tin quan trọng nhất trong dữ liệu nhị phõn. Phương phỏp SPIHT sử dụng cả hai nguyờn tắc này; nú sắp xếp cỏc hệ số biến đổi và truyền đi cỏc bớt cú trọng số lớn nhất. Quỏ trỡnh giải mó cú thể dừng lại ở bất kỳ một bước nào ứng với giỏ trị ảnh cần

mó hoỏ yờu cầu. Đõy chớnh là cỏch mà phương phỏp mó hoỏ SPIHT làm tổn

thất thụng tin.

II.6.3.7. Phương phỏp mó hoỏ EZW:

Phương phỏp mó hoỏ EZW (Embedded Zerotree Wavelet Encoder)

cũng dựa trờn cơ sở phộp mó hoỏ luỹ tiến (progressive coding) giống như

về cõy zero (zerotree). Về cơ bản, thuật toỏn này dựa trờn hai nguyờn tắc

như đó trỡnh bày ở phần phương phỏp mó hoỏ SPIHT. Sau đõy chỳng ta sẽ (adsbygoogle = window.adsbygoogle || []).push({});

xem xột cỏc khỏi niệm cơ bản của thuật toỏn: Cõy tứ phõn: Sau khi ỏp dụng biến đổi Wavelet ứng với cỏc mức phõn giải khỏc nhau chỳng ta cú thể biểu diễn cỏc hệ số biến đổi dưới dạng một cõy. Ta thấy rằng với cõy biểu diễn này cứ mỗi nỳt cha thỡ cú 4 nỳt con. Sở dĩ cú được điều này là do quỏ trỡnh biến đổi Wavelet ở cỏc tỷ lệ khỏc nhau. Ta gọi đõy là cỏc cõy tứ phõn

(quadtree).

Hình 2.6.4: Cây tứ phân

Cõy zero (zerotree): Cõy zero là một cõy tứ phõn, trong đú tất cả cỏc nỳt của nú đều nhỏ hơn nỳt gốc. Một cõy như vậy khi mó hoỏ sẽ được mó hoỏ bằng một đối tượng duy nhất và khi giải mó thỡ chỳng ta cho tất cả cỏc giỏ trị bằng khụng. Ngoài ra để cú thể mó hoỏ được cỏc hệ số Wavelet trong trường hợp này, giỏ trị của nỳt gốc phải nhỏ hơn giỏ trị ngưỡng đang được xem xột ứng với hệ số Wavelet đú Sau khi cú đủ cỏc khỏi niệm cần thiết về cõy tứ phõn và cõy zero, chỳng ta cú thể trỡnh bày nguyờn lý hoạt động của thuật toỏn. Thuật toỏn sẽ mó hoỏ cỏc hệ số theo thứ tự giảm dần. Chỳng ta sẽ dựng một giỏ trị gọi là ngưỡng (threshold) và sử dụng ngưỡng này để tiến hành mó hoỏ cỏc hệ số biến đổi. Cỏc hệ số được mó hoỏ theo thứ tự từ vựng tần số thấp đến vựng tần số cao. Và chỉ những hệ số cú giỏ trị tuyệt đối lớn hơn hoặc bằng ngưỡng thỡ mới được mó hoỏ. Tiếp theo giảm ngưỡng và tiếp tục làm như vậy cho tới khi ngưỡng đạt tới một giỏ trị nhỏ hơn giỏ trị của hệ

số nhỏ nhất. Cỏch giảm giỏ trị ngưỡng ở đõy thực hiện tương đối đặc biệt, giỏ trị của ngưỡng giảm xuống một nửa so với trước đú. Bộ giải mó phải biết cỏc mức ngưỡng này thỡ mới cú thể giải mó ảnh thành cụng. Nhưng khi ta đi từ nỳt cha đến nỳt con trong cõy tứ phõn thỡ nú vẫn cú 3 nỳt con. Vậy ta phải đi theo nhỏnh cú nỳt con nào trước. Hay núi một cỏch đầy đủ hơn ta di chuyển từ hệ số này đến hệ số khỏc theo thứ tự như thế nào. Cú nhiều cỏch di chuyển khỏc nhau, tuy nhiờn hai cỏch di chuyển trờn hỡnh trờn được sử dụng nhiều nhất.

Hình 2.6.5

Việc sắp xếp này cũn phải được quy ước thống nhất giữa quỏ trỡnh mó hoỏ và quỏ trỡnh giải mó để việc giải mó ảnh được thành cụng. Trờn đõy chỉ

là nguyờn lý cơ bản của phương phỏp mó hoỏ EZW. Hiện nay phương phỏp

mó hoỏ này được ỏp dụng ngày càng nhiều nộn ảnh động. Phương phỏp này cho tỉ lệ nộn và độ tin cậy giải mó cao. Ngoài ra phương phỏp EZW rất dễ triển khai trờn mỏy tớnh bởi phương phỏp này khụng yờu cầu việc lập trỡnh quỏ phức tạp.

II.6.4.So sỏnh chuẩn JPEG2000 với JPEG và cỏc chuẩn nộn ảnh tĩnh khỏc:

Một tớnh năng quan trọng và là ưu điểm rừ nột nhất của JPEG2000so với

JPEG cũng như cỏc chuẩn nộn ảnh khỏc như MPEG 4 VTC hay JPEG - LS

theo cựng một cơ chế mó hoỏ nghĩa là JPEG2000 thực hiện tất cả cỏc dạng thức của JPEG chỉ bằng một cơ chế mó hoỏ duy nhất. Nếu xột về sự tồn tại của hai kỹ thuật này thỡ JPEG cũng cú khả năng nộn ảnh cú tổn thất và khụng tổn thất thụng tin. Tuy nhiờn với JPEG thỡ cơ chế mó hoỏ với hai dạng này là khỏc nhau và rất khú để sử dụng cả hai dạng này cựng lỳc cho cựng một ứng dụng. Do đú, cú thể thấy rằng JPEG cú tớnh mềm dẻo hơn bất kỳ chuẩn nộn ảnh tĩnh nào trước đõy. Hơn thế, chỳng ta đó thấy rằng tất cả cỏc phương phỏp thiết kế cho chuẩn JPEG2000 đều ưu việt và cú nhiều tớnh năng hơn so với JPEG; ngoài ra những thống kờ về thực tế cho thấy với cựng một tỷ lệ nộn và một loại ảnh thỡ ảnh được nộn bởi JPEG2000 hầu như luụn cú chất lượng tốt hơn so với JPEG. Chỳng ta xem xột hai ảnh trờn hỡnh 2.6.6 để thấy rừ điều này, ảnh bờn trỏi được nộn theo JPEG cũn ảnh bờn

phải được nộn theo JPEG2000.

JPEG JPEG 2000

JPEG JPEG 2000

Tớnh năng ưu việt thứ hai của JPEG2000 so với JPEG chớnh là trong dạng thức nộn cú tổn thất thụng tin, JPEG2000 cú thể đưa ra tỷ lệ nộn cao hơn nhiều so với JPEG. Cỏc phần mềm nộn ảnh JPEG hiện tại (kể cả

Photoshop) cũng chỉ thiết kế để cú thể nộn được tới tỷ lệ 40:1nhưng với

JPEG2000 thỡ tỷ lệ nộn cú thể lờn tới 200:1. Theo cụng thức tớnh PSNR

trong đơn vị dB, chỳng ta cú: (b là số bớt dựng biểu diễn một pixel trờn ảnh gốc) PSNR(dB) =          1 2 10 log 20 b RMSE

Trong đú MSE( Mean square error ) là sai số bỡnh phương trung bỡnh , PSNR (peak to signal to noise ratio) là tỉ số tớn hiệu trờn nhiễu đỉnh.MSE thường được gọi là phương sai lượng tử - 2

q

(quantization error variance) .MSE giữa ảnh gốc và ảnh khụi phục được tớnh như sau :

        k j q f i k gi k N MSE , 2 2 , , 1 

Trong đú tổng lấy theo j, k tớnh cho tổng tất cả cỏc điểm ảnh trong ảnh và N là số điểm ảnh trong ảnh. RMSE là căn bậc 2 của MSE .

Với hai ảnh ở hỡnh 2.6.6, sự so sỏnh về tham số PSNR cho trờn bảng bờn dưới. Để cú thể so sỏnh dễ dàng hơn, ta xột ảnh được nộn với cỏc tỷ lệ khỏc nhau (đo lường bởi hệ số bớt/pixel hay bpp). Tất cả cỏc số liệu trờn bảng đều cho thấy JPEG2000 nộn ảnh tốt hơn là JPEG; hơn thế hệ số PSNR (adsbygoogle = window.adsbygoogle || []).push({});

mà chỳng ta xột trong bảng được đo trong hệ đơn vị logarit.

Bit per pixel 0.125 0.50 2.00

Ảnh 1 theo JPEG 24.42 31.17 35.15

Ảnh 1 theo JPEG2000 28.12 32.95 37.35

Ảnh 2 theo JPEG 22.6 28.92 35.99

Tớnh năng ưu việt thứ 3 của JPEG2000 so với JPEG là chuẩn nộn ảnh này cú thể hiển thị được cỏc ảnh với độ phõn giải và kớch thước khỏc nhau từ cựng một ảnh nộn. Với JPEG thỡ điều này là khụng thể thực hiện được.

Sở dĩ cú điều này là do JPEG2000 sử dụng kỹ thuật phõn giải ảnh và mó

hoỏ đớnh kốm mà chỳng ta đó núi tới ở phần mó hoỏ ảnh theo JPEG2000. Tớnh năng này là một lợi thế đặc biệt quan trọng của JPEG2000, trong khi JPEG cũng như cỏc chuẩn nộn ảnh tĩnh trước đõy phải nộn nhiều lần để thu được chất lượng với từng lần nộn khỏc nhau thỡ với JPEG2000 ta chỉ cần nộn một lần cũn chất lượng ảnh thỡ sẽ được quyết định tuỳ theo người sử dụng trong quỏ trỡnh giải nộn ảnh theo JPEG2000.Một tớnh năng ưu việt nữa của JPEG2000 là tớnh năng mó hoỏ ảnh quan trọng theo vựng (ROI - Region of Interest) mà chỳng ta đó đề cập trong phần mó hoỏ ảnh theo JPEG2000.

Một phần của tài liệu Đề án tốt nghiệp: Tìm hiểu một số phương pháp nén ảnh ppt (Trang 58 - 66)