Nhận xét về tỷ số nén,chất l−ợng nén

Một phần của tài liệu luận văn thạc sĩ cao học ngành điện tử viên thông đề tài nén ảnh động dùng WAVELET (Trang 116 - 124)

Đối với tệp air.rgb:

Dung l−ợng đầu vào 426 Kb, dung l−ợng đầu ra 225 Kb cùng kích th−ớc frames 320x240. Do đó tỉ số nén là: 426 1.89333 225 R C = =

Dung l−ợng đầu vào là 426 Kb, dung l−ợng đầu ra là 214 Kb kích th−ớc 40x30. Do đó tỉ số nén là : 426 1.9999 214 R C = =

Đối với tệp Sound.Mp3 và Demọmp3 ta có:

Với tệp đầu vào MP3 đầu ra chúng ta có tệp định dạng MPEG4.ở đây chúng ta chú ý đến chất l−ợng của đầu ra hơn là chất l−ợng nén.File MPEG4 ở đây có chất l−ợng cao không có nhiễu ứng dụng trong truyền thông đa ph−ơng tiện.

Đối với tệp Global.avi:

Dung l−ợng đầu vào file Global.avi 3.46 Mb, dung l−ợng đầu ra Global.raw 3.38 Mb cùng kích th−ớc frames 320x240 pixels. Do đó tỉ số nén là: 3.46 1.026 3.38 R C = =

Dung l−ợng đầu vào file Global.raw 3.38MB , dung l−ợng đầu ra Global.wl 15.1 Kb kích th−ớc 320x240 với số khung xử lý là 15. Do đó tỉ số nén là : 3.38.1024 229.2 15.1 R C = =

Qua đây chúng ta thấy đối với ph−ơng pháp dùng wavelet chúng ta có tỷ lệ nén rất cao so với các ph−ơng pháp nén thông th−ờng.Hình sau minh hoạ quan hệ giữa kích th−ớc khung và tỷ số nén:

Với file Global.wl kích th−ớc 320x240 l−ợng tử là 129 và tổn hao dpcm =65 số frame 15 ta có : STT MSE RMSE PSNR 1 2754.689 52.485 13.76 2 2624.778 51.233 13.97 3 2720.400 52.157 13.82 4 2718.881 52.143 13.82 5 2744.705 52.390 13.78 6 2893.206 53.789 13.55 7 2929.208 54.122 13.50 8 2901.895 53.869 13.54 9 2825.329 53.154 13.65 10 2708.651 52.045 13.84 11 2645.592 51.435 13.94 12 2468.484 49.684 14.24 13 2413.063 49.123 14.34 14 2729.685 52.246 13.80 15 2884.536 53.708 13.56

Ta có đồ thị sau: MSE 0 500 1000 1500 2000 2500 3000 3500 1 3 5 7 9 11 13 15 MSE

Hình 4.2. Đồ thị quan hệ MSE giữa các khung

0 10 20 30 40 50 60 1 3 5 7 9 11 13 15 RMSE PSNR

Kết luận

Luận văn xin đ−ợc kết thúc với 1 vài định h−ớng. 1. ứng dụng luận văn

Một thuật toán mã hoá ảnh mới dùng wavelet (EZBC) đã đ−ợc giới thiệu trong ch−ơng tr−ớc. Thuật toán này đ−a đến 2 kỹ thuật thành công đó là - thiết lập sự phân chia và mô hình ngữ cảnh - cho hiệu quả mã hoá entropy đặc tr−ng cho mặt phẳng mã hoá. Không giống nh− cây nhị phân truyền thống- cơ sở bộ mã hoá phân chia, chúng ta có thể thiết lập cây tứ phân - dựa trên l−ợc đồ khối mã hoá zeroblock cho việc phân chia hệ số mã hoá wavelet. Đầu tiên chúng ta sẽ khai thác tính thống kê phụ thuộc vào cây quadtree giới thiệu trong bộ giải mã. Bộ mã hoá của chúng ta có 1 vài đặc tính −u việt so với mặt phẳng mã hoá truyền thống là tốc độ điều khiển chính xác và dụ đoán giải mã đa tốc độ.

Thuật toán này là lý t−ởng cho mã hoá phân giải scalable. Sự cải thiện rất lớn của PSNR thông qua thuật toán đó là kết quả mô phỏng.

Một hệ thống phân tích tổng hợp theo thời gian với việc bù chuyển động chính xác 1 nửa điểm ảnh (IMCTF) đ−ợc gi−ói thiệu trong ch−ơng 6. Băng lọc thời gian cho phép giải mã hoàn chỉnh tín hiệu Video. Chất l−ợng ảnh của băng lọc giải mã Video không bị ảnh h−ởng từ hiện t−ợng bóng mờ tác động th−ờng thấy trong bộ mã hoá 3-D thông th−ờng (không bù chuyển động).

Hệ thống mã hoá Video mới (IMC3D-EZBC) đ−ợc trình bày trong ch−ơng 7. Chúng ta minh hoạ kết quả thực nghiệm đó là sự thay đổi tốc độ bit mã hoá và phân giải không gian thời gian có thể đ−ợc giải mã từ 1 file nén đơn lẻ sử dụng hệ thống mã hoá mớị

Đối t−ợng mới - dựa trên hệ thống mã hoá OB-EZBC, mở rộng từ khung đầu vào EZBC, đ−ợc trình bày trong ch−ơng 3. Thuật toán đề xuất có khả năng mã hoá hình dạng ảnh tuỳ ý. Khả năng cao của EZBC đ−ợc giữ lại và luồng bit cho đối t−ợng riêng lẻ có thể phân giải tỷ lệ và mã hoá tốc độ độc lập.

2. H−ớng phát triển cho t−ơng lai

Một vài h−ớng phát triển cho t−ơng lai:

Ưu điểm của mô hình ngữ cảnh: Sự thy đổi mang tính thống kê phụ thuộc

có thể đ−ợc quan sát trong cấu trúc hình tháp. Điều đó hy vọng rằng việc cải thiện nén ảnh có thể đạt đ−ợc bởi mô hình chiến l−ợc tinh vi có lợi cho việc lựa chọn và l−ợng tử hoá.

Mô hình thống kê chính xác cho hệ số wavelet: L−ợc đồ l−ợng tử hoá lại có thể đ−ợc cải thiện sử dụng kả năng mô hình chính xác, chuẩn hoa bởi hàm mật độ Gaussian, thay vì hình thành hàm mật độ hiện thờị

Việc thích nghi trong cấu trúc băng con và kích th−ớc GOP: Phân tích 2

băng con và kích th−ớc cố định GOP (chỉ cho Video) đ−ợc sử dụng cho hệ thống mã hoá hiện thờị Kết quả tìm đ−ợc trong mục 6.5. Tập trung năng l−ợng băng con sẽ tăng khi phân chia tần số cao cho mô hình ảnh. Có thể cải thiện nhờ sử dụng phân giải gói wavelet cho việc tối −u hoá băng con theo không gian và thời gian.

TàI LIệU THAM KHảO

[1] M. R. Aaron, “The digital (r)evolution, ” IEEE Commụ Mag., pp.21–22, 1974.

[2] J. M. Shapiro, “Embeđed image coding using zerotrees of wavelet coefficients, ” IEEE Trans. on Signal Processing, vol.41, pp.3445–3462, Dec.1993.

[3] G. K. Wallace, “The JPEG still picture compression standard, ”Communications of the ACM, vol.34, pp.30–44, April 1991.

[4] W. P. Pennebaker and J. L. Mitchell, JPEG Still Image Data Compression Standard. New York: Van Nostrand Reinhold, 1993.

[5] ISO/IEC, Information Technology — Lossless and Near-Lossless Compression of Continuous-Tone Still Images. ISO/IEC 14495-1, ITU

Recommend. T.87, Dec.1994.

[6] M. J. Weinberger, G. Seroussi, and G. Sapiro, “The LOCO-I lossless image compression algorithm: principles and standardization into JPEG-LS, ”

IEEE Trans. Image Processing, vol.9, pp.1309–1324, Aug.2000. [Online].

Available: http: //www. hpl. hp. com/locọ

[7] ISO/IEC, Information Technology — Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to 1.5 Mbps. ISO/IEC

11172-2, 1992.

[8] ISO/IEC, Information Technology — Generic Coding of Moving Pictures

and Associated Audio Informations: Video. ISO/IEC 13818-2, 1995.

[9] ISO/IEC, Information Technology — Coding of Audio-Visual Objects —

Part 2: Visual. ISO/IEC 14496-2, Dec.1994.

[10] ITU Telecommunication Standardization Sector of ITU, Video Codec

for Audiovisual Services at p ì 64 kbits/sec. ITU-T Recommendation H.261,

[11] ITU Telecommunication Standardization Sector of ITU, Video Coding for Low Bitrate Communication. ITU-T Recommendation H.263,

Mar.1996.

[12] ITU Telecommunication Standardization Sector of ITU, Video Coding for Low Bitrate Communication. ITU-T Recommendation H.263

Version 2, Jan.1993.

[13] Digital Imaging Group, Inc, Flashpix Format Specification, version 1.0.2, July 1993.

[14] D. Taubman, “High performance scalable image compression with EBCOT, ”IEEE Trans. Image Processing, vol.9, pp.1158 –1170, July 2000. [15] ISO/IEC, ISO/IEC FCD 15444-1: Information Technology — JPEG 2000

image coding system: Core coding system. ISO/IEC JTC1/SC 29/WG N1646,

Mar.2000.

[16] W. Li, “Overview of fine granularity scalability in MPEG-4 Video standard” IEEE Trans. Circuits and Syst. for Video Technol., vol.11, pp.301– 317, Mar.2001.Speical Issue on Streaming Video.

[17] S. -T. Hsiang and J. W. Woods, “Embeđed image coding using zeroblocks of subband/wavelet coefficients and context modeling, ” in Proc.

of IEEE In tSymp. on Circuits and Systems, vol.3, (Geneva), pp.662–665, May

2000.

[18] S. -T. Hsiang and J. W. Woods, “Embeđed Video coding using motion compensated 3-D subband/wavelet filter bank, ” in Packet Video Workshop, (Sardinia, Italy), May 2000.

[19] S.-T. Hsiang, “Embeđed image coding using zeroblocks of subband/wavelet coefficients and context modeling, ” in Proc.2001 IEEE

PHụ LụC

THUậT NGữ tiếng anh

3-D three - dimensional

AGP alphabet and group partitioning

APSG alphabet partitioning and sample grouping

CREW Compression with Reversible Embeđed Wavelets CSF contrast sensitivity function

DCT discrete cosine transform DFD displaced frame difference

DPCM differential pulse code modulation DVR display visual resolution

DWT discrete wavelet transform

EBCOT Embeđed Block Coding with Optimal Truncation EZBC Embeđed ZeroBlock Coding and context modeling EZW Embeđed image coding using Zerotrees of Wavelet

coefficients

FGS fine granularity scalability GOP group of pictures

HDTV high definition television HVS human visual system

HVSBM hierarchical variable size block matching

IMCTF invertible motion compensated temporal subband/wavelet filtering system

JND just noticeable distortion

LSB least significant bit LZC Layered Zero Coding

MC motion compensated/compensation MND minimally noticeable distortion MPEG Moving Picture Experts Group MSB most significant bit

MSE mean square error PCM pulse code modulation PSF point spread function PSNR peak signal-to-noise ratio R-D rate-distortion

RBDWT region-based discrete wavelet transform ROI region Of interest

RWT reversible wavelet transform

SA-DCT shape adaptive discrete cosine transform SAQ successive approximation quantization SNR signal-to-noise ratio

SPIHT Set-Partitioning In Hierarchical Trees UTQ uniform threshold quantization/quantizer VO Video object

VOP Video object plane

WMSE weighted mean square error bpp bits per pixel

bps bits per second cpd cycles per degree ppd pixels per degree

Một phần của tài liệu luận văn thạc sĩ cao học ngành điện tử viên thông đề tài nén ảnh động dùng WAVELET (Trang 116 - 124)

Tải bản đầy đủ (PDF)

(124 trang)