Đối với tệp air.rgb:
Dung l−ợng đầu vào 426 Kb, dung l−ợng đầu ra 225 Kb cùng kích th−ớc frames 320x240. Do đó tỉ số nén là: 426 1.89333 225 R C = =
Dung l−ợng đầu vào là 426 Kb, dung l−ợng đầu ra là 214 Kb kích th−ớc 40x30. Do đó tỉ số nén là : 426 1.9999 214 R C = =
Đối với tệp Sound.Mp3 và Demọmp3 ta có:
Với tệp đầu vào MP3 đầu ra chúng ta có tệp định dạng MPEG4.ở đây chúng ta chú ý đến chất l−ợng của đầu ra hơn là chất l−ợng nén.File MPEG4 ở đây có chất l−ợng cao không có nhiễu ứng dụng trong truyền thông đa ph−ơng tiện.
Đối với tệp Global.avi:
Dung l−ợng đầu vào file Global.avi 3.46 Mb, dung l−ợng đầu ra Global.raw 3.38 Mb cùng kích th−ớc frames 320x240 pixels. Do đó tỉ số nén là: 3.46 1.026 3.38 R C = =
Dung l−ợng đầu vào file Global.raw 3.38MB , dung l−ợng đầu ra Global.wl 15.1 Kb kích th−ớc 320x240 với số khung xử lý là 15. Do đó tỉ số nén là : 3.38.1024 229.2 15.1 R C = =
Qua đây chúng ta thấy đối với ph−ơng pháp dùng wavelet chúng ta có tỷ lệ nén rất cao so với các ph−ơng pháp nén thông th−ờng.Hình sau minh hoạ quan hệ giữa kích th−ớc khung và tỷ số nén:
Với file Global.wl kích th−ớc 320x240 l−ợng tử là 129 và tổn hao dpcm =65 số frame 15 ta có : STT MSE RMSE PSNR 1 2754.689 52.485 13.76 2 2624.778 51.233 13.97 3 2720.400 52.157 13.82 4 2718.881 52.143 13.82 5 2744.705 52.390 13.78 6 2893.206 53.789 13.55 7 2929.208 54.122 13.50 8 2901.895 53.869 13.54 9 2825.329 53.154 13.65 10 2708.651 52.045 13.84 11 2645.592 51.435 13.94 12 2468.484 49.684 14.24 13 2413.063 49.123 14.34 14 2729.685 52.246 13.80 15 2884.536 53.708 13.56
Ta có đồ thị sau: MSE 0 500 1000 1500 2000 2500 3000 3500 1 3 5 7 9 11 13 15 MSE
Hình 4.2. Đồ thị quan hệ MSE giữa các khung
0 10 20 30 40 50 60 1 3 5 7 9 11 13 15 RMSE PSNR
Kết luận
Luận văn xin đ−ợc kết thúc với 1 vài định h−ớng. 1. ứng dụng luận văn
Một thuật toán mã hoá ảnh mới dùng wavelet (EZBC) đã đ−ợc giới thiệu trong ch−ơng tr−ớc. Thuật toán này đ−a đến 2 kỹ thuật thành công đó là - thiết lập sự phân chia và mô hình ngữ cảnh - cho hiệu quả mã hoá entropy đặc tr−ng cho mặt phẳng mã hoá. Không giống nh− cây nhị phân truyền thống- cơ sở bộ mã hoá phân chia, chúng ta có thể thiết lập cây tứ phân - dựa trên l−ợc đồ khối mã hoá zeroblock cho việc phân chia hệ số mã hoá wavelet. Đầu tiên chúng ta sẽ khai thác tính thống kê phụ thuộc vào cây quadtree giới thiệu trong bộ giải mã. Bộ mã hoá của chúng ta có 1 vài đặc tính −u việt so với mặt phẳng mã hoá truyền thống là tốc độ điều khiển chính xác và dụ đoán giải mã đa tốc độ.
Thuật toán này là lý t−ởng cho mã hoá phân giải scalable. Sự cải thiện rất lớn của PSNR thông qua thuật toán đó là kết quả mô phỏng.
Một hệ thống phân tích tổng hợp theo thời gian với việc bù chuyển động chính xác 1 nửa điểm ảnh (IMCTF) đ−ợc gi−ói thiệu trong ch−ơng 6. Băng lọc thời gian cho phép giải mã hoàn chỉnh tín hiệu Video. Chất l−ợng ảnh của băng lọc giải mã Video không bị ảnh h−ởng từ hiện t−ợng bóng mờ tác động th−ờng thấy trong bộ mã hoá 3-D thông th−ờng (không bù chuyển động).
Hệ thống mã hoá Video mới (IMC3D-EZBC) đ−ợc trình bày trong ch−ơng 7. Chúng ta minh hoạ kết quả thực nghiệm đó là sự thay đổi tốc độ bit mã hoá và phân giải không gian thời gian có thể đ−ợc giải mã từ 1 file nén đơn lẻ sử dụng hệ thống mã hoá mớị
Đối t−ợng mới - dựa trên hệ thống mã hoá OB-EZBC, mở rộng từ khung đầu vào EZBC, đ−ợc trình bày trong ch−ơng 3. Thuật toán đề xuất có khả năng mã hoá hình dạng ảnh tuỳ ý. Khả năng cao của EZBC đ−ợc giữ lại và luồng bit cho đối t−ợng riêng lẻ có thể phân giải tỷ lệ và mã hoá tốc độ độc lập.
2. H−ớng phát triển cho t−ơng lai
Một vài h−ớng phát triển cho t−ơng lai:
• Ưu điểm của mô hình ngữ cảnh: Sự thy đổi mang tính thống kê phụ thuộc
có thể đ−ợc quan sát trong cấu trúc hình tháp. Điều đó hy vọng rằng việc cải thiện nén ảnh có thể đạt đ−ợc bởi mô hình chiến l−ợc tinh vi có lợi cho việc lựa chọn và l−ợng tử hoá.
• Mô hình thống kê chính xác cho hệ số wavelet: L−ợc đồ l−ợng tử hoá lại có thể đ−ợc cải thiện sử dụng kả năng mô hình chính xác, chuẩn hoa bởi hàm mật độ Gaussian, thay vì hình thành hàm mật độ hiện thờị
• Việc thích nghi trong cấu trúc băng con và kích th−ớc GOP: Phân tích 2
băng con và kích th−ớc cố định GOP (chỉ cho Video) đ−ợc sử dụng cho hệ thống mã hoá hiện thờị Kết quả tìm đ−ợc trong mục 6.5. Tập trung năng l−ợng băng con sẽ tăng khi phân chia tần số cao cho mô hình ảnh. Có thể cải thiện nhờ sử dụng phân giải gói wavelet cho việc tối −u hoá băng con theo không gian và thời gian.
TàI LIệU THAM KHảO
[1] M. R. Aaron, “The digital (r)evolution, ” IEEE Commụ Mag., pp.21–22, 1974.
[2] J. M. Shapiro, “Embeđed image coding using zerotrees of wavelet coefficients, ” IEEE Trans. on Signal Processing, vol.41, pp.3445–3462, Dec.1993.
[3] G. K. Wallace, “The JPEG still picture compression standard, ”Communications of the ACM, vol.34, pp.30–44, April 1991.
[4] W. P. Pennebaker and J. L. Mitchell, JPEG Still Image Data Compression Standard. New York: Van Nostrand Reinhold, 1993.
[5] ISO/IEC, Information Technology — Lossless and Near-Lossless Compression of Continuous-Tone Still Images. ISO/IEC 14495-1, ITU
Recommend. T.87, Dec.1994.
[6] M. J. Weinberger, G. Seroussi, and G. Sapiro, “The LOCO-I lossless image compression algorithm: principles and standardization into JPEG-LS, ”
IEEE Trans. Image Processing, vol.9, pp.1309–1324, Aug.2000. [Online].
Available: http: //www. hpl. hp. com/locọ
[7] ISO/IEC, Information Technology — Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to 1.5 Mbps. ISO/IEC
11172-2, 1992.
[8] ISO/IEC, Information Technology — Generic Coding of Moving Pictures
and Associated Audio Informations: Video. ISO/IEC 13818-2, 1995.
[9] ISO/IEC, Information Technology — Coding of Audio-Visual Objects —
Part 2: Visual. ISO/IEC 14496-2, Dec.1994.
[10] ITU Telecommunication Standardization Sector of ITU, Video Codec
for Audiovisual Services at p ì 64 kbits/sec. ITU-T Recommendation H.261,
[11] ITU Telecommunication Standardization Sector of ITU, Video Coding for Low Bitrate Communication. ITU-T Recommendation H.263,
Mar.1996.
[12] ITU Telecommunication Standardization Sector of ITU, Video Coding for Low Bitrate Communication. ITU-T Recommendation H.263
Version 2, Jan.1993.
[13] Digital Imaging Group, Inc, Flashpix Format Specification, version 1.0.2, July 1993.
[14] D. Taubman, “High performance scalable image compression with EBCOT, ”IEEE Trans. Image Processing, vol.9, pp.1158 –1170, July 2000. [15] ISO/IEC, ISO/IEC FCD 15444-1: Information Technology — JPEG 2000
image coding system: Core coding system. ISO/IEC JTC1/SC 29/WG N1646,
Mar.2000.
[16] W. Li, “Overview of fine granularity scalability in MPEG-4 Video standard” IEEE Trans. Circuits and Syst. for Video Technol., vol.11, pp.301– 317, Mar.2001.Speical Issue on Streaming Video.
[17] S. -T. Hsiang and J. W. Woods, “Embeđed image coding using zeroblocks of subband/wavelet coefficients and context modeling, ” in Proc.
of IEEE In tSymp. on Circuits and Systems, vol.3, (Geneva), pp.662–665, May
2000.
[18] S. -T. Hsiang and J. W. Woods, “Embeđed Video coding using motion compensated 3-D subband/wavelet filter bank, ” in Packet Video Workshop, (Sardinia, Italy), May 2000.
[19] S.-T. Hsiang, “Embeđed image coding using zeroblocks of subband/wavelet coefficients and context modeling, ” in Proc.2001 IEEE
PHụ LụC
THUậT NGữ tiếng anh
3-D three - dimensional
AGP alphabet and group partitioning
APSG alphabet partitioning and sample grouping
CREW Compression with Reversible Embeđed Wavelets CSF contrast sensitivity function
DCT discrete cosine transform DFD displaced frame difference
DPCM differential pulse code modulation DVR display visual resolution
DWT discrete wavelet transform
EBCOT Embeđed Block Coding with Optimal Truncation EZBC Embeđed ZeroBlock Coding and context modeling EZW Embeđed image coding using Zerotrees of Wavelet
coefficients
FGS fine granularity scalability GOP group of pictures
HDTV high definition television HVS human visual system
HVSBM hierarchical variable size block matching
IMCTF invertible motion compensated temporal subband/wavelet filtering system
JND just noticeable distortion
LSB least significant bit LZC Layered Zero Coding
MC motion compensated/compensation MND minimally noticeable distortion MPEG Moving Picture Experts Group MSB most significant bit
MSE mean square error PCM pulse code modulation PSF point spread function PSNR peak signal-to-noise ratio R-D rate-distortion
RBDWT region-based discrete wavelet transform ROI region Of interest
RWT reversible wavelet transform
SA-DCT shape adaptive discrete cosine transform SAQ successive approximation quantization SNR signal-to-noise ratio
SPIHT Set-Partitioning In Hierarchical Trees UTQ uniform threshold quantization/quantizer VO Video object
VOP Video object plane
WMSE weighted mean square error bpp bits per pixel
bps bits per second cpd cycles per degree ppd pixels per degree