1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ khoa học: Nén ảnh động dùng wavelet

124 28 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 124
Dung lượng 2,74 MB

Nội dung

Bộ giáo dục đào tạo TRờNG ĐạI Học BáCH KHOA Hµ Néi Luận văn thạc sĩ khoa học nén ảnh động dùng wavelet Ngành: §iƯn tư viƠn th«ng Ng−êi h−íng dÉn khoa häc: PGS TS Hå Anh T Hµ néi 2005 Mơc lơc Trang Lời nói đầu Ch−¬ng TỉNG QUAN VỊ NÐN ¶NH Video THEO CHN MPEG 1.1 Kh¸i niƯm vỊ Video phơng pháp nén Video 1.1.1 Kh¸i niƯm Video 1.1.1.1 Kh«ng gian mÇu (Color Space) 1.1.1.2 Các cấu số hoá tín hiệu Video 1.1.2 C¸c phơng pháp nén Video 1.1.2.1 Giảm tốc độ dòng bit 1.1.2.2 Nén dòng tín hiệu Video số theo không gian 10 1.1.2.3 NÐn dßng tÝn hiÖu theo thêi gian 11 1.1.2.4 Nén hỗn hợp sử dụng tổ hợp phơng pháp 11 1.1.3 Tham sè nÐn Video 11 1.2 Giíi thiƯu chung vỊ chn MPEG 12 1.3 Các khái niệm nén Video theo chn MPEG 14 1.3.1 CÊu tróc ph©n cÊp Video theo chuÈn MPEG 14 1.3.2 Phân loại frame Video 17 1.3.3 Nhãm ¶nh (GOP: Group Of Picture) 19 1.4 Phơng pháp nén ảnh Video theo chuẩn MPEG 21 1.4.1 Mô hình tổng qu¸t bé m· ho¸ Video theo chuÈn MPEG 21 1.4.2 Lấy mẫu thông tin màu 22 1.4.3 L−ỵng tư ho¸ 23 1.4.4 Néi suy ¶nh 23 1.4.5 Dự đoán bù chuyển động 24 1.4.5.1 Đánh giá chuyển động (motion estimation) 24 1.4.5.2 Bï chun ®éng (Motion Compensation) 24 1.4.6 Biến đổi Cosine rời rạc 26 1.4.7 M· VLC 27 1.5 Quá trình nén Video theo chuÈn MPEG-1 27 1.5.1 Tham số đặc trng 27 1.5.2 Qu¸ trình mà hoá 28 1.5.3.Quá trình giải mà 32 1.6 Quá trình nén Video theo chuẩn MPEG-2 33 1.6.1 Tham số đặc trng 36 1.6.2 Mô hình mà hoá Non-scalable theo MPEG-2 37 1.6.3 Mô hình mà hoá scalable theo MPEG-2 38 Chơng M hoá SCALABLE VIDEO 42 2.1 Băng lọc 1/2 pixel biến đổi ngợc theo thời gian - tính toán bù chuyển động 42 2.1.1 Giíi thiƯu 44 2.1.2 ThuËt to¸n 46 2.1.2.1 Mô hình Video phæ biÕn 46 2.1.2.2 Qt l tiÕn Video víi vÐct¬ chun động xác 1/2 điểm ảnh 49 2.1.2.3 Di chun cơc bé më réng 51 2.1.3 Ba tham sè m· hoá băng sử dụng IMCTF 54 2.1.4 KÕt qu¶ thùc nghiƯm 55 2.1.5 Tãm tắt kết luận 59 2.2 M· ho¸ scalable video 61 2.2.1 Kh¸i qu¸t 62 2.2.1.1 M· ho¸ lai truyÒn thèng 63 2.2.1.1.1.M· ho¸ Scalable SNR 63 2.2.1.1.2 Phân giải mà Scalable 66 2.2.1.2 Embedded Coding and Fine Granularity Scalability 66 2.2.1.3 Mà hoá sử dụng băng chiều mà hoá Wavelet 69 2.2.2 HƯ thèng tỉng quan 70 2.2.3 Băng mà ho¸ chiỊu 71 2.2.4 Tỷ lệ dòng bít mà hoá 74 2.2.4.1.HƯ thèng dßng bÝt 74 2.2.4.2 Lùa chän dßng bÝt mà hoá truyền dẫn 78 2.2.5 KÕt qu¶ thùc nghiƯm 81 2.2.5.1 So s¸nh víi m· ho¸ Nonscalable 81 2.2.5.2 So sánh mà hoá LZC 3D-SPIHT 83 2.2.5.3 Mà hoá tốc độ đa phân giải 86 2.2.6 Tãm t¾t vµ kÕt luËn 91 Chơng Đối tợng-cơ sở m hoá SCALABLE 95 3.1 Đối tợng - Cơ sở mà hoá 97 3.1.1 Mặt phẳng đối tợng Video 97 3.1.2 Công cụ mà hoá cho đối tợng Video 98 3.1.2.1 Định dạng mà ho¸ 98 3.1.2.2 CÊu tróc m· ho¸ 99 3.2 Đối tợng-Cơ së m· ho¸ sư dơng EZBC 100 3.2.1 Tæng quan 101 3.2.2 Miền Cơ sở biến đổi Wavelet rời rạc 102 3.2.3 Đối tợng-Cơ sở mà hoá mặt phẳng bít EZBC 103 3.3 KÕt qu¶ thùc nghiƯm 104 3.4 Tãm t¾t vµ kÕt luËn 106 Chơng 4: Chơng trình thử nghiệm đánh giá kết 111 4.1 Xây dựng chơng trình 111 4.1.1 Kh¸i qu¸t chung 111 4.1.2 Cấu trúc chơng trình 111 4.2 Đánh giá kết thư nghiƯm 112 4.2.1 D÷ liƯu thư nghiƯm 112 4.2.2 KÕt qu¶ thư nghiƯm 112 4.2.3 NhËn xÐt vÒ tû sè nÐn,chÊt l−ỵng nÐn 115 KÕt luËn 118 øng dông luËn văn 118 Hớng phát triển cho tơng lai 119 TµI LIƯU THAM KH¶O 120 PHô LôC 122 THUËT NG÷ tiÕng anh 122 Lời nói đầu Trong năm gần phát triển mạnh mẽ Internet nên vấn đề truyền liệu mạng đặc biệt truyền ảnh âm đợc quan tâm Do việc nén liệu đặc biệt liệu phim ảnh cần thiết hết Trong phạm vi luận văn tập trung vào việc nén liệu video Đối với nén ảnh động, chuẩn MPEG(Moving Photographic Experts Group) đà đợc xác lập ISO IEC Đây kỹ thuật nén ảnh động đà mang lại nhiều thành công Nó đạt tỷ lệ nén cao 10:1 mà mắt thờng khó phân biệt đợc Tuy nhiên cha phải tû lƯ cao tèi −u Sù ®êi cđa Wavelet đà mở công nghệ Đó chuẩn MJPEG2000 Sự đời MJPEG2000 mở tơng lai cho kỹ thuật nén ảnh với tính cao Kỹ thuật Wavelet đợc nghiên cứu nhiều phần mềm nh Matlap Mục đích luận văn nhằm nghiên cứu số phơng pháp nén ảnh động đợc quan tâm Luận văn đợc trình bày thành bốn chơng phụ lục Chơng Một tổng quan nén ảnh động Chơng giới thiệu số chuẩn nén ảnh động MPEG1,MPEG2,MPEG4 MPEG7 Đồng thời trình bày cấu trúc video Chơng Hai trình bày phơng pháp nén Scalable video Chơng đề cập đến thuật toán LZC 3D-SPIHT Chơng Ba sâu vào nghiên cứu đối tợng mà hoá video dựa biến đổi Wavelet Chơng Bốn nêu khái quát cách thiết kế cài đặt chơng trình Chơng mang tính chất minh hoạ cho đà đợc trình bày chơng trớc Phần phụ lục nêu số chơng trình nguồn thông dụng viÕt trªn Visual C + + Do thêi gian có hạn nên nghiên cứu đợc phần kỹ thuật nén ảnh động chắn không tránh khỏi thiếu sót Cuối xin chân thành cảm ơn giúp đỡ nhiệt tình hiệu PGS TS Hồ Anh Tuý đà giúp đỡ hoàn thành luận văn Hà nội ngày 20/10/2005 Đồ án cao học ĐTVT 2003 Chơng TỉNG QUAN VỊ NÐN ¶NH Video THEO CHN MPEG 1.1 Khái niệm Video phơng pháp nén Video 1.1.1 Khái niệm Video Video biểu diễn điện tử chuỗi ảnh liên tiếp Những ảnh ảnh tĩnh đợc gọi frame Chuỗi frame xuất với tốc độ nhanh cho ta cảm giác chuyển động liên tục (tối thiểu 25frame/giây) Mặc dù frame có khác nhau, cần thiết phải có tốc độ frame cao để đạt đợc cảm giác chuyển động thực Tốc độ frame độ phân giải frame nhân tố quan trọng ảnh hởng trực tiếp đến chất lợng Video Trong truyền hình, độ phân giải truyền hình 720x576 tốc độ frame 25 30 Hz 1.1.1.1 Không gian mầu (Color Space) Dựa theo lý thuyết ảnh màu, cảm thụ màu mắt sở màu bản: màu ®á (Red), mµu lơc (Green) vµ mµu lam (Blue) Trong hệ màu RGB, màu đợc mô tả điểm bên hình lập phơng đơn vị, với gốc toạ độ (0, 0, 0) màu đen; thành phần R (đỏ), G (lục), B (lam) biểu diƠn cho trơc Mét hƯ thèng biĨu diƠn mµu khác đợc sử dụng lĩnh vực truyền hình nhằm giúp việc số hóa đợc thuận lợi hệ màu YUV, miêu tả ảnh Video gồm thành phần độ chói (Y) sắc màu (UV) Hệ màu nhằm đạt đợc hiệu suất truyền cao hơn, giữ nguyên tính tơng thích với hệ số truyền hình màu đen trắng Thành phần chói (luminance) cung cấp giá trị mức xám ảnh, hai thành phần lại mang thông tin màu sắc (chrominance) để chuyển đổi từ ảnh xám sang ảnh màu Nguyễn Hữu Phát Đồ án cao học ĐTVT 2003 Chuyển đổi RGB sang YUV đợc thực theo chuẩn CCIR 601 nh− sau: Y = 0.299R + 0.587G + 0.114B U = 0.493 (B - Y) V = 0.877 (R - Y) đó: Y thành phần chói U, V hai thành phần màu Đặc biệt: R = G = B th× Y = R = G = B U = V = Một định dạng màu khác là, tơng tự YUV Y, CB, CR với Y tơng tự nh hai thành phÇn nh− sau: CB = U/2 + 0.5 CR = V/1.6 + 0.5 Do đó, màu CB, CR nằm khoảng [0, 1] Với u điểm hệ YCBCR đợc áp dụng rộng rÃi việc số hoá Video 1.1.1.2 Các cấu số hoá tín hiệu Video Hình 1.1 Cấu trúc lấy mẫu Nguyễn Hữu Phát Đồ án cao học ĐTVT 2003 Trong truyền hình, frame chuỗi Video có độ phân giải 720 x 576 điểm có tốc độ frame 25 30Hz Mỗi ảnh chuỗi Video đợc lấy số hoá nh hình 1.1 Cấu trúc 4: 2: Giả sử dòng ngang TV gồm 720 điểm ảnh Hình 1.2 CÊu tróc lÊy mÉu 4: 2: ViƯc lÊy mẫu diễn nh sau: - Điểm đầu lấy mẫu tín hiệu chói (Y) lấy mẫu màu (CB, CR) - Điểm lấy mẫu tín hiệu chói (Y) không lấy mẫu tín hiệu Khi giải mÃ, màu suy từ điểm ¶nh tr−íc Tn tù nh− vËy, cø lÇn lÊy mÉu Y, cã lÇn lÊy mÉu CR, lÇn lÊy mÉu CB CÊu tróc 4: 1: H×nh 1.3 Cấu trúc lấy mẫu 4: 1: Điểm ảnh lấy mẫu đủ Y, CR, CB, điểm kế tiÕp chØ lÊy mÉu Y, kh«ng lÊy mÉu tÝn hiƯu màu Khi giải mÃ, mầu điểm ảnh phải suy từ điểm ảnh đầu Tuần tự nh vậy, cø lÇn lÊy mÉu Y, cã lÇn lÊy mÉu CR, lÇn lÊy mÉu CB CÊu tróc lÊy mẫu 4: 2: Nguyễn Hữu Phát Đồ án cao học ĐTVT 2003 Lấy mẫu tín hiệu Y tất điểm ảnh dòng, tín hiệu màu Y, có màu CR CB cách theo hàng Hình 1.4 Cấu trúc lÊy mÉu 4: 2: CÊu tróc lÊy mÉu 4: 4: LÊy mÉu tÝn hiƯu Y, CR, CB t¹i tất điểm ảnh dòng Hình 1.5 Cấu trúc lấy mẫu 4: 4: 1.1.2 Các phơng pháp nÐn Video Mơc tiªu chÝnh cđa viƯc nÐn tÝn hiƯu Video lµ biĨu diƠn mét ngn tÝn hiƯu Video b»ng số bit đợc mà đảm bảo yêu cầu chất lợng cảm thụ Với tín hiệu Video, giới hạn dải thông tín hiệu tơng tự khoảng 6MHz, tín hiệu Video số hoá theo tiểu chuẩn CCIR 601 với tốc độ bit 270Mbit/s chiếm dải thông không dới 189MHz, tức lớn 31,5 lần so với dải thông tín hiệu tơng tự Chính vậy, giảm dải thông vấn đề quan trọng với công nghệ Video số Về giảm dải thông đợc thực cách: - Giảm tốc độ dòng bit (bit Rate Reduction - BRR) Nguyễn Hữu Phát Đồ án cao học ĐTVT 2003 - Nén dòng tín hiệu Video số theo không gian, tức giảm độ d thừa số frame (spatial redundancy) - NÐn dßng tÝn hiƯu theo thêi gian, tức giảm độ d thừa theo thời gian (temporal redundancy) - Nén hỗn hợp sử dụng tổ hợp phơng pháp 1.1.2.1 Giảm tốc độ dòng bit Có hai phơng pháp giảm tốc độ dòng bit Cách thứ dựa đặc điểm sinh lý mắt ngời Mắt ngời không nhạy cảm với tín hiệu màu nên phơng pháp này, ngời ta giảm bớt độ phân giải tín hiệu màu Cách thứ hai dựa ý nghĩa bit lợng tử hoá điểm ảnh Với bit lợng tử hoá, bit byte đợc chia làm hai nhóm: nhóm có ý nghĩa (MMB-More Meaning Bit) nhóm ý nghĩa (LMB-Less Meaning Bit) Việc ta cắt giảm bit nhóm LMB không ảnh hởng nhiều tới chất lợng ảnh Tuy nhiên, phơng pháp không đợc chấp nhận giải pháp giảm dải thông tại, nên không đợc đề cập đến Phần lớn định dạng số thành phần sử dụng tần số lấy mẫu 13.5MHz tín hiÖu chãi Theo chuÈn CCIR 601, nÕu tÝn hiÖu màu đợc lấy màu đợc lấy mẫu với tần số nh tín hiệu chói, có định dạng 4: 4: 4.Định dạng đợc sử dụng thiết bị dựng phim phi tuyến đồ hoạ vi tính liên quan đến phim nhựa Tốc độ bit định dạng cho hệ PAL là: Với lợng tư ho¸ bit: (720 + 720 +720) x 576 x x 25 = 249 Mbit/s Víi l−ỵng tư hãa 10 bit: (720 + 720 +720) x 576 x 10 x 25 = 311 Mbit/s Trong ®ã: 720 x 576 độ phân giải hình (576 số dòng /frame) 25 tốc độ chuyển ảnh (25 frames/s) Nguyễn Hữu Phát Đồ án cao học ĐTVT 2003 Hình 3.8 MISS AMERICA mà hoá 0.05 bpp Hệ số mặt phẳng bit liên quan đến bề mặt ảnh bị tăng mức (giữa bên trái), mức (giữa bên phải), ba mức (trên bên phái) mức (dới bên phải) Nguyễn Hữu Phát 109 Đồ án cao học ĐTVT 2003 Hình 3.9 Ví dụ ứng dụng mà hoá scalable- đối tợng ảnh từ hình 3.5 đợcgiải mà tốc độ bittrung bình 1.0 bpp độ phân giải khác cho ảnh cuối Nguyễn Hữu Phát 110 Đồ án cao học ĐTVT 2003 Chơng 4: Chơng trình thử nghiệm đánh giá kết 4.1 Xây dựng chơng trình 4.1.1 Khái quát chung Chơng trình đợc viết Visual C++ 6.0.Chơng trình thực chức sau: ChuyÓn tõ file video AVI (*.avi) sang file RAW(*.raw) HiÓn thị thông số file avi Chuyển từ file RGB(*.rgb) sang file định dạng YUV (*.yuv) Hiển thị thông tin file RGB YUV Tạo file MPEG4 từ file đầu vào dạng MP3,H.263,ACC, AMR,DIVX,MP4AV,M4V,CMP,XVID Hiển thị thông tin file MPEG4 ChuyÓn tõ file RAW sang file WAVELET 4.1.2 CÊu trúc chơng trình Cấu trúc chơng trình gồm chức sau: a Cửa sổ thực nén cho phép nhập file video *.avi đầu vào, ghi file đầu dạng raw b Cửa sổ hiển thị cho phép hiển thị thông tin file *.avi nh loại file avi,tèc ®é frame,sè frame file,®é lín cđa frame c Cưa sỉ thùc hiƯn nÐn cho phÐp nÐn tõ file *.rgb đầu vào,ghi file *.yuv với tham sè t chän lµ chiỊu cao vµ chiỊu réng cđa frame d Cưa sỉ hiĨn thÞ cho phÐp hiĨn thÞ thông tin file *.rgb (hoặc *.yuv) với thông số đầu vào nh chiếu cao chiều rộng số frames/s đầu gồm kích thớc y,u,v frame đà đọc e Cưa sỉ thùc hiƯn nÐn cho phÐp nÐn tõ file *.mp3,H.263,ACC, AMR,DIVX,MP4AV,M4V,CMP,XVID đầu vào,ghi file MPEG4 (*.mp4) đầu với tham số tuỳ chọn tốc độ frame, sử dụng Nguyễn Hữu Phát 111 Đồ án cao học ĐTVT 2003 định dạng file ACC,cho phép file AVI, tính toán tốc độ bit H263,cho phép thay đổi tốc độ bít,tối u hoá,liệt kê track f Cửa sổ hiển thị cho phép hiển thị thông tin file *.mp4 đầu gồm số track,loại track,thông tin track g Chơng trình wavelet thực nén file Video đầu vào định dạng RAW(*.raw) sử dụng Wavelet, ghi file đầu WAVELET(*.wl) h Chơng trình giải nén thực đọc file WAVELET(*.wl) đầu vào Trong chơng trình có sử dụng số cấu trúc liệu, module thực thuật toán cho trình nén trình giải nén Do mà nguồn cho chơng trình dài, đa số phần vào phần phụ lục luận văn 4.2 Đánh giá kết thử nghiệm 4.2.1 Dữ liệu thử nghiệm Dữ liƯu thư nghiƯm lµ hai tƯp: TƯp air.rgb : dung l−ỵng 426 Kb,file thu trùc tiÕp tÝn hiƯu Red Green Blue Tệp Sound.mp3: dung lợng 2.85 KB file mp3.Đây file nhạc Audio định dạng theo chuẩn MP3 Tệp Demo.mp3: dung lợng 36.3 KB file mp3.Đây file nhạc Audio định dạng theo chuẩn MP3 TƯp global.avi : dung l−ỵng 3.46 MB.KÝch th−íc frame 320x240 gồm 107 frames.Tốc độ truyền 15 frames/s Đây tƯp cđa thư nghiƯm cđa Visual C++ 4.2.2 KÕt qu¶ thử nghiệm Kết thu đợc cho tệp air.rgb nh sau: Đánh giá cho tệp air.rgb : Nguyễn Hữu Phát 112 Đồ án cao học ĐTVT 2003 RGB YUV YUV YUV YUV TƯp gèc air.rgb air.yuv air.yuv air.yuv air.yuv Lo¹i tƯp RGB YUV YUV YUV YUV Dung l−ỵng 426 Kb 214 Kb 225 Kb 253 Kb 213 Kb 320 pixels 40 pixels 320 pixels 240 pixels 40 pixels 240 pixels 30 pixels 240 pixels 240 pixels 40 pixels 122 91 KÝch th−íc Y 1200 76800 57600 1600 KÝch th−íc 300 19200 14400 400 ChiỊu réng frames ChiỊu cao frames Số frames xử lý UV Bảng 4.1: Đánh giá tham số tệp air.rgb air.yuv Đánh giá cho tệp Demo.mp3 Sound.mp3 tốc độ 30 frames/s thu đợc kết Tệp gốc Demo.mp3 Demo.mp4 Sound.mp3 Sound.mp4 Loại tệp MP3 MPEG4 MP3 MPEG4 Dung l−ỵng 36.3 KB 41.8 KB 2.85 KB 4.45 KB Video frames/s 30 30 Time Scale 9000 9000 Play load 1460 1460 Bảng 4.2: Đánh giá tham số tệp Demo.mp3 Sound.mp3 Phân tích thông tin file Demo.mp4 Sound.mp3 ta thu đợc : Nguyễn Hữu Phát 113 Đồ án cao học ĐTVT 2003 Tên tệp STT track Loại track Thông tin track Demo.mp4 Audio MPEG-2 Audio,56Kbps,90000Hz Hint Playload MPA cho track Bảng 4.3: Tham số tệp Demo.mp3 Tên tệp STT track Loại track Thông tin track Sound.mp4 Audio MPEG-1 Audio,128Kbps,90000Hz Hint Playload MPA cho track B¶ng 4.4: Tham số tệp Sound.mp3 Kết thu đợc cho tƯp global.avi nh− sau: TƯp gèc Global.avi Global.raw Global.wl Lo¹i tƯp AVI RAW WAVELET Dung l−ỵng 3.46 MB 3.38 MB 15.1KB ChiÒu réng 320 pixels 320 pixels 320 pixels 240 pixels 240 pixels 240 pixels 107 107 15 frames ChiÒu cao frames Số frames Bảng 4.5: Đánh giá tệp Global.avi Minh hoạ frame file global.avi: Nguyễn Hữu Phát 114 Đồ án cao học ĐTVT 2003 Hình 4.1: Một frame file Global.avi 4.2.3 NhËn xÐt vÒ tû sè nén,chất lợng nén Đối với tệp air.rgb: Dung lợng đầu vào 426 Kb, dung lợng đầu 225 Kb kích thớc frames 320x240 Do tỉ số nén là: CR = 426 = 1.89333 225 Dung lợng đầu vào 426 Kb, dung lợng đầu 214 Kb kích thớc 40x30 Do tỉ số nén : CR = 426 = 1.9999 214 §èi víi tƯp Sound.Mp3 Demo.mp3 ta có: Với tệp đầu vào MP3 đầu có tệp định dạng MPEG4.ở ý đến chất lợng đầu chất lợng nén.File MPEG4 có chất lợng cao nhiễu ứng dụng truyền thông đa phơng tiện Đối với tệp Global.avi: Dung lợng đầu vào file Global.avi 3.46 Mb, dung lợng đầu Global.raw 3.38 Mb cïng kÝch th−íc frames 320x240 pixels Do ®ã tØ sè nÐn lµ: CR = 3.46 = 1.026 3.38 Ngun Hữu Phát 115 Đồ án cao học ĐTVT 2003 Dung lợng đầu vào file Global.raw 3.38MB , dung lợng đầu Global.wl 15.1 Kb kÝch th−íc 320x240 víi sè khung xử lý 15 Do tỉ số nén : CR = 3.38.1024 = 229.2 15.1 Qua thấy phơng pháp dùng wavelet có tỷ lệ nén cao so với phơng pháp nén thông thờng.Hình sau minh hoạ quan hệ kÝch th−íc khung vµ tû sè nÐn: Víi file Global.wl kích thớc 320x240 lợng tử 129 tổn hao dpcm =65 sè frame 15 ta cã : STT 10 11 12 13 14 15 MSE RMSE PSNR 2754.689 52.485 13.76 2624.778 51.233 13.97 2720.400 52.157 13.82 2718.881 52.143 13.82 2744.705 52.390 13.78 2893.206 53.789 13.55 2929.208 54.122 13.50 2901.895 53.869 13.54 2825.329 53.154 13.65 2708.651 52.045 13.84 2645.592 51.435 13.94 2468.484 49.684 14.24 2413.063 49.123 14.34 2729.685 52.246 13.80 2884.536 53.708 13.56 B¶ng 4.6: Sai sè psnr cđa tƯp Global.wl Nguyễn Hữu Phát 116 Đồ án cao học ĐTVT 2003 Ta có đồ thị sau: MSE 3500 3000 2500 2000 MSE 1500 1000 500 11 13 15 Hình 4.2 Đồ thị quan hệ MSE khung 60 50 40 RMSE 30 PSNR 20 10 11 13 15 Hình 4.3 Đồ thị quan hệ RMSE PSNR khung Nguyễn Hữu Phát 117 Đồ án cao học ĐTVT 2003 Kết luận Luận văn xin đợc kết thúc với vài định hớng ứng dụng luận văn Một thuật toán mà hoá ảnh dùng wavelet (EZBC) đà đợc giới thiệu chơng trớc Thuật toán đa đến kỹ thuật thành công - thiết lập phân chia mô hình ngữ cảnh - cho hiệu mà hoá entropy đặc trng cho mặt phẳng mà hoá Không giống nh nhị phân truyền thống- sở mà hoá phân chia, cã thĨ thiÕt lËp c©y tø ph©n - dùa lợc đồ khối mà hoá zeroblock cho việc phân chia hệ số mà hoá wavelet Đầu tiên khai thác tính thống kê phụ thuộc vào quadtree giới thiệu giải mà Bộ mà hoá có vài đặc tính u việt so với mặt phẳng mà hoá truyền thống tốc độ điều khiển xác dụ đoán giải mà đa tốc độ Thuật toán lý tởng cho mà hoá phân giải scalable Sự cải thiện lớn PSNR thông qua thuật toán kết mô Một hệ thống phân tích tổng hợp theo thời gian với việc bù chuyển động xác nửa điểm ảnh (IMCTF) đợc giói thiệu chơng Băng lọc thời gian cho phép giải mà hoàn chỉnh tín hiệu Video Chất lợng ảnh băng lọc giải mà Video không bị ảnh hởng từ tợng bóng mờ tác động thờng thấy mà hoá 3-D thông thờng (không bù chuyển động) Hệ thống mà hoá Video (IMC3D-EZBC) đợc trình bày chơng Chúng ta minh hoạ kết thực nghiệm thay đổi tốc độ bit mà hoá phân giải không gian thời gian đợc giải mà từ file nén đơn lẻ sử dụng hệ thống mà hoá Nguyễn Hữu Phát 118 Đồ án cao học ĐTVT 2003 Đối tợng - dựa hệ thống mà hoá OB-EZBC, mở rộng từ khung đầu vào EZBC, đợc trình bày chơng Thuật toán đề xuất có khả mà hoá hình dạng ảnh tuỳ ý Khả cao EZBC đợc giữ lại luồng bit cho đối tợng riêng lẻ phân giải tỷ lệ mà hoá tốc độ độc lập Hớng phát triển cho tơng lai Một vài hớng phát triển cho tơng lai: ã Ưu điểm mô hình ngữ cảnh: Sự thy đổi mang tính thống kê phụ thuộc đợc quan sát cấu trúc hình tháp Điều hy vọng việc cải thiện nén ảnh đạt đợc mô hình chiến lợc tinh vi có lợi cho việc lựa chọn lợng tử hoá ã Mô hình thống kê xác cho hệ số wavelet: Lợc đồ lợng tử hoá lại đợc cải thiện sử dụng kả mô hình xác, chuẩn hoa hàm mật độ Gaussian, thay hình thành hàm mật độ thời ã Việc thích nghi cấu trúc băng kích thớc GOP: Phân tích băng kích thớc cố định GOP (chỉ cho Video) đợc sử dụng cho hệ thống mà hoá thời Kết tìm đợc mục 6.5 Tập trung lợng băng tăng phân chia tần số cao cho mô hình ảnh Có thể cải thiện nhờ sử dụng phân giải gói wavelet cho việc tối u hoá băng theo không gian thời gian Nguyễn Hữu Phát 119 Đồ án cao học ĐTVT 2003 TàI LIệU THAM KHảO [1] M R Aaron, “The digital (r)evolution, ” IEEE Commu Mag., pp.21–22, 1974 [2] J M Shapiro, “Embedded image coding using zerotrees of wavelet coefficients, ” IEEE Trans on Signal Processing, vol.41, pp.3445–3462, Dec.1993 [3] G K Wallace, “The JPEG still picture compression standard, ”Communications of the ACM, vol.34, pp.30–44, April 1991 [4] W P Pennebaker and J L Mitchell, JPEG Still Image Data Compression Standard New York: Van Nostrand Reinhold, 1993 [5] ISO/IEC, Information Technology — Lossless and Near-Lossless Compression of Continuous-Tone Still Images ISO/IEC 14495-1, ITU Recommend T.87, Dec.1994 [6] M J Weinberger, G Seroussi, and G Sapiro, “The LOCO-I lossless image compression algorithm: principles and standardization into JPEG-LS, ” IEEE Trans Image Processing, vol.9, pp.1309–1324, Aug.2000 [Online] Available: http: //www hpl hp com/loco [7] ISO/IEC, Information Technology — Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to 1.5 Mbps ISO/IEC 11172-2, 1992 [8] ISO/IEC, Information Technology — Generic Coding of Moving Pictures and Associated Audio Informations: Video ISO/IEC 13818-2, 1995 [9] ISO/IEC, Information Technology — Coding of Audio-Visual Objects — Part 2: Visual ISO/IEC 14496-2, Dec.1994 [10] ITU Telecommunication Standardization Sector of ITU, Video Codec for Audiovisual Services at p × 64 kbits/sec ITU-T Recommendation H.261, 1994 Nguyễn Hữu Phát 120 Đồ án cao häc §TVT 2003 [11] ITU Telecommunication Standardization Sector of ITU, Video Coding for Low Bitrate Communication ITU-T Recommendation H.263, Mar.1996 [12] ITU Telecommunication Standardization Sector of ITU, Video Coding for Low Bitrate Communication ITU-T Recommendation H.263 Version 2, Jan.1993 [13] Digital Imaging Group, Inc, Flashpix Format Specification, version 1.0.2, July 1993 [14] D Taubman, “High performance scalable image compression with EBCOT, ”IEEE Trans Image Processing, vol.9, pp.1158 –1170, July 2000 [15] ISO/IEC, ISO/IEC FCD 15444-1: Information Technology — JPEG 2000 image coding system: Core coding system ISO/IEC JTC1/SC 29/WG N1646, Mar.2000 [16] W Li, “Overview of fine granularity scalability in MPEG-4 Video standard” IEEE Trans Circuits and Syst for Video Technol., vol.11, pp.301– 317, Mar.2001.Speical Issue on Streaming Video [17] S -T Hsiang and J W Woods, “Embedded image coding using zeroblocks of subband/wavelet coefficients and context modeling, ” in Proc of IEEE In tSymp on Circuits and Systems, vol.3, (Geneva), pp.662–665, May 2000 [18] S -T Hsiang and J W Woods, “Embedded Video coding using motion compensated 3-D subband/wavelet filter bank, ” in Packet Video Workshop, (Sardinia, Italy), May 2000 [19] S.-T Hsiang, “Embedded image coding using zeroblocks of subband/wavelet coefficients and context modeling, ” in Proc.2001 IEEE Data Compression Conference, (Snowbird, Utah), Mar.2001 Nguyễn Hữu Phát 121 Đồ án cao học ĐTVT 2003 PHụ LụC THUậT NGữ tiếng anh 3-D three - dimensional AGP alphabet and group partitioning APSG alphabet partitioning and sample grouping CREW Compression with Reversible Embedded Wavelets CSF contrast sensitivity function DCT discrete cosine transform DFD displaced frame difference DPCM differential pulse code modulation DVR display visual resolution DWT discrete wavelet transform EBCOT Embedded Block Coding with Optimal Truncation EZBC Embedded ZeroBlock Coding and context modeling EZW Embedded image coding using Zerotrees of Wavelet coefficients FGS fine granularity scalability GOP group of pictures HDTV high definition television HVS human visual system HVSBM hierarchical variable size block matching IMCTF invertible motion compensated temporal subband/wavelet filtering system JND just noticeable distortion JPEG Joint Photographic Experts Group NguyÔn Hữu Phát 122 Đồ án cao học ĐTVT 2003 LSB least significant bit LZC Layered Zero Coding MC motion compensated/compensation MND minimally noticeable distortion MPEG Moving Picture Experts Group MSB most significant bit MSE mean square error PCM pulse code modulation PSF point spread function PSNR peak signal-to-noise ratio R-D rate-distortion RBDWT region-based discrete wavelet transform ROI region Of interest RWT reversible wavelet transform SA-DCT shape adaptive discrete cosine transform SAQ successive approximation quantization SNR signal-to-noise ratio SPIHT Set-Partitioning In Hierarchical Trees UTQ uniform threshold quantization/quantizer VO Video object VOP Video object plane WMSE weighted mean square error bpp bits per pixel bps bits per second cpd cycles per degree ppd pixels per degree ppi pixels per inch Ngun H÷u Ph¸t 123 ... Các ảnh B đợc giải mà sử dụng bù chuyển động từ ảnh I ảnh P trớc sau (theo thứ tự hiển thị) Dự đoán đợc gọi thuận ảnh tham chiếu (ảnh I ảnh P) ảnh trớc ảnh xét; đợc gọi ngợc ảnh tham chiếu ảnh. .. 1.11 ảnh B2 dùng bù chuyển động thuận từ ảnh I1 bù chuyển động ngợc từ ảnh P4 .Do đó, ảnh B2 dùng bù chuyển động hai chiều kết lấy trung bình, nên đợc gọi bù chuyển động nội suy Bù chuyển động. .. lai cho kỹ thuật nén ảnh với tính cao Kỹ thuật Wavelet đợc nghiên cứu nhiều phần mềm nh Matlap Mục đích luận văn nhằm nghiên cứu số phơng pháp nén ảnh động đợc quan tâm Luận văn đợc trình bày

Ngày đăng: 04/08/2020, 21:29

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w