LUẬN VĂN Nén ảnh động dùng Wavelet LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Bộ giáo dục đào tạo TRờNG ĐạI Học BáCH KHOA Hà Nội Luận văn thạc sĩ khoa học nén ảnh động dùng wavelet Ngành: Điện tử viễn thông Nguyễn Hữu phát Ngời hớng dẫn khoa học: PGS TS Hồ Anh Tuý Hµ néi 2005 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Mục lục Trang Lời nói đầu Chơng TổNG QUAN Về NéN ảNH Video THEO CHUÈN MPEG 1.1 Khái niệm Video phơng pháp nén Video 1.1.1 Kh¸i niƯm Video 1.1.1.1 Không gian mầu (Color Space) 1.1.1.2 Các cÊu sè ho¸ tÝn hiƯu Video 1.1.2 Các phơng pháp nén Video 1.1.2.1 Giảm tốc độ dòng bit 1.1.2.2 NÐn dßng tÝn hiƯu Video sè theo kh«ng gian 10 1.1.2.3 NÐn dßng tÝn hiƯu theo thêi gian 11 1.1.2.4 NÐn hỗn hợp sử dụng tổ hợp phơng pháp 11 1.1.3 Tham sè nÐn Video 11 1.2 Giíi thiƯu chung vỊ chn MPEG 12 1.3 C¸c kh¸i niƯm nén Video theo chuẩn MPEG 14 1.3.1 CÊu tróc ph©n cÊp Video theo chn MPEG 14 1.3.2 Phân loại frame Video 17 1.3.3 Nhãm ¶nh (GOP: Group Of Picture) 19 1.4 Phơng pháp nén ¶nh Video theo chuÈn MPEG 21 1.4.1 Mô hình tổng quát mà hoá Video theo chuÈn MPEG 21 1.4.2 LÊy mÉu thông tin màu 22 1.4.3 Lợng tử hoá 23 1.4.4 Néi suy ¶nh 23 1.4.5 Dự đoán bï chun ®éng 24 1.4.5.1 Đánh giá chuyển động (motion estimation) 24 1.4.5.2 Bï chuyÓn ®éng (Motion Compensation) 24 1.4.6 Biến đổi Cosine rời rạc 26 1.4.7 M· VLC 27 1.5 Quá trình nén Video theo chuẩn MPEG-1 27 1.5.1 Tham sè ®Ỉc tr−ng 27 1.5.2 Quá trình mà hoá 28 1.5.3.Quá trình giải mà 32 1.6 Quá trình nén Video theo chuÈn MPEG-2 33 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 1.6.1 Tham số đặc trng 36 1.6.2 Mô hình mà hoá Non-scalable theo MPEG-2 37 1.6.3 Mô hình mà hoá scalable theo MPEG-2 38 Chơng M hoá SCALABLE VIDEO 42 2.1 Băng lọc 1/2 pixel biến đổi ngợc theo thời gian - tính toán bù chuyển động 42 2.1.1 Giíi thiƯu 44 2.1.2 ThuËt to¸n 46 2.1.2.1 Mô hình Video phổ biến 46 2.1.2.2 QuÐt luü tiÕn Video với véctơ chuyển động xác 1/2 điểm ảnh 49 2.1.2.3 Di chun cơc bé më réng 51 2.1.3 Ba tham số mà hoá băng sử dụng IMCTF 54 2.1.4 KÕt qu¶ thùc nghiÖm 55 2.1.5 Tóm tắt kết luận 59 2.2 M· ho¸ scalable video 61 2.2.1 Kh¸i qu¸t 62 2.2.1.1 M· ho¸ lai trun thèng 63 2.2.1.1.1.M· ho¸ Scalable SNR 63 2.2.1.1.2 Phân giải mà Scalable 66 2.2.1.2 Embedded Coding and Fine Granularity Scalability 66 2.2.1.3 M· ho¸ sư dụng băng chiều mà hoá Wavelet 69 2.2.2 HƯ thèng tỉng quan 70 2.2.3 Băng mà hoá chiều 71 2.2.4 Tû lƯ dßng bÝt m· ho¸ 74 2.2.4.1.HƯ thèng dßng bÝt 74 2.2.4.2 Lựa chọn dòng bít mà hoá truyền dẫn 78 2.2.5 KÕt qu¶ thùc nghiÖm 81 2.2.5.1 So s¸nh víi m· ho¸ Nonscalable 81 2.2.5.2 So s¸nh mà hoá LZC 3D-SPIHT 83 2.2.5.3 Mà hoá tốc độ đa phân gi¶i 86 2.2.6 Tóm tắt kết luận 91 Ch−¬ng Đối tợng-cơ sở m hoá SCALABLE 95 3.1 Đối tợng - Cơ sở mà hoá 97 3.1.1 MỈt phẳng đối tợng Video 97 3.1.2 Công cụ mà hoá cho đối t−ỵng Video 98 3.1.2.1 Định dạng mà hoá 98 3.1.2.2 CÊu tróc m· ho¸ 99 3.2 Đối tợng-Cơ sở mà hoá sử dụng EZBC 100 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 3.2.1 Tæng quan 101 3.2.2 Miền Cơ sở biến đổi Wavelet rời rạc 102 3.2.3 Đối tợng-Cơ sở mà hoá mặt phẳng bít EZBC 103 3.3 KÕt qu¶ thùc nghiƯm 104 3.4 Tóm tắt kết luận 106 Chơng 4: Chơng trình thử nghiệm đánh giá kết 111 4.1 Xây dựng chơng trình 111 4.1.1 Kh¸i qu¸t chung 111 4.1.2 Cấu trúc chơng trình 111 4.2 Đánh giá kÕt qu¶ thư nghiƯm 112 4.2.1 D÷ liƯu thư nghiƯm 112 4.2.2 KÕt qu¶ thư nghiƯm 112 4.2.3 NhËn xÐt vÒ tû sè nÐn,chÊt l−ỵng nÐn 115 KÕt luËn 118 øng dụng luận văn 118 Hớng phát triển cho tơng lai 119 TàI LIệU THAM KHảO 120 PHô LôC 122 THUËT NG÷ tiÕng anh 122 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Lời nói đầu Trong năm gần phát triển mạnh mẽ Internet nên vấn đề truyền liệu mạng đặc biệt truyền ảnh âm đợc quan tâm Do việc nén liệu đặc biệt liệu phim ảnh cần thiết hết Trong phạm vi luận văn tập trung vào việc nén liệu video Đối với nén ảnh động, chuẩn MPEG(Moving Photographic Experts Group) đà đợc xác lập ISO IEC Đây kỹ thuật nén ảnh động đà mang lại nhiều thành công Nó đạt tỷ lệ nén cao 10:1 mà mắt thờng khó phân biệt đợc Tuy nhiên cha phải tû lƯ cao tèi −u Sù ®êi cđa Wavelet đà mở công nghệ Đó chuẩn MJPEG2000 Sự đời MJPEG2000 mở tơng lai cho kỹ thuật nén ảnh với tính cao Kỹ thuật Wavelet đợc nghiên cứu nhiều phần mềm nh Matlap Mục đích luận văn nhằm nghiên cứu số phơng pháp nén ảnh động đợc quan tâm Luận văn đợc trình bày thành bốn chơng phụ lục Chơng Một tổng quan nén ảnh động Chơng giới thiệu số chuẩn nén ảnh động MPEG1,MPEG2,MPEG4 MPEG7 Đồng thời trình bày cấu trúc video Chơng Hai trình bày phơng pháp nén Scalable video Chơng đề cập đến thuật toán LZC 3D-SPIHT Chơng Ba sâu vào nghiên cứu đối tợng mà hoá video dựa biến đổi Wavelet Chơng Bốn nêu khái quát cách thiết kế cài đặt chơng trình Chơng mang tính chất minh hoạ cho đà đợc trình bày chơng trớc Phần phụ lục nêu số chơng trình nguồn thông dụng viÕt trªn Visual C + + Do thêi gian có hạn nên nghiên cứu đợc phần kỹ thuật nén ảnh động chắn không tránh khỏi thiếu sót Cuối xin chân thành cảm ơn giúp đỡ nhiệt tình hiệu PGS TS Hồ Anh Tuý đà giúp đỡ hoàn thành luận văn Hà nội ngµy 20/10/2005 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đồ án cao học ĐTVT 2003 Chơng TổNG QUAN Về NéN ảNH Video THEO CHUẩN MPEG 1.1 Khái niệm Video phơng pháp nén Video 1.1.1 Khái niệm Video Video biểu diễn điện tử chuỗi ảnh liên tiếp Những ảnh ảnh tĩnh đợc gọi frame Chuỗi frame xuất với tốc độ nhanh cho ta cảm giác chuyển động liên tục (tối thiểu 25frame/giây) Mặc dù frame có khác nhau, cần thiết phải có tốc độ frame cao để đạt đợc cảm giác chuyển động thực Tốc độ frame độ phân giải frame nhân tố quan trọng ảnh hởng trực tiếp đến chất lợng Video Trong truyền hình, độ phân giải truyền hình 720x576 tốc độ frame 25 30 Hz 1.1.1.1 Không gian mầu (Color Space) Dựa theo lý thuyết ảnh màu, cảm thụ màu mắt sở màu bản: màu đỏ (Red), mµu lơc (Green) vµ mµu lam (Blue) Trong hƯ mµu RGB, màu đợc mô tả điểm bên hình lập phơng đơn vị, với gốc toạ độ (0, 0, 0) màu đen; thành phần R (đỏ), G (lục), B (lam) biểu diễn cho trục Một hệ thống biểu diễn màu khác đợc sư dơng chÝnh lÜnh vùc trun h×nh nh»m gióp việc số hóa đợc thuận lợi hệ màu YUV, miêu tả ảnh Video gồm thành phần độ chói (Y) sắc màu (UV) Hệ màu nhằm đạt đợc hiệu suất truyền cao hơn, giữ nguyên tính tơng thích với hệ số truyền hình màu đen trắng Thành phần chói (luminance) cung cấp giá trị mức xám ảnh, hai thành phần lại mang thông tin màu sắc (chrominance) để chuyển đổi từ ảnh xám sang ảnh màu Nguyễn Hữu Phát LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đồ án cao học ĐTVT 2003 Chuyển đổi RGB sang YUV đợc thùc hiÖn theo chuÈn CCIR 601 nh− sau: Y = 0.299R + 0.587G + 0.114B U = 0.493 (B - Y) V = 0.877 (R - Y) ®ã: Y thành phần chói U, V hai thành phần màu Đặc biệt: R = G = B Y = R = G = B U = V = Một định dạng màu khác là, tơng tự YUV Y, CB, CR với Y tơng tự nh hai thành phần nh sau: CB = U/2 + 0.5 CR = V/1.6 + 0.5 Do đó, màu CB, CR nằm khoảng [0, 1] Với u điểm hệ YCBCR đợc áp dụng rộng rÃi việc số hoá Video 1.1.1.2 Các cấu số hoá tín hiệu Video Hình 1.1 Cấu trúc lấy mẫu Nguyễn Hữu Phát LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đồ án cao học ĐTVT 2003 Trong truyền hình, frame chuỗi Video có độ phân giải 720 x 576 điểm có tốc độ frame 25 30Hz Mỗi ảnh chuỗi Video đợc lấy số hoá nh hình 1.1 Cấu trúc 4: 2: Giả sử dòng ngang TV gồm 720 điểm ảnh Hình 1.2 Cấu trúc lấy mẫu 4: 2: ViƯc lÊy mÉu sÏ tn tù diƠn nh sau: - Điểm đầu lấy mẫu tín hiệu chói (Y) lấy mẫu màu (CB, CR) - Điểm tiÕp theo chØ lÊy mÉu tÝn hiƯu chãi (Y) vµ không lấy mẫu tín hiệu Khi giải mÃ, màu suy từ điểm ảnh trớc Tuần tự nh vậy, cø lÇn lÊy mÉu Y, cã lÇn lÊy mÉu CR, lÇn lÊy mÉu CB CÊu tróc 4: 1: H×nh 1.3 CÊu tróc lÊy mÉu 4: 1: Điểm ảnh lấy mẫu đủ Y, CR, CB, điểm lấy mẫu Y, không lấy mẫu tín hiệu màu Khi giải mÃ, mầu điểm ảnh phải suy từ điểm ảnh đầu TuÇn tù nh− vËy, cø lÇn lÊy mÉu Y, cã lÇn lÊy mÉu CR, lÇn lÊy mÉu CB CÊu tróc lÊy mÉu 4: 2: Ngun H÷u Ph¸t LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com §å ¸n cao häc §TVT 2003 LÊy mÉu tÝn hiƯu Y tất điểm ảnh dòng, tín hiệu màu Y, có màu CR CB cách theo hàng Hình 1.4 CÊu tróc lÊy mÉu 4: 2: CÊu tróc lÊy mÉu 4: 4: LÊy mÉu tÝn hiÖu Y, CR, CB tất điểm ảnh dòng Hình 1.5 CÊu tróc lÊy mÉu 4: 4: 1.1.2 C¸c phơng pháp nén Video Mục tiêu việc nén tÝn hiƯu Video lµ biĨu diƠn mét ngn tÝn hiƯu Video số bit đợc mà đảm bảo yêu cầu chất lợng cảm thụ Với tín hiệu Video, giới hạn dải thông tín hiệu tơng tự khoảng 6MHz, tín hiệu Video số hoá theo tiểu chuẩn CCIR 601 với tốc độ bit 270Mbit/s chiếm dải thông không dới 189MHz, tức lớn 31,5 lần so với dải thông tín hiệu tơng tự Chính vậy, giảm dải thông vấn đề quan trọng với công nghệ Video số Về giảm dải thông đợc thực cách: - Giảm tốc độ dòng bit (bit Rate Reduction - BRR) Nguyễn Hữu Phát LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đồ án cao học ĐTVT 2003 Hình 3.8 MISS AMERICA mà hoá 0.05 bpp Hệ số mặt phẳng bit liên quan đến bề mặt ảnh bị tăng mức (giữa bên trái), mức (giữa bên phải), ba mức (trên bên phái) mức (dới bên phải) Nguyễn Hữu Phát 109 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com §å án cao học ĐTVT 2003 Hình 3.9 Ví dụ ứng dụng mà hoá scalable- đối tợng ảnh từ hình 3.5 đợcgiải mà tốc độ bittrung bình 1.0 bpp độ phân giải khác cho ảnh cuối Nguyễn Hữu Phát 110 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đồ án cao học ĐTVT 2003 Chơng 4: Chơng trình thử nghiệm đánh giá kết 4.1 Xây dựng chơng trình 4.1.1 Khái quát chung Chơng trình đợc viết Visual C++ 6.0.Chơng trình thực chức sau: Chuyển từ file video AVI (*.avi) sang file RAW(*.raw) Hiển thị thông sè cđa file avi Chun tõ file RGB(*.rgb) sang file định dạng YUV (*.yuv) Hiển thị thông tin file RGB YUV Tạo file MPEG4 từ file đầu vào dạng MP3,H.263,ACC, AMR,DIVX,MP4AV,M4V,CMP,XVID Hiển thị thông tin file MPEG4 Chuyển từ file RAW sang file WAVELET 4.1.2 Cấu trúc chơng trình Cấu trúc chơng trình gồm chức sau: a Cưa sỉ thùc hiƯn nÐn cho phÐp nhËp file video *.avi đầu vào, ghi file đầu dạng raw b Cửa sổ hiển thị cho phép hiển thị thông tin file *.avi nh loại file avi,tốc độ frame,số frame file,®é lín cđa frame c Cưa sỉ thực nén cho phép nén từ file *.rgb đầu vµo,ghi file *.yuv víi tham sè t chän lµ chiỊu cao vµ chiỊu réng cđa frame d Cưa sổ hiển thị cho phép hiển thị thông tin file *.rgb (hoặc *.yuv) với thông số đầu vào nh chiếu cao chiều rộng số frames/s đầu gồm kích thớc y,u,v frame đà đọc e Cửa sổ thực nén cho phép nén từ file *.mp3,H.263,ACC, AMR,DIVX,MP4AV,M4V,CMP,XVID đầu vào,ghi file MPEG4 (*.mp4) đầu với tham số tuỳ chọn tốc độ frame, sử dụng Nguyễn Hữu Phát 111 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đồ án cao học ĐTVT 2003 định dạng file ACC,cho phép file AVI, tính toán tốc độ bit H263,cho phép thay đổi tốc độ bít,tối u hoá,liệt kê track f Cưa sỉ hiĨn thÞ cho phÐp hiĨn thị thông tin file *.mp4 đầu gồm số track,loại track,thông tin track g Chơng trình wavelet thực nén file Video đầu vào định dạng RAW(*.raw) sử dụng Wavelet, ghi file đầu WAVELET(*.wl) h Chơng trình giải nén thực đọc file WAVELET(*.wl) đầu vào Trong chơng trình có sử dụng số cấu trúc liệu, module thực thuật toán cho trình nén trình giải nén Do mà nguồn cho chơng trình dài, đa số phần vào phần phụ lục luận văn 4.2 Đánh giá kết thử nghiệm 4.2.1 Dữ liệu thử nghiệm Dữ liệu thử nghiệm hai tƯp: TƯp air.rgb : dung l−ỵng 426 Kb,file thu trùc tiÕp tÝn hiƯu Red Green vµ Blue TƯp Sound.mp3: dung lợng 2.85 KB file mp3.Đây file nhạc Audio định dạng theo chuẩn MP3 Tệp Demo.mp3: dung lợng 36.3 KB file mp3.Đây file nhạc Audio định dạng theo chuẩn MP3 Tệp global.avi : dung lợng 3.46 MB.Kích thớc frame 320x240 gồm 107 frames.Tốc độ truyền 15 frames/s Đây tệp thử nghiệm Visual C++ 4.2.2 KÕt qu¶ thư nghiƯm KÕt qu¶ thu đợc cho tệp air.rgb nh sau: Đánh giá cho tệp air.rgb : Nguyễn Hữu Phát 112 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đồ án cao học ĐTVT 2003 RGB YUV YUV YUV YUV TÖp gèc air.rgb air.yuv air.yuv air.yuv air.yuv Lo¹i tƯp RGB YUV YUV YUV YUV Dung l−ỵng 426 Kb 214 Kb 225 Kb 253 Kb 213 Kb 320 pixels 40 pixels 320 pixels 240 pixels 40 pixels 240 pixels 30 pixels 240 pixels 240 pixels 40 pixels 122 91 KÝch th−íc Y 1200 76800 57600 1600 KÝch th−íc 300 19200 14400 400 ChiỊu réng frames ChiỊu cao frames Sè frames xư lý UV B¶ng 4.1: Đánh giá tham số tệp air.rgb air.yuv Đánh giá cho tệp Demo.mp3 Sound.mp3 tốc độ 30 frames/s thu đợc kết Tệp gốc Demo.mp3 Demo.mp4 Sound.mp3 Sound.mp4 Loại tệp MP3 MPEG4 MP3 MPEG4 Dung lợng 36.3 KB 41.8 KB 2.85 KB 4.45 KB Video frames/s 30 30 Time Scale 9000 9000 Play load 1460 1460 B¶ng 4.2: Đánh giá tham số tệp Demo.mp3 Sound.mp3 Phân tích thông tin file Demo.mp4 Sound.mp3 ta thu đợc : Nguyễn Hữu Phát 113 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đồ án cao học ĐTVT 2003 Tên tệp STT track Loại track Thông tin track Demo.mp4 Audio MPEG-2 Audio,56Kbps,90000Hz Hint Playload MPA cho track Bảng 4.3: Tham số tệp Demo.mp3 Tên tệp STT track Loại track Thông tin track Sound.mp4 Audio MPEG-1 Audio,128Kbps,90000Hz Hint Playload MPA cho track B¶ng 4.4: Tham số tệp Sound.mp3 Kết thu đợc cho tÖp global.avi nh− sau: TÖp gèc Global.avi Global.raw Global.wl Loại tệp AVI RAW WAVELET Dung lợng 3.46 MB 3.38 MB 15.1KB ChiÒu réng 320 pixels 320 pixels 320 pixels 240 pixels 240 pixels 240 pixels 107 107 15 frames Chiều cao frames Số frames Bảng 4.5: Đánh giá tệp Global.avi Minh hoạ frame file global.avi: Nguyễn Hữu Ph¸t 114 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đồ án cao học ĐTVT 2003 Hình 4.1: Một frame file Global.avi 4.2.3 NhËn xÐt vÒ tû sè nÐn,chÊt lợng nén Đối với tệp air.rgb: Dung lợng đầu vào 426 Kb, dung lợng đầu 225 Kb kích thớc frames 320x240 Do tỉ số nén là: CR = 426 = 1.89333 225 Dung lợng đầu vào 426 Kb, dung lợng đầu 214 Kb kích thớc 40x30 Do tỉ số nén : CR = 426 = 1.9999 214 Đối với tệp Sound.Mp3 Demo.mp3 ta có: Với tệp đầu vào MP3 đầu có tệp định dạng MPEG4.ở ý đến chất lợng đầu chất lợng nén.File MPEG4 có chất lợng cao nhiễu ứng dụng truyền thông đa phơng tiện Đối với tệp Global.avi: Dung lợng đầu vào file Global.avi 3.46 Mb, dung lợng đầu Global.raw 3.38 Mb cïng kÝch th−íc frames 320x240 pixels Do ®ã tØ sè nén là: CR = 3.46 = 1.026 3.38 Nguyễn Hữu Ph¸t 115 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đồ án cao học ĐTVT 2003 Dung lợng đầu vào file Global.raw 3.38MB , dung lợng đầu Global.wl 15.1 Kb kÝch th−íc 320x240 víi sè khung xư lý lµ 15 Do tỉ số nén : CR = 3.38.1024 = 229.2 15.1 Qua thấy phơng pháp dùng wavelet có tỷ lệ nén cao so với phơng pháp nén thông thờng.Hình sau minh hoạ quan hệ kích thớc khung vµ tû sè nÐn: Víi file Global.wl kÝch th−íc 320x240 lợng tử 129 tổn hao dpcm =65 số frame 15 ta cã : STT 10 11 12 13 14 15 MSE RMSE PSNR 2754.689 52.485 13.76 2624.778 51.233 13.97 2720.400 52.157 13.82 2718.881 52.143 13.82 2744.705 52.390 13.78 2893.206 53.789 13.55 2929.208 54.122 13.50 2901.895 53.869 13.54 2825.329 53.154 13.65 2708.651 52.045 13.84 2645.592 51.435 13.94 2468.484 49.684 14.24 2413.063 49.123 14.34 2729.685 52.246 13.80 2884.536 53.708 13.56 B¶ng 4.6: Sai số psnr tệp Global.wl Nguyễn Hữu Phát 116 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com §å án cao học ĐTVT 2003 Ta có đồ thị sau: MSE 3500 3000 2500 2000 MSE 1500 1000 500 11 13 15 H×nh 4.2 Đồ thị quan hệ MSE khung 60 50 40 RMSE 30 PSNR 20 10 11 13 15 Hình 4.3 Đồ thị quan hệ RMSE PSNR khung Nguyễn Hữu Phát 117 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com §å án cao học ĐTVT 2003 Kết luận Luận văn xin đợc kết thúc với vài định hớng ứng dụng luận văn Một thuật toán mà hoá ảnh dùng wavelet (EZBC) đà đợc giới thiệu chơng trớc Thuật toán đa đến kỹ thuật thành công - thiết lập phân chia mô hình ngữ cảnh - cho hiệu mà hoá entropy đặc trng cho mặt phẳng mà hoá Không giống nh nhị phân truyền thống- sở mà hoá ph©n chia, chóng ta cã thĨ thiÕt lËp c©y tø phân - dựa lợc đồ khối mà hoá zeroblock cho việc phân chia hệ số mà hoá wavelet Đầu tiên khai thác tính thống kê phụ thuộc vào quadtree giới thiệu giải mà Bộ mà hoá có vài đặc tính u việt so với mặt phẳng mà hoá truyền thống tốc độ điều khiển xác dụ đoán giải mà đa tốc độ Thuật toán lý tởng cho mà hoá phân giải scalable Sự cải thiện lớn PSNR thông qua thuật toán kết mô Một hệ thống phân tích tổng hợp theo thời gian với việc bù chuyển động xác nửa điểm ảnh (IMCTF) đợc giói thiệu chơng Băng lọc thời gian cho phép giải mà hoàn chỉnh tín hiệu Video Chất lợng ảnh băng lọc giải mà Video không bị ảnh hởng từ tợng bóng mờ tác động thờng thấy mà hoá 3-D thông thờng (không bù chuyển động) Hệ thống mà hoá Video (IMC3D-EZBC) đợc trình bày chơng Chúng ta minh hoạ kết thực nghiệm thay đổi tốc độ bit mà hoá phân giải không gian thời gian đợc giải mà từ file nén đơn lẻ sử dụng hệ thống mà hoá Nguyễn Hữu Phát 118 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đồ án cao học ĐTVT 2003 Đối tợng - dựa hệ thống mà hoá OB-EZBC, mở rộng từ khung đầu vào EZBC, đợc trình bày chơng Thuật toán đề xuất có khả mà hoá hình dạng ảnh tuỳ ý Khả cao EZBC đợc giữ lại luồng bit cho đối tợng riêng lẻ phân giải tỷ lệ mà hoá tốc độ độc lập Hớng phát triển cho tơng lai Một vài hớng phát triển cho tơng lai: ã Ưu điểm mô hình ngữ cảnh: Sự thy đổi mang tính thống kê phụ thuộc đợc quan sát cấu trúc hình tháp Điều hy vọng việc cải thiện nén ảnh đạt đợc mô hình chiến lợc tinh vi có lợi cho việc lựa chọn lợng tử hoá ã Mô hình thống kê xác cho hệ số wavelet: Lợc đồ lợng tử hoá lại đợc cải thiện sử dụng kả mô hình xác, chuẩn hoa hàm mật độ Gaussian, thay hình thành hàm mật độ thời ã Việc thích nghi cấu trúc băng kích thớc GOP: Phân tích băng kích thớc cố định GOP (chỉ cho Video) đợc sử dụng cho hệ thống mà hoá thời Kết tìm đợc mục 6.5 Tập trung lợng băng tăng phân chia tần số cao cho mô hình ¶nh Cã thĨ c¶i thiƯn nhê sư dơng ph©n gi¶i gói wavelet cho việc tối u hoá băng theo không gian thời gian Nguyễn Hữu Phát 119 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đồ án cao học ĐTVT 2003 TàI LIệU THAM KHảO [1] M R Aaron, “The digital (r)evolution, ” IEEE Commu Mag., pp.21–22, 1974 [2] J M Shapiro, “Embedded image coding using zerotrees of wavelet coefficients, ” IEEE Trans on Signal Processing, vol.41, pp.3445–3462, Dec.1993 [3] G K Wallace, “The JPEG still picture compression standard, ”Communications of the ACM, vol.34, pp.30–44, April 1991 [4] W P Pennebaker and J L Mitchell, JPEG Still Image Data Compression Standard New York: Van Nostrand Reinhold, 1993 [5] ISO/IEC, Information Technology — Lossless and Near-Lossless Compression of Continuous-Tone Still Images ISO/IEC 14495-1, ITU Recommend T.87, Dec.1994 [6] M J Weinberger, G Seroussi, and G Sapiro, “The LOCO-I lossless image compression algorithm: principles and standardization into JPEG-LS, ” IEEE Trans Image Processing, vol.9, pp.1309–1324, Aug.2000 [Online] Available: http: //www hpl hp com/loco [7] ISO/IEC, Information Technology — Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to 1.5 Mbps ISO/IEC 11172-2, 1992 [8] ISO/IEC, Information Technology — Generic Coding of Moving Pictures and Associated Audio Informations: Video ISO/IEC 13818-2, 1995 [9] ISO/IEC, Information Technology — Coding of Audio-Visual Objects — Part 2: Visual ISO/IEC 14496-2, Dec.1994 [10] ITU Telecommunication Standardization Sector of ITU, Video Codec for Audiovisual Services at p × 64 kbits/sec ITU-T Recommendation H.261, 1994 Nguyễn Hữu Phát 120 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đồ án cao học ĐTVT 2003 [11] ITU Telecommunication Standardization Sector of ITU, Video Coding for Low Bitrate Communication ITU-T Recommendation H.263, Mar.1996 [12] ITU Telecommunication Standardization Sector of ITU, Video Coding for Low Bitrate Communication ITU-T Recommendation H.263 Version 2, Jan.1993 [13] Digital Imaging Group, Inc, Flashpix Format Specification, version 1.0.2, July 1993 [14] D Taubman, “High performance scalable image compression with EBCOT, ”IEEE Trans Image Processing, vol.9, pp.1158 –1170, July 2000 [15] ISO/IEC, ISO/IEC FCD 15444-1: Information Technology — JPEG 2000 image coding system: Core coding system ISO/IEC JTC1/SC 29/WG N1646, Mar.2000 [16] W Li, “Overview of fine granularity scalability in MPEG-4 Video standard” IEEE Trans Circuits and Syst for Video Technol., vol.11, pp.301– 317, Mar.2001.Speical Issue on Streaming Video [17] S -T Hsiang and J W Woods, “Embedded image coding using zeroblocks of subband/wavelet coefficients and context modeling, ” in Proc of IEEE In tSymp on Circuits and Systems, vol.3, (Geneva), pp.662–665, May 2000 [18] S -T Hsiang and J W Woods, “Embedded Video coding using motion compensated 3-D subband/wavelet filter bank, ” in Packet Video Workshop, (Sardinia, Italy), May 2000 [19] S.-T Hsiang, “Embedded image coding using zeroblocks of subband/wavelet coefficients and context modeling, ” in Proc.2001 IEEE Data Compression Conference, (Snowbird, Utah), Mar.2001 Nguyễn Hữu Phát 121 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đồ án cao học ĐTVT 2003 PHơ LơC THT NG÷ tiÕng anh 3-D three - dimensional AGP alphabet and group partitioning APSG alphabet partitioning and sample grouping CREW Compression with Reversible Embedded Wavelets CSF contrast sensitivity function DCT discrete cosine transform DFD displaced frame difference DPCM differential pulse code modulation DVR display visual resolution DWT discrete wavelet transform EBCOT Embedded Block Coding with Optimal Truncation EZBC Embedded ZeroBlock Coding and context modeling EZW Embedded image coding using Zerotrees of Wavelet coefficients FGS fine granularity scalability GOP group of pictures HDTV high definition television HVS human visual system HVSBM hierarchical variable size block matching IMCTF invertible motion compensated temporal subband/wavelet filtering system JND just noticeable distortion JPEG Joint Photographic Experts Group Nguyễn Hữu Phát 122 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đồ án cao học §TVT 2003 LSB least significant bit LZC Layered Zero Coding MC motion compensated/compensation MND minimally noticeable distortion MPEG Moving Picture Experts Group MSB most significant bit MSE mean square error PCM pulse code modulation PSF point spread function PSNR peak signal-to-noise ratio R-D rate-distortion RBDWT region-based discrete wavelet transform ROI region Of interest RWT reversible wavelet transform SA-DCT shape adaptive discrete cosine transform SAQ successive approximation quantization SNR signal-to-noise ratio SPIHT Set-Partitioning In Hierarchical Trees UTQ uniform threshold quantization/quantizer VO Video object VOP Video object plane WMSE weighted mean square error bpp bits per pixel bps bits per second cpd cycles per degree ppd pixels per degree ppi pixels per inch Nguyễn Hữu Phát 123 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ... Các ảnh B đợc giải mà sử dụng bù chuyển động từ ảnh I ảnh P trớc sau (theo thứ tự hiển thị) Dự đoán đợc gọi thuận ảnh tham chiếu (ảnh I ảnh P) ảnh trớc ảnh xét; đợc gọi ngợc ảnh tham chiếu ảnh. .. 1.11 ảnh B2 dùng bù chuyển động thuận từ ảnh I1 bù chuyển động ngợc từ ảnh P4 .Do đó, ảnh B2 dùng bù chuyển động hai chiều kết lấy trung bình, nên đợc gọi bù chuyển động nội suy Bù chuyển động. .. chuyển động, nhng ảnh P4 đợc giải mà phải sử dụng véctơ chuyển động từ ảnh I1 Bù chuyển động gọi bù chuyển động thuận xuôi theo trình tự thời gian Các ảnh P dùng bù chuyển động thuận từ ảnh I