Ngày nay, công nghệ mã hóa video đã và đang được sử dụng rất phổ biến, từ các ứng dụng truyền thống như truyền hình quảng bá, truyền hình hội nghị đến các ứng dụng mới xuất hiện như mạng cảm biến (sensor), mạng giám sát từ xa. Trong đó, các ứng dụng mới như mô hình mạng video giám sát giao thông, camera an ninh lắp đặt trong các nhà hàng, bệnh viện… Những hệ thống này có đòi hỏi hoàn toàn khác so với hệ thống truyền hình quảng bá là yêu cầu phần phát đơn giản, gọn nhẹ, rẻ tiền trong khi phần phức tạp có thể chuyển về bộ xử lý trung tâm ở phía thu, nơi sẽ được đầu tư thiết bị tập trung và hiện đại hơn. Do đó các chuẩn mã hóa video truyền thống sẽ không còn phù hợp nữa.
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌCGIA CÔNG ĐẠI HỌC QUỐC HÀ NGHỆ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ VŨ THỊ QUỲNH ANH Vũ Thị Quỳnh Anh PHÁTPHÁT TRIỂNTRIỂN MƠ HÌNH TẠP ÂM TƯƠNG QUANQUAN NHẰM MƠ HÌNH TẠP ÂM TƯƠNG NÂNG HIỆU NĂNG HÓAMÃ CỦA KỸCỦA THUẬT MÃ HÓA NHẰMCAO NÂNG CAO HIỆUMÃ NĂNG HÓA KỸ THUẬT VIDEO PHÂN TÁNTÁN DVCDVC MÃ HÓA VIDEO PHÂN LUẬN VĂN THẠC SỸ NGÀNH ĐIỆN TỬ VIỄN THÔNG Chuyên ngành: Kỹ thuật viễn thơng LUẬN VĂN THẠC SĨ NGÀNH CƠNG NGHỆ KỸ THUẬT ĐIỆN TỬ - VIỄN THÔNG Người hướngngành: dẫn khoa TS.viễn Hồng Văn Xiêm Chun Kỹhọc: thuật thơng TS Đinh Triều Dương HÀ NỘI, 2019 HÀ NỘI, 2019 LỜI CAM ĐOAN Tôi xin cam đoan đề tài “PHÁT TRIỂN MƠ HÌNH TẠP ÂM TƯƠNG QUAN NHẰM NÂNG CAO HIỆU NĂNG MÃ HÓA CỦA KỸ THUẬT MÃ HÓA VIDEO PHÂN TÁN DVC” TS Hoàng Văn Xiêm TS Đinh Triều Dương hướng dẫn cơng trình nghiên cứu Các nội dung nghiên cứu, kết luận văn trung thực không chép cơng trình người khác Tất tài liệu tham khảo sử dụng khóa luận ghi rõ nguồn gốc ghi tên tác giả Nếu có sai sót, tơi xin chịu hồn tồn trách nhiệm Hà Nội, ngày tháng năm 2019 Tác giả Vũ Thị Quỳnh Anh LỜI CẢM ƠN Em xin bày tỏ lòng biết ơn sâu sắc đến hai thầy TS Hồng Văn Xiêm TS Đinh Triều Dương tận tình hướng dẫn hỗ trợ em hoàn thành luận văn Em xin cảm ơn thầy cô giáo khoa Điện tử Viễn thông, Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội giảng dạy cho em kiến thức bổ ích suốt trình học tập trường Cuối cùng, em xin bày tỏ lòng biết ơn vơ hạn với gia đình thân yêu Cảm ơn người bạn thân thiết chăm sóc, khích lệ q trình học tập nghiên cứu Trong trình thực luận văn này, kiến thức hạn chế, khơng thể tránh khỏi thiếu sót, em mong nhận ý kiến góp ý thầy để em tiếp tục hồn thiện phát triển đề tài Hà Nội, tháng năm 2019 Vũ Thị Quỳnh Anh MỤC LỤC LỜI CAM ĐOAN MỤC LỤC DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT DANH MỤC HÌNH VẼ DANH MỤC BẢNG BIỂU PHẦN MỞ ĐẦU 10 PHẦN NỘI DUNG 12 CHƯƠNG 12 1.1 Đặt vấn đề 12 1.2 Tổng quan mã hóa video dự đốn HEVC 12 1.2.1 Kiến trúc tổng quát mã hóa HEVC 14 1.2.2 Các kỹ thuật mã hóa video HEVC 17 1.2.2.1 Biểu diễn lấy mẫu ảnh 17 1.2.2.2 Phân chia hình ảnh thành đơn vị mã hóa 17 1.2.2.3 Phân chia CTB thành CB 17 1.2.2.4 Khối dự đoán (PB) đơn vị dự đoán (PU) 17 1.2.2.5 Phân chia cấu trúc thành đơn vị biến đổi khối biến đổi 19 1.2.2.6 Mảng (Slice) Tile 20 1.2.2.7 Dự đoán ảnh 21 1.2.3 Kết luận chương 23 CHƯƠNG 24 2.1 Tổng quan mã hóa video phân tán DVC 24 2.2 Định lý Slepian-Wolf 25 2.3 Định lý Winer-Ziv 26 2.4 Các mơ hình thực nghiệm kỹ thuật mã hóa video phân tán 27 2.4.1 Giải pháp Stanford 27 2.4.2 Giải pháp PRISM 30 2.5 Kết luận chương 32 CHƯƠNG 33 3.1 Mơ hình tạp âm tương quan mã hóa video WZ 33 3.2 Tính tốn tham số CNM miền pixel PDWZ 34 3.2.1 Cấu trúc mã hóa WZ miền Pixel 34 3.2.2 Ước lượng tạp âm tương quan mức khung (Frame level) 36 3.2.3 Ước lượng tạp âm tương quan mức khối (Block level) 37 3.2.4 Ước lượng tạp âm tương quan mức pixel (Pixel level) 38 3.3 Tính tốn tham số CNM miền biến đổi TDWZ 39 3.3.1 Cấu trúc mã hóa video WZ miền biến đổi 39 3.3.2 Ước lượng tạp âm tương quan mức DCT khung (DCT band-byframe level) 39 3.3.3 Ước lượng tạp âm tương quan mức hệ số khối (Coefficient-by-block level) 41 3.4 Kết luận chương 42 CHƯƠNG 43 4.1 Kết thực nghiệm 43 4.2 Đánh giá kết luận 49 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 50 TÀI LIỆU THAM KHẢO 51 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Từ viết tắt Nghĩa tiếng Việt Nghĩa tiếng Anh A AVC Advanced Video Coding Mã hóa video tiên tiến B BAC Binary Arithmetic Coding Mã hóa số học nhị phân C Content Adaptive Binary Mã hóa số học nhị phân thích nghi Arithmetic Coding theo thuộc tính Content Adaptive Variable Mã chiều dài thay đổi thích nghi Length Coding theo thuộc tính CNM Correlation Noise Model Mơ hình tạp âm tương quan CPU Central Processing Unit Đơn vị xử lý trung tâm CTB Coding Tree Block Khối mã hóa CTU Coding Tree Unit Đơn vị mã hóa CU Coding Unit Đơn vị mã hóa CABAC CAVLC D DCT Discrete Cosine Transform Biến đổi Cosine rời rạc DPB Decoded Picture Buffer Bộ đệm hình ảnh giải mã DRAM DVC Dynamic Random Access Bộ nhớ truy cập ngẫu nhiên động Memory Distributed Video Coding Mã hóa video phân tán G GOP Group Of Picture Nhóm ảnh GMC Global Motion Compensation Bù chuyển động toàn phần H HD High Definition Độ phân giải cao HEVC High Eficiency Video Coding Mã hóa video hiệu suất cao I IDCT Inverse Discrete Cosine Transform Biến đổi cosin rời rạc ngược M MCP Motion Compensation Prediction Dự đoán bù chuyển động MCFI Motion Compensated Frame Interpolation Phép nội suy khung cách bù chuyển động N NAL Lớp trừu tượng hóa mạng Network Abstraction Layer P PB Prediction Block Khối dự đoán PDWZ Pixel Domain Wyner Ziv Wyner Ziv miền pixel PSNR Peak Signal to Noise Ratio Tỉ lệ tín hiệu đỉnh/ tạp âm Q QP Tham số lượng tử hóa Quantization Parameter S SI Side Information Thơng tin phụ T TDWZ Transform Domain Wyner Ziv Wyner Ziv miền biến đổi DANH MỤC HÌNH VẼ Hình 1: Minh họa sai khác khung liên tiếp dãy video .13 Hình 2: Sơ đồ khối mã hóa HEVC [12] .14 Hình 3: Chế độ chia tách CB thành PBs 18 Hình 4: Chia nhỏ CTB thành CB 20 Hình 5: Các chế độ hướng cho dự đốn hình ảnh 21 Hình 1: Mơ hình mã hóa dự đoán cổ điển 24 Hình 2: Sơ đồ mã nguồn phụ thuộc thống kê 25 Hình 3: Biểu đồ vùng tỉ lệ tốc độ mã nguồn X, Y 25 Hình 4: Mơ tả định lý Slepian – Wolf với thông tin phụ 26 Hình 5: Mã hóa mát thông tin với thông tin phụ phần giải mã .26 Hình 6: Kiến trúc mã hóa DISCOVER [2] 27 Hình 7: Bộ mã hóa PRISM: (a) cấu trúc mã hóa; (b) cấu trúc giải mã .31 Hình 1: Cấu trúc mã hóa PDWZ 34 Hình 2: Biểu đồ tương đối phần dư (WZ-SI) cho chuỗi video Foreman tần số 30 Hz [11] 35 Hình 3: Cấu trúc mã hóa video TDWZ 39 Hình 1: Khung mẫu từ chuỗi video test: (a) Soccer (frame 1); (b) Foreman (frame 1); (c) Coastguard (frame 1); (d) Hallmonitor (frame 1) 43 Hình 2: Hiệu PSNR ứng với tốc độ Rate khác thực chuỗi Foreman 45 Hình 3: Hiệu PSNR ứng với tốc độ Rate khác thực chuỗi Soccer 46 Hình 4: Hiệu PSNR ứng với tốc độ Rate khác thực chuỗi Coastguard .46 Hình 5: Hiệu PSNR ứng với tốc độ Rate khác thực Hallmonitor 47 DANH MỤC BẢNG BIỂU Bảng 1: Phân loại, ý nghĩa lớp kiểu đơn vị NAL 16 Bảng 1: Hiệu PSNR ứng với tốc độ Rate khác thực chuỗi Foreman 45 Bảng 2: Hiệu PSNR ứng với tốc độ Rate khác thực chuỗi Soccer 46 Bảng 3: Hiệu PSNR ứng với tốc độ Rate khác thực chuỗi 47 Bảng 4: Hiệu PSNR ứng với tốc độ Rate khác thực chuỗi Hallmonitor 47 Bảng 5: Bảng tổng hợp hiệu PSNR ứng với tốc độ Rate khác thực chuỗi test video giá trị QPs thiết lập khác 48 Bảng 6: Bảng tổng hợp thời gian mô q trình mã hóa giải mã khung WZ thực chuỗi test video với giá trị QPs khác 48 PHẦN MỞ ĐẦU Lý chọn đề tài Hiện nay, với công nghệ phát triển, việc chia sẻ video mạng trở nên phổ biến, nhu cầu sử dụng liệu video dự đoán tăng trưởng ngày mạnh mẽ Lưu lượng truy cập video thiết bị di động dự báo tăng khoảng 50% năm năm 2022, chiếm gần 3/4 tổng lưu lượng liệu di động Ngoài ra, việc sử dụng video nhúng phương tiện truyền thông xã hội trang web tiếp tục phát triển, thúc đẩy hình thiết bị lớn hơn, độ phân giải cao tảng hỗ trợ phát trực tiếp Video nhúng phương tiện truyền thông xã hội trang web tính lưu lượng video Giá trị trung bình từ phép đo số mạng HSPA LTE thương mại chọn Châu Mỹ, Châu Á Châu Âu cho thấy, loại thiết bị nào, video đóng góp lớn cho lưu lượng truy cập Tuy nhiên, có khác biệt lớn mạng Nhưng liệu video thường liệu có dung lượng lớn, ví dụ truyền hình có độ phân giải cao HDTV khơng nén tốc độ lên tới 1,5Gbps, để truyền tải khó Do vậy, phương pháp để tăng hiệu nén video vấn đề quan tâm nghiên cứu, phát triển Trong ứng dụng mã hóa video thơng thường, ví dụ: phát sóng truyền phát video, giải mã video dựa mạnh mẽ bù chuyển động dựa khối lai biến đổi DCT kiến trúc chủ yếu điều khiển một-nhiều mơ hình với mã hóa phức tạp nhiều ánh sáng giải mã Gánh nặng phức tạp mã hóa (đó thơng thường cao lần 10 lần so với giải mã) liên kết với nhiệm vụ ước tính chuyển động, chủ yếu chịu trách nhiệm hiệu suất biến dạng tốc độ cao (RD) đạt Tuy nhiên, kiến trúc bị thách thức số ứng dụng giám sát video không dây, mạng cảm biến đa phương tiện, camera PC không dây, camera điện thoại di động Những ứng dụng có khác yêu cầu từ mục tiêu video truyền thống hệ thống phân phối, ví dụ: hệ thống giám sát video khơng dây, mã hóa chi phí thấp codec, cho phép phân bổ linh hoạt độ phức tạp mã hóa giải mã quan trọng có nhiều mã hóa vài giải mã Yêu cầu đặt phát triển mơ hình mã hóa 10 a) Phương sai khối thứ z thấp phương sai khung R’, tương ứng với việc chi tiết khối tương tự với trung bình khối R’, nói ˆ Rz2 ˆ R2 b) Phương sai khối thứ z cao phương sai khung R’, tương ứng với việc khối có sai số phần dư cao – ví dụ: khối nội suy nằm cách xa khối gốc tương ứng, kết sau MCFI khơng xác Như nhắc đến 3.2.1, CNM chuyển thông tin pixel SI thành thông tin đầu vào mềm (thông tin tin cậy) cho trình giải mã; phần dư (WZ – SI) cao, độ tin cậy thông tin thấp Trong trường hợp MCFI khơng xác, độ tin cậy khối cung cấp cho giải mã - tương ứng với giá trị α – thấp khối nội suy tốt (với phương sai gần ˆ R2 hơn) Sau tính ˆ Rz cho khối, giá trị sử dụng cho trình giải mã khối tương ứng 3.2.4 Ước lượng tạp âm tương quan mức pixel (Pixel level) Để cải thiện hiệu suất RD cho codec PDWZ, [11] đề xuất phương pháp tính tham số α mức pixel Các bước tính tốn tham số α biểu diễn sau: 1) Tương tự bước 1) phần 3.2.3 2) Tương tự bước 2) phần 3.2.3 3) Khoảng cách giá trị trung bình khối z khung R’ giá trị trung bình khung R’: DR ' z ( E[ R' Z ] E[ R' ]) (3.9) 4) Tính tham số α pixel (x,y) khung R’, ˆ ( x, y) ˆ R ˆ Rz ˆ ( x, y ) ˆ Rz ( R( x, y )) 2 , ˆ Rz ˆ R2 , (ˆ Rz ˆ R2 ) ( D R ' z ˆ R2 ) 2 , (ˆ Rz ˆ R2 ) ( D R ' z ˆ R2 ) (( R( x, y )) ˆ Rz ) 2 , (ˆ Rz ˆ R2 ) ( D R ' z ˆ R2 ) (( R( x, y )) ˆ Rz ) (3.10) biểu diễn bốn trường hợp: a) Nội suy SI có chất lượng cao b) Nội suy SI có chất lượng trung bình 38 (3.10) c) Nội suy SI có chất lượng thấp – inlier pixel d) Nội suy SI chất có lượng thấp – outlier pixel Sau tính tốn α, giá trị sử dụng để giải mã cho pixel tương ứng khung WZ 3.3 Tính tốn tham số CNM miền biến đổi TDWZ 3.3.1 Cấu trúc mã hóa video WZ miền biến đổi MÃ HÓA WYNER-ZIV DCT Khung WZ Bitplane Lượng tử hóa GIẢI MÃ WYNER-ZIV Dòng bit WZ Mã hóa Turbo Bộ đệm Khung WZ giải mã Giải mã Turbo Tái cấu trúc IDCT Bitplane M DCT băng b Kênh phản hồi Mơ hình tạp âm tương quan DCT Khung SI Tạo SI Bộ đệm khung Khung Mã hóa INTRA truyền thống Giải mã INTRA truyền thống Khung giải mã Hình 3: Cấu trúc mã hóa video TDWZ Bộ mã hóa video WZ miền biến đổi (Transform domain WZ – TDWZ) khai thác tương quan mặt không gian khung cách sử dụng DCT khối khung, cách thu khối đại diện có chất lượng tốt hơn, dẫn tới hiệu suất RD codec cải thiện 3.3.2 Ước lượng tạp âm tương quan mức DCT khung (DCT band-byframe level) Kỹ thuật tính tham số phân phối Laplace α mức DCT khung việc điều chỉnh tham số α theo thời gian xuyên suốt chuỗi video Phương pháp sử dụng để tính tốn tham số α cho dải DCT khung Các bước tính toán biểu diễn sau [11]: 1) Tạo khung dư: 39 Tính khung dư R’ khung bù chuyển động khung tham chiếu X’B X’F sau: R' ( x, y) ( X ' F ( x dx F , y dy F ) X ' B ( x dx B , y dy B )) (3.11) Trong đó, X B' ( x dx B , y dy B ) X F' ( x dxF , y dyF ) khung giải mã bù chuyển động trước sau; (x,y) tương ứng với vị trí pixel khung R’; (dx B , dy B ) (dx F , dy F ) vector chuyển động tương ứng khung X’B X’F; F F B trọng số, F B tương ứng với khoảng cách theo thời gian từ khung nội suy SI đến khung X’F X’B tương ứng 2) Biến đổi DCT khung R’ Sử dung biến đổi DCT x cho khung R’, thu khung T’ chứa hệ số DCT: T’ = DCT(R’) (3.12) 3) Tạo khung |T’| Tính khung |T’| với phần tử giá trị tuyệt đối phần tử tương ứng khung T’ 4) Tính phương sai băng b khung DCT |T’|, ˆ b2 ˆ b2 E[| T ' b | ] ( E[| T ' b |]) (3.13) 5) Tính tham số α cho DCT băng b, ˆ b Tính tham số ˆ b cho băng DCT, sử dụng: ˆ b ˆ b2 (3.14) Sau tính ˆ b cho băng DCT , giá trị sử dụng để chuyển đổi băng DCT SI thành thông tin đầu vào mềm trình giải mã băng DCT tương ứng khung WZ 40 3.3.3 Ước lượng tạp âm tương quan mức hệ số khối (Coefficient-by-block level) Trong cách tiếp cận hệ số theo khối này, tham số phân phối Laplace α điều chỉnh thích nghi thời gian (dọc theo chuỗi video) không gian (cho hệ số DCT khối x 4) Các bước tính tốn biểu diễn sau [11]: Bước 1), 2), 3) 4) tương tự bước 1), 2), 3), 4) phần 3.3.2 5) Tính cách biệt hệ số thứ k băng DCT b khung |T’|, Db[k] Với băng DCT b khung |T’|, tính cách biệt Db[k] hệ số thứ k băng b giá trị trung bình DCT băng b khung |T’|, b , sau: Db[ k ] | T ' b[ k ] | b , b L | T ' b[ k ] | L k 1 (3.15) Trong đó, T 'b[ k ] đại diện cho hệ số DCT thứ k băng b khung |T’| L kích thước băng DCT 6) Tính tốn tham số α cho hệ số DCT thứ k, ˆ b[ k ] ˆ b[ k ] ˆ b (D ) b[ k ] , ( Db[ k ] ) ˆ b2 (3.16) , ( Db[ k ] ) ˆ b2 (3.16) biểu diễn hai trường hợp: a) Nội suy SI có chất lượng cao: Khoảng cách biệt (Db[k])2 nhỏ ˆ b2 , chứng tỏ khối/vùng nội suy xác lúc tham số ˆ b mức DCT khung (band-by-frame) có độ tin cậy cao b) Nội suy SI có chất lượng thấp: Khoảng cách biệt (Db[k])2 lớn ˆ b2 , tương ứng với việc block có lỗi phần dư cao, q trình tạo SI khơng cho kết tốt Vì vậy, tham số ˆ b hướng tiếp cận tốt trường hợp Phương án thay sử dụng (Db[k])2 thay cho ˆ b2 41 Sau tính tham số ˆ b[ k ] cho hệ số DCT băng b khung WZ, giá trị áp dụng vào (3.1) để chuyển đổi hệ số DCT k băng b SI thành thông tin đầu vào mềm giải mã 3.4 Kết luận chương Chương nghiên cứu , phân tích phương pháp tính tham số cho mơ hình tạp âm tương quan ba cấp độ khung, khối , pixel xét miền pixel mức hệ số DCT khung, khối xét miền biến đổi Bộ mã hóa video TDWZ có cấu trúc tương tự mã hóa video PDWZ, khác biến đổi DCT; tương quan khung ảnh khai thác qua DCT, mã hóa TDWZ cho hiệu nén tốt PDWZ Ở chương sau, để kiếm chứng hiệu mã hóa video phân tán với mơ hình CNM sử dụng phân phối Laplace, luận văn đánh giá hiệu nén codec miền biến đổi TDWZ, với mơ hình CNM sử dụng phân phối Laplace, Gauss Cauchy phân phối sử dụng để biểu diễn giá trị biến ngẫu nhiên thực nghiệm đồ thị phân phối biểu diễn gần sát với đồ thị phân phối phần dư ảnh gốc thông tin phụ SI 42 CHƯƠNG KẾT QUẢ THỰC NGHIỆM VÀ ĐÁNH GIÁ 4.1 Kết thực nghiệm Để đánh giá hiệu mơ hình ước lượng tương quan tạp âm CNM, tiến hành nhiều thực nghiệm với nhiều chuỗi video test sequence khác với mơ hình ước lượng CNM khác Trong đó, 04 chuỗi video theo chuẩn QCIF chọn bao gồm: Soccer, Foreman, Coastguard, Hallmonitor dùng để khảo sát hiệu hệ mã hóa DVC (a) (b) (c) (d) Hình 1: Khung mẫu từ chuỗi video test: (a) Soccer (frame 1); (b) Foreman (frame 1); (c) Coastguard (frame 1); (d) Hallmonitor (frame 1) Điều kiện mơ Khung chính(Key frame): mã hóa/giải mã H.265/HEVC Intra Chuỗi video: Foreman, Soccer, Coast guard, Hallmonitor QP: 25 ~ 40 Mơ hình CNM: Phân phối Laplace Phân phối Gauss Phân phối Cauchy Trong luận văn, hiệu mã hóa video mã hóa dựa vào PSNR (tỉ số tín hiệu nhiễu đỉnh) hàm đo chất lượng video thu sau giải mã tương ứng với tốc độ Bitrate mã hóa video frame 𝑃𝑁𝑆𝑅 = 10𝑙𝑜𝑔10 (2𝑏 −1)2 43 𝑀𝑆𝐸 (𝑑𝐵) (4.1) MSE sai số bình phương trung bình (Mean square error) định nghĩa cho cường độ sai khác ảnh gốc ảnh dự đoán: 𝑀𝑆𝐸 = 𝑁2 𝑁−1 ∑𝑁−1 𝑖=0 ∑𝑗=0 (𝐶𝑖𝑗 − 𝑅𝑖𝑗 ) (4.2) NxN kích thước bù chuyển động, hệ số Cij Rij tương ứng với mẫu vùng mẫu tham khảo; b số lượng bit/mẫu Trong phép đo đánh giá, Key frame mã hóa sử dụng kỹ thuật mã hóa Intra coding chuẩn H.265/HEVC H.265/HEVC chuẩn mã hóa video với kỹ thuật Intra coding tích hợp nhiều tính nhằm tăng cường hiệu nén cho Key frame coding mã hóa video phân tán DVC Các giá trị lượng tử QP dùng để mã hóa Key frame lựa chọn để đảm bảo cân chất lượng mã hóa Key frame WZ frame GOP Thông thường, giá trị QP lựa chọn không hợp lý dẫn đến tượng chênh lệch chất lượng hiển thị Key frame WZ frame, cụ thể: chất lượng Key frame cao chất lượng WZ frame làm cho hình ảnh hiển thị bị giật, khơng mềm mại, tạo cảm giác khó chịu cho người xem Để so sánh hiệu đạt mã hóa DVC ứng với mơ hình CNM khác nhau, luận văn tiến hành khảo sát 03 mơ hình CNM khác là: Mơ hình Laplace, mơ hình Gauss, mơ hình Cauchy Các mơ hình khảo sát mức frame (frame level) miền biến đổi (transform domain) ứng với bước thực trình bày phần 3.3.2 luận văn Hình 4.2 hiệu mã hóa theo kỹ thuật DVC thực với chuỗi Foreman ứng với mơ hình CNM khác Bảng 4.1 thông tin chi tiết thông số kỹ thuật thiết lập để thực mã hóa Key frame mã hóa DVC Cụ thể: 44 Foreman Sequence 40.00 38.00 PSNR (dB) 36.00 Cauchy 34.00 Laplace 32.00 Gauss 30.00 28.00 50.00 100.00 150.00 200.00 250.00 300.00 350.00 400.00 450.00 Bitrate (Kbps) Hình 2: Hiệu PSNR ứng với tốc độ Rate khác thực chuỗi Foreman Bảng 1: Hiệu PSNR ứng với tốc độ Rate khác thực chuỗi Foreman DVC/HEVC with Laplace QP Bitrate PSNR 40 64.66 28.96 34 142.34 32.67 29 264.61 36.17 25 427.22 39.49 DVC/HEVC with Gauss QP Bitrate PSNR 40 64.66 28.82 34 142.34 32.41 29 264.61 35.61 25 427.22 38.79 DVC/HEVC with Cauchy QP Bitrate PSNR 40 64.66 28.95 34 142.34 32.66 29 264.61 36.17 25 427.22 39.49 Các giá trị QPs thiết lập trường hợp gồm 04 giá trị từ QP = 25, tới QP = 40 Tương ứng với giá trị QP tốc độ Bitrate xác lập điểm làm việc cho mã hóa DVC Trên Hình 4.2, trục hồnh trục biểu diễn giá trị Birate tương ứng với QPs khác nhau, trục tung trục biểu diễn chất lượng hay hiệu PSNR thu mã hóa Giá trị PSNR giá trị trung bình PSNR thu Key frame WZ frame Các kết thu khảo sát với chuỗi video sequence thể Hình 4.2, 4.3, 4.4 4.5 Chi tiết bảng thơng số mơ tả cho hình trình bày Bảng 4.1, 4.2, 4.3 4.4 tương ứng 45 Soccer sequence 41.00 39.00 PSNR (dB) 37.00 35.00 Cauchy 33.00 Laplace 31.00 Gauss 29.00 27.00 50.00 150.00 250.00 350.00 450.00 550.00 Bitrate (Kbps) Hình 3: Hiệu PSNR ứng với tốc độ Rate khác thực chuỗi Soccer Bảng 2: Hiệu PSNR ứng với tốc độ Rate khác thực chuỗi Soccer DVC/HEVC with Laplace QP Bitrate PSNR 44 59.53 28.18 36 141.35 32.15 31 262.80 35.29 25 467.34 39.23 DVC/HEVC with Gauss QP Bitrate PSNR 44 59.53 27.78 36 141.35 31.36 31 262.80 33.88 25 467.34 36.75 DVC/HEVC with Cauchy QP Bitrate PSNR 44 59.53 28.18 36 141.35 32.14 31 262.80 35.28 25 467.34 39.23 Coastguard sequence 38.00 37.00 36.00 PSNR (dB) 35.00 Cauchy 34.00 33.00 Laplace 32.00 Gauss 31.00 30.00 29.00 28.00 50.00 150.00 250.00 350.00 450.00 Bitrate (Kbps) Hình 4: Hiệu PSNR ứng với tốc độ Rate khác thực chuỗi Coastguard 46 Bảng 3: Hiệu PSNR ứng với tốc độ Rate khác thực chuỗi Coastguard DVC/HEVC with Laplace QP Bitrate PSNR 38 71.48 28.83 34 138.14 31.42 30 251.65 34.25 26 422.01 37.42 DVC/HEVC with Gauss QP Bitrate PSNR 38 71.48 28.82 34 138.14 31.39 30 251.65 34.19 26 422.01 37.34 DVC/HEVC with Cauchy QP Bitrate PSNR 38 71.48 28.80 34 138.14 31.41 30 251.65 34.25 26 422.01 37.42 Hallmonitor sequence 43.00 41.00 PSNR (dB) 39.00 37.00 Laplace 35.00 Gauss 33.00 Cauchy 31.00 29.00 27.00 100.00 150.00 200.00 250.00 300.00 350.00 400.00 450.00 500.00 Bitrate (Kbps) Hình 5: Hiệu PSNR ứng với tốc độ Rate khác thực Hallmonitor Bảng 4: Hiệu PSNR ứng với tốc độ Rate khác thực chuỗi Hallmonitor DVC/HEVC with Laplace DVC/HEVC with Gauss DVC/HEVC with Cauchy QP Bitrate PSNR QP Bitrate PSNR QP Bitrate PSNR 37 153.97 31.91 37 153.97 31.92 37 153.97 31.86 33 223.19 34.94 33 223.19 34.93 33 223.19 34.90 29 313.07 37.98 29 313.07 37.96 29 313.07 37.96 24 479.93 41.40 24 479.93 41.32 24 479.93 41.39 47 Bảng 5: Bảng tổng hợp hiệu PSNR ứng với tốc độ Rate khác thực chuỗi test video giá trị QPs thiết lập khác Sequence QP PSNR(dB) Laplace Gauss Cauchy 28.96 32.67 36.17 39.49 28.18 32.15 35.29 39.23 28.33 31.42 34.25 37.42 31.91 34.94 37.98 41.40 28.82 32.41 35.61 38.79 27.78 31.36 33.88 36.75 28.82 31.39 34.19 37.34 31.92 34.93 37.96 41.32 28.95 32.66 36.17 39.49 28.18 32.14 35.28 39.23 28.80 31.41 34.25 37.42 31.86 34.90 37.96 41.39 40 34 29 25 44 36 31 25 38 34 30 26 37 33 29 24 Foreman Soccer Coastguard Hallmonitor Bảng 6: Bảng tổng hợp thời gian mô q trình mã hóa giải mã khung WZ thực chuỗi test video với giá trị QPs khác Sequence Foreman Soccer Coastguard Hallmonitor QP Simulation time(s) 40 34 29 25 44 36 31 25 38 34 30 26 37 33 29 24 Thời gian trung bình (s) 48 Laplace Gauss Cauchy 344.86 770.19 1400.84 2245.35 456.70 970.08 1759.46 2727.85 305.35 451.80 922.05 1681.34 128.46 239.69 382.47 539.25 957.86 398.24 954.22 1830.15 2689.65 475.88 1038.38 1820.05 2757.31 266.45 558.14 1233.38 1997.85 202.54 362.81 536.36 709.77 1114.45 480.49 923.51 1659.32 2390.31 646.01 1240.87 1906.48 3039.71 196.19 437.33 867.51 1605.04 152.38 268.50 374.96 522.16 1044.42 Các giá trị Bảng 4.6 thể thời gian mô q trình mã hóa giải mã khung WZ chuỗi Foreman, Soccer, Coastguard Hallmonitor Kết cho thấy với mơ hình Laplace, thời gian mơ tính trung bình chuỗi video test nhanh nhất, tốt Cauchy mơ hình đạt hiệu nén tương đương 4.2 Đánh giá kết luận Như kết Bảng 4.5, ứng với tất giá trị QPs thiết lập khác nhau, hiệu mã hóa DVC/HEVC ln đạt giá trị cao ứng với mơ hình CNM theo phân phối Laplace Mơ hình Gauss sử dụng cho chuỗi video có nhiều chuyển động hiệu thấp Laplace Cauchy Mơ hình Cauchy đạt hiệu tương đương sử dụng mơ hình Laplace, mơ hình Cauchy thường có độ phức tạp tính tốn nhiều Theo Bảng 4.6, thời gian mơ mơ hình Cauchy cao mơ hình Laplace Bởi vậy, xét hiệu kết hợp với đơn giản, dễ thực hiện, giảm thiểu chi phí, thực tế mơ hình CNM theo phân phối Laplace đánh giá tốt nhất, thường khai thác sử dụng 49 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Qua mô đánh giá hiệu mã hóa video phân phối DVC – HEVC với mơ hình tạp âm tương quan thay đổi theo phân phối Laplace, Gauss Cauchy Hiệu đạt với mơ hình CNM theo Laplace có kết tốt chuỗi video thử nghiệm Vì vậy, việc ứng dụng phân phối Laplace việc xây dựng mơ hình tạp âm tương quan CNM khả thi cho kết khả quan Tuy nhiên số cơng trình nghiên cứu rằng, với trường hợp chuỗi video có nhiều chuyển động, tương quan khơng gian thời gian khung biến đổi nhanh khơng việc áp dụng phân phối Laplace không thực sát với thống kê phân phối phần dư thông tin gốc thông tin phụ Vậy nên, hướng nghiên cứu phát triển luận văn mơ hình tạp âm tương quan thích nghi (adaptive) với việc sử dụng phân phối khác để thích nghi với thay đổi dọc theo chuỗi video 50 TÀI LIỆU THAM KHẢO [1] B Girod, et al., "Distributed video coding," Procedding of the IEEE, vol 93, no 1, pp 71-83, Jan 2005 [2] X Artiga, J Ascenso, M Dalai, S Klomp, D Kubasov, anh M Ouaret, “The DISCOVER codec: architecture, techniques and evalution” in Picture Coding Symposium, Lisbon, Portugal, December 2007 [3] T Wiegand, G J Sullivan, G Bjontegaard, and A Luthra, "Overview of the H.264/AVC Video Coding Standard," IEEE Transactions on Circuits and Systems for Video Technology, vol 13, no 7, pp 560-576, Jul 2003 [4] A D Wyner and J Ziv, "The rate-distortion function for source coding with side information at the decoder," IEEE Transactions on Information Technology, vol 22, no 1, pp 1-10, Jan 1976 [5] D Slepian and J K Wolf, "Noiseless coding of correlated information sources," IEEE Transactions on Information Technology, vol 19, pp 471-480, Jul 1973 [6] L Nataro, C Brites, J Ascenso, F Pereira, “Side information extrapolation for low-delay pixel-domain distributed video coding”, in International Workshop on Very Low Bitrate Video, Sardinia, Italy, September 2005 [7] J Ascenso, C Brites, and F Pereira, “Improving Frame Interpolation with Spatial Motion Smoothing for Pixel Domain Distributed Video Coding,” 5th EURASIP Conf on Speech, Image Processing, Multimedia Communications and Services, Jul 2005 [8] C.Brites, J Ascenso and F Pereira, “Studying temporal correlation noise modeling for pixel based Wyner-Ziv video coding” in IEEE International Conference on Image Processing, Atlanta GA, USA,Octorber 2006 [9] J Ascenso, C.Brites and F Pereira, “Content adaptive Wyner-Ziv video coding driven by motion activity” in IEEE International Conference on Image Processing, Atalanta, USA, October 2006 [10] D Kubasov et al., “Optimal reconstruction in Wyner-Ziv video coding with multiple side information,” in IEEE Workshop on Multimedia Signal Processing, pp 183-186, Crete, Greece, Oct 2007 51 [11] Catarina Brites and Fernando Pereira, “Correlation Noise Modeling for Efficient Pixel and Transform Domain Wyner–Ziv Video Coding”, IEEE Transactions On Circuits And Systems For Video Technology, Vol 18, No 9, September 2008 [12] Vivienne Sze, Madhukar Budagavi, Gary J.Sullivan, “High Efficientcy Video Coding”, Algorithms and Architectures 52 ... CAM ĐOAN Tôi xin cam đoan đề tài “PHÁT TRIỂN MƠ HÌNH TẠP ÂM TƯƠNG QUAN NHẰM NÂNG CAO HIỆU NĂNG MÃ HÓA CỦA KỸ THUẬT MÃ HÓA VIDEO PHÂN TÁN DVC TS Hoàng Văn Xiêm TS Đinh Triều Dương hướng dẫn cơng... lượng mã hóa tốt Vì vậy, luận văn áp dụng chuẩn nén H.265/HEVC Intra mơ hình mã hóa video phân tán đề cập chi tiết Chương 23 CHƯƠNG TỔNG QUAN VỀ MÃ HÓA VIDEO PHÂN TÁN DVC 2.1 Tổng quan mã hóa video. .. này, mơ hình mã hóa video nghiên cứu, phát triền mơ hình mã hóa video phân tán DVC (Distributed Video Coding) Mục đích nghiên cứu Luận văn tập trung tìm hiểu nghiên cứu mơ hình tạp âm tương quan