Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 53 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
53
Dung lượng
2,25 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ CHU TRẦN HÙNG NGHIÊNCỨUVÀPHÂNTÍCHBỘMÃHÓAVIDEODÙNGCHOMẠNGSENSOR Ngành : Công nghệ Kỹ thuật Điện tử, Truyền thông Chuyên ngành : Kỹ thuật Điện tử Mã số : 60520203 LUẬN VĂN THẠC SĨ CÔNG NGHỆ KỸ THUẬT ĐIỆN TỬ TRUYỀN THÔNG NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS TRỊNH ANH VŨ TS HOÀNG VĂN XIÊM Hà Nội - 2016 LỜI CAM ĐOAN Tôi xin cam đoan số liệu kết nghiêncứu luận văn trung thực chưa sử dụng để bảo vệ học vị Mọi giúp đỡ luận văn cảm ơn thông tin trích dẫn luận văn rõ nguồn gốc rõ ràng phép công bố Hà Nôi, ngày … tháng … năm 2016 Người thực hiện: Chu Trần Hùng MỤC LỤC LỜI CAM ĐOAN MỤC LỤC CÁC THUẬT NGỮ VIẾT TẮT DANH MỤC BẢNG DANH MỤC SƠ ĐỒ, HÌNH VẼ LỜI NÓI ĐẦU CHƯƠNG 1: CƠ SỞ LÝ THUYẾT CỦA KỸ THUẬT MÃHÓAVIDEO TRUYỀN THỐNG 1.1 Yêu cầu mãhóavideo 1.2 Các kỹ thuật mãhóavideo then chốt 1.2.1 Mãhóa sai khác ảnh thực tế ảnh dự đoán 1.2.2 Mãhóa miền biến đổi 1.2.3 Phép lượng tử tuyến tính 1.2.4 Các phép dự đoán ảnh 1.2.5 Mãhóa Entropy 1.3 Các chuẩn mãhóavideo phổ biến 1.3.1 Chuẩn H.264/AVC 1.3.2 Chuẩn H.265/HEVC 10 1.4.Nhược điểm kỹ thuật mãhóavideo truyền thống 12 1.4.1 Độ phức tạp cao phía mãhóa 12 1.4.2 Khả chống chịu nhiễu thấp 13 CHƯƠNG 2: CƠ SỞ KỸ THUẬT CỦA MÃVIDEOPHÂN TÁN 15 2.1 Mãhóa dự đoán cổ điển 15 2.2 Định lý Slepian-Wolf 15 2.3 Định lý Winer-Ziv 17 2.4 Ví dụ minh họa 18 CHƯƠNG 3: CÁC MÔ HÌNH THỰC NGHIỆM CỦA KỸ THUẬT MÃVIDEOPHÂN TÁN 20 3.1 Giải pháp STANFORD 20 3.1.1 Biến đổi lượng tử hóa 21 3.1.2 Mãhóa kênh đệm 21 3.1.3 Tỉ lệ ước tính tối thiểu 21 3.1.4 Phần thông tin phụ khai thác 21 3.1.5 Mô hình kênh ảo tính toán đầu vào mềm 22 3.1.6 Giải mã Kênh Kiểm tra CRC 22 3.1.7 Sự khôi phục biến đổi ngược 22 3.2 Giải pháp PRISM 22 3.2.1 Quá trình huấn luyện 24 3.2.2 Quá trình mãhóa 26 3.2.3 Quá trình giải mã 32 CHƯƠNG 4: ĐÁNH GIÁ ƯU NHƯỢC ĐIỂM BỘMÃHÓA DVC 33 4.1 Điều kiện đánh giá 33 4.2 Đánh giá hiệu nén 35 4.3 Đánh giá độ phức tạp 38 KẾT LUẬN 42 TÀI LIỆU THAM KHẢO 44 CÁC THUẬT NGỮ VIẾT TẮT Từ viết tắt Nghĩa tiếng Anh Nghĩa tiếng Việt AMVP Advanced Motion Vector Bộ dự đoán vector chuyển động Predictor nâng cao AVC Advanced Video Coding Mãhóavideo tiên tiến BAC Binary Arithmetic Coding Mãhóa số học nhị phân CABAC Content Adaptive Binary Mãhóa số học nhị phân thích nghi Arithmetic Coding theo thuộc tính Content Adaptive Variable Mã chiều dài thay đổi thích nghi Length Coding theo thuộc tính CPU Central Processing Unit Đơn vị xử lý trung tâm CTU Coding Tree Unit Đơn vị mãhóa CU Coding Unit Đơn vị mãhóa DCT Discrete Cosine Transform Biến đổi Cosine rời rạc DPCM Differential Pulse Code Điều xung mã vi sai CAVLC Modulation DPB Decoded Picture Buffer Bộ đệm hình ảnh giải mã DRAM Dynamic Random Access Bộ nhớ truy cập ngẫu nhiên động Memory DVC Distributed Video Coding Mãhóavideophân tán GOP Group Of Picture Nhóm ảnh GMC Global Motion Compensation Bù chuyển động toàn phần HD High Definition Độ phân giải cao HEVC High Eficiency Video Coding Mãhóavideo hiệu suất cao HVS Human Visual System Hệ thống trực quan người IDCT Inverse Discrete Cosine Biến đổi cosin rời rạc ngược Transform IEC International Electrotechnical Ủy ban Kỹ thuật Điện Quốc tế Commission ISO International Organization for Standardization Tổ chức tiêu chuẩn hóa quốc tế ITU-T International Khu vực tiêu chuẩn hóa viễn thông Telecommunication Union thuộc Tổ chức viễn thông quốc tế Telecommunication Liên hợp quốc Standardization Sector JPEG Joint Photographic Experts Chuẩn nén ảnh ủy ban quốc tế Group MB Macroblock Khối lớn MC Motion Compensated Bù chuyển động MCP Motion Compensated Prediction Dự đoán bù chuyển động MPEG Moving Picture Experts Group Nhóm chuyên gia hình ảnh động MPS Most Probable Symbol Biểu tượng có khả xuất nhiều MVD Motion Vector Difference Sự khác biệt vector chuyển động MVP Motion Vector Predictor Bộ dự đoán vector chuyển động PPS Picture Parameter Set Tập hợp tham số hình ảnh PSNR Peak Signal to Noise Ratio Tỉ lệ tín hiệu đỉnh/ tạp âm PU Prediction Unit Đơn vị dự đoán QG Quantization Group Nhóm lượng tử hóa QP Quantization Parameter Tham số lượng tử hóa RDO Rate Distortion Optimization Tối ưu hóa tốc độ/ méo SAO Sample Adaptive Offset Bù thích nghi mẫu SD Standard Definition Định dạng tiêu chuẩn SPS Sequence Parameter Set Tập hợp tham số chuỗi SRAM Static Random Access Memory Bộ nhớ truy cập ngẫu nhiên tĩnh TU Transform Unit Đơn vị biến đổi UHD Ultra High Definition Định dạng cực cao VLC Variable Length Code Mã có chiều dài thay đổi VLSI Very Large Scale Integration Tích hợp với quy mô rộng DANH MỤC BẢNG Bảng 1.1 Giá trị lượng tử xác suất tương ứng Bảng 1.2 Từ mã Huffman lượng bít cần mãhóa tương ứng Bảng 4.1 Bảng mô tả tóm tắt thông số sử dụng đánh giá 33 Bảng 4.2: Bảng lượng tử mãhóa DVC 34 Bảng 4.3: Giá trị lượng tử cho khung GOP=2, QCIF 15Hz 35 DANH MỤC SƠ ĐỒ, HÌNH VẼ Hình 1.1 Mô tả ví dụ video với độ phân giải 2K kích thước tương ứng loại video khác Hình 1.2: Minh họa sai khác khung liên tiếp dãy video Hình 1.3: Giá trị điểm ảnh miền pixel miền DCT tương ứng Hình 1.4 Mô hình phép lượng tử tuyến tính sử dụngmãhóavideo Hình 1.5 Mô tả ảnh gốc, ảnh dự đoán ảnh dư thừa [20] Hình 1.6 Tạo ảnh dự đoán khung Hình 1.7 Tạo ảnh dự đoán liên khung Hình 1.8 Sử dụng thuật toán tạo từ mã Huffman Hình 1.9 Kiến trúc tổng quát chuẩn H.264/AVC [3] Hình 1.10 Kiến trúc tổng quát chuẩn H.254/HEVC [1] 10 Hình 1.11: Phạm vi dò tìm vecto dịch chuyển block chứa bánh xe 12 Hình 1.12:Ước lượng véc tơ dịch chuyển 13 Hình 2.1: Mô hình mãhóa dự đoán cổ điển 15 Hình 2.2: Sơ đồ mã nguồn phụ thuộc thống kê 16 Hình 2.3: Biểu đồ vùng tỉ lệ tốc độ mã nguồn X,Y 16 Hình 2.4: Mô tả định lí Slepian-Wolf với thông tin phụ 17 Hình 2.5: Mãhóa mát thông tin với thông tin phụ phần giải mã 17 Hình 3.1 Cấu trúc khám phá thuật nén giải nén [15] 20 Hình 3.2: Sơ đồ mãhóa giải mã PRISM [9] 24 Hình 3.3: Quét zig- zag 26 Hình 3.4: Mô hình mã Syndrome [8] 29 Hình 3.5: Mặt phẳng bit syndrome [9] 30 Hình 3.6: Chương trình quét xoắn ốc 32 Hình 4.1 Mô tả khung hình chuỗi video 33 Hình 4.2: Biểu đồ so sánh hiệu nén - Foreman 36 Hình 4.3: Biểu đồ so sánh hiệu nén - Hall monitor 36 Hình 4.4: Biểu đồ so sánh hiệu nén - Coast guard 37 Hình 4.5: Biểu đồ so sánh hiệu nén – Soccer 37 Hình 4.6: Biểu đồ so sánh thời gian mãhóa - Foreman 39 Hình 4.7: Biểu đồ so sánh thời gian mãhóa - Hall monitor 39 Hình 4.8: Biểu đồ so sánh thời gian mãhóa - Coastguard 40 Hình 4.9: Biểu đồ so sánh thời gian mãhóa - Soccer 40 LỜI NÓI ĐẦU Ngày nay, công nghệ mãhóavideo sử dụng phổ biến, từ ứng dụng truyền thống truyền hình quảng bá, truyền hình hội nghị đến ứng dụng xuất mạng cảm biến (sensor), mạng giám sát từ xa Các công nghệ dựa mô hình mãhóavideo dự đoán, với chuẩn mãhóa phổ biến MPEG-2/Video, H264/AVC hay H.265/HEVC Mặc hiệu mãhóa cao, khai thác có hiệu thông tin tương quan khung hình phía phat, công nghệ mãhóa với mức độ yêu cầu cao độ phức tạp thuật toán phía phát, cần thiết bị đại, đắt tiền bên phát Mô hình mãhóa phù hợp với hệ thống truyền hình quảng bá, đài truyền hình với nguồn tài mạnh đầu tư thiết bị đắt tiền để phát sóng Ở phía người dùng, giải mã đơn giản giúp cho người dùng dễ dàng xem chương trình với đầu thu có giá thành rẻ Công nghệ ngày phát triển, mô hình mạngvideo khác triển khai đời sống, chẳng hạn mạngvideo giám sát giao thông, camera an ninh lắp đặt nhà hàng, bệnh viện… Những hệ thống có đòi hỏi hoàn toàn khác so với hệ thống truyền hình quảng bá yêu cầu phần phát đơn giản, gọn nhẹ, rẻ tiền phần phức tạp chuyển xử lý trung tâm phía thu, nơi đầu tư thiết bị tập trung đại Do chuẩn mãhóavideo truyền thống không phù hợp Yêu cầu đặt phát triển mô hình mãhóa để đơn giản phầnmãhóamà không làm tổn thất đáng kể hiệu suất nén so với mô hình truyền thống Trong nỗ lực đưa câu trả lời cho nhu cầu mãhóavideo đáp ứng nhu cầu thực tiễn này, mô hình mãhóavideonghiên cứu, phát triền mô hình mãhóavideophân tán DVC (Distributed Video Coding) Mô hình dựa kết định lý thuyết thông tin định lý Slepian- Wolf Wyner- Zip Theo hướng nghiêncứu luận văn tập trung trình bày mô hình mãvideophân tán DVC; bên cạnh đó, luận án đưa mô hình mãhóa truyền thống để phântích Từ luận vắn đưa so sánh đánh giá ưu, nhược điểm mô hình hướng phát triển cho mô hình CHƯƠNG 1: CƠ SỞ LÝ THUYẾT CỦA KỸ THUẬT MÃHÓAVIDEO TRUYỀN THỐNG Ra đời từ cách bốn mươi năm, mãhóavideo đóng vai trò vô quan trọng phát triển trưởng thành truyền thông số, truyền hình Internet Chương tập trung vào điểm lại số kỹ thuật then chốt sử dụng chuẩn mãhóavideo truyền thống 1.1 Yêu cầu mãhóavideo Một tín hiệu video số thường chứa lượng lớn liệu; gặp nhiều khó khăn việc lưu trữ truyền kênh truyền có băng thông hạn chế Ngoài ra, với phát triển khoa học kỹ thuật, ngày sản xuất cảm biến màu có độ phân giải lên đến hàng chục triệu pixel thực tế ứng dụng độ phân giải 1920×1080 pixel, lớn chuẩn 2K, 4K Khi việc biểu diễn thông tin video tốn nhiều liệu (a) Video với độ phần giải 2K (b) Kích thước tương ứng số loại video Hình 1.1 Mô tả ví dụ video với độ phân giải 2K kích thước tương ứng loại video khác Do để tiết kiệm không gian lưu trữ băng thông kênh truyền cần phải mãhóa (nén) tín hiệu video Quá trình nén ảnh thực thông tin ảnh có tổ chức, có trật tự, xem xét kỹ tính trật tự, cấu trúc ảnh phát loại bỏ lượng thông tin dư thừa, giữ lại thông tin quan trọng nhằm giảm số lượng bit lưu trữ truyền mà đảm bảo thông tin hiển thị ảnh Tại đầu thu, giải mã tổ chức, xếp lại ảnh xấp xỉ gần xác so với ảnh gốc đảm bảo thông tin cần thiết nhiệm biểu diễn coset Depth xác định số bít coset, path lưu trữ bít nhận diện coset Trong thực hành Depth Clsize Path kết bước trước Mã entropy: nhằm có ưu điểm thống kê chữ nhánh bước trước Mỗi từ mã (Last, Run, Depth, Level) mãdùngmã độ dài thay đổi 3.2.2.6 Mãhóa mặt phẳng bít bổ sung syndrome Mô dul nhằm nén truyền mặt phẳng bít cosey bổ sung Giá trị tạp âm tương quan ước lượng mãhóa không thật xác so với thực tế Đối với đa số block, giá trị tạp âm tương quan ước lượng lớn giá trị thật nên giải điều chế thành công Tuy nhiên có tỷ lệ nhỏ block, giá trị ước lượng nhỏ giá trị thật, nên khoản cách từ mã coset không đủ nên chọn nhầm ứng cử viên bên giải mãVà số hệ số giải mã sai dẫn đến CRC truyền để phát không thành công Đây giá phải trả cho việc ước lượng tạp âm tương quan Để giảm điều kích thướng số coset phải tăng thêm lượng để số phần trăm giải mã không xác chấp nhận Tuy nhiên lại không đạt độ nén mong muốn Do nguyên nhân chiến lược lai ghép triển khai: Thay cho việc truyền thêm bít cho coset, bít bổ sung truyền phối hợp với giải mã để dùng tổng kiểm tra ngắn Các từ thành tổng kiểm tra goi từ mã mặt phẳng bít số bổ sung Bên phía giải mã, tổng kiểm tra có khả hiệu chỉnh lượng giới hạn số coset mà bị lựa chọn sai khoảng cách từ mã không đủ coset Khi giải mã syndrome kết thúc, giải mã mặt phẳng bít bổ sung truy cập từ mã lượng tử giải cho phép tạo lại từ mã mặt phẳng bít số bổ sung Đây phiên lỗi từ mã mặt phẳng bít bên mã hóa, từ tổng kiểm tra hiệu chỉnh Sau hiệu chỉnh số coset, giải mãdùng số tăng thêm tiến hành giải mã lại với ứng cử viên trước Trong codec IST-PRISM, bít thêm (bít xám hình 3.5) mã phối hợp dùngmã BCH Phânmã hệ thống BCH chưa bít bổ sung bị loại, có tổng kiểm tra truyền đến giải mãMã BCH lựa chọn chúng đơn giản thích hợp với khối nhỏ 3.2.2.7 Mã CRC Mã CRC thiết kế để chọn từ mã ứng cử viên, có nhiều ứng viên cửa sổ dò tìm bên phái giải mã Trong PRISM mã lựa chọn CRC-16 có đa thức tạo mã là: x16 + x12 + x5 + Cuối mãhóa việc tạo dòng bít có cấu trúc sau: 31 3.2.3 Quá trình giải mã 3.2.3.1 Giải mã syndrome Mục tiêu tìm từ mã coset nhận Trước tiên xác định coset, sau hiệu chỉnh coset dùng tổng kiểm tra BCH từ mã mặt phẳng bít số bổ sung Do có nhiều ứng cử viên coset có tương quan với từ mã cần tìm nên cần dò tìm thử để tìm từ mã Phép thử thành công kết hợp với mã kiểm ta CRC Chi tiết khối giải mã sau: Modul có chức chọn từ mã coset sử dụng thông tin lề Thông tin lề dùng block DCT lượng tử quét zig-zag i) Giải mã entropy ii) Giải mã số coset iii) Tạo lại ký hiệu iv) Giải mã mặt phẳng bít bổ sung syndrome 3.2.3.2 Dò chuyển động Module tạo ứng cử kết hợp với syndrome nhận để giải mã DVC thích hợp cho dãy có nội dung chuyển động giới hạn video surveillance and videotelephony Với dãy có nội dung chuyển động thấp block bù chuyển động nằm gần block giải mã có nhiều tương quan với Đó nguyên nhân tác giả dùng cách quét theo đường xoắn ốc để tìm ứng cử Hình 3.6: Chương trình quét xoắn ốc 32 CHƯƠNG 4: ĐÁNH GIÁ ƯU NHƯỢC ĐIỂM BỘMÃHÓA DVC 4.1 Điều kiện đánh giá Chương đưa kịch so sánh đánh giá mã DVC mã truyền thống, tập trung vào đánh giá hiệu nén độ phức tạp cho chuỗi video với đặc tính nội dung khác Hình 4.1 hiển thị khung hình chuỗi video Foreman Hall monitor Coastguard Soccer Hình 4.1 Mô tả khung hình chuỗi video Do thành phần màu (Chroma) không ảnh hưởng đáng kể tới hiệu nén mãhóa nên thực nghiệm, thành phần độ chói (Luma) sử dụng để mãhóa đánh giá so sánh Các thông số khác chuỗi video mô tả tóm tắt bảng 4.1 Bảng 4.1 Bảng mô tả tóm tắt thông số sử dụng đánh giá Tên chuỗi video Foreman Hall Monitor Coastguard Soccer Số khung hình 299 329 299 299 Kích cỡ QCIF (176 × 144) Tốc độ khung hình 15 Hz Kích cỡ nhóm ảnh (Key – WZ – Key) Tham số lượng tử QM1, QM3, QM5, QM7 33 Bảng lượng tử sử dụngchomãhóa DVC Bảng 4.2: Bảng lượng tử mãhóa DVC QM1 16 8 0 0 0 0 0 0 0 0 QM3 32 8 4 0 0 0 0 0 0 0 QM5 QM7 32 16 16 4 4 0 4 0 64 32 16 32 16 16 4 4 0 Các mãhóa tham chiếu: o H.264/Intra: Đây mãhóa phổ biến, cấu hình từ chuẩn H.264/AVC tải tử [19]; đó, tất khung hình sử dụng phương pháp mãhóa dự đoán khung Do vậy, phương pháp mãhóa đòi hỏi thời gian mãhóa thấp, phù hợp với ứng dụngmạng sensor,… Cần lưu ý rằng, H.264/Intra đối tượng so sánh mãhóavideophân tán DVC o H.264/No ME: Đây mãhóavideo phổ biến, cấu hình từ chuẩn H.264/AVC tài tử [19] Tuy nhiên, không phương pháp dự đoán khung mà liên khung với giả thiết vector dự đoán không sử dụng Trong mãhóa này, phương pháp ước lượng vector chuyển động không sử dụng Do vậy, yêu cầu thời gian mãhóa thấp Tuy nhiên, có khai thác tính tương quan khung phía mã hóa, mãhóa nhạy cảm với nhiễu liên khung o DVC-UET: Đây mãhóa trình bày phântích luận văn Bộmãhóa xây dựng Visual Processing and Communications Group, VNU-UET [20] dựa mô hình nhóm nghiêncứu đại học Stanford Trong đó, khung hình (key frames) mãhóa với H.264/AVC Intra mãhóa H.264/AVC Intra mang lại hiệu nén cao đồng thời yêu cầu độ phức tạp thấp không khai thác ước lượng chuyển động phía phát Các giá trị lượng tử cho khung lựa chọn với mục tiêu có chất lượng video giải mã gần liên tục cho toàn khung hình mô tả bảng 4.3 34 Bảng 4.3: Giá trị lượng tử cho khung GOP=2, QCIF 15Hz Sequences QM1 QM3 QM5 QM7 Foreman 40 38 34 29 Hall Monitor 37 36 33 29 Coastguard 38 37 30 30 Soccer 44 41 36 31 4.2 Đánh giá hiệu nén Hiệu nén yêu cầu quan trọng phương pháp mãhóa video; phương pháp đánh giá tốt hiệu nén cao so với phương pháp trước Trong việc đánh giá hiệu nén mãhóa video, mối tương quan chất lượng hình ảnh sau giải mã, đo giá trị đỉnh tín hiệu tạp âm (Peak Signal to Noise Ration – PSNR) lượng bít cần sử dụng để mãhóa (bitrate – bit per second – bps) Trong đó, PSNR xác định sau: PSNR 10 log10 2552 MSE MSE: Mean Squared Error giá trị trung bình bình phương lỗi (sự khác biệt) tín hiệu trước sau giải mã Trên sở đó, việc đánh giá hiệu nén so sánh với chuẩn H.264/AVC xác định cho trường hợp lượng tử khác mô tả bảng 4.2 4.3 Hình 4.2 đến 4.5 thể biểu đồ so sánh hiệu nén cho chuỗi video đánh giá 35 Hình 4.2: Biểu đồ so sánh hiệu nén - Foreman Hình 4.3: Biểu đồ so sánh hiệu nén - Hall monitor 36 Hình 4.4: Biểu đồ so sánh hiệu nén - Coast guard Hình 4.5: Biểu đồ so sánh hiệu nén – Soccer 37 Trên sở kết thu mô tả hình 4.2 – 4.5, số kết luận rút sau; So sánh với H.264/Intra - Trong hầu hết trường hợp so sánh mô hình mãhóa DVC có hiệu suất nén cao so với mô hình mãhóa H264/Intra - Ở trường hợp Coastguard, Hall Monitor Foreman vật thể chuyển động với tốc độ không cao nên sử dụngmã DVC đạt hiệu cao Chỉ trường hợp Soccer vật thể chuyển động với tốc độ cao mô hình truyền thống lại đạt hiệu nén tốt Điều việc ước lượng chuyển động phía mãhóa chuẩn nén video truyền thống So sánh với H.264/ No ME Trong trường hợp so sánh mô hình mãhóa DVC có hiệu suất nén đạt xấp xỉ so với mô hình H.264/ No ME Trong trường hợp chuỗi Coastguard chí đạt hiệu suất nén cao nhiên mục tiêu so sánh luận văn 4.3 Đánh giá độ phức tạp Độ phức tạp việc mã hóa, với hiệu nén khả chống chịu lỗi ba yêu cầu chuẩn nén video hiệu Do vậy, nghiêncứu trọn vẹn không đánh giá độ phức tạp phương pháp mãhóavideophân tán DVC, so sánh với chuẩn H.264/AVC Có nhiều cách đánh giá độ phức tạp chuẩn mã hóa, xác định số lượng phép tính thuật toán hay cách phổ biến đơn giản đo thời gian mãhóa phương pháp mãhóa điều kiện kiểm thử chuẩn Về số lượng phép tính thấy từ chương dò tìm vecto dịch chuyển trung bình tốn nhiều phép tính (trong ví dụ đưa 8,55 x 109 phép tính giây ) DVC phép dò tìm vecto dịch chuyển bên mã hóa, số phép tính chủ yếu cho khung reference theo mãhóa intra tạo thông tin phụ Trong nghiêncứu này, phương pháp thứ hai, đo lường thời gian mãhóa phương pháp mãhóa DVC-UET, H.264/Intra H.264/No ME sử dụng máy tính với cấu hình bao gồm chíp dual core Pentium D 3.4 GHz, 2GB RAM, ngôn ngữ lập trình C++ Microsoft Visual Studio sử dụng Hình 4.6 đến 4.9 mô tả so sánh thời gian mãhóa chuẩn H.264/AVC phương pháp DVC 38 Hình 4.6: Biểu đồ so sánh thời gian mãhóa - Foreman Hình 4.7: Biểu đồ so sánh thời gian mãhóa - Hall monitor 39 Hình 4.8: Biểu đồ so sánh thời gian mãhóa - Coastguard Hình 4.9: Biểu đồ so sánh thời gian mãhóa - Soccer 40 Nhận xét: - Các biểu đồ so sánh thời gian mãhóacho thấy mô hình mãhóa DVC có thời gian mãhóa thấp hẳn so với mô hình lại tất trường hợp nên khẳng định mô hình mãhóa DVC có độ phức tạp thấp phầnmã hóa,phù hợp với nhu cầu phát triển mạngvideo giám sát Điều so với mãhóa H.264/Intra, mãhóa DVC-UET không sử dụng cách tạo dự đoán nề (với mode dự đoán) tối ưu hệ thống (Rate-Distortion Optimization RDO) phức tạp phía phát 41 KẾT LUẬN Trước nhu cầu ngày cao mãhóavideo có hiệu nén tốt đòi hỏi thời gian mãhóa thấp; đặc biệt ứng dụngmạng sensor, luận văn tập trung vào việc giới thiệu, phântích so sánh phương pháp mãhóavideophân tán – DVC Mãhóavideophân tán DVC hướng nghiêncứu quan tâm đặc điểm hiệu mãhóa cao, độ phức tạp mãhóa thấp khả chống chịu nhiễu hiệu Luận văn chia làm năm chương Chương giới thiệu kỹ thuật sử dụngmãhóavideo dự đoán truyền thống Chương tóm tắt qua phần sở lý thuyết mãhóavideophân tán, cụ thể hai định lý Slepian-Wolf Wyner-Ziv Tiếp theo, chương trình bày phântích hai hướng xây dựngmãhóavideophân tán thực tế, đề xuất hai nhóm nghiêncứu trường đại học Stanford đại học Berkeley Chương trình bày kết so sánh hiệu nén độ phức tạp mãhóa mô hình mãhóavideophân tán DVC Như trình bày chương chương 3, kỹ thuật mãhóavideophân tán có khả mang lại hiệu nén cao để thích ứng với kênh truyền vô tuyến hạn hẹp, nhiên có điểm khác biệt so với kỹ thuật mãhóa truyền thống (trình bày chương 1) độ phức tạp mặt thuật toán Cụ thể, mãhóavideo truyền thống nặng phầnmãhóa kỹ thuật DVC phầnmãhóa lại nhẹ Do vậy, mãhóavideophân tán phù hợp với nhu cầu phát triển mạng giám sát Như trình bày chương 4, khác biệt mãhóahóa truyền thống thực việc dò tìm xác vecto dịch chuyển khung reference khung inter, mã DVC dựa ước lượng tạp âm tương quan Ở phương pháp DVC (tiêu biểu PRISM DISCOVER), phức tạp dịch chuyển phía giải mã việc dò tìm từ mã hệ số DCT tập phân hoạch Thực so sánh chất lượng (theo PSNR) độ phức tạp (theo thời gian) cho thấy: DVC có kết đánh giá chất lượng tốt chuỗi video hình ảnh với vật thể chuyển động chậm Về thời gian mãhóa trường hợp DVC tốt hẳn so với mô hình truyền thống Nhận thấy tiềm lớn hương nghiêncứu này, tương lại hệ thống DVC toàn diện, tương thích ngược với chuẩn H.265/HEVC hướng nghiêncứu tiềm 42 LỜI CẢM ƠN Được phân công Khoa Điện tử viễn thông, trường Đại học Công nghệ, hướng dẫn PGS.TS Trịnh Anh Vũ TS Hoàng Văn Xiêm thực luận văn: “ Nghiêncứuphântíchmãhóavideodùngchomạngsensor ’’ Để hoàn thành luận văn xin cảm ơn Thầy cô Khoa Điện tử viễn thông, trường Đại học Công nghệ nhiệt tình dạy dỗ, cung cấp phương pháp, kiến thức suốt thời gian học tập Tôi xin chân thành cảm ơn tới hai thầy giáo PGS.TS Trịnh Anh Vũ TS Hoàng Văn Xiêm tận tình hướng dẫn bảo nhiều kiến thức phương pháp làm việc trình thực hoàn thành đồ án Tôi xin gửi lời cảm ơn tới nhóm nghiêncứu “Visual Processing and Communication” trường Đại học Công nghệ hỗ trợ việc tìm hiểu phântíchmãhóa DVC Mặc dù cố gắng tích cực việc thực luận văn tránh sai sót định, mong nhận đóng góp Thầy cô bạn đồng nghiệp để hoàn chỉnh luận văn có hướng phát triển Tôi xin chân thành cảm ơn! 43 TÀI LIỆU THAM KHẢO [1] D Le Gall, “MPEG: a video compression standard for multimedia applications”, Communications of the ACM, Vol 34, No 4, pp 46-56, Apr 1991 [2] B G Haskell, A Puri, and A N Netravali, “Digital video: an introduction to MPEG-2”, Spingher US Publisher, 2002 [3] T Wiegand, G J Sullivan, G Bjontegaard, and A Luthra, "Overview of the H.264/AVC Video Coding Standard," IEEE Transactions on Circuits and Systems for Video Technology, vol 13, no 7, pp 560-576, Jul 2003 [4] G J Sullivan, J R Ohm, W J Han, and T Wiegand, “Overview of the High Efficiency Video Coding (HEVC) standard,” IEEE Transactions on Circuits and Systems for Video Technology, vol 22, no 12, pp 1649-1668, Dec 2012 [5] Iain E G Richardson, “H.264 And MPEG-4 Video Compression”, The Robert Gordon University, Aberdeen, UK [6] F MacWilliams and N Sloane, “The Theory of Error Correcting Codes” The Netherlands: Elsevier, Amsterdam, Netherlands, 1977 [7] D Slepian and J K Wolf, "Noiseless coding of correlated information sources," IEEE Transactions on Information Technology, vol 19, pp 471-480, Jul 1973 [8] A D Wyner and J Ziv, "The rate-distortion function for source coding with side information at the decoder," IEEE Transactions on Information Technology, vol 22, no 1, pp 1-10, Jan 1976 [9] B Girod, et al., "Distributed video coding," Procedding of the IEEE, vol 93, no 1, pp 71-83, Jan 2005 [10] R Puri and K Ramchandran, “PRISM: A new robust video coding architecture based on distributed compression principles,” in 40th Allerton Conf Communication, Control and Computing,, Allerton, IL, USA, 2002 [11] X Artiga, J Ascenso, M Dalai, S Klomp, D Kubasov, anh M Ouaret, “The DISCOVER codec: architecture, techniques and evalution” in Picture Coding Symposium, Lisbon, Portugal, December 2007 [12] L Nataro, C Brites, J Ascenso, F Pereira, “Side information extrapolation for low-delay pixel-domain distributed video coding”, 44 in International Workshop on Very Low Bitrate Video, Sardinia, Italy, September 2005 [13] J Ascenso, C Brites, and F Pereira, “Improving Frame Interpolation with Spatial Motion Smoothing for Pixel Domain Distributed Video Coding,” 5th EURASIP Conf on Speech, Image Processing, Multimedia Communications and Services, Jul 2005 [14] C.Brites, J Ascenso and F Pereira, “Studying temporal correlation noise modeling for pixel based Wyner-Ziv video coding” in IEEE International Conference on Image Processing, Atlanta GA, USA,Octorber 2006 [15] J Ascenso, C.Brites and F Pereira, “Content adaptive Wyner-Ziv video coding driven by motion activity” in IEEE International Conference on Image Processing, Atalanta, USA, October 2006 [16] D Kubasov et al., “Optimal reconstruction in Wyner-Ziv video coding with multiple side information,” IEEE Workshop on Multimedia Signal Processing, pp 183-186, Crete, Greece, Oct 2007 [17] R Puri, A Majumdar and K Ramchandran, "PRISM: A Video Coding Paradigm With Motion Estimation at the Decoder", IEEE Transactions on Image Processing, vol 16, no 10, pp 2436-2448, October 2007 [18] M Contente, “Low complexity video coding for sensor networks”, Master Thesis, IST-Lisbon University, Oct 2009 [19] http://iphome.hhi.de/suehring/tml/ [20] X HoangVan and B Jeon, “Flexible complexity control solution for transform domain Wyner-Ziv video”, IEEE Transactions on Broadcasting, Vol 58, No 2, pp 209-220, Jun 2012 45 ... vậy, nghiên cứu tập trung vào giới thiệu phân tích mô hình mã hóa video mới, tên gọi mã hóa video phân tán (Distributed Video Coding – DVC) chương 14 CHƯƠNG 2: CƠ SỞ KỸ THUẬT CỦA MÃ VIDEO PHÂN... nỗ lực đưa câu trả lời cho nhu cầu mã hóa video đáp ứng nhu cầu thực tiễn này, mô hình mã hóa video nghiên cứu, phát triền mô hình mã hóa video phân tán DVC (Distributed Video Coding) Mô hình... THUẬT MÃ HÓA VIDEO TRUYỀN THỐNG 1.1 Yêu cầu mã hóa video 1.2 Các kỹ thuật mã hóa video then chốt 1.2.1 Mã hóa sai khác ảnh thực tế ảnh dự đoán 1.2.2 Mã hóa miền