1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Nghiên cứu và phân tích bộ mã hóa video dùng cho mạng sensor

53 530 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 53
Dung lượng 2,25 MB

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ CHU TRẦN HÙNG NGHIÊN CỨU PHÂN TÍCH BỘ HÓA VIDEO DÙNG CHO MẠNG SENSOR Ngành : Công nghệ Kỹ thuật Điện tử, Truyền thông Chuyên ngành : Kỹ thuật Điện tử số : 60520203 LUẬN VĂN THẠC SĨ CÔNG NGHỆ KỸ THUẬT ĐIỆN TỬ TRUYỀN THÔNG NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS TRỊNH ANH VŨ TS HOÀNG VĂN XIÊM Hà Nội - 2016 LỜI CAM ĐOAN Tôi xin cam đoan số liệu kết nghiên cứu luận văn trung thực chưa sử dụng để bảo vệ học vị Mọi giúp đỡ luận văn cảm ơn thông tin trích dẫn luận văn rõ nguồn gốc rõ ràng phép công bố Hà Nôi, ngày … tháng … năm 2016 Người thực hiện: Chu Trần Hùng MỤC LỤC LỜI CAM ĐOAN MỤC LỤC CÁC THUẬT NGỮ VIẾT TẮT DANH MỤC BẢNG DANH MỤC SƠ ĐỒ, HÌNH VẼ LỜI NÓI ĐẦU CHƯƠNG 1: CƠ SỞ LÝ THUYẾT CỦA KỸ THUẬT HÓA VIDEO TRUYỀN THỐNG 1.1 Yêu cầu hóa video 1.2 Các kỹ thuật hóa video then chốt 1.2.1 hóa sai khác ảnh thực tế ảnh dự đoán 1.2.2 hóa miền biến đổi 1.2.3 Phép lượng tử tuyến tính 1.2.4 Các phép dự đoán ảnh 1.2.5 hóa Entropy 1.3 Các chuẩn hóa video phổ biến 1.3.1 Chuẩn H.264/AVC 1.3.2 Chuẩn H.265/HEVC 10 1.4.Nhược điểm kỹ thuật hóa video truyền thống 12 1.4.1 Độ phức tạp cao phía hóa 12 1.4.2 Khả chống chịu nhiễu thấp 13 CHƯƠNG 2: CƠ SỞ KỸ THUẬT CỦA VIDEO PHÂN TÁN 15 2.1 hóa dự đoán cổ điển 15 2.2 Định lý Slepian-Wolf 15 2.3 Định lý Winer-Ziv 17 2.4 Ví dụ minh họa 18 CHƯƠNG 3: CÁC MÔ HÌNH THỰC NGHIỆM CỦA KỸ THUẬT VIDEO PHÂN TÁN 20 3.1 Giải pháp STANFORD 20 3.1.1 Biến đổi lượng tử hóa 21 3.1.2 hóa kênh đệm 21 3.1.3 Tỉ lệ ước tính tối thiểu 21 3.1.4 Phần thông tin phụ khai thác 21 3.1.5 Mô hình kênh ảo tính toán đầu vào mềm 22 3.1.6 Giải Kênh Kiểm tra CRC 22 3.1.7 Sự khôi phục biến đổi ngược 22 3.2 Giải pháp PRISM 22 3.2.1 Quá trình huấn luyện 24 3.2.2 Quá trình hóa 26 3.2.3 Quá trình giải 32 CHƯƠNG 4: ĐÁNH GIÁ ƯU NHƯỢC ĐIỂM BỘ HÓA DVC 33 4.1 Điều kiện đánh giá 33 4.2 Đánh giá hiệu nén 35 4.3 Đánh giá độ phức tạp 38 KẾT LUẬN 42 TÀI LIỆU THAM KHẢO 44 CÁC THUẬT NGỮ VIẾT TẮT Từ viết tắt Nghĩa tiếng Anh Nghĩa tiếng Việt AMVP Advanced Motion Vector Bộ dự đoán vector chuyển động Predictor nâng cao AVC Advanced Video Coding hóa video tiên tiến BAC Binary Arithmetic Coding hóa số học nhị phân CABAC Content Adaptive Binary hóa số học nhị phân thích nghi Arithmetic Coding theo thuộc tính Content Adaptive Variable chiều dài thay đổi thích nghi Length Coding theo thuộc tính CPU Central Processing Unit Đơn vị xử lý trung tâm CTU Coding Tree Unit Đơn vị hóa CU Coding Unit Đơn vị hóa DCT Discrete Cosine Transform Biến đổi Cosine rời rạc DPCM Differential Pulse Code Điều xung vi sai CAVLC Modulation DPB Decoded Picture Buffer Bộ đệm hình ảnh giải DRAM Dynamic Random Access Bộ nhớ truy cập ngẫu nhiên động Memory DVC Distributed Video Coding hóa video phân tán GOP Group Of Picture Nhóm ảnh GMC Global Motion Compensation Bù chuyển động toàn phần HD High Definition Độ phân giải cao HEVC High Eficiency Video Coding hóa video hiệu suất cao HVS Human Visual System Hệ thống trực quan người IDCT Inverse Discrete Cosine Biến đổi cosin rời rạc ngược Transform IEC International Electrotechnical Ủy ban Kỹ thuật Điện Quốc tế Commission ISO International Organization for Standardization Tổ chức tiêu chuẩn hóa quốc tế ITU-T International Khu vực tiêu chuẩn hóa viễn thông Telecommunication Union thuộc Tổ chức viễn thông quốc tế Telecommunication Liên hợp quốc Standardization Sector JPEG Joint Photographic Experts Chuẩn nén ảnh ủy ban quốc tế Group MB Macroblock Khối lớn MC Motion Compensated Bù chuyển động MCP Motion Compensated Prediction Dự đoán bù chuyển động MPEG Moving Picture Experts Group Nhóm chuyên gia hình ảnh động MPS Most Probable Symbol Biểu tượng có khả xuất nhiều MVD Motion Vector Difference Sự khác biệt vector chuyển động MVP Motion Vector Predictor Bộ dự đoán vector chuyển động PPS Picture Parameter Set Tập hợp tham số hình ảnh PSNR Peak Signal to Noise Ratio Tỉ lệ tín hiệu đỉnh/ tạp âm PU Prediction Unit Đơn vị dự đoán QG Quantization Group Nhóm lượng tử hóa QP Quantization Parameter Tham số lượng tử hóa RDO Rate Distortion Optimization Tối ưu hóa tốc độ/ méo SAO Sample Adaptive Offset Bù thích nghi mẫu SD Standard Definition Định dạng tiêu chuẩn SPS Sequence Parameter Set Tập hợp tham số chuỗi SRAM Static Random Access Memory Bộ nhớ truy cập ngẫu nhiên tĩnh TU Transform Unit Đơn vị biến đổi UHD Ultra High Definition Định dạng cực cao VLC Variable Length Code có chiều dài thay đổi VLSI Very Large Scale Integration Tích hợp với quy mô rộng DANH MỤC BẢNG Bảng 1.1 Giá trị lượng tử xác suất tương ứng Bảng 1.2 Từ Huffman lượng bít cần hóa tương ứng Bảng 4.1 Bảng mô tả tóm tắt thông số sử dụng đánh giá 33 Bảng 4.2: Bảng lượng tử hóa DVC 34 Bảng 4.3: Giá trị lượng tử cho khung GOP=2, QCIF 15Hz 35 DANH MỤC SƠ ĐỒ, HÌNH VẼ Hình 1.1 Mô tả ví dụ video với độ phân giải 2K kích thước tương ứng loại video khác Hình 1.2: Minh họa sai khác khung liên tiếp dãy video Hình 1.3: Giá trị điểm ảnh miền pixel miền DCT tương ứng Hình 1.4 Mô hình phép lượng tử tuyến tính sử dụng hóa video Hình 1.5 Mô tả ảnh gốc, ảnh dự đoán ảnh dư thừa [20] Hình 1.6 Tạo ảnh dự đoán khung Hình 1.7 Tạo ảnh dự đoán liên khung Hình 1.8 Sử dụng thuật toán tạo từ Huffman Hình 1.9 Kiến trúc tổng quát chuẩn H.264/AVC [3] Hình 1.10 Kiến trúc tổng quát chuẩn H.254/HEVC [1] 10 Hình 1.11: Phạm vi dò tìm vecto dịch chuyển block chứa bánh xe 12 Hình 1.12:Ước lượng véc tơ dịch chuyển 13 Hình 2.1: Mô hình hóa dự đoán cổ điển 15 Hình 2.2: Sơ đồ nguồn phụ thuộc thống kê 16 Hình 2.3: Biểu đồ vùng tỉ lệ tốc độ nguồn X,Y 16 Hình 2.4: Mô tả định lí Slepian-Wolf với thông tin phụ 17 Hình 2.5: hóa mát thông tin với thông tin phụ phần giải 17 Hình 3.1 Cấu trúc khám phá thuật nén giải nén [15] 20 Hình 3.2: Sơ đồ hóa giải PRISM [9] 24 Hình 3.3: Quét zig- zag 26 Hình 3.4: Mô hình Syndrome [8] 29 Hình 3.5: Mặt phẳng bit syndrome [9] 30 Hình 3.6: Chương trình quét xoắn ốc 32 Hình 4.1 Mô tả khung hình chuỗi video 33 Hình 4.2: Biểu đồ so sánh hiệu nén - Foreman 36 Hình 4.3: Biểu đồ so sánh hiệu nén - Hall monitor 36 Hình 4.4: Biểu đồ so sánh hiệu nén - Coast guard 37 Hình 4.5: Biểu đồ so sánh hiệu nén – Soccer 37 Hình 4.6: Biểu đồ so sánh thời gian hóa - Foreman 39 Hình 4.7: Biểu đồ so sánh thời gian hóa - Hall monitor 39 Hình 4.8: Biểu đồ so sánh thời gian hóa - Coastguard 40 Hình 4.9: Biểu đồ so sánh thời gian hóa - Soccer 40 LỜI NÓI ĐẦU Ngày nay, công nghệ hóa video sử dụng phổ biến, từ ứng dụng truyền thống truyền hình quảng bá, truyền hình hội nghị đến ứng dụng xuất mạng cảm biến (sensor), mạng giám sát từ xa Các công nghệ dựa mô hình hóa video dự đoán, với chuẩn hóa phổ biến MPEG-2/Video, H264/AVC hay H.265/HEVC Mặc hiệu hóa cao, khai thác có hiệu thông tin tương quan khung hình phía phat, công nghệ hóa với mức độ yêu cầu cao độ phức tạp thuật toán phía phát, cần thiết bị đại, đắt tiền bên phát Mô hình hóa phù hợp với hệ thống truyền hình quảng bá, đài truyền hình với nguồn tài mạnh đầu tư thiết bị đắt tiền để phát sóng Ở phía người dùng, giải đơn giản giúp cho người dùng dễ dàng xem chương trình với đầu thu có giá thành rẻ Công nghệ ngày phát triển, mô hình mạng video khác triển khai đời sống, chẳng hạn mạng video giám sát giao thông, camera an ninh lắp đặt nhà hàng, bệnh viện… Những hệ thống có đòi hỏi hoàn toàn khác so với hệ thống truyền hình quảng bá yêu cầu phần phát đơn giản, gọn nhẹ, rẻ tiền phần phức tạp chuyển xử lý trung tâm phía thu, nơi đầu tư thiết bị tập trung đại Do chuẩn hóa video truyền thống không phù hợp Yêu cầu đặt phát triển mô hình hóa để đơn giản phần hóa không làm tổn thất đáng kể hiệu suất nén so với mô hình truyền thống Trong nỗ lực đưa câu trả lời cho nhu cầu hóa video đáp ứng nhu cầu thực tiễn này, mô hình hóa video nghiên cứu, phát triền mô hình hóa video phân tán DVC (Distributed Video Coding) Mô hình dựa kết định lý thuyết thông tin định lý Slepian- Wolf Wyner- Zip Theo hướng nghiên cứu luận văn tập trung trình bày mô hình video phân tán DVC; bên cạnh đó, luận án đưa mô hình hóa truyền thống để phân tích Từ luận vắn đưa so sánh đánh giá ưu, nhược điểm mô hình hướng phát triển cho mô hình CHƯƠNG 1: CƠ SỞ LÝ THUYẾT CỦA KỸ THUẬT HÓA VIDEO TRUYỀN THỐNG Ra đời từ cách bốn mươi năm, hóa video đóng vai trò vô quan trọng phát triển trưởng thành truyền thông số, truyền hình Internet Chương tập trung vào điểm lại số kỹ thuật then chốt sử dụng chuẩn hóa video truyền thống 1.1 Yêu cầu hóa video Một tín hiệu video số thường chứa lượng lớn liệu; gặp nhiều khó khăn việc lưu trữ truyền kênh truyền có băng thông hạn chế Ngoài ra, với phát triển khoa học kỹ thuật, ngày sản xuất cảm biến màu có độ phân giải lên đến hàng chục triệu pixel thực tế ứng dụng độ phân giải 1920×1080 pixel, lớn chuẩn 2K, 4K Khi việc biểu diễn thông tin video tốn nhiều liệu (a) Video với độ phần giải 2K (b) Kích thước tương ứng số loại video Hình 1.1 Mô tả ví dụ video với độ phân giải 2K kích thước tương ứng loại video khác Do để tiết kiệm không gian lưu trữ băng thông kênh truyền cần phải hóa (nén) tín hiệu video Quá trình nén ảnh thực thông tin ảnh có tổ chức, có trật tự, xem xét kỹ tính trật tự, cấu trúc ảnh phát loại bỏ lượng thông tin dư thừa, giữ lại thông tin quan trọng nhằm giảm số lượng bit lưu trữ truyền đảm bảo thông tin hiển thị ảnh Tại đầu thu, giải tổ chức, xếp lại ảnh xấp xỉ gần xác so với ảnh gốc đảm bảo thông tin cần thiết nhiệm biểu diễn coset Depth xác định số bít coset, path lưu trữ bít nhận diện coset Trong thực hành Depth Clsize Path kết bước trước  entropy: nhằm có ưu điểm thống kê chữ nhánh bước trước Mỗi từ (Last, Run, Depth, Level) dùng độ dài thay đổi 3.2.2.6 hóa mặt phẳng bít bổ sung syndrome Mô dul nhằm nén truyền mặt phẳng bít cosey bổ sung Giá trị tạp âm tương quan ước lượng hóa không thật xác so với thực tế Đối với đa số block, giá trị tạp âm tương quan ước lượng lớn giá trị thật nên giải điều chế thành công Tuy nhiên có tỷ lệ nhỏ block, giá trị ước lượng nhỏ giá trị thật, nên khoản cách từ coset không đủ nên chọn nhầm ứng cử viên bên giải số hệ số giải sai dẫn đến CRC truyền để phát không thành công Đây giá phải trả cho việc ước lượng tạp âm tương quan Để giảm điều kích thướng số coset phải tăng thêm lượng để số phần trăm giải không xác chấp nhận Tuy nhiên lại không đạt độ nén mong muốn Do nguyên nhân chiến lược lai ghép triển khai: Thay cho việc truyền thêm bít cho coset, bít bổ sung truyền phối hợp với giải để dùng tổng kiểm tra ngắn Các từ thành tổng kiểm tra goi từ mặt phẳng bít số bổ sung Bên phía giải mã, tổng kiểm tra có khả hiệu chỉnh lượng giới hạn số coset bị lựa chọn sai khoảng cách từ không đủ coset Khi giải syndrome kết thúc, giải mặt phẳng bít bổ sung truy cập từ lượng tử giải cho phép tạo lại từ mặt phẳng bít số bổ sung Đây phiên lỗi từ mặt phẳng bít bên hóa, từ tổng kiểm tra hiệu chỉnh Sau hiệu chỉnh số coset, giải dùng số tăng thêm tiến hành giải lại với ứng cử viên trước Trong codec IST-PRISM, bít thêm (bít xám hình 3.5) phối hợp dùng BCH Phân hệ thống BCH chưa bít bổ sung bị loại, có tổng kiểm tra truyền đến giải BCH lựa chọn chúng đơn giản thích hợp với khối nhỏ 3.2.2.7 CRC CRC thiết kế để chọn từ ứng cử viên, có nhiều ứng viên cửa sổ dò tìm bên phái giải Trong PRISM lựa chọn CRC-16 có đa thức tạo là: x16 + x12 + x5 + Cuối hóa việc tạo dòng bít có cấu trúc sau: 31 3.2.3 Quá trình giải 3.2.3.1 Giải syndrome Mục tiêu tìm từ coset nhận Trước tiên xác định coset, sau hiệu chỉnh coset dùng tổng kiểm tra BCH từ mặt phẳng bít số bổ sung Do có nhiều ứng cử viên coset có tương quan với từ cần tìm nên cần dò tìm thử để tìm từ Phép thử thành công kết hợp với kiểm ta CRC Chi tiết khối giải sau: Modul có chức chọn từ coset sử dụng thông tin lề Thông tin lề dùng block DCT lượng tử quét zig-zag i) Giải entropy ii) Giải số coset iii) Tạo lại ký hiệu iv) Giải mặt phẳng bít bổ sung syndrome 3.2.3.2 Dò chuyển động Module tạo ứng cử kết hợp với syndrome nhận để giải DVC thích hợp cho dãy có nội dung chuyển động giới hạn video surveillance and videotelephony Với dãy có nội dung chuyển động thấp block bù chuyển động nằm gần block giải có nhiều tương quan với Đó nguyên nhân tác giả dùng cách quét theo đường xoắn ốc để tìm ứng cử Hình 3.6: Chương trình quét xoắn ốc 32 CHƯƠNG 4: ĐÁNH GIÁ ƯU NHƯỢC ĐIỂM BỘ HÓA DVC 4.1 Điều kiện đánh giá Chương đưa kịch so sánh đánh giá DVC truyền thống, tập trung vào đánh giá hiệu nén độ phức tạp cho chuỗi video với đặc tính nội dung khác Hình 4.1 hiển thị khung hình chuỗi video Foreman Hall monitor Coastguard Soccer Hình 4.1 Mô tả khung hình chuỗi video Do thành phần màu (Chroma) không ảnh hưởng đáng kể tới hiệu nén hóa nên thực nghiệm, thành phần độ chói (Luma) sử dụng để hóa đánh giá so sánh Các thông số khác chuỗi video mô tả tóm tắt bảng 4.1 Bảng 4.1 Bảng mô tả tóm tắt thông số sử dụng đánh giá Tên chuỗi video Foreman Hall Monitor Coastguard Soccer Số khung hình 299 329 299 299 Kích cỡ QCIF (176 × 144) Tốc độ khung hình 15 Hz Kích cỡ nhóm ảnh (Key – WZ – Key) Tham số lượng tử QM1, QM3, QM5, QM7 33  Bảng lượng tử sử dụng cho hóa DVC Bảng 4.2: Bảng lượng tử hóa DVC QM1 16 8  0  0 0 0  0 0  0 0 QM3 32 8  4  0 0 0  0 0  0 0 QM5 QM7 32 16  16 4     4 0    4 0 64 32 16  32 16    16 4     4 0  Các hóa tham chiếu: o H.264/Intra: Đây hóa phổ biến, cấu hình từ chuẩn H.264/AVC tải tử [19]; đó, tất khung hình sử dụng phương pháp hóa dự đoán khung Do vậy, phương pháp hóa đòi hỏi thời gian hóa thấp, phù hợp với ứng dụng mạng sensor,… Cần lưu ý rằng, H.264/Intra đối tượng so sánh hóa video phân tán DVC o H.264/No ME: Đây hóa video phổ biến, cấu hình từ chuẩn H.264/AVC tài tử [19] Tuy nhiên, không phương pháp dự đoán khung liên khung với giả thiết vector dự đoán không sử dụng Trong hóa này, phương pháp ước lượng vector chuyển động không sử dụng Do vậy, yêu cầu thời gian hóa thấp Tuy nhiên, có khai thác tính tương quan khung phía hóa, hóa nhạy cảm với nhiễu liên khung o DVC-UET: Đây hóa trình bày phân tích luận văn Bộ hóa xây dựng Visual Processing and Communications Group, VNU-UET [20] dựa mô hình nhóm nghiên cứu đại học Stanford Trong đó, khung hình (key frames) hóa với H.264/AVC Intra hóa H.264/AVC Intra mang lại hiệu nén cao đồng thời yêu cầu độ phức tạp thấp không khai thác ước lượng chuyển động phía phát Các giá trị lượng tử cho khung lựa chọn với mục tiêu có chất lượng video giải gần liên tục cho toàn khung hình mô tả bảng 4.3 34 Bảng 4.3: Giá trị lượng tử cho khung GOP=2, QCIF 15Hz Sequences QM1 QM3 QM5 QM7 Foreman 40 38 34 29 Hall Monitor 37 36 33 29 Coastguard 38 37 30 30 Soccer 44 41 36 31 4.2 Đánh giá hiệu nén Hiệu nén yêu cầu quan trọng phương pháp hóa video; phương pháp đánh giá tốt hiệu nén cao so với phương pháp trước Trong việc đánh giá hiệu nén hóa video, mối tương quan chất lượng hình ảnh sau giải mã, đo giá trị đỉnh tín hiệu tạp âm (Peak Signal to Noise Ration – PSNR) lượng bít cần sử dụng để hóa (bitrate – bit per second – bps) Trong đó, PSNR xác định sau: PSNR  10 log10 2552 MSE MSE: Mean Squared Error giá trị trung bình bình phương lỗi (sự khác biệt) tín hiệu trước sau giải Trên sở đó, việc đánh giá hiệu nén so sánh với chuẩn H.264/AVC xác định cho trường hợp lượng tử khác mô tả bảng 4.2 4.3 Hình 4.2 đến 4.5 thể biểu đồ so sánh hiệu nén cho chuỗi video đánh giá 35 Hình 4.2: Biểu đồ so sánh hiệu nén - Foreman Hình 4.3: Biểu đồ so sánh hiệu nén - Hall monitor 36 Hình 4.4: Biểu đồ so sánh hiệu nén - Coast guard Hình 4.5: Biểu đồ so sánh hiệu nén – Soccer 37 Trên sở kết thu mô tả hình 4.2 – 4.5, số kết luận rút sau;  So sánh với H.264/Intra - Trong hầu hết trường hợp so sánh mô hình hóa DVC có hiệu suất nén cao so với mô hình hóa H264/Intra - Ở trường hợp Coastguard, Hall Monitor Foreman vật thể chuyển động với tốc độ không cao nên sử dụng DVC đạt hiệu cao Chỉ trường hợp Soccer vật thể chuyển động với tốc độ cao mô hình truyền thống lại đạt hiệu nén tốt Điều việc ước lượng chuyển động phía hóa chuẩn nén video truyền thống  So sánh với H.264/ No ME Trong trường hợp so sánh mô hình hóa DVC có hiệu suất nén đạt xấp xỉ so với mô hình H.264/ No ME Trong trường hợp chuỗi Coastguard chí đạt hiệu suất nén cao nhiên mục tiêu so sánh luận văn 4.3 Đánh giá độ phức tạp Độ phức tạp việc hóa, với hiệu nén khả chống chịu lỗi ba yêu cầu chuẩn nén video hiệu Do vậy, nghiên cứu trọn vẹn không đánh giá độ phức tạp phương pháp hóa video phân tán DVC, so sánh với chuẩn H.264/AVC Có nhiều cách đánh giá độ phức tạp chuẩn hóa, xác định số lượng phép tính thuật toán hay cách phổ biến đơn giản đo thời gian hóa phương pháp hóa điều kiện kiểm thử chuẩn Về số lượng phép tính thấy từ chương dò tìm vecto dịch chuyển trung bình tốn nhiều phép tính (trong ví dụ đưa 8,55 x 109 phép tính giây ) DVC phép dò tìm vecto dịch chuyển bên hóa, số phép tính chủ yếu cho khung reference theo hóa intra tạo thông tin phụ Trong nghiên cứu này, phương pháp thứ hai, đo lường thời gian hóa phương pháp hóa DVC-UET, H.264/Intra H.264/No ME sử dụng máy tính với cấu hình bao gồm chíp dual core Pentium D 3.4 GHz, 2GB RAM, ngôn ngữ lập trình C++ Microsoft Visual Studio sử dụng Hình 4.6 đến 4.9 mô tả so sánh thời gian hóa chuẩn H.264/AVC phương pháp DVC 38 Hình 4.6: Biểu đồ so sánh thời gian hóa - Foreman Hình 4.7: Biểu đồ so sánh thời gian hóa - Hall monitor 39 Hình 4.8: Biểu đồ so sánh thời gian hóa - Coastguard Hình 4.9: Biểu đồ so sánh thời gian hóa - Soccer 40 Nhận xét: - Các biểu đồ so sánh thời gian hóa cho thấy mô hình hóa DVC có thời gian hóa thấp hẳn so với mô hình lại tất trường hợp nên khẳng định mô hình hóa DVC có độ phức tạp thấp phần hóa,phù hợp với nhu cầu phát triển mạng video giám sát Điều so với hóa H.264/Intra, hóa DVC-UET không sử dụng cách tạo dự đoán nề (với mode dự đoán) tối ưu hệ thống (Rate-Distortion Optimization RDO) phức tạp phía phát 41 KẾT LUẬN Trước nhu cầu ngày cao hóa video có hiệu nén tốt đòi hỏi thời gian hóa thấp; đặc biệt ứng dụng mạng sensor, luận văn tập trung vào việc giới thiệu, phân tích so sánh phương pháp hóa video phân tán – DVC hóa video phân tán DVC hướng nghiên cứu quan tâm đặc điểm hiệu hóa cao, độ phức tạp hóa thấp khả chống chịu nhiễu hiệu Luận văn chia làm năm chương Chương giới thiệu kỹ thuật sử dụng hóa video dự đoán truyền thống Chương tóm tắt qua phần sở lý thuyết hóa video phân tán, cụ thể hai định lý Slepian-Wolf Wyner-Ziv Tiếp theo, chương trình bày phân tích hai hướng xây dựng hóa video phân tán thực tế, đề xuất hai nhóm nghiên cứu trường đại học Stanford đại học Berkeley Chương trình bày kết so sánh hiệu nén độ phức tạp hóa mô hình hóa video phân tán DVC Như trình bày chương chương 3, kỹ thuật hóa video phân tán có khả mang lại hiệu nén cao để thích ứng với kênh truyền vô tuyến hạn hẹp, nhiên có điểm khác biệt so với kỹ thuật hóa truyền thống (trình bày chương 1) độ phức tạp mặt thuật toán Cụ thể, hóa video truyền thống nặng phần hóa kỹ thuật DVC phần hóa lại nhẹ Do vậy, hóa video phân tán phù hợp với nhu cầu phát triển mạng giám sát Như trình bày chương 4, khác biệt hóa hóa truyền thống thực việc dò tìm xác vecto dịch chuyển khung reference khung inter, DVC dựa ước lượng tạp âm tương quan Ở phương pháp DVC (tiêu biểu PRISM DISCOVER), phức tạp dịch chuyển phía giải việc dò tìm từ hệ số DCT tập phân hoạch Thực so sánh chất lượng (theo PSNR) độ phức tạp (theo thời gian) cho thấy: DVC có kết đánh giá chất lượng tốt chuỗi video hình ảnh với vật thể chuyển động chậm Về thời gian hóa trường hợp DVC tốt hẳn so với mô hình truyền thống Nhận thấy tiềm lớn hương nghiên cứu này, tương lại hệ thống DVC toàn diện, tương thích ngược với chuẩn H.265/HEVC hướng nghiên cứu tiềm 42 LỜI CẢM ƠN Được phân công Khoa Điện tử viễn thông, trường Đại học Công nghệ, hướng dẫn PGS.TS Trịnh Anh Vũ TS Hoàng Văn Xiêm thực luận văn: “ Nghiên cứu phân tích hóa video dùng cho mạng sensor ’’ Để hoàn thành luận văn xin cảm ơn Thầy cô Khoa Điện tử viễn thông, trường Đại học Công nghệ nhiệt tình dạy dỗ, cung cấp phương pháp, kiến thức suốt thời gian học tập Tôi xin chân thành cảm ơn tới hai thầy giáo PGS.TS Trịnh Anh Vũ TS Hoàng Văn Xiêm tận tình hướng dẫn bảo nhiều kiến thức phương pháp làm việc trình thực hoàn thành đồ án Tôi xin gửi lời cảm ơn tới nhóm nghiên cứu “Visual Processing and Communication” trường Đại học Công nghệ hỗ trợ việc tìm hiểu phân tích hóa DVC Mặc dù cố gắng tích cực việc thực luận văn tránh sai sót định, mong nhận đóng góp Thầy cô bạn đồng nghiệp để hoàn chỉnh luận văn có hướng phát triển Tôi xin chân thành cảm ơn! 43 TÀI LIỆU THAM KHẢO [1] D Le Gall, “MPEG: a video compression standard for multimedia applications”, Communications of the ACM, Vol 34, No 4, pp 46-56, Apr 1991 [2] B G Haskell, A Puri, and A N Netravali, “Digital video: an introduction to MPEG-2”, Spingher US Publisher, 2002 [3] T Wiegand, G J Sullivan, G Bjontegaard, and A Luthra, "Overview of the H.264/AVC Video Coding Standard," IEEE Transactions on Circuits and Systems for Video Technology, vol 13, no 7, pp 560-576, Jul 2003 [4] G J Sullivan, J R Ohm, W J Han, and T Wiegand, “Overview of the High Efficiency Video Coding (HEVC) standard,” IEEE Transactions on Circuits and Systems for Video Technology, vol 22, no 12, pp 1649-1668, Dec 2012 [5] Iain E G Richardson, “H.264 And MPEG-4 Video Compression”, The Robert Gordon University, Aberdeen, UK [6] F MacWilliams and N Sloane, “The Theory of Error Correcting Codes” The Netherlands: Elsevier, Amsterdam, Netherlands, 1977 [7] D Slepian and J K Wolf, "Noiseless coding of correlated information sources," IEEE Transactions on Information Technology, vol 19, pp 471-480, Jul 1973 [8] A D Wyner and J Ziv, "The rate-distortion function for source coding with side information at the decoder," IEEE Transactions on Information Technology, vol 22, no 1, pp 1-10, Jan 1976 [9] B Girod, et al., "Distributed video coding," Procedding of the IEEE, vol 93, no 1, pp 71-83, Jan 2005 [10] R Puri and K Ramchandran, “PRISM: A new robust video coding architecture based on distributed compression principles,” in 40th Allerton Conf Communication, Control and Computing,, Allerton, IL, USA, 2002 [11] X Artiga, J Ascenso, M Dalai, S Klomp, D Kubasov, anh M Ouaret, “The DISCOVER codec: architecture, techniques and evalution” in Picture Coding Symposium, Lisbon, Portugal, December 2007 [12] L Nataro, C Brites, J Ascenso, F Pereira, “Side information extrapolation for low-delay pixel-domain distributed video coding”, 44 in International Workshop on Very Low Bitrate Video, Sardinia, Italy, September 2005 [13] J Ascenso, C Brites, and F Pereira, “Improving Frame Interpolation with Spatial Motion Smoothing for Pixel Domain Distributed Video Coding,” 5th EURASIP Conf on Speech, Image Processing, Multimedia Communications and Services, Jul 2005 [14] C.Brites, J Ascenso and F Pereira, “Studying temporal correlation noise modeling for pixel based Wyner-Ziv video coding” in IEEE International Conference on Image Processing, Atlanta GA, USA,Octorber 2006 [15] J Ascenso, C.Brites and F Pereira, “Content adaptive Wyner-Ziv video coding driven by motion activity” in IEEE International Conference on Image Processing, Atalanta, USA, October 2006 [16] D Kubasov et al., “Optimal reconstruction in Wyner-Ziv video coding with multiple side information,” IEEE Workshop on Multimedia Signal Processing, pp 183-186, Crete, Greece, Oct 2007 [17] R Puri, A Majumdar and K Ramchandran, "PRISM: A Video Coding Paradigm With Motion Estimation at the Decoder", IEEE Transactions on Image Processing, vol 16, no 10, pp 2436-2448, October 2007 [18] M Contente, “Low complexity video coding for sensor networks”, Master Thesis, IST-Lisbon University, Oct 2009 [19] http://iphome.hhi.de/suehring/tml/ [20] X HoangVan and B Jeon, “Flexible complexity control solution for transform domain Wyner-Ziv video”, IEEE Transactions on Broadcasting, Vol 58, No 2, pp 209-220, Jun 2012 45 ... vậy, nghiên cứu tập trung vào giới thiệu phân tích mô hình mã hóa video mới, tên gọi mã hóa video phân tán (Distributed Video Coding – DVC) chương 14 CHƯƠNG 2: CƠ SỞ KỸ THUẬT CỦA MÃ VIDEO PHÂN... nỗ lực đưa câu trả lời cho nhu cầu mã hóa video đáp ứng nhu cầu thực tiễn này, mô hình mã hóa video nghiên cứu, phát triền mô hình mã hóa video phân tán DVC (Distributed Video Coding) Mô hình... THUẬT MÃ HÓA VIDEO TRUYỀN THỐNG 1.1 Yêu cầu mã hóa video 1.2 Các kỹ thuật mã hóa video then chốt 1.2.1 Mã hóa sai khác ảnh thực tế ảnh dự đoán 1.2.2 Mã hóa miền

Ngày đăng: 03/03/2017, 09:44

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w