Bài viết này đề xuất phương pháp mô hình hóa nhiễu tương quan mới thay đổi thích ứng cho các hệ số DC dựa vào đặc tính của chuỗi. Các kết quả thực nghiệm cho thấy hiệu năng của phương pháp đề xuất đã được cải thiện hơn so với mô hình Laplacian trước đây.
ộng để tạo thông tin phụ trợ cần phải thực phía mã hóa Mặt khác, hiệu méo – tốc độ (RD) bị giảm tận dụng thơng tin giải mã Để khắc phục nhược điểm này, mơ hình hóa nhiễu tương quan bất đối xứng đề xuất [21] mã hóa sử dụng giải pháp tạo thông tin phụ trợ độ phức tạp thấp giải mã sử dụng giải pháp tạo thông tin phụ trợ độ phức tạp cao Tuy nhiên, cách tiếp cận dẫn đến kết khác mã hóa giải mã Vì cần phải thực số kỹ thuật phụ thêm để loại bỏ ước lượng sai mơ hình tương quan Với phân tích trên, thấy có nhiều cách tiếp cận mơ hình nhiễu tương quan Bài báo tập trung vào điều chỉnh mơ hình Laplacian hay Gaussian tùy thuộc vào nội dung chuỗi video Mơ hình nhiễu tương quan thực giải mã - giải pháp thực tế cho kiến trúc mã hóa video phân tán B Mơ hình nhiễu tương quan đề xuất Khi thử với nhiều khung hình chuỗi video khác nhau, kết cho thấy phân bố Laplacian khơng hồn tồn phù hợp Cụ thể là, với hệ số AC nhiễu tương quan tuân theo phân bố Laplace xác với hệ số DC, chuỗi chuyển động phức tạp nhiễu tuân theo phân bố Laplace chuỗi chuyển động chậm lại phù hợp với phân bố Gaussian Vì vậy, để cải thiện tính xác mơ hình nhiễu tương quan trực tuyến, đề tài đề xuất thuật tốn xây dựng mơ hình nhiễu tương quan thích ứng cho hệ thống mã hóa video miền biến đổi Thuật tốn đề xuất sử dụng hai loại phân bố Laplacian Gaussian cho hệ số DC tùy thuộc vào nội dung chuỗi video Bước 1: Trước tiên tính khung hình dư thừa khung hình WZ khung hình SI tương ứng cách xấp xỉ hiệu phiên bù chuyển động khung hình trước sau sử dụng cơng thức đây: Frame Hình PSNR chuỗi Aikyo B Phân tích kết Để đánh giá kết thuật toán, tham số PSNR (tỷ số tín hiệu/nhiễu đỉnh trung bình) khung hình WZ giải mã sử dụng áp dụng hai phương pháp: mơ hình Laplacian túy mơ hình nhiễu tương quan thích ứng TẠP CHÍ KHOA HỌC CƠNG NGHỆ THƠNG TIN VÀ TRUYỀN THÔNG Nguyễn Thị Hương Thảo, Vũ Văn San Bảng II PSNR CỦA CÁC KHUNG HÌNH WZ GIẢI MÃ (dB) Chuỗi video Mơ hình Laplacian Mơ hình đề xuất Aikyo 28.0 27.8 Foreman 28.8 29.5 Carphone 29.2 29.4 Kết chuỗi trình bày Bảng II Bảng II mô tả so sánh PSNR trung bình khung hình WZ giải mã hai trường hợp: sử dụng mơ hình Laplacian để mơ hình hóa nhiễu tương quan sử dụng mơ hình lai ghép đề xuất Minh họa hình ảnh chuỗi Aikyo trình bày Hình Các kết cho thấy phương pháp đề xuất cho mức độ cải thiện trung bình lên tới 0.7 dB cho chuỗi Foreman 0.2 dB cho chuỗi Carphone nhiên lại giảm 0.2 dB chuỗi Aikyo Điều cho thấy kết đạt tốt với chuỗi có nhiều chuyển động lại chưa hiệu chuỗi chuyển động V KẾT LUẬN Bài báo giới thiệu mơ hình nhiễu tương quan cho mã hóa video Wyner-Ziv miền biến đổi Bằng cách sử dụng thông tin phụ gửi từ mã hóa, thuộc tính thống kê nhiễu tương quan đặc tính chuyển động chuỗi video, thuật tốn đề xuất xây dựng dựa phân bố Laplacian Gaussian Các kết thực nghiệm so sánh phương pháp đề xuất với phương pháp sử dụng phân bố Laplacian thơng thường cho thấy phương pháp đề xuất cải thiện đáng kể chất lượng khung hình giải mã với độ phức tạp tăng lên không đáng kể Trong nghiên cứu tập trung áp dụng kỹ thuật trí tuệ nhân tạo vào xây dựng mơ hình nhiễu tương quan cho kiến trúc DVC nhằm cải thiện hiệu tổng thể hệ thống TÀI LIỆU THAM KHẢO [1] D Slepian and J Wolf, Noiseless Coding of Correlated Information Sources, IEEE Transactions on Information Theory, vol 19, no 4, pp.471-480, July 1973 [2] A Wyner and J Ziv, The Rate-Distortion Function for Source Coding with Side Information at the Decoder, IEEE Transactions on Information Theory, vol 22, no 1, pp.1-10, January 1976 [3] X Artigas, J Ascenso, M Dalai, S Klomp, D Kubasov, and M Ouaret, “The DISCOVER codec: Architecture, techniques and evaluation” in Proc Picture Coding Symp., Lisbon, Portugal, Oct 2007, pp 1–5 [4] R Puri and K Ramchandran, PRISM: A new robust video coding architecture based on distributed compression principles, 40th Allerton Conf Communication, Control and Computing,, Allerton, IL, USA, 2002 SỐ (CS.01) 2018 [5] 18 Catarina Brites, Fernando Pereira, Correlation noise modeling for efficient pixel and transform domain Wyner-Ziv video coding, IEEE Transactions on Circuits and Systems for Video Technology, Volume: 18, Issue: 9, Sept 2008 [6] B Girod, A Aaron, S Rane, and D Rebollo-Monedero, “Distributed Video Coding,” Proceedings of the IEEE, vol 93, no 1, pp 71-83, January 2005 [7] Catarina Brites, Joao Ascenso, Fernando Pereira, Studying temporal correlation noise modeling for pixel based Wyner-Ziv video coding, Image Processing, 2006 IEEE International Conference on, ICIP 2006 [8] Catarina Brites, Fernando Pereira, Correlation noise modeling for multiview transform domain Wyner-Ziv video coding, Image Processing (ICIP), 2014 IEEE International Conference on [9] Xiem Hoang Van, Joao Ascenso, Fernando Pereira, Adaptive scalable video coding: a HEVC based framework combining the predictive and distributed paradigms, IEEE Transactions on Circuits and Systems for Video Technology, Volume: 27, Issue: 8, Aug 2017 [10] Jürgen Slowack, Jozef Škorupa, Stefaan Mys, Nikos Deligiannis, Peter Lambert, Adrian Munteanu, and Rik Van de Walle (2011) Correlation Noise Estimation in Distributed Video Coding Effective Video Coding for Multimedia Applications, pp 133‐ 156, Intech Publishing, 2011, ISBN 978‐ 953‐ 307‐ 177‐ [11] S Minali and G Calvagno, “A distributed video coder based on the H.264/AVC standard,” in EUSIPCO, Poznan, Poland, Sep 2007 [12] Minali, J Wang, and K Ramchandran, “Achieving H.264-like compression efficiency with distributed video coding,” in SPIE VCIP, San Jose, CA, USA, Jan 2007 [13] J L Martínez, G Fernández-Escribano, H Kalva, W A R J Weerakkody, W A C Fernando, and A Garrido, “Feedback free DVC architecture using machine learning,” in Proc IEEE ICIP, Oct 2008, pp 1140–1143 [14] T Sheng, X Zhu, G Hua, H Guo, J Zhou, and C W Chen, “Feedback free rate-allocation scheme for transform domain Wyner–Ziv video coding,” Multimedia Syst., vol 16, no 2, pp 127–137, 2010 [15] X Huang and S Forchhammer, “Cross-band noise model refinement for transform domain Wyner-Ziv video coding,” Signal Process., Image Commun., vol 27, no 1, pp 16–30, 2012 [16] Hao Qin, Bin Song, Yue Zhao, and Haihua Liu, Adaptive Correlation Noise Model for DC Coefficients in Wyner-Ziv Video Coding, ETRI Journal, Volume 34, Number 2, April 2012 [17] Hu Xiaofei, Zhu Xiuchang, “A Wyner-Ziv video coding method utilizing mixture correlation noise model”, Journal of electronics (China), Vol.29, No.3/4, pp 197-203, July 2012 [18] Huynh Van Luong, Lars Lau Raket, Xin Huang, and Soren Forchhammer, Side information and noise learning for distributed video coding using optical flow and clustering, IEEE Transactions on Image Processing ( Volume: 21, Issue: 12, Dec 2012 ) [19] Huynh Van Luong, Lars Lau Raket, Xin Huang, and Soren Forchhammer, Re-estimation of motion and reconstruction for distributed video coding, IEEE Transactions on Image Processing ( Volume: 23, Issue 7, July 2014 ) [20] Xiem Hoang Van, Joao Ascenso, Fernando Pereira, Adaptive scalable video coding: a HEVC based framework combining the predictive and distributed paradigms, IEEE Transactions on TẠP CHÍ KHOA HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG MÔ HÌNH NHIỄU TƯƠNG QUAN CHO HỆ THỐNG MÃ HĨA VIDEO PHÂN TÁN Circuits and Systems for Video Technology, Volume: 27, Issue: 8, Aug 2017 [21] X HoangVan et al., “HEVC backward compatible scalability: A low encoding complexity distributed video coding based approach,” Signal Process.: Image Commun., vol 33, no 4, pp 51-70, Apr 2015 Abstract: Distributed video coding is a new paradigm which is suitable for uplink applications such as wireless sensor networks, video surveillance systems Previous research results have shown that despite of independent encoding and joint decoding, distributed video coding can achieve equivalent performance to predictive video coding However, the Rate - Distortion(RD) performance of these distributed video encoding systems depends greatly on correlation noise modeling between the original information and corresponding side information at the decoder In previous works, most use Laplacian distribution to model correlation noise and don‟t take into account statistical property of the transform domain correlation noise and the motion characteristic of the frame This paper proposes a new method in which models for the DC coefficients are adaptively adjusted depending on the motion characteristics of sequence The experimental results show that the performance of the proposed method has been improved compared to the previous Laplacian model Keyword: DVC, Wyner-Ziv Coding, correlation noise model Nguyễn Thị Hƣơng Thảo, Nhận tốt nghiệp đại học thạc sỹ Học viện Cơng nghệ Bưu Viễn thông vào năm 2003 2010 Hiện giảng dạy làm Nghiên cứu sinh Khoa Kỹ thuật Điện tử - Học viện Cơng nghệ Bưu Viễn thơng Lĩnh vực nghiên cứu: Xử lý tín hiệu Video, Xử lý Ảnh, Lý thuyết thông tin Vũ Văn San, Nhận học vị Tiến sỹ năm 2000 Viện Điện tử Viễn thông, Hàn quốc Hiện TS Vũ Văn San cơng tác Học viện Cơng nghệ Bưu Viễn thông Lĩnh vực nghiên cứu: Truyền dẫn xử lý tín hiệu số SỐ (CS.01) 2018 TẠP CHÍ KHOA HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ... thiệu mơ hình nhiễu tương quan cho mã hóa video Wyner-Ziv miền biến đổi Bằng cách sử dụng thông tin phụ gửi từ mã hóa, thuộc tính thống kê nhiễu tương quan đặc tính chuyển động chuỗi video, thuật... Transactions on TẠP CHÍ KHOA HỌC CƠNG NGHỆ THƠNG TIN VÀ TRUYỀN THƠNG MƠ HÌNH NHIỄU TƯƠNG QUAN CHO HỆ THỐNG MÃ HÓA VIDEO PHÂN TÁN Circuits and Systems for Video Technology, Volume: 27, Issue: 8,... bình khung hình WZ giải mã hai trường hợp: sử dụng mơ hình Laplacian để mơ hình hóa nhiễu tương quan sử dụng mơ hình lai ghép đề xuất Minh họa hình ảnh chuỗi Aikyo trình bày Hình Các kết cho thấy