Phương pháp tạo thông tin phụ trợ dựa trên kỹ thuật học máy cho mã hóa video Wyner-Ziv

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	7
Dung lượng	2,38 MB

Nội dung

Bài viết đề xuất một kỹ thuật tạo thông tin phụ trợ cải tiến cho mã hóa video WZ bằng cách kết hợp hai ứng viên thông tin phụ trợ để tạo ra thông tin phụ trợ có chất lượng tốt trong quá trình giải mã. Các kết quả mô phỏng cho thấy các cải tiến đáng kể của chất lượng thông tin phụ trợ, và do đó là hiệu năng nén của bộ mã hóa video phân tán trong các điều kiện khác nhau như sự thay đổi của nội dung chuỗi video, kích thước video. Keywords- Video WZ, t

Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) Phương pháp tạo thông tin phụ trợ dựa kỹ thuật học máy cho mã hóa video Wyner-Ziv Nguyễn Thị Hương Thảo & Vũ Hữu Tiến Học Viện Cơng Nghệ Bưu Chính Viễn Thông Email: { thaonth, tienvh}@ptit.edu.vn xét mức độ méo tín hiệu khơng có tổn thất hiệu suất nén so với trường hợp mã hóa kết hợp Dựa định lý này, số sơ đồ mã hóa video WZ thực tế đề xuất từ năm 2002 số nhóm nghiên cứu Trong số phải kể đến kiến trúc DISCOVER [3] nhóm dự án Châu Âu Trong kiến trúc này, khung hình chuỗi chia thành hai tập khung hình: khung hình khung hình WZ Nhóm ảnh (GOP) có kích thước n định nghĩa tập gồm n khung hình có có khung hình n  khung hình WZ Các khung hình mã hóa giải mã độc lập sử dụng kỹ thuật mã hóa chế độ Intra ví dụ H.264/AVC Intra [4] HEVC Intra [5] Các khung hình WZ mã hóa cách độc lập, biến đổi sang miền tần số lượng tử hóa Tại phía giải mã, khung hình giải mã sử dụng để tạo thông tin phụ trợ - ước lượng khung hình WZ cần giải mã Để ước lượng thông tin phụ trợ, kiến trúc DISCOVER sử dụng kỹ thuật nội suy thời gian bù chuyển động (MCTI) [6] Tuy nhiên, mã hóa video WZ chưa đạt hiệu nén mã hóa video dự đoán Một phần chất lượng thơng tin phụ trợ thơng tin phụ trợ có ảnh hưởng lớn đến hiệu nén hệ thống Đã có nhiều đề xuất đưa nhằm cải tiến chất lượng thông tin phụ trợ Trong báo này, đề xuất phương pháp để cải tiến chất lượng thông tin phụ trợ mã hóa video WZ miền biến đổi Trong giải pháp này, tạo thông tin phụ trợ cách kết hợp hai SI ứng viên SI ứng viên thứ SI tạo theo phương pháp truyền thống ứng viên SI thứ hai tạo dựa mạng nơ-ron Sau hai ứng viên kết hợp với để tạo SI cuối Phương pháp tạo thơng tin phụ trợ xác giống với khung hình WZ gốc cách lựa chọn kỹ thuật học máy phù hợp Bài báo cấu trúc sau Phần II giới thiệu nghiên cứu liên quan bao gồm giới thiệu ngắn gọn kiến trúc mã hóa sử dụng báo nghiên cứu trước tạo thơng tin phụ trợ Phần III mô tả hệ thống đề xuất Các tham số mô kết mô trình bày Phần IV kết luận đưa Phần V Abstract— Mã hóa video Wyner-Ziv (WZ) trường hợp đặc biệt mã hóa video phân tán – sơ đồ mã hóa video dựa định lý Slepian-Wolf Wyner-Ziv Ngược lại với mã hóa video dự đốn, mã hóa video WZ khai thác thống kê nguồn phía giải mã để giữ cho mã hóa có độ phức tạp thấp Tuy nhiên, mã hóa video WZ chưa đạt hiệu nén giải pháp mã hóa video dự đốn truyền thống Lý đến từ việc tạo thơng tin phụ trợ dự đốn khung hình WZ gốc, có chất lượng chưa cao Để khắc phục vấn đề này, báo đề xuất kỹ thuật tạo thông tin phụ trợ cải tiến cho mã hóa video WZ cách kết hợp hai ứng viên thông tin phụ trợ để tạo thơng tin phụ trợ có chất lượng tốt q trình giải mã Các kết mơ cho thấy cải tiến đáng kể chất lượng thơng tin phụ trợ, hiệu nén mã hóa video phân tán điều kiện khác thay đổi nội dung chuỗi video, kích thước video Keywords- Video WZ, thơng tin phụ trợ I GIỚI THIỆU Mã hóa video WZ sơ đồ mã hóa video khai thác giống khung hình liên tiếp chuỗi video phía giải mã khơng phải phía mã hóa giải pháp mã hóa video dự đốn truyền thống Do đó, mã hóa kiến trúc mã hóa video WZ thường có độ phức tạp thấp điều phù hợp với ứng dụng mạng giám sát video, mạng cảm biến đa phương tiện Các ứng dụng yêu cầu mã hóa có độ phức tạp thấp cho phép giải mã có độ phức tạp cao Ngồi ra, kiến trúc mã hóa video WZ cịn có khả phân bố linh hoạt độ phức tạp mã hóa giải mã tùy theo yêu cầu cụ thể Từ quan điểm lý thuyết thông tin, định lý SlepianWolf [1] nén không tổn thất phát biểu mã hóa nguồn có tương quan với cách độc lập giải mã chúng cách kết hợp mà đạt tốc độ trường hợp mã hóa giải mã kết hợp Định lý sau mở rộng với tên gọi định lý Wyner-Ziv [2] phát biểu mã hóa hóa độc lập với số thơng tin phụ trợ sẵn có phía giải mã với số điều kiện đó, nghĩa nguồn Gauss kết hợp khơng nhớ có xem ISBN 978-604-80-5958-3 402 Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) II vector chuyển động trước Tiếp đó, ước lượng chuyển động song hướng lọc vector chuyển động thu bước trước với ràng buộc phép chiếu tuyến tính khung hình tham chiếu trước sau Để cải thiện độ mượt không gian, lọc trung vị có trọng số sử dụng Cuối cùng, bù chuyển động song hướng thực để tạo thông tin phụ trợ, ước lượng WZF tương ứng CÁC NGHIÊN CỨU LIÊN QUAN A Kiến trúc mã hóa WZ-HEVC Phần giới thiệu mã hóa WZ miền biến đổi với tên gọi WZ-HEVC Khác với mã hóa DISCOVER ban đầu [3], khung hình mã hóa mã hóa mã hóa HEVCIntra Vì có tên gọi WZ-HEVC mơ tả Hình Biến đổi DCT Bộ lượng tử đồng Bộ mã hóa LDPCA Bộ đệm Bộ giải mã LDPCA Mơ hình nhiễu tương quan: Thống kê dư thừa hệ số DCT WZF gốc khung hình SI tương ứng giả định tuân theo phân bố Laplace sau: WZF giải mã Mặt phẳng bit WZF Tái tạo IDCT Kênh phản hồi Mơ hình hóa nhiễu tương quan f X / y ( x)  DCT Tạo SI Bộ mã hóa HEVC Intra Bộ giải mã HEVC Intra KF giải mã  Hình Kiến trúc mã hóa WZ-HEVC Q trình mã hóa Chuỗi video đầu vào phân tách thành khung hình (KF) X 2t 1 khung hình WZ (WZF) X t Các KF mã hóa mã hóa HEVC Intra WZF mã hóa theo nguyên tắc phân tán sau: e  x  y (1) (2) 2 Trong công thức (2),  phương sai dư thừa khung hình WZF gốc khung hình SI tương ứng Trong mã hóa sử dụng báo này, tham số  phân bố Laplace ước lượng trực tuyến giải mã mức dải hệ số Bộ giải mã LDPCA: Khi có hệ số DCT khung hình SI nhiễu tương quan dải hệ số DCT, mặt phẳng bit dải hệ số giải mã LDPCA với hỗ trợ bit chẵn lẻ gửi từ mã hóa thơng qua kênh phản hồi Để định có cần gửi thêm bit chẵn lẻ để giải mã thành công cho mặt phẳng bit đó, tiêu chí dừng u cầu sử dụng Để phát sửa lỗi lại mặt phẳng bit, tổng kiểm tra dư thừa vịng (CRC) tính cho mặt phẳng bit mã hóa gửi tới giải mã Bộ giải mã tính CRC tương ứng cho mặt phẳng bit giải mã LDPCA thành công so sánh với CRC nhận từ mã hóa để đảm bảo loại bỏ xác suất lỗi cho mặt phẳng bit giải mã Sau mặt phẳng bit giải mã LDPCA thành công, mặt phẳng bit lại dải hệ số xử lý cách tương tự Biến đổi DCT: Mỗi WZF chia thành khối không chồng có kích thước  biến đổi DCT áp dụng cho khối để tạo thành hệ số DCT tương ứng với pixel khối Lượng tử hóa: Để giảm tốc độ bit, hệ số DCT lượng tử hóa Các hệ số DCT nhóm thành 16 dải hệ số bk (k  0;15) dải hệ số gồm hệ số có vị trí khối khác Các dải DCT lượng tử đồng với lượng tử 2M k M k số bit biểu diễn cho hệ số DCT dải hệ số bk Các ma trận lượng tử chọn tương ứng với mức tốc độ bit khác [7] Bộ mã hóa LDPCA: Mỗi mặt phẳng bit đưa vào mã hóa LDPCA để tạo bit chẵn lẻ tương ứng Các bit chẵn lẻ lưu đệm khung hình bit hệ thống bị loại bỏ Các bit chẵn lẻ truyền tới giải mã theo cụm tùy theo yêu cầu từ giải mã Tái tạo: Các mặt phẳng bit giải mã LDPCA với khung hình SI thống kê dư thừa cho dải hệ số DCT sử dụng để tái tạo lại hệ số DCT ban đầu Giá trị tái tạo cho hệ số DCT dải hệ số DCT cho [9]: Quá trình giải mã Tại giải mã, KF giải mã giải mã HEVC Intra WZF giải mã với trợ giúp KF u x '  E  x | q ', y   Tạo thông tin phụ trợ: Khối nội suy thời gian bù chuyển động tạo thông tin phụ trợ, ước lượng WZF mã hóa, cách sử dụng KF giải mã trước sau [8] Trong mơ-đun này, hai khung hình tham chiếu lọc thơng thấp để giảm nhiễu cho q trình ước lượng chuyển động Sau thực ước lượng chuyển động trước để có ISBN 978-604-80-5958-3 f X / y hàm mật độ xác suất X với y cho trước  tham số phân bố Laplace xác định công thức sau: Bộ đệm khung hình KF   xf X|y ( x | y )dx l u  (3) f X | y ( x | y )dx l x ' hệ số DCT tái tạo, y hệ số DCT tương ứng WZF E[.] toán tử kỳ vọng l , u biên tương ứng q ' 403 Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) Biến đổi DCT ngược (IDCT): Cuối cùng, hệ số DCT tái tạo biến đổi DCT ngược để nhận khung hình miền pixel thêm từ mã hóa gửi tới [15][16] Trong giải pháp này, mã hóa thường tạo mã băm cho khối gửi tới giải mã để hỗ trợ trình giải mã nhằm cải thiện chất lượng SI Tuy nhiên, nhược điểm phương pháp độ phức tạp mã hóa tăng lên Một hướng tiếp cận khác SI ban đầu lọc liên tục qua nhiều vịng lặp q trình giải mã LDPCA cách sử dụng liệu giải mã trước [17][18][19][20] Với cách tiếp cận này, tương đồng SI khung hình WZ gốc tăng liên tục trình giải mã cải thiện chất lượng cuối giảm tốc độ bit yêu cầu Hơn nữa, không cần phải tạo gửi thơng tin thêm khung hình thời nên mã hóa giữ độ phức tạp thấp Nhược điểm cách tiếp cận độ phức tạp giải mã tăng lên so với giải pháp trước Trong báo đề xuất phương pháp tạo SI cách kết hợp SI tạo ban đầu phương pháp MCTI với SI tạo mạng nơron Điều giúp tạo SI có chất lượng tốt so với việc sử dụng SI ban đầu B Các phương pháp tạo thông tin phụ trợ Trong mã hóa video dự đốn, kỹ thuật ước lượng bù chuyển động góp phần cải tiến chất lượng khung hình dự đốn dẫn đến cải tiến đáng kể hiệu nén hệ thống Cũng vậy, kỹ thuật tạo thông tin phụ trợ giải mã góp phần quan trọng vào việc cải tiến hiệu nén mã hóa video WZ để rút ngắn khoảng cách hiệu so với mã hóa video dự đốn Tương quan thơng tin phụ trợ giải mã thông tin phụ trợ giải mã khung hình WZ thời mã hóa cao số lượng bit cần gửi từ mã hóa đến giải mã để đạt chất lượng Vì vậy, chất lượng SI đóng vai trị trung tâm giúp đạt hiệu nén cho mã hóa WZ Tuy nhiên, câu hỏi đặt là: làm để tạo thông tin phụ trợ giải mã khung hình WZ gốc khơng sẵn có giải mã? Câu trả lời khó để dự đốn cách xác tuyệt đối khung hình WZ gốc mà dự đốn với mức độ xác dựa khung hình giải mã trước Cho đến nay, có nhiều nghiên cứu tập trung vào giải pháp tạo SI Có thể phân loại kỹ thuật tạo SI thành hai loại tạo SI tạo SI nâng cao Các kỹ thuật tạo SI thường tạo SI sử dụng trực tiếp trình giải mã Ngược lại, kỹ thuật tạo SI nâng cao thường thực cải tiến chất lượng SI ban đầu suốt trình giải mã, SI ban đầu tạo kỹ thuật tạo SI Với kỹ thuật tạo SI thường phát triển theo hai hướng Cách tiếp cận thứ tạo SI tương ứng cho khung hình WZ giải mã trước trình giải mã LDPCA bắt đầu SI tạo dựa khung hình giải mã trước mà không cần liệu bổ sung từ phía mã hóa [10][11][12] Các giải pháp có ưu điểm mã hóa khơng cần tạo gửi thơng tin bổ sung khung hình thời có nhược điểm khó ước lượng chuyển động cách chuẩn xác kích thước GOP lớn vùng có chuyển động bất thường hay chuyển động nhanh Cách tiếp cận thứ hai SI tạo cách thử dựa vào khung hình giải mã trước số liệu điều khiển từ mã hóa gửi lới Theo cách tiếp cận này, giải mã kênh chạy số lần cho ứng viên SI ứng viên tốt chọn dựa theo tiêu chí định trước [13][14] Có thể thấy cách tiếp cận có ưu điểm có khả thích ứng tốt với nội dung video có thực số kỹ thuật ước lượng đơn giản Tuy nhiên lại làm tăng thêm độ phức tạp cho mã hóa cần phải truyền thêm liệu điều khiển sang phía giải mã Để cải tiến chất lượng SI, giải pháp tạo SI nâng cao đề xuất Các SI tạo trước giải mã LDPCA có sử dụng thêm số thơng tin bổ sung hay gọi gợi ý ISBN 978-604-80-5958-3 HỆ THỐNG ĐỀ XUẤT III Hình mơ tả mã hóa video miền biến đối dựa cấu trúc mã hóa WZ-HEVC đề cập mục II Bộ mã hóa DCT Bộ lượng tử hóa đồng Khung hình WZ giải mã Bộ giải mã Bộ mã hóa LDPCA Bộ đệm Bộ giải mã LDPCA IDCT Tái tạo Các mặt phẳng bit Kênh phản hồi Mô hình nhiễu tương quan Khung hình WZ MCTI DCT Tạo SI Mơ hình mạng Nơ-ron Chuỗi video Khung hình đầu vào Chia tách khung hình Bộ đệm khung hình Bộ mã hóa HEVC Intra Bộ giải mã HEVC Intra Khung hình giải mã Hình Kiến trúc mã hóa video WZ đề xuất Cụ thể, phương pháp này, khung hình SI tạo cách kết hợp từ hai khung hình: khung hình SI MCTI tạo kỹ thuật MCTI mô tả [11] khung hình SI NN tạo mạng nơ-ron với đầu vào tham số hai khung hình Hai khung hình SI MCTI SI NN kết hợp để tạo khung hình SI cuối Các bước tạo khung hình SI mô tả chi tiết sau Bước 1: Tạo khung hình SI MCTI SI MCTI khung hình tạo kỹ thuật MCTI mô tả ngắn gọn theo sơ đồ Hình Hai KF tham chiếu trước sau lọc thông thấp sử dụng tham chiếu thuật toán ước lượng chuyển động tìm kiếm đầy đủ sử dụng 404 Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) đầu hệ số DC AC dự đoán khối hình khung hình SI NN Hàm kích hoạt ReLU sử dụng nơ-ron tiêu chí đối sánh cải tiến Tiêu chí đối sánh ưu tiên vector chuyển động gần tâm Sau thực ước lượng chuyển động song hướng Trong bước này, vector chuyển động tương ứng với khối SI lựa chọn lọc Tiếp theo, lọc vector trung vị có trọng số sử dụng để cải thiện độ mịn không gian trường chuyển động Cuối cùng, với vector chuyển động có được, khối SI tạo cách lấy trung bình bù chuyển động cho khối KF Bước 3: Tạo khung hình SI Khung hình SI cuối dùng cho việc giải mã khung hình WZ tạo cách kết hợp hai khung hình SI MCTI khung hình SI NN sau: SI  1.SI MCTI   SI NN Bước 2: Tạo khung hình SI NN Trong 1  hai trọng số đo mức độ quan trọng hai khung hình SI MCTI SI NN việc tạo khung hình SI Trong phương pháp đề xuất, hệ số 1  tìm thực nghiệm với giá trị tương tứng 0,25 0,75 Trong phương pháp này, mơ hình mạng nơ-ron sử dụng để dự đốn khung hình SI NN từ hai khung hình IV Cụ thể, hai KF chia thành khối kích thước  biến đổi cosin rời rạc (DCT) Các hệ số DC AC hai khối tương ứng hai khung hình đưa vào mạng nơ-ron để dự đoán hệ số DC AC cho khối hình  khung hình SI NN Phương pháp tạo SI đề xuất đánh giá áp dụng mã hóa Wyner-Ziv so sánh với phương pháp tạo SI khác Dữ liệu sử dụng để huấn luyện khối ảnh  khung hình chuỗi video "Harbor", "Husky", "Mobile", News" "Pamphlet" với độ phân giải không gian 176 144 , số lượng khung hình chuỗi 300 Các chuỗi chọn có đa dạng kết cấu ảnh đặc tính chuyển động chuỗi Các chuỗi mã hóa giải mã HEVC Intra với bốn tham số lượng tử Tổng số khối hình dùng để huấn luyện mơ hình 1.188.000 khối Bảng II Điều kiện thử nghiệm Chuỗi Video Độ phân giải Số khung hình Tham số lượng tử Carphone {25,29,34,40} Foreman {25,29,34,40} 176x144 300 Akiyo {25,29,34,40} Coastguard {26,30,34,38} Phần đánh giá sử dụng mã hóa sau:  HEVC Intra: Bộ mã hóa sử dụng phần mềm tham chiếu HM với chệ độ mã hóa Intra Đây mã hóa đại diện cho mã hóa video dự đốn lựa chọn để so sánh có độ phức tạp mã hóa thấp Để huấn luyện cho tập liệu xây dựng trên, phương pháp đề xuất sử dụng mạng nơ-ron nhiều lớp Để định cấu trúc mạng nơ-ron với số lớp ẩn số nơ-ron lớp, số cấu trúc mạng khác thử nghiệm Kết thử nghiệm số cấu trúc mạng thể bảng I  WZ-HEVC: Đây mã hóa Wyner-Ziv tuân theo kiến trúc DISCOVER với khung hình mã hóa HEVC Intra SI tạo phương pháp MCTI Bảng I Độ xác số cấu trúc mạng nơ-ron Sai số tuyệt đối trung bình (MAE)  ReSI-WZ-HEVC: Đây mã hóa WZ-HEVC với mơ-đun tạo SI cải tiến nhóm tác giả đề xuất [20] {2,1} 1,91 {2,2,1} 0,85 {2,2,2,1} 0,82 {2,3,2,1} 0,78 {2,4,2,1} 0,82 Như kết bảng I, cấu trúc mạng nơron gồm lớp đầu vào, hai lớp ẩn lớp đầu lựa chọn Lớp đầu vào gồm hai giá trị hệ số DC AC hai khối hình hai khung hình Lớp ẩn 1, tương ứng gồm nơ-ron Lớp ISBN 978-604-80-5958-3 ĐIỀU KIỆN THỬ NGHIỆM VÀ KẾT QUẢ THỬ NGHIỆM A Điều kiện thử nghiệm Để đánh giá hiệu giải pháp tạo thông tin phụ trợ đề xuất so với phương pháp khác, bốn chuỗi video sau sử dụng “Akiyo”, “Carphone”, “Foreman” “Coastguard” với đặc điểm mô tả Bảng II Hình Kỹ thuật tạo thơng tin phụ trợ nội suy khung hình Cấu trúc mạng (4)  NN-WZ-HEVC: Đây mã hóa xây dựng WZ-HEVC với mô-đun tạo SI mạng nơron đề xuất mục III Hiệu hiệu méo – tốc độ bit (RD) phương pháp đề xuất với số phương pháp trước Hai đại lượng BD-PSNR BD-Rate [21] 405 Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021)  NN-WZ-HEVC so với mã hóa WZ khác: Hiệu RD mã hóa NN-WZ-HEVC đạt mức cải thiện đáng kể so với hai mã hóa WZ cịn lại Khi so với mã hóa WZ-HEVC, mức cải tiến BD-PSNR lên tới 6,21 dB mức tiết kiệm tốc độ bit đạt tới 151,28% chuỗi Akiyo Đối với chuỗi chuyển động phức tạp nhanh việc tạo SI gặp khó khăn nên chất lượng SI chưa cao Tuy nhiên, tổng thể, NN-WZ-HEVC đạt mức giảm tốc độ bit trung bình 59,28% so với mã hóa WZ-HEVC 8,13% so với mã hóa ReSI-WZ-HEVC sử dụng đánh giá Đại lượng BDPSNR cho biết mức cải thiện tương đối hai phương pháp cách đo lường sai khác trung bình hai đường cong RD đường cong RD chọn làm đường cong sở Trong nghiên cứu này, NN-WZ-HEVC chọn làm đường cong sở Nếu BD-PSNR âm, điều có nghĩa mã hóa NN-WZ-HEVC có hiệu tốt Tương tự vậy, đại lượng BD-Rate cho biết mức độ tiết kiệm tốc độ bit hai phương pháp Nếu BD-Rate có giá trị dương, điều có nghĩa đường cong sở NNWZ-HEVC có mức tiết kiệm tốc độ bit tốt B Kết phân tích Bảng III, IV Hình 4, 5, 6, mơ tả so sánh hiệu (trên phương diện tốc độ bit chất lượng khung hình sau giải nén) phương pháp đề xuất (thể hiệu RD mã hóa NN-WZHEVC) so với phương pháp tạo SI khác (thể hiệu RD mã hóa WZ-HEVC, ReSI-WZ-HEVC) mã hóa truyền thống HEVCIntra đại diện cho mã hóa có độ phức tạp thấp Bảng III So sánh BD-Rate [%] mã hóa NN-WZHEVC với mã khác Chuỗi Video Carphone Foreman Akiyo Coastguard Trung bình WZHEVC 70,74 10,65 151,28 4,45 59,28 ReSI-WZHEVC 8,43 6,64 16,09 1,37 8,13 HEVC Intra Hình RD phương pháp với chuỗi Carphone 4,72 90,64 62,28 -26,36 32,83 Bảng IV So sánh BD-PSNR [dB] mã hóa NN-WZHEVC với mã hóa khác Chuỗi Video Carphone Foreman Akiyo Coastguard Trung bình WZHEVC -3,59 -0,54 -6,21 -0,18 -2,63 ReSI-WZHEVC -0,66 -0,33 -1,11 -0,02 -0,53 HEVC Intra -0,35 -3,74 -3,56 1,51 -1,54 Hình RD phương pháp với chuỗi Foreman Từ kết bảng III IV, ta nhận thấy:  NN-WZ-HEVC so với HEVC Intra: Hiệu RD NN-WZ-HEVC tốt so với HEVC cho hầu hết chuỗi ngoại trừ chuỗi Coastguard chuỗi có chuyển động nhanh phức tạp Đối với chuỗi chuyển động chậm, NN-WZ-HEVC cho kết tốt SI có chất lượng tốt Khi đo đại lượng BD-Rate, NN-WZ-HEVC tiết kiệm đến 90,64% chuỗi chuyển động chậm, ví dụ Foreman Tổng thể, NN-WZ-HEVC đạt mức tiết kiệm tốc độ bit trung bình 32,83% mức cải thiện BD-PSNR lên tới 1,54dB ISBN 978-604-80-5958-3 Hình RD phương pháp với chuỗi Akiyo 406 Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) [5] [6] Hình RD phương pháp với chuỗi Soccer V [7] KẾT LUẬN Trong báo này, đề xuất phương pháp cải tiến chất lượng thơng tin phụ trợ cho mã hóa Wyner-Ziv cách kết hợp hai ứng viên SI Ứng viên SI SI tạo theo cách truyền thống sử dụng kỹ thuật MCTI ứng viên SI thứ hai tạo mạng nơ-ron Hai ứng viên sau kết hợp với để tạo thành SI cuối Các kết thực nghiệm cho thấy so với phương pháp trước đó, phương pháp tạo SI đề xuất tạo SI chất lượng tốt cải thiện BD-PSNR tiết kiệm BD-Rate cho hệ thống mã hóa video Wyner-Ziv Hướng phát triển nghiên cứu mở rộng theo số cách Đầu tiên thực tối ưu hóa cho mạng nơ-ron để có kết tốt Sau nghiên cứu xây dựng mạng nơ-ron cho phù hợp với ứng dụng cụ thể Ví dụ, mạng nơ-ron xây dựng riêng cho ứng dụng thoại hội nghị cách thay đổi liệu huấn luyện để phản ánh chất loại ứng dụng Với phát triển nhanh chóng nghiên cứu học sâu, việc áp dụng mạng nơ-ron mang lại kết tốt nhiều [8] [9] [10] TÀI LIỆU THAM KHẢO [1] [2] [3] [4] [11] D Slepian, J K Wolf, and D Slepian, “Noiseless Coding of Correlated Information Sources,” IEEE Trans Inf Theory, vol 19, no 4, pp 471–480, 1973, doi: 10.1109/TIT.1973.1055037 A Wyner and J.Ziv, “The Rate-Distortion Function for Source Coding with Side Information at the Decoder,” IEEE Trans Inf Theory., vol 22, no 1, pp 1–10, 1976 X Artigas, J Ascenso, M Dalai, S Klomp, D Kubasov, and M Ouaret, “The DISCOVER codec: architecture, techniques and evaluation.,” Proc Pict Coding Symp., pp 6– 9, 2007 T Wiegand, G J Sullivan, S Member, G Bjøntegaard, A Luthra, and S Member, ISBN 978-604-80-5958-3 [12] [13] 407 “Overview of the H.264/AVC Video Coding Standard,” IEEE Trans Circuits Syst Video Technol., vol 13, no 7, pp 560–576, 2003 H Standard, G J Sullivan, J Ohm, W Han, and T Wiegand, “Overview of the High Efficiency Video Coding,” IEEE Trans Circuits Syst Video Technol., vol 22, no 12, pp 1649–1668, 2012 C Brites and F Pereira, “Improving frame interpolation with spatial motion smoothing for pixel domain distributed video coding,” EURASIP Conf Speech Image Process Multimed Commun Serv Smolenice, Slovak Repub., no January, 2005 J Park, B Jeon, D Wang, and A Vincent, “Wyner-Ziv video coding with region adaptive quantization and progressive channel noise modeling,” 2009 IEEE Int Symp Broadband Multimed Syst Broadcast BMSB 2009, vol 0, 2009, doi: 10.1109/ISBMSB.2009.5133844 C Brites, J Ascenso, and F Pereira, “Improving transform domain Wyner-Ziv video coding performance,” in ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings, 2006, vol 2, pp 525–528, doi: 10.1109/icassp.2006.1660395 D Kubasov, J Nayak, and C Guillemot, “Optimal reconstruction in Wyner-Ziv video coding with multiple side information,” 2007 IEEE 9Th Int Work Multimed Signal Process MMSP 2007 - Proc., pp 183–186, 2007, doi: 10.1109/MMSP.2007.4412848 A Aaron, S D Rane, E Setton, and B Girod, “Transform-domain Wyner-Ziv codec for video,” Vis Commun Image Process 2004, vol 5308, p 520, 2004, doi: 10.1117/12.527204 J Ascenso, C Brites, and F Pereira, “Improving Frame Interpolation with Spatial Motion Smoothing for Pixel Domain Distributed Video Coding,” 5th EURASIP Conf Speech Image Process Multimed Commun Serv., no Dvc, pp 1–6, 2005 D Kubasov, C Guillemot, C U De Beaulieu, and G Leclerc, “Mesh-Based MotionCompensated Interpolation for Side Information Extraction in Distributed Video Coding , 2006, pp 26,” in International Conference on Image Processing, Atlanta, GA, 2006, pp 261–264 R Puri, A Majumdar, and K Ramchandran, “PRISM: A video coding paradigm with motion estimation at the decoder,” IEEE Trans Image Process., vol 16, no 10, pp Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) [14] [15] [16] [17] [18] 2436–2448, 2007, doi: 10.1109/TIP.2007.904949 R Puri and K Ramchandran, “PRISM: A new robust video coding architecture based on distributed compression principles,” 2002 A Aaron, S Rane, and B Girod, “Wyner-Ziv video coding with hash-based motion compensation at the receiver,” in 2004 International Conference on Image Processing, 2004 ICIP ’04., Singapore, 2004, pp 3097–3100 F Pereira and J Ascenso, “Adaptive HashBased Side Information Exploitation for Efficient Wyner-Ziv Video Coding,” in EEE International Conference on Image Processing, San Antonio, TX, 2007, vol 9, pp 29–32 A Abou-Elailah, F Dufaux, M Cagnazzo, B Pesquet-Popescu, and J Farah, “Successive refinement of side information using adaptive search area for long duration GOPs in distributed video coding,” 2012 19th Int Conf Telecommun ICT 2012, no Ict, 2012, doi: 10.1109/ICTEL.2012.6221275 ISBN 978-604-80-5958-3 [19] [20] [21] 408 H Van Luong, L L Raket, and S Forchhammer, “Re-estimation of motion and reconstruction for distributed video coding,” IEEE Trans Image Process., vol 23, no 7, pp 2804–2819, 2014, doi: 10.1109/TIP.2014.2320364 R Martins, C Brites, J Ascenso, and F Pereira, “Refining side information for improved transform domain wyner-ziv video coding,” IEEE Trans Circuits Syst Video Technol., vol 19, no 9, pp 1327–1341, 2009, doi: 10.1109/TCSVT.2009.2022783 T V Huu, T Nguyen Thi Huong, M N Ngoc, and X Hoangvan, “Improving performance of distributed video coding by consecutively refining of side information and correlation noise model,” Proc - 2019 19th Int Symp Commun Inf Technol Isc 2019, pp 502–506, 2019, doi: 10.1109/ISCIT.2019.8905187 G Bjontegaard, “Calculation of average PSNR differences between RD curves,” 2001 ... vậy, kỹ thuật tạo thông tin phụ trợ giải mã góp phần quan trọng vào việc cải tiến hiệu nén mã hóa video WZ để rút ngắn khoảng cách hiệu so với mã hóa video dự đốn Tương quan thông tin phụ trợ. .. SI tạo ban đầu phương pháp MCTI với SI tạo mạng nơron Điều giúp tạo SI có chất lượng tốt so với việc sử dụng SI ban đầu B Các phương pháp tạo thơng tin phụ trợ Trong mã hóa video dự đoán, kỹ thuật. .. trung vào giải pháp tạo SI Có thể phân loại kỹ thuật tạo SI thành hai loại tạo SI tạo SI nâng cao Các kỹ thuật tạo SI thường tạo SI sử dụng trực tiếp trình giải mã Ngược lại, kỹ thuật tạo SI nâng

Ngày đăng: 29/04/2022, 10:15