Dự đoán liên hình ảnh 1 Giới thiệu

2.1.2.1. Giới thiệu

Trong khi dự đoán nội hình ảnh khai thác sự tương quan giữa các mẫu lân cận không gian, dự đoán liên hình ảnh lại sử dụng sự tương quan thời gian giữa các hình ảnh theo thứ tự nhận được từ một dự đoán bù chuyển động (MCP) cho một khối của các mẫu hình ảnh.

Với MCP dựa theo khối, một hình ảnh video được chia thành các khối chữ nhật. Giả sử chuyển động là đồng nhất bên trong một khối và vật thể chuyển động đó lớn hơn một khối, với mỗi khối, có thể tìm thấy một khối tương ứng trong các hình ảnh đã giải mã trước đó để phục vụ như là yếu tố dự đoán. Khái niệm chung của MCP dựa trên mô hình chuyển động tịnh tiến. Sử dụng mô hình chuyển động tịnh tiến, vị trí của khối trong hình ảnh đã được giải mã trước đó được chỉ định bởi vector chuyển động , ) với là dịch vị ngang và là dịch vị dọc so với vị trí của khối hiện tại.

Phép nội suy được áp dụng trên các hình ảnh tham chiếu để rút ra được tín hiệu dự đoán khi vector chuyển động tương ứng có độ chính xác mẫu phân

số. Hình ảnh được giải mã trước đó được gọi là hình ảnh tham chiếu và được chỉ định bởi một chỉ mục tham chiếu tới một danh sách hình ảnh tham chiếu. Các tham số mô hình chuyển động tịnh tiến, tức là các vector chuyển động và chỉ số tham chiếu, được gọi là dữ liệu chuyển động. Có 2 loại của dự đoán liên hình ảnh trong các chuẩn mã hóa video hiện đại là dự đoán đơn và dự đoán đôi.

Trong trường hợp dự đoán đôi, 2 tập hợp của dữ liệu chuyển động x0, y0, z0 và x1, y1, z1) được sử dụng để tạo ra 2 MCP và sau đó được kết hợp để trở thành MCP sau cùng [1]. Điều này được thực hiện bằng cách lấy trung bình nhưng trong trường hợp dự đoán trọng số, các trọng số khác nhau có thể được áp dụng tới mỗi MCP. Các hình ảnh tham chiếu mà có thể được sử dụng trong dự đoán đôi được lưu trữ trong 2 danh sách khác nhau, tên là danh sách 0 và danh sách 1. Để giới hạn băng thông bộ nhớ trong các lát cho phép dự đoán đôi, chuẩn HEVC giới hạn PU với 4x8 và 8x4 khối dự đoán luma để chỉ sử dụng dự đoán đơn. Dữ liệu chuyển động được suy ra bởi bộ mã hóa sử dụng một quá trình ước lượng chuyển động. Ước lượng chuyển động không được xác định rõ trong các tiêu chuẩn video do đó các bộ mã hóa khác nhau có thể sử dụng các bù trừ khác nhau về độ phức tạp-chất lượng trong thiết kế.

Hình 2.1. Dự đoán liên hình ảnh trong HEVC

Đồ thị khối tổng quan của mã hóa liên hình ảnh HEVC được thể hiện ở hình 2.1. Dữ liệu chuyển động của một khối có quan hệ với các khối lân cận.

Để khai thác sự tương quan này, dữ liệu chuyển động không được mã hóa trực tiếp trong dòng bit nhưng được mã hóa mang tính dự đoán dựa trên dữ liệu chuyển động lân cận. Trong HEVC, có 2 khái niệm được sử dụng cho điều đó. Mã hóa mang tính dự đoán của các vector chuyển động được cải tiến trong HEVC bằng việc giới thiệu một công cụ mới tên dự đoán vector chuyển động nâng cao (AMVP), thứ dự đoán tốt nhất cho mỗi khối chuyển động sẽ được báo hiệu tới bộ giải mã. Thêm vào đó, một kĩ thuật mới gọi là sát nhập khối liên dự đoán nhận được từ toàn bộ các dữ liệu chuyển động của một khối từ các khối lân cận thay thế cho chế độ trực tiếp và chế độ bỏ qua trong H264.

Mã hóa dữ liệu chuyển động

Phép nội suy mẫu phân số