Đổi mới mã hóa dự đoán vector chuyển động trong chuẩn mã hóa video HEVC

MỤC LỤC

Tổng kết chương 1

Mã hóa mang tính dự đoán của các vector chuyển động được cải tiến trong HEVC bằng việc giới thiệu một công cụ mới tên dự đoán vector chuyển động nâng cao (AMVP), thứ dự đoán tốt nhất cho mỗi khối chuyển động sẽ được báo hiệu tới bộ giải mã. Thêm vào đó, một kĩ thuật mới gọi là sát nhập khối liên dự đoán nhận được từ toàn bộ các dữ liệu chuyển động của một khối từ các khối lân cận thay thế cho chế độ trực tiếp và chế độ bỏ qua trong H264. Mã hóa dữ liệu chuyển động. a) Dự đoán vector chuyển động nâng cao (AMVP). Với mỗi MCP nhận được từ một danh sách hình ảnh tham chiếu, hình ảnh tham chiếu tương ứng (∆t) được báo hiệu bởi một chỉ mục tới danh sách hình ảnh tham chiếu, ref_idx_l0/1 và MV (∆x, ∆y) được thể hiện bởi một chỉ mục tới MVP, mvp_l0/1_flag, và MVD của nó. Một cờ mới được giới thiệu trong header lát, mvd_l1_zero_flag, chỉ định rằng có phải MVD cho danh sách hình ảnh tham chiếu thứ hai bằng không và do đó không được truyền tín hiệu trong dòng bit hay không. Khi vector chuyển động được tái tạo đầy đủ, một thao tác cắt cuối cùng đảm bảo rằng các giá trị của mỗi phần tử của vector chuyển động cuối cùng luôn trong khoảng -215 tới 215-1. b) Sát nhập khối liên dự đoán.

Hình 2.1. Dự đoán liên hình ảnh trong HEVC
Hình 2.1. Dự đoán liên hình ảnh trong HEVC

Biến đổi và lượng tử hóa 1. Giới thiệu

• HEVC giữ các mẫu của mỗi một trong các khối dự đoán đơn tại một độ chính xác cao và chỉ thực hiện làm tròn tới độ sâu bit đầu vào tại giai đoạn cuối cùng, tăng cường hiệu suất mã hóa bằng cách giảm lỗi làm tròn. • Các ma trận giải lượng tử hóa không phẳng cho toàn bộ kích thước biến đổi: Trong khi đồng ý cho các kích thước biến đổi nhỏ, chi phí triển khai của việc sử dụng các ma trận giải lượng tử hóa cho các biến đổi lớn hơn là cao vì việc các kích thước khối lớn hơn. • Một bộ đệm đồng vị 20 bit được sử dụng cho việc lưu trữ các kết quả trung gian sau giai đoạn biến đổi đầu tiên trong biến đổi 2D: Một sự gia tăng kích thước bộ đệm chuyển vị dẫn tới bộ nhớ và băng thông bộ nhớ lớn hơn.

Tỉ lệ phụ thuộc tần số rất có ích để thực hiện lượng tử hóa dựa trên hệ thống thị giác con người (HVS) nơi mà các hệ số tần số thấp được lượng tử hóa với một kích thước bước lượng tử hóa mịn hơn khi so sánh với các hệ số tần số cao trong khối biến đổi. Kích thước QG là một bội số của kích thước đơn vị mã hóa mà có thể thay đổi từ 8x8 tới 64x64 phụ thuộc vào kích thước đơn vị cây mã hóa (CTU) và phần tử cú pháp diff_cu_qp_delta_depth như thể hiện trong bảng 2.2.

Hình 2.2. Mã hóa video lai dựa trên khối. (a) Bộ mã hóa, (b) Bộ giải mã.
Hình 2.2. Mã hóa video lai dựa trên khối. (a) Bộ mã hóa, (b) Bộ giải mã.

Các bộ lọc lặp vòng trong HEVC 1. Giới thiệu

Do lọc giải khối chỉ được áp dụng cho các đường biên giữa các đơn vị mã hóa (CU), đơn vị dự đoán (PU) hoặc đơn vị biến đổi (TU) và không áp dụng cho các khu vực bên trong, độ phức tạp trung bình của giả khối HEVC giảm hơn so với H264 do HEVC có thể sử dụng các kích thước khối lớn hơn. Vì việc giải khối của một biên dọc (ngang) trong HEVC không ảnh hưởng tới việc giải khối của các biên dọc (ngang) khác do việc chỉ lọc các biên trong lưới 8x8 mẫu, mọi biên dọc (ngang) có thể được xử lý song song. Do điều kiện (2.8) được đánh là là đúng cho tín hiệu mà tạo thành độ dốc hoàn hảo đi qua đường biên khối (như là một sự thay đổi từ từ trong thành phần luma), giải khối trong chế độ lọc thường được thiết kế để không điều chỉnh độ dốc.

Do đó các giá trị tuyệt đối của bốn độ bù đặc trưng được báo hiệu bởi bộ giải mã - một cho mỗi hạng mục EO, và các dấu của các độ bù được báo hiệu hoàn toàn được xác định từ các hạng mục EO tương ứng. Trong các hình ảnh tự nhiên, các thành phần chroma thường được biểu diễn bởi một tín hiệu băng hẹp, điều đó có nghĩa là bằng một vài độ bù băng, bộ mã hóa có thể phục hồi hầu hết các mẫu trong khu vực.

Hình 2.7. Xác định sức mạnh biên (Bs) cho biên khối. P kí hiệu khối bên  trái (hoặc phía trên) và Q kí hiệu khối bên phải (hoặc phía dưới tại biên khối
Hình 2.7. Xác định sức mạnh biên (Bs) cho biên khối. P kí hiệu khối bên trái (hoặc phía trên) và Q kí hiệu khối bên phải (hoặc phía dưới tại biên khối

Mã hóa Entropy 1. Giới thiệu

Chiến lược mã hóa của CABAC được dựa trên việc phát hiện rằng một sự mã hóa rất hiệu quả của phần tử cú pháp không ở dạng các giá trị nhị phân trong một bộ mã hóa video lai dựa trên khối, giống như các phần tử của sự khác biệt vector chuyển động hoặc các giá trí mức hệ số chuyển đổi, có thể đạt được bằng cách sử dụng một kế hoạch nhị phân hóa như một loại của đơn vị tiền xử lý cho các giai đoạn kế tiếp của việc mô hình hóa thuộc tính và mã hóa số học. Bằng cách phân tích mỗi giá trị phần tử cú pháp không nhị phân thành một chuỗi các bin, việc phân tích xa hơn giá trị mỗi bin trong CABAC phụ thuộc vào quyết định chế độ mã hóa có liên quan, thứ có thể được chọn như cách thông thường hoặc bằng chế độ bỏ qua. Trong chế độ mã hóa thông thường, mỗi giá trị bin được mã hóa sử dụng bộ máy mã hóa số học nhị phân thông thường, với mô hình xác suất liên quan được xác định bởi một lựa chọn cho trước dựa trên loại phần tử cú pháp và vị trí bin hoặc chỉ số bin (binIdx) trong việc biểu diễn nhị phân hóa của phần tử cú pháp, hoặc được lựa chọn phù hợp từ hai hoặc nhiều mô hình xác suất phụ thuộc vào thông tin phụ có liên quan.

Kiến trúc bộ giải mã video phụ thuộc mạnh vào các tham số như thông lượng yêu cầu, nút công nghệ, ngân sách khu vực và công suất, giao diện điều khiển và giao diện dữ liệu tới thế giới bên ngoài và các công nghệ bộ nhớ sử dụng cho bộ đệm hình ảnh đã giải mã. Để đối phó với độ trễ có thể thay đổi của bộ nhớ cache+hệ thống bộ nhớ DRAM, kĩ thuật đường ống đàn hồi có thể được sử dụng giữa các bộ giải mã entropy, cái gửi những yêu cầu đọc tới bộ nhớ cache, và bộ dự đoán, cái đọc dữ liệu từ bộ nhớ cache. Việc giải lượng tử hóa sẽ tăng ti lệ các hệ số được giải mã bởi bộ giải mã entropy và biến đổi ngược sẽ chuyển đổi các hệ số tỉ lệ thành các điểm ảnh phần dư sử dụng một biến đổi cosine rời rạc ngược (IDCT) hoặc một biến đổi sin rời rạc ngược (IDST).

Các tham số sức mạnh đường biên khả dụng tại độ chính xác trong trường hợp xấu nhất của các điểm ảnh 4x4 và mất khoảng 78 bit [2] (64 bit cho hai vector chuyển động, 4 bit cho hai chỉ mục danh sách tham chiếu, 6 bit cho tham số lượng tử hóa và 2 bit cho chế độ dự đoán – nội dự đoán , dự đoán đơn, dự đoán đôi - và một bit cho mỗi đường biên TU, đường biên PU).

Hình 2.11. Sơ đồ khối CABAC (từ bộ giải mã)
Hình 2.11. Sơ đồ khối CABAC (từ bộ giải mã)

Cấu trúc phần cứng bộ mã hóa 1. Giới thiệu

Khi kích thước khung tăng lớn hơn, khu vực trong cùng đối tượng hoặc với chuyển động đồng nhất có thể được dự đoán tốt và mã hóa một cách kinh tế với kích thước khối lớn. Để dạt thông lượng tốt hơn, mạch tiền chuẩn hóa có thể được sử dụng để giảm đường dẫn trọng yếu chuẩn hóa.Trong HEVC, nhiều hơn 20% các bin là các bin đường vòng. Do mạch cập nhật phạm vi và mô hình thuộc tính không ảnh hưởng tới mã hóa đường vòng, một kế hoạch phun bin bỏ qua (BPBS) có thể được áp dụng để chia quá trình từ dòng bin và tái sát nhập thành dòng bit trước giai đoạn cập nhật thấp.

Bằng cách phân tầng các mạch trạng thái, phạm vi, thấp và đầu ra và sử dụng một mạch chuyển tiếp trạng thái trong giai đoạn trạng thái, ta đạt được một bộ máy CABAC với nhiều bin trên mỗi chu kì như thể hiện trong hình 3.12a, b. Mặc dù đường dẫn trọng yếu trẻ nên dài hơn, mào đầu lại vừa phải vì những đường dẫn trọng yếu gốc của bộ mã hóa M và L là rất không cân bằng như thể hiện trong hình 3.14.

Hình 3.8. Sơ đồ khối hệ thống bộ mã hóa
Hình 3.8. Sơ đồ khối hệ thống bộ mã hóa

Tổng kết chương 3

Với các yêu cầu tốc độ bin cao, sử dụng một bộ máy CABAC riêng lẻ trong một vài tình huống không thể đạt được tốc độ bin yêu cầu. Nhiều phần của khung (tức là nhiều CTU) có thể được mã hóa tại cùng thời điểm nếu các cấu hình này được sử dụng để làm hiệu quả sử dụng cao hơn nữa. Còn về bộ mã hóa thì các vấn đề thiết kế chủ chốt trong đường ống hệ thông, thiết kế mức module, và quyết định chế độ phức tạp cao mà hỗ trợ RDO đầy đủ trong phần cứng đã được thảo luận.

Mặc dù HEVC là một tiêu chuẩn phức tạp, ta vẫn có thể đạt được việc triển khai có hiệu quả với thiết kế về thuật toán và kiến trúc đúng đắn. Với các kĩ thuật đã được trình bày trong chương này, chúng tôi đã chỉ ra rằng HEVC có thể được sử dụng cho mã hóa thời gian thực cho các ứng dụng phân giải cực cao.