Các công cụ mã hóa cơ bản

I-VOP

Một hình chữ nhật I-VOP là một khung hình của video được mã hóa trong chế độ Intra (không có dự báo từ bất kỳ mã VOP khác).

Các giai đoạn mã hóa và giải được thể hiện trong hình 5.7.

Block type QP ≤ 4 5 ≤ QP ≤ 8 9 ≤ QP ≤ 24 25 ≤ QP

Luma 8 2 × QP QP + 8 (2 × QP) − 16

Chroma 8 (QP + 13)/2 (QP + 13)/2 QP − 6

Bảng 5.4 giá trị của các thành phần dc_scaler trong vùng QP

DCT và IDCT: Khối luma và chroma mẫu được chuyển đổi bằng cách sử dụng một 8 × 8 phía trước DCT trong mã hóa và một 8 × 8 ngược DCT trong giải mã (xem Phần 3.4).

Lượng tử hóa: Các MPEG-4 Visual chuẩn là phương pháp thay đổi tỷ lệ lượng tử hóa biến giá trị của bộ giải mã. Thay đổi tỷ lệ được điều khiển bởi một tham số mô hình, QP, có thể mất giá trị 1-31 (giá trị lớn hơn của QP sản xuất một kích thước bước lớn hơn và do đó cao hơn nén và biến dạng). Hai phương pháp thay đổi tỷ lệ được mô tả trong tiêu chuẩn: "Phương pháp 2" (phương pháp cơ bản) và "phương pháp 1 '(hơn linh hoạt nhưng cũng phức tạp hơn). Cách 2 ngược lượng tử hoạt động như sau. Các DC Hệ số trong một macroblock Intra-mã được thay đổi tỷ lệ theo:

DC = DCQ. dc_scaler (5.1)

DCQ là hệ số lượng tử hóa, DC là hệ số tỷ lệ và dc_scaler là một tham số mặc định trong tiêu chuẩn. Trong chế độ tiêu đề ngắn hạn (xem bên dưới), dc_scaler là 8 (tức là tất cả hệ số Intra DC được thay đổi tỷ lệ với hệ số 8), nếu không dc_scaler được tính theo giá trị của QP (Bảng 5.4). Tất cả các biến hệ số khác (bao gồm cả AC và Inter DC) đều được thay đổi tỷ lệ như sau:

| F | = QP • (2 • | FQ | + 1) (nếu QP là kỳ quặc và FQ / = 0)

| F | = QP • (2 • | FQ | + 1) - 1 (nếu QP chẵn và FQ / = 0) (5.2) F = 0 (nếu FQ = 0)

FQ là hệ số lượng tử hóa và F là các thay đổi hệ số tỷ lệ. Các dấu hiệu của F được thực hiện giống như các dấu hiệu của FQ. Chuyển tiếp lượng tử không phải là de fi được xác định bởi các tiêu chuẩn.

Quét Zig-zag: lượng tử hóa DCT cients coef fi được sắp xếp lại trong một zig-zag quét trước khi mã hóa (xem Phần 3.4).

Mã hóa cấp trước: Các mảng sắp xếp lại tương ứng với mỗi khối được mã hóa để đại diện cho các số không hệ số hiệu quả. Mỗi số 0 Hệ số được mã hóa như một bộ ba của (cuối cùng, chạy, mức độ), nơi 'cuối cùng' chỉ ra cho dù đây là hệ thức khác không trong khối, 'chạy' tín hiệu số trước 0 và 'độ' chỉ ra ký tên và độ lớn.

mã hóa Entropy: thông tin Header và (cuối cùng, chạy, mức độ) ba (xem phần 3.5) biểu diễn bởi mã chiều dài thay đổi (VLCs). Các mã này cũng tương tự như mã Huffman và được mặc định trong tiêu chuẩn, dựa trên hệ số xác suất tính trước.

Một mã I-VOP bao gồm một tiêu đề VOP, tiêu đề gói tin video lựa chọn và roblocks mac- mã. Mỗi khối macro được mã hóa với một tiêu đề (mặc định loại khối macro, xác định những khối trong khối macro chứa hệ số mã, báo hiệu những thay đổi trong tham số lượng tử hóa, vv) tiếp theo là hệ số mã cho mỗi khối 8 × 8.

. Trong các bộ giải mã, trình tự của VLCs được giải mã để trích xuất các hệ số lượng tử hóa biến được tái thu nhỏ lại và biến đổi bởi một IDCT 8 × 8 để tái tạo lại được giải mã I-VOP (Hình 5.7). P-VOP

Một P-VOP được mã hoá với dự đoán Inter từ một mã hóa trước đó I- hoặc P-VOP (một VOP tham khảo). Các giai đoạn mã hóa và giải được thể hiện trong hình 5.8.

Ước lượng chuyển động và bồi thường thiệt hại: Đề án bồi thường chuyển động cơ bản là block bồi thường dựa trên macroblocks 16 × 16 điểm (xem Chương 3). Việc bù đắp giữa các khối mẫu hiện hành và các khu vực bồi thường trong bức ảnh tham khảo (các vecter chuyển động) có thể có độ phân giải half-pixel. Mẫu dự đoán tại các vị trí sub-pixel được tính và sử dụng Bilinear suy giữa các mẫu ở vị trí số nguyên-pixel. Các phương pháp chuyển động dự toán (lựa chọn tốt nhất 'vector chuyển động) là trái với ý của nhà thiết kế. (Dự đoán Motion-bù, MCP trong hình 5.8).

Các khu vực ing match- (hoặc dự đoán) được trừ từ các khối mẫu hiện nay để sản xuất ra một khối còn lại. Sau khi bồi thường chuyển động, các dữ liệu còn lại được chuyển đổi với DCT, lượng tử hóa, sắp xếp lại, chạy cấp mã hoá và mã hoá entropy. Các dư lượng tử hóa được thay đổi tỷ lệ và ngược lại biến đổi trong bộ mã hóa để tái tạo lại một bản sao cục bộ của MB được giải mã (để có thêm chuyển động bồi thường dự đoán). Một mã P-VOP gồm tiêu đề VOP, tùy chọn tiêu đề gói tin video và khối macro mã hóa từng chứa một header (lần này bao gồm các vector chuyển động theo kiểu khác được mã hóa) và mã hoá cho mỗi khối 8 × 8. Các bộ giải mã hình thức dự đoán bù chuyển động cùng dựa trên các vector chuyển động và nhận được bản sao riêng của địa

phương của VOP tham khảo. Các dữ liệu còn lại được giải mã được thêm vào dự đoán để tái tạo ra một khối giải mã (Motion-bù tái thiết, MCR trong hình 5.8).

Khối macro trong một P-VOP có thể được mã hóa trong chế độ Inter (với dự đoán chuyển động bồi thường từ các tài liệu tham khảo VOP) hoặc chế độ Intra (không chuyển động bồi thường dự đoán). Chế độ liên thông thường sẽ cung cấp cho các mã hóa tốt nhất fide tính hiệu nhưng chế độ Intra có thể hữu ích trong khu vực mà không có một trận đấu tốt trong một VOP trước đó, chẳng hạn như là một khu vực mới được đậy.

Tiêu đề ngắn

Các công cụ 'tiêu đề ngắn' cung cấp khả năng tương thích giữa MPEG-4 Visual và các tiêu chuẩn ITU-T H.263 mã hóa video. An I- hoặc P-VOP được mã hóa trong 'tiêu đề ngắn' chế độ có cú pháp giống hệt với một I-hình ảnh hay P-picture được mã hóa trong các chế độ cơ bản của H.263. Điều này có nghĩa rằng một MPEG-4 I-VOP hoặc P-VOP nên giải mã bởi một bộ giải mã H.263 và ngược lại.

Trong chế độ tiêu đề ngắn gọn, khối macro trong vòng một VOP được tổ chức trong nhóm khối gồm một hoặc nhiều hàng hoàn chỉnh của khối macro. Mỗi GOB có thể (tùy chọn) bắt đầu với một dấu (một fide cố định độ dài mã nhị phân cho phép một bộ giải mã để khi một lỗi là gặp phải, xem Phần 5.3.2.4).

5.3.2.3 Công cụ mã hóa tối ưu

Các công cụ sau đây, một phần của profile đơn giản, có thể cải thiện nén tối ưu. Họ chỉ được sử dụng khi chế độ tiêu đề ngắn không được kích hoạt

Hình 5.9 một hoặc 4 vector chuyển động trong 1khối macro Bốn vector chuyển động mỗi khối macro

Bồi thường chuyển động có xu hướng để có hiệu quả hơn với các kích thước khối nhỏ hơn. Kích thước khối mặc định bồi thường chuyển động là 16 × 16 mẫu (luma), 8 × 8 mẫu (chroma), kết quả là một vector chuyển động mỗi khối macro. Công cụ này cung cấp cho các bộ mã hóa tùy chọn để lựa chọn một kích thước khối nhỏ hơn đền bù chuyển động, 8 × 8 mẫu (luma) và 4 × 4 mẫu (chroma), cho bốn vector chuyển động mỗi khối macro. Chế độ này có thể có hiệu quả hơn trong việc giảm thiểu năng lượng trong dư bù chuyển động, đặc biệt là trong lĩnh vực chuyển động phức tạp hoặc ở gần ranh giới của các đối tượng chuyển. Có một chi phí tăng lên trong việc gửi bốn vector chuyển động thay vì một, và do đó, các bộ mã hóa có thể chọn để gửi một hoặc bốn vector chuyển động trên một cơ sở khối macro (Hình 5.9).

Không hạn chế chuyển động Vectors

Trong một số trường hợp, phù hợp nhất cho một khối macro có thể là một khu vực 16 × 16 mà kéo dài bên ngoài ranh giới của VOP tham khảo. Hình 5.10 cho thấy góc dưới bên trái của một VOP hiện tại (ảnh phải) và trước đó, tài liệu tham khảo VOP (ảnh bên trái). di chuyển vào các hình ảnh trong VOP hiện hành và do đó không phải là một trận đấu tốt cho các khối macro nhấn mạnh bên trong VOP tham khảo. Trong hình 5.11, các mẫu trong các VOP tham khảo đã được ngoại suy ('độn') vượt ra ngoài ranh giới của VOP. Một trận đấu tốt hơn cho các khối mẫu thu được bằng cách cho phép các vector chuyển động để trỏ vào khu vực ngoại suy này (các khối mẫu được đánh dấu trong hình 5.11 là trận đấu tốt nhất trong trường hợp này). Các công cụ không bị hạn chế Chuyển động Vectors (UMV) cho phép vector chuyển động đến điểm bên ngoài ranh giới của VOP tham khảo. Nếu một mẫu chỉ định bởi các vector chuyển động bên ngoài tham chiếu VOP, các mẫu cạnh gần nhất được sử dụng để thay thế. Chế độ UMV có thể cải thiện bù chuyển động tối ưu, đặc biệt là khi có đối tượng di chuyển vào và ra khỏi hình ảnh.

Dự đoán Intra

tần số chậm chuyển đổi của láng giềng trong nội bộ mã 8 × 8 khối thường tương quan. Trong chế độ này, DC Hệ số và (tùy chọn) hàng đầu tiên và cột của AC trong một Intra-mã hoá 8 × 8 khối được dự đoán từ nước láng giềng khối mã. Hình 5.12 cho thấy một khối macro được mã hóa trong chế độ nội và DCT cho mỗi khối luma bốn 8 × 8 được thể hiện trong hình 5.13. Các hệ số DC (trên cùng bên trái) là rõ ràng

Hình 5.12 Macroblock được mã hóa trong chế độ nội

tương tự nhưng nó là ít rõ ràng cho dù có sự tương quan giữa hàng đầu tiên kinh và cột của hệ số AC trong các khối.

Các hệ số DC của khối hiện nay (X trong hình 5.14) được dự đoán từ Hệ số DC của trên (C) hoặc bên trái (A) trước đây mã 8 × 8 khối. Các DC Hệ số giá trị thay đổi tỷ lệ của các khối A, B và C xác định các phương pháp dự đoán DC. Nếu A, B hoặc C là bên ngoài ranh giới VOP hoặc biên giới của các gói dữ liệu video hiện tại (xem phần sau), hoặc nếu họ không phải là nội mã, giá trị hệ số DC của họ được giả định là bằng 1024 (Hệ số DC của một khối giữa màu xám của mẫu). Sự chỉ đạo của các dự đoán được xác định bởi:

0 2 5 4 6 8 0 2 5 4 6 8 500 500 400 400 300 300 200 200 100 100 0 0 0 0 -100 -100

Upper left Upper right

Lower left Lower right

Hình 5.13 Hệ sốDCT (luma blocks) nếu | DCA - DCB | <| DCB - DCC | dự đoán từ khối C

khác

dự đoán từ khối A

Sự chỉ đạo của DC dốc nhỏ nhất sẽ được chọn làm hướng dự đoán cho khối X. Các dự đoán, PDC, được hình thành bằng cách chia hệ số DC, vùng lân cận chọn

33 5 0 0 4 0 0 3 0 0 2 0 0 1 0 0 0 - 1 0 0 0 2 4 6 8 5 5 0 0 4 0 0 3 0 0 2 0 0 1 0 0 0 - 1 0 0 0 2 5 4 6 8

Hình 5.14 Dự đoán hệ số DC

Hình 5.15 Dự đoán hệ số AC

khối bởi một yếu tố rộng và PDC sau đó được trừ vào thực tế lượng tử hóa hệ số DC (QDCX) và còn lại (PQDCX) được mã hoá và truyền đi.

Dự đoán hệ số AC được thực hiện theo một cách tương tự, với các dòng đầu tiên kinh hoặc cột của AC dự đoán theo hướng xác định cho các DC Hệ số (Hình 5.15). Ví dụ, nếu hướng dự đoán là từ khối A, cột gốc đầu tiên của AC trong khối X được dự đoán từ cột đầu tiên của khối A. Nếu hướng dự đoán là từ khối C, hàng đầu tiên của hệ số AC trong X được dự đoán từ hàng đầu tiên kinh của C. Các dự đoán được thu nhỏ tùy thuộc vào kích thước bước của khối X và A hoặc C.

công cụ Truyền dẫn hiệu suất

Các chi tiết profile đơn giản