H.264/AVC (Advanced Video Coding) là một tiờu chuẩn cho việc nộn video, quỏ trỡnh biến đổi dữ liệu video kỹ thuật số thành một định dạng mà chiếm ớt dung lƣợng hơn khi nú đƣợc lƣu trữ hoặc truyền đi. Nộn video (hay mó húa video) là một cụng nghệ vụ cựng quan trọng cho cỏc ứng dụng bao gồm truyền hỡnh dữ liệu số, video DVD, TV di động, họp hội nghị qua video và truyền video Internet. Tiờu chuẩn húa nộn video giỳp cỏc sản phẩm từ cỏc nhà sản xuất khỏc nhau (vớ dụ cỏc bộ mó húa, cỏc bộ giải mó và phƣơng tiện lƣu trữ) cú thể vận hành qua lại. Một bộ mó húa chuyển video thành một định dạng nộn và một bộ giải mó chuyển video nộn ngƣợc lại thành một định dạng khụng nộn.
H.264/AVC - “Advanced Video Coding” là một tài liệu đƣợc cụng bố bởi cơ quan tiờu chuẩn quốc tế ITU-T (liờn hiệp viễn thụng quốc tế) và ISO/IEC (tổ chức tiờu chuẩn húa quốc tế và Ủy ban kỹ thuật điện tử quốc tế) ban hành. Nú định nghĩa một định dạng cho video đƣợc nộn và một phƣơng phỏp giải mó cỳ phỏp này để tạo ra một chuỗi video cú thể hiển thị đƣợc. Tài liệu tiờu chuẩn khụng thực sự chỉ cỏch mó húa (nộn) video dữ liệu số - điều này trỏi với cỏc nhà sản xuất của bộ mó húa
video. Trong thực tế, bộ mó húa chắc chắn phản ỏnh những thao tỏc của quỏ trỡnh giải mó.
Cỏc tiờu chuẩn H.264/AVC đƣợc cụng bố lần đầu tiờn vào năm 2003. Nú xõy dựng dựa trờn cỏc khỏi niệm về cỏc tiờu chuẩn trƣớc đú nhƣ MPEG-2, MPEG-4 và cung cấp một khả năng nộn tiờn tiến và hiệu quả (tức là chất lƣợng nộn video tốt hơn) và linh hoạt hơn trong nộn, truyền tải và lƣu trữ video
2.4.4.1. í tưởng của chuẩn H.264
Một bộ mó húa video H.264 thực hiện cỏc quỏ trỡnh mó húa, biến đổi và dự bỏo (xem trong hỡnh
2.5) để tạo ra một dũng bit đƣợc nộn. Một bộ giải mó video H.264 thực hiện cỏc quỏ trỡnh bổ sung bao gồm giải mó, biến đổi ngƣợc và thiết lập lại để tạo ra một chuỗi video đƣợc giải mó.
2.4.4.2. Thuật toỏn H.264
a. Quỏ trỡnh mó húa
Khối dự đoỏn (Prediction):
Bộ mó húa xử lý một khung hỡnh của video trong cỏc đơn vị của một Macroblock - MB (16x16 pixel). Nú tạo thành một dự đoỏn của MB dựa trờn dữ liệu đó mó húa trƣớc đú, hoặc từ khung hỡnh hiện tại (dự đoỏn Intra) hoặc những khung hỡnh khỏc để đƣợc mó hoỏ
và truyền (dự đoỏn Inter). Bộ mó húa khử dự đoỏn từ MB hiện tại để tạo ra một phần dƣ.
Hỡnh 2.5: Quỏ trỡnh mó húa và giải mó video H.264
Hỡnh 2.7: Dự đoỏn Inter.
Cỏc phƣơng thức dự đoỏn đƣợc hỗ trợ bởi chuẩn H.264 linh hoạt hơn so với cỏc tiờu chuẩn trƣớc đú, cho phộp dự đoỏn chớnh xỏc và do đú nộn video hiệu quả. Dự đoỏn Intra sử dụng khối kớch cỡ 16x16 và 4x4 để dự đoỏn MB từ xung quanh, cỏc điểm ảnh đó đƣợc mó húa trƣớc đú trong cựng một khung hỡnh (hỡnh 2.6).
Dự đoỏn Inter dựng một dóy cỏc khối kớch thƣớc (từ 16x16 xuống cũn 4x4) để dự đoỏn cỏc ảnh điểm trong cựng khung từ cỏc miền giống nhau trong cỏc khung đƣợc mó húa trƣớc đõy (Hỡnh 2.7)
Biến đổi và lượng tử húa
Một khối mẫu cũn lại đƣợc chuyển đổi bằng cỏch sử dụng một phộp biến đổi nguyờn 4x4 hoặc 8x8, một dạng gần đỳng của phộp biến đổi Cosin rời rạc (DCT). Kết quả đầu ra của sự biến đổi là một dóy cỏc hệ số, mỗi một trong số đú là một giỏ trị trọng số cho một mụ hỡnh cơ sở tiờu chuẩn. Khi đƣợc kết hợp, cỏc mụ hỡnh trọng số cơ sở tỏi tạo khối cỏc mẫu cũn lại. Hỡnh 2.8 cho thấy làm thế nào để đảo ngƣợc DCT tạo ra một khối hỡnh ảnh bằng cỏch gỏn trọng số cho mỗi mụ hỡnh cơ sở theo một hệ số xỏc định và kết hợp cỏc trọng số của mụ hỡnh cơ sở.
Đầu ra của phộp biến đổi, một khối cỏc hệ số biến đổi đƣợc lƣợng tử húa, tức là mỗi hệ số đƣợc chia bởi một giỏ trị số nguyờn. Sự lƣợng tử húa làm giảm độ chớnh xỏc của hệ số biến đổi theo một tham số lƣợng tử húa (QP). Thụng thƣờng, kết quả là một khối trong đú hầu hết hoặc tất cả cỏc hệ số là số 0, với một vài hệ số
khỏc khỏc 0. Đặt cho QP đến một giỏ trị lớn, cú nghĩa càng cú thờm nhiều cỏc hệ số 0, giỳp ta giải mó chất lƣợng hỡnh ảnh trong mức độ nộn lớn, với mức chi phớ thấp nhất. Đặt QP một giỏ trị nhỏ cú nghĩa là nhiều hệ số khỏc 0 cũn lại sau khi lƣợng tử húa, dẫn đến chất lƣợng hỡnh ảnh đƣợc giải mó tốt hơn nhƣng nộn thấp hơn.
Mó húa dũng bớt
Quỏ trỡnh mó húa video tạo ra một số giỏ trị đƣợc mó húa để tạo thành luồng bớt nộn. Những giỏ trị này bao gồm:
- Hệ số biến đổi đƣợc lƣợng tử húa.
- Thụng tin cho phộp cỏc bộ giải mó để tạo ra cỏc dự đoỏn.
- Thụng tin về cấu trỳc của dữ liệu nộn và cỏc cụng cụ nộn đƣợc sử dụng trong quỏ trỡnh mó húa.
- Thụng tin về một chuỗi video đầy đủ.
Những giỏ trị và cỏc thụng số (cỏc thành phần cỳ phỏp) đƣợc biến đổi thành mó nhị phõn bằng cỏch sử dụng độ dài biến mó húa và mó húa số học. Mỗi phƣơng phỏp mó húa tạo ra sự biểu diễn nhị phõn của thụng tin hiệu quả và gọn nhẹ. Cỏc luồng bớt đƣợc mó húa sau đú cú thể đƣợc lƣu trữ và truyền đi.
Hỡnh 2.8: Biến đổi ngược: Kết hợp cỏc cấu trỳc gốc được gắn trọng số đờ̉ tạo ra một khối hỡnh ảnh 4x4.
b. Quỏ trỡnh giải nộn
Luồng bớt đƣợc giải mó
Một bộ giải mó video nhận đƣợc từ luồng bớt nộn H.264, giải mó mỗi cỳ phỏp cỏc yếu tố và trớch rỳt cỏc thụng tin mụ tả ở trờn (lƣợng biến đổi hệ số, dự đoỏn thụng tin, v..v..). Sau đú, thụng tin này đƣợc sử dụng để đảo ngƣợc quỏ trỡnh mó húa và tạo một chuỗi cỏc hỡnh ảnh video.
Phộp biến đổi ngƣợc và thay đổi tỉ lệ
Cỏc hệ số biến đổi đƣợc lƣợng tử húa để thu nhỏ lại. Mỗi hệ số đƣợc nhõn một giỏ trị số nguyờn để khụi phục lại quy mụ ban đầu của nú. Một phộp biến đổi ngƣợc kết hợp cỏc mẫu cơ sở tiờu chuẩn, trọng sơ bởi cỏc hệ số đƣợc thu nhỏ lại, để tỏi tạo mỗi khối dữ liệu cũn lại. Cỏc khối đƣợc kết hợp với nhau để tạo thành một MB cũn lại.
Tỏi tạo
Đối với mỗi MB, bộ giải mó tạo nờn một dự đoỏn trựng với một trong cỏc dự đoỏn đƣợc tạo ra bởi cỏc bộ mó húa. Bộ giải mó cho biết thờm dự đoỏn cũn lại để giải mó để tỏi tạo lại một MB đƣợc giải mó sau đú cú thể đƣợc hiển thị nhƣ là một phần của một khung hỡnh video.
2.4.4.3. Chuẩn H.264 trờn thực tế
a. Tớnh năng hoạt động
Cú lẽ lợi ớch lớn nhất của chuẩn H.264 so với cỏc tiờu chuẩn trƣớc là hiệu quả nộn của nú. So với cỏc tiờu chuẩn nhƣ MPEG-2 và MPEG-4 thỡ H.264 cú thể cung cấp:
Chất lƣợng hỡnh ảnh tốt hơn ở cựng 1 tỉ lệ bớt đƣợc nộn.
Một tỉ lệ bớt đƣợc nộn thấp hơn cho cựng một chất lƣợng hỡnh ảnh.
Vớ dụ, một DVD một lớp cú thể lƣu trữ một bộ phim dài khoảng 2 tiếng trong định dạng MPEG-2. Dựng H.264, đĩa đú cú thể lƣu trữ bộ phim kộo dài 4 tiếng hay nhiều hơn của video chất lƣợng phim ảnh (vớ dụ: tỉ lệ bớt thấp hơn cho chất lƣợng giống nhau). Định dạng nộn H.264 cú thể truyền đi với chất lƣợng tốt hơn ở cựng 1 tỉ lệ bớt so với MPEG-2 và MPEG-4 (Hỡnh 2.9).
Cải thiện hiệu suất nộn H.264 làm cho chi phớ tớnh toỏn cao hơn. H.264 tinh vi hơn phƣơng phỏp nộn trƣớc đú và điều này cú nghĩa là cần nhiều năng lƣợng hơn cho quỏ trỡnh nộn và giải nộn video H.264.
b. Cỏc ứng dụng của chuẩn H.264
Ngoài cải tiến hiệu suất nộn, H.264 cung cấp tớnh linh hoạt về mặt cỏc lựa chọn nộn và hỗ trợ truyền tải. Một bộ mó húa H.264 cú thể lựa chọn từ sự đa dạng của cỏc cụng cụ nộn, làm cho nú phự hợp với cỏc ứng dụng khỏc nhau từ tỉ lệ bớt thấp, độ chậm trễ truyền thụng di động thấp, qua đú thỡ số khỏch hàng tăng cao để sản xuất TV chuyờn nghiệp. Tiờu chuẩn này cung cấp hỗ trợ tớch hợp cho sự truyền tải hoặc lƣu trữ, bao gồm 1 gúi định dạng đƣợc nộn và tớnh năng trợ giỳp làm giảm thiểu ảnh hƣởng của cỏc lỗi truyền.
H.264/AVC đang đƣợc ứng dụng trong một loạt cỏc ứng dụng ngày càng phổ biến bao gồm:
DVD độ nột cao (định dạng HD-DVD và Blu-Ray).
TV độ nột cao phỏt súng ở Chõu Âu.
Cỏc sản phẩm của Apple: tải video iTunes, video iPod và MacOS.
Phỏt súng TV di động; Video internet; Họp hội nghị qua video.
Trờn đõy em đó giới thiệu qua thuật toỏn nộn và giải nộn chuẩn H.264/AVC và nhƣ vậy chuẩn AIC sẽ là sự kết hợp giữa chuẩn H.264 và chuẩn nộn ảnh JPEG để trở thành chuẩn nộn ảnh tối ƣu hơn, đạt tốc độ nộn nhanh mà chất lƣợng ảnh cú thể tốt hơn.
Hỡnh 2.9: Một khung video được nộn tại cựng một tỉ lệ bớt dựng MPEG-2 (trỏi), MPEG-4 bằng mắt (giữa) và nộn H.264 (phải).