H.264 là tiêu chuẩn nén hình ảnh, được biết đến như MPEG-4 Part 10 hoặc AVC (Advanced Video Coding). Phiên bản đầu tiên của H.264/AVC được hoàn thiện vào tháng 5/2003. H.264/AVC tạo ra một tiêu chuẩn có khả năng cung cấp chất lượng hình ảnh tốt tại tốc độ bít thấp hơn các tiêu chuẩn trước đó như MPEG-2, H.263, hoặc MPEG-4 mà không cần tăng độ phức tạp về cấu trúc. Hơn nữa tiêu chuẩn này được áp dụng cho các ứng dụng trên các hệ thống và mạng đa chủng loại, gồm tốc độ bít cao và thấp, lưu trữ DVD, quảng bá, hình ảnh với độ phân giải thấp và cao, các mạng gói RTP/IP, và các hệ thống điện thoại đa phương tiện ITU-T.
H.264 được đặt tên theo dòng tiêu chuẩn H.26x của ITU-T, trong khi AVC theo phía ISO/IEC MPEG. Mục đích của H.264 là tạo ra một chuẩn có khả năng cung cấp chất lượng video cao ở tốc độ bit thấp hơn hẳn (bằng một nửa hoặc thấp hơn nữa) so với yêu cầu của các chuẩn trước đó (MPEG-2, H.263 hay MPEG-2 Part 2) mà không làm tăng nhiều sự phức tạp trong thiết triển khai. Một mục tiêu khác đó là cho phép tiêu chuẩn được áp dụng cho nhiều kiểu ứng dụng (cho cả tốc độ bit thấp và cao, và cả độ phân giải video thấp và cao) và có thể làm việc tốt trên nhiều kiểu mạng và hệ thống (quảng bá, lưu trữ DVD, mạng gói RTP/IP, các hệ thống điện thoại đa phương tiện của ITU-T).
JVT gần đây đã hoàn thiện việc phát triển một số mở rộng so với chuẩn ban đầu, được biết đến với tên gọi Mở rộng phạm vi độ trung thực (Fidelity Range Extensions, FRExt). Các mở rộng này hỗ trợ mã hóa video trung thực cao bằng cách tăng độ chính xác lấy mẫu (bao gồm mã hóa 10 bit và 12 bit) và thông tin mầu sắc độ phân giải cao (bao gồm các cấu trúc lấy mẫu YUV 4:2:2 và YUV 4:4:4). Nhiều đặc điểm khác cũng được thêm vào trong các mở rộng FRExt như chuyển đổi thích ứng giữa các khối 4x4 và
8x8, các ma trận trọng số lượng tử hóa dựa trên cảm biến của các bộ mã hóa cụ thể, hỗ trợ thêm nhiều không gian mầu sắc, ...
Một số tính năng mới của H.264/MPEG-4 Part 10 cho phép chuẩn này nén các tín hiệu video hiệu quả hơn so với các chuẩn cũ và và linh hoạt hơn cho các ứng dụng trong các môi trường mạng. Một số các tính năng quan trọng đó là:
− Bù chuyển động đa hình sử dụng các hình ảnh đã được mã hóa trước đó làm tham chiếu theo cách linh hoạt hơn các chuẩn cũ, cho phép lên tới 32 hình ảnh tham chiếu được sử dụng (các chuẩn cũ chỉ sử dụng 1, hoặc 2 với trường hợp B picture). Tính năng đặc biệt này cho phép cải thiện tốc độ bit và chất lượng trong hầu hết các trường hợp.
− Bù chuyển động block có kích thước biến đổi với kích thước block rộng đến 16x16 và nhỏ đến 4x4, cho phép phân mảnh chính xác các vùng chuyển động.
− Cấu trúc cặp macroblock, cho phép các macroblock kích thước 16x16 (so với 16x8 ở MPEG-2).
− Độ chính xác bù chuyển động lên đến 1/4 pixel, cho phép thể hiện chính xác các dịch chuyển của vùng chuyển động.
− Đánh số khung, cho phép tạo ra các chuỗi con (điều chỉnh về thời gian bằng cách gộp một ảnh giữa các ảnh khác), phát hiện và giấu các hình bị mất (xảy ra do mất gói trên mạng hoặc lỗi kênh).
− Đếm thứ tự hình, cho phép giữ các hình và các giá trị mẫu theo trật tự trong các hình được giải mã tách biệt với thông tin định thời (cho phép thông tin định thời được chuyển đi và điều khiển độc lập bởi hệ thống mà không ảnh hưởng đến nội dung hình ảnh được giải mã).
Các kỹ thuật này, cùng với nhiều kỹ thuật khác, làm cho H.264 hoạt động tốt hơn so với các tiêu chuẩn trước, trong nhiều trường hợp và môi trường ứng dụng khác nhau. H.264 thường làm việc tốt hơn rất nhiều so với MPEG-2, cho chất lượng tốt hơn ở tốc độ bít chỉ bằng một nửa hoặc thấp hơn so với yêu cầu của MPEG-2. H.264 cung cấp các profile sau:
− Baseline profile (BP): Dùng cho các ứng dụng chi phí thấp đòi hỏi ít tài nguyên hơn, chủ yếu dùng cho các ứng dung hội nghị truyền hình và di động.
− Main Profile (MP): Dùng cho các ứng dụng quảng bá và lưu trữ.
− Extended profile (XP): Có khả năng nén khá cao, giảm thiểu khả năng mất dữ liệu.
− High Profile (HiP): Dùng cho các ứng dụng quảng bá và lưu trữ đĩa, đặc biệt cho các ứng dụng truyền hình yêu cầu độ nét cao (HD-DVD, Bluray disc).
− High 10 Profile (Hi10P): Được xây dựng bên trên của HiP, hỗ trợ độ 10 bit trên một mẫu của độ chính xác của hình ảnh được giải mã.
− High 4:2:2 Profile (Hi422P): dùng cho các ứng dụng chuyên nghiệp sử dụng video quét xen kẽ, được xây dựng bên trên của Hi10P, hỗ trợ khuôn dạng lấy mẫu sắc độ 4:2:2 trong khi sử dụng 10 bit trên một mẫu của độ chính xác của hình ảnh được giải mã.
− High 4:4:4 Profile (Hi444P): được xây dựng bên trên của Hi422P, hỗ trợ lấy mẫu sắc độ 4:4:4, lên đến 12 bit trên một mẫu.
MPEG đã tích hợp đầy đủ các hỗ trợ của H.264/AVC vào các hệ thống tiêu chuẩn của mình (MPEG-2 và MPEG-4) và các tập tin đa phương tiện theo tiêu chuẩn ISO.
ITU-T đã đưa H.264/AVC vào bộ tiêu chuẩn H.32x cho hệ thống điện thoại đa phương tiện. Dựa trên các tiêu chuẩn ITU-T, H.264/AVC được sử dụng rộng rãi cho ứng dụng hội nghị truyền hình, và đã được ứng dụng trong các sản phẩm của các công ty chiếm ưu thế trên thị trường (như Polycom và Tendberg). Điều quan trọng hơn cả là tất cả các sản phẩm hội nghị truyền hình mới đều hỗ trợ H.264/AVC.
H.264 cũng được sử dụng trong nhiều loại dịch vụ Video-on-Demand trên Internet để cung cấp phim và các show diễn truyền hình trực tiếp đến máy tính và máy thu hình và có khả năng sẽ thay thế chuẩn mã hóa H.262/MPEG-2 hiện tại đang sử dụng trong các hệ thống truyền hình số quảng bá mặt đất và vệ tinh.
Yêu cầu về băng thông của các chuẩn nén:
− Có thể thấy được từ đồ thị so sánh ở trên, kỹ thuật mã hóa H.264 rất hiệu quả ở dải băng thông thấp. Chất lượng video của chuẩn H.264 tại băng thông 1,5 Mbps tốt hơn so với chuẩn MPEG-2 ở băng thông 3 Mbps. Sử dụng chuẩn nén H.264 có thể tiết kiệm được hơn một nửa băng thông.
Các lợi ích của H.264/AVC:
− Hiệu quả nén gấp đôi, tốc độ nén bằng một nửa so với chuẩn MPEG-2 yêu cầu đối với hình ảnh chất lượng cao và giảm được được dung lượng lưu trữ cần thiết.
− Cho phép nhiều nội dung hơn được truyền đi trên hệ thống có sẵn với tốc độ bít thấp hơn.
− Chi phí truyền dẫn thấp hơn do thời gian truyền giảm một nửa.
− Chi phí triển khai thấp hơn với công nghệ H.264/AVC xây dựng trên nền tảng tiêu chuẩn, phần cứng xử lí không độc quyền.
− Kết hợp hợp với một lớp thích ứng mạng (Network Adaptation Layer) để cung cấp một cách linh hoạt khả năng truyền tải qua mạng chuyển mạch gói và luồng bít, cho phép nâng cấp một cách dễ dàng các giải pháp phân phối dựa trên MPEG-2.
− Sử dụng một thiết lập chung về công nghệ giữa mobile và IPTV: luồng TCP/UDP + H.264/AVC.
Bảng 2.2 Yêu cầu về băng thông đối với các chuẩn nén
Độ nét tiêu chuẩn Độ nét cao Ứng dụng
MP3
MPEG-2 4 - 5 Mbps 18 - 20 Mbps Digital TV, DVD
MPEG-4 Part 10; H.264 2 - 4 Mbps 8 - 10 Mbps Multi video
Hình 2.4 So sánh hoạt động của các chuẩn nén
Hình 2.5 So sánh về yêu cầu băng thông, lưu trữ và thời gian tải của các chuẩn nén