IV. Tổng quan về công nghệ MPEG-4 part 10
1. Cấu trúc phân lớp của H.264/AVC
Với sự gia tăng các ứng dụng và dịch vụ trên nhiều mạng thì câu hỏi ựặt ra là làm thế nào quản lắ ựược các ứng dụng ựó. Do vậy, chuẩn H.264/AVC phải có ựộ linh hoạt cao và có thể ứng dụng trên nhiều mạng khác nhaụ Do ựó, chuẩn H.264/AVC ựược thiết kế theo phân lớp mã hóa video VCL ( Video Coding Layer) và lơp NAL làm nhiệm vụ tương thắch với môi trường mạng khác nhaụ
Hình 3.5: Cấu trúc phân lớp của H.264
điều khiển dữ liệu
Lớp mã hóa video
Phân chia dữ liệu
Lớp mạng NAL
Truyền hình IPTV và khả năng ứng dụng tại Việt Nam
Học Viên thực hiện: Lưu Văn Hải Page 70
1.1. Lớp mạng NAL ( Network Abstration Layer) NAL có khả năng ánh xạ từ lớp VCL ựến lớp truyền tải:
+ RTP/IP cho dịch vụ thời gian thực qua mạng Internet (conversational và streaming). + định dạng file: ISO MP4 cho lưu trữ và truyêng tải MMS.
+ H32x cho các dịch vụ ựàm thoại có dây và không dâỵ + Dòng truyền tải MPEG-2 cho các dịch vụ quảng bá.
Gói NAL: dữ liệu video ựược mã hóa ựược tổ chức trong một ựơn vị NAL( hay gói NAL). Mỗi gói có ựộ dài tắnh theo bytẹ Byte ựầu tiên của mỗi gói NAL là byte mào ựầu, nó chỉ rõ loại dữ liệu ựược chứa trong NAL, các byte còn lại chứa dữ liệụ
Phần dữ liệu của NAL ựược ghép xen.
Cấu trúc của ựơn vị NAL có ựịnh dạng chung cho việc sử dụng truyền trong hệ thống hướng bit và hướng góị
1.2. Lớp mã hóa video:
Lớp mã hóa video của H.264/AVC thì tương tự với các tiêu chuẩn khác như MPEG-2 videọ Nó là sự kết hợp dự ựoán theo thời gian và theo không gian,vàvới mã chuyển vị. Ảnh ựược tách thành các khốị Ảnh ựầu tiên của dãy hoặc ựiểm truy nhập ngẫu nhiên thì ựược mã hóa ỘIntraỢ, có nghĩa là không dùng thông tin nào ngoài thông tin chứa trong bản thân ảnh. Mỗi mẫu của một khối trong một frame Intra ựược dự ựoán nhờ dùng các mẫu không gian bên cạnh của các khối ựã mã hóa trước ựó. đối với tất cả các ảnh còn lại của dãy hoặc giữa các ựiểm truy cập ngẫu nhiên, mã hóa ỘInterỢ ựược sử dụng, dùng dự ựoán bù chuyển ựộng từ các ảnh ựược mã hóa trước.
1.3.Khái niệm về ảnh, khung, bán ảnh, macroblock
Tắn hiệu video ựược mã hóa trong H.264 bao gồm tập hợp các ảnh ựược mã hóa có trật tự. Một ảnh có thể biểu diễn bằng cả một khung hoặc một bán ảnh. Nhìn chung, một khung gồm có hai bán ảnh xen kẽ nhau: bán ảnh trên và bán ảnh dướị Bán ảnh trên gồm các dòng chẵn 0, 2, 4, Ầ, H/2 -1, với H là tổng số dòng trong một khung. Bán ảnh dưới gồm các dòng lẻ và bắt ựầu từ dòng thứ 2.
Truyền hình IPTV và khả năng ứng dụng tại Việt Nam
Học Viên thực hiện: Lưu Văn Hải Page 71
Hình 3.6: Các bán ảnh trong một khung
Các macroblock: Mỗi ảnh video, frame hoặc field, ựược chia thành các macroblock có kắch thước cố ựịnh bao trùm một diện tắch ảnh hình chữ nhật gồm 16 x 16 mẫu thành phần luma và 8 x 8 mẫu cho mỗi một trong hai thành phần chromạ Tất cả các mẫu macroblock luma hoặc chroma ựược dự ựoán theo không gian hoặc thời gian, và dự ựoán tại chỗ hợp thành ựược truyền ựi nhờ dùng mã chuyển vị. Do vậy mỗi thành phần màu dự ựoán tại chỗ ựược chia nhỏ thành các khốị Mỗi khối ựược biến ựổi nhờ dùng biến ựổi nguyên (an integer transform), và các hệ số biến ựổi ựược lượng tử hóa và ựược truyền ựi bằng phương pháp mã hóa entropỵ
Các macroblock ựược tổ chức thành các slice, biểu diễn các tập con của ảnh ựã cho và có thể ựược giải mã ựộc lập. Thứ tự truyền các macroblock trong dòng bit phụ thuộc vào bản ựồ phân phối Macroblock (Macroblock Allocation Map) và không nhất thiết phải theo thứ tự quét. H.264 / AVC hỗ trợ năm dạng mã hóa slice khác nhaụ đơn giản nhất là slice I (Intra), trong ựó tất cả macroblock ựược mã hóa không có tham chiếu tới các ảnh khác trong dãy videọ Tiếp theo là các slice P và B, ở ựó việc mã hóa có tham chiếu tới các ảnh trước nó (slice P) hoặc cả ảnh trước lẫn ảnh sau (slice B). Hai dạng slice còn lại là SP (switching P) và SI (switching I), ựược xác ựịnh cho chuyển mạch hiệu quả giữa các dòng bit ựược mã hóa ở các tốc ựộ bit khác nhaụ