d. Thứ tự truyền dẫ nv thứ tự hiển thị ảnh μ
2.3.3.4. MPEG-4 AVC/H.264 (Part 10).
MPEG-4 Part 10 mới đợc thêm vào gần đây, cũng đợc gọi là MPEG-4 AVC (mã hoá Video tiên tiến) hay H.264, đa ra khả năng nén với tỷ lệ lớn hơn. Nó có thể cung cấp chất lợng Video DVD với tốc độ bit nhỏ hơn 40% so với MPEG-2 và hứa hẹn thích hợp cho Video chuyển động đầy đủ qua các kết nối không dây, vệ tinh, và Internet ADSL. Nó cũng là một trong các bộ mã hoá/ giải mã Video đã đợc lựa chọn cho HD DVD Laser Blue Ray.
H.264 cũng sử dụng các d thừa không gian, thời gian và tâm lý thị giác để cải thiện hiệu suất nén Video. Các cấu trúc thêm so với MPEG-2 chứa trong H.264 bao gồm:
Dự đoán chuyển động kích thớc khối thay đổi với các kích thớc khối nhỏ tới 4x4 pixel.
Bù chuyển động độ chính xác 1/ 4 mẫu cho chuyển động mềm mại hơn.
Các vector chuyển động qua các biên ảnh tơng phản với ảnh tham chiếu đợc giải mã trớc đó.
Bù chuyển động nhiều ảnh tham chiếu, so với chỉ một ảnh trớc đó trong các bộ mã hoá/ giải mã đã có.
Tách thứ tự tham chiếu từ thứ tự hiển thị cho độ mềm dẻo cao hơn và loại bỏ các trễ phụ liên kết với mã hoá dự đoán hai hớng.
Tách các phơng pháp thể hiện ảnh với khả năng tham chiếu ảnh.
Dự đoán lợng giá cho phép tín hiệu dự đoán bù chuyển động đợc lợng giá và bù một lợng xác định bởi bộ mã hoá. Điều này có thể cải thiện hiệu suất nén rất lớn cho các cảnh chứa các bóng mờ, và cũng có thể đ- ợc sử dụng mềm dẻo cho các mục đích khác.
Cải thiện suy luận chuyển động "bỏ qua" và "trực tiếp" để mã hoá tốt hơn Video chứa chuyển động toàn cục.
Dự đoán không gian có hớng cho mã hoá Intra, ngoại suy các cạnh của các phần đợc giải mã trớc đó của ảnh hiện thời và dùng nó trong các miền của ảnh đợc mã hoá Intra. Điều này cải thiện chất lợng của dự đoán tín hiệu, và cũng cho phép dự đoán từ các miền lân cận không đợc mã hoá sử dụng mã hoá Intra.
Lọc tách khối lặp để giảm lỗi khối.
Nén Video sử dụng H.264/ AVC tạo ra Video ở tốc độ bit thấp hơn điển hình 2 đến 4 lần so với MPEG-2 và chuẩn nén MPEG-4 trớc đó, ở các mức chất lợng Video tơng ứng.
Sơ đồ hoạt động của bộ mã hoá và giải mã H.264
Bộ mã hoá có thể đợc chia làm 2 phần chính (phân theo 2 dòng dữ liệu) đó là: phần thuận (từ trái qua phải) và phần tái tạo (từ phải qua trái).
Bộ mã hoá (phần thuận) hoạt động nh sau:
• Một khung hình hay một mành đầu vào Fn đợc xử lý ở các đơn vị một khối macroblock.
• Khi chế độ mã hoá theo thời gian đợc tiến hành: ở hình 3.4, Fn đợc so sánh với khung hình tham khảo biểu diễn bởi F’
n-1 trên hình, tiến hành quá trình ớc lợng chuyển động ME. Độ sai khác thu đợc khi ớc lợng chuyển động giữa vị trí macroblock hiện tại với macroblock đợc chọn tham khảo biểu diễn dới dạng một vector chuyển động. Dựa trên vector chuyển động, quá trình bù chuyển động theo thời gian (MC) diễn ra (tại nút P).
Khi chế độ mã hoá theo không gian đợc tiến hành, Fn đợc tiến hành bù chuyển động theo khung hình tại nút P, với các hình ảnh tham khảo là các khung hình đã đợc tái tạo trớc đó F’
n.
• Dự đoán P đợc trừ từ các macroblock tham khảo cho các macroblock hiện tại để tạo ra macroblock Dn thể hiện độ sai khác (độ d thừa dữ liệu).
• Dn đợc biến đổi (T) và lợng tử hoá Q, cho đầu ra là các hệ số X. Các hệ số đầu ra đợc sắp xếp lại và mã hoá entropy.
• Sau cùng các hệ số, các vector chuyển động, các thông tin header cho từng macroblock tạo dòng bit qua nén sẵn sàng cho qua NAL (Network Abstraction Layer) để truyền dẫn và lu trữ.
Hình 2.15. Sơ đồ nguyên lý của bộ mã hoá
Bộ mã hoá (phần tái tạo lại):
• Các hệ số X đợc thay đổi lại tỉ lệ (Q-1) và biến đổi ngợc (T-1) tạo phần sai khác D’
n đã qua giải mã.
• Quá trình dự đoán bù chuyển động P đợc thêm vào D’
n tái tạo một macroblock (uFn); sau khi đợc đa qua bộ lọc macroblock này đợc lu lại làm khung ảnh tham khảo F’
n cho các khung hình mã hoá tiếp sau.
Bộ giải mã hoạt động nh sau: Bộ giải mã nhận một chuỗi bit nhị phân đã đợc nén từ NAL.
• Tiến hành giải mã entropy luồng bit nén thành các hệ số lợng tử X.
50 NAL NAL X D n D’ n + + - + P Trong ảnh Liên ảnh uF’ n Fn (Hiện tại) F’ n (Xây dựng lại) ME MC Chọn dự đoán trong ảnh Dự đoán trong ảnh Bộ lọc T Q T-1 Q-1 Xếp lại thứ tự Mã hoá Entropy F’ n-1 (Tham chiếu)
• Mã hoá run-level và sắp xếp lại đợc thiết lập (lúc này theo chiều nghịch). X đợc thay đổi lại tỉ lệ (Q-1) và biến đổi ngợc (T-1) tạo phần sai khác D’
n đã qua giải mã.
• Sử dụng các thông tin về header đã giải mã, bộ giải mã tái tạo ra các block dự đoán P.
• P đợc thêm vào D’ để tái lập ra macroblock uF’
n. Macroblock đợc tái tạo qua bộ lọc sẽ đợc lu lại và sử dụng để tạo nên khung hình đợc giải mã F’
n.
Hình 2.16. Sơ đồ nguyên lý bộ giải mã H.264 ME: ớc lợng chuyển động
MC: bù chuyển động T (transform): Biến đổi
Q (Quantisation): Quá trình lợng tử hóa
Trên hình vẽ ta thấy có bộ lọc đợc sử dụng. Bộ lọc tích hợp này giúp cải thiện chất lợng cho ảnh đợc tái tạo (để sử dụng cho quá trình dự đoán về thời gian), không áp dụng cho các macroblock đợc tái tạo cho quá trình dự đoán trong khung hình.