Ch−ơng III: Nén video theo chuẩn MPEG
3.3. Nén tín hiệu video theo MPEG-
3.3.1. Tiêu chuẩn nén video MPEG-2
Tiêu chuẩn MPEG-2 còn đ−ợc gọi là ISO/IEC 13818 là sự phát triển tiếp theo của MPEG-1 ứng dụng cho độ phân giải tiêu chuẩn của truyền hình do CCIR- 601 qui định.
MPEG 2 gồm 4 phần:
ắ Phần 1: Hệ thống (ISO/IEC 13818-1): xác định cấu trúc ghép kênh audio, video và cung cấp đồng bộ thời gian thực.
ắ Phần 2: Video (ISO/IEC 13828-2): xác định những thành phần mã hóa đại diện cho dữ liệu video và phân loại xử lý giải mã để khôi phục lại khung hình ảnh.
ắ Phần 3: Audio (ISO/IEC 13818-3): mã hóa và giải mã dữ liệu âm thanh.
ắ Phần 4: Biểu diễn (ISO/IEC 13818-3): định nghĩa quá trình kiểm tra các yêu cầu của MPEG-2 .
So với MPEG-1, MPEG-2 có nhiều cải thiện, ví dụ về kích th−ớc ảnh và độ phân giải ảnh, tốc độ bit tối đa, tính phục hồi lỗi, khả năng co giãn dòng bit. Khả năng co giãn dòng bit của MPEG-2 cho phép khả năng giải mã một phần dòng bit mã hóa để nhận đ−ợc ảnh khôi phục có chất l−ợng tuỳ thuộc mức độ yêu cầu.
Sau đây là một số đặc điểm chủ yếu của tiêu chuẩn này :
♦ Hỗ trợ nhiều dạng thức video, đặc biệt là các dạng thức video độ phân giải không gian cao, dạng thức video xen kẽ của truyền hình.
♦ Cú pháp dòng bit MPEG-2 là sự mở rộng của dòng bit MPEG-1.
♦ Nén video MPEG-2 t−ơng hợp với nén video MPEG-1. Đ−ợc thể hiện qua 4 hình thức t−ơng hợp.
∗ T−ơng hợp thuận: bộ giải mã MPEG-2 có khả năng giải mã dòng bit (hoặc một phần dòng bit MPEG-1).
∗ T−ơng hợp ng−ợc: bộ giải mã MPEG-1 có khả năng giải mã đ−ợc một phần dòng bit MPEG-2.
∗ T−ơng hợp lên: bộ giải mã độ phân giải cao có khả năng giải mã đ−ợc dòng bit của bộ mã hoá có độ phân giải thấp.
∗ T−ơng hợp xuống: bộ giải mã độ phân giải thấp có thể giải mã đ−ợc một phần dòng bit của bộ mã hóa độ phân giải cao.
♦ MPEG-2 hỗ trợ khả năng co giãn (scalability): co giãn không gian, co giãn SNR (Signal to Noise Ratio), co giãn phân chia số liệu...
∗ Cho phép nhiều cấu trúc lấy mẫu: 4:4:4, 4:2:2 và 4:2:0.
∗ Hệ số DC đ−ợc mã hóa với độ chính xác đặc biệt.
∗ Bảng l−ợng tử riêng biệt cho các thành phần chói và màu nên lợi dụng đ−ợc đặc điểm của mắt ng−ời ít nhạy cảm hơn với tín hiệu màu.
∗ Cho phép cả hai dạng quét: quét xen kẽ và quét liên tục.
∗ Có khả năng hồi phục lỗi.
♦ Cú pháp đầy đủ của MPEG-2 đ−ợc thể hiện qua các tập con gọi là profile, phù hợp với các lĩnh vực áp dụng. Mỗi profile lại bao gồm từ 1 đến 4 mức độ hạn chế về độ phân giải không gian, tốc độ bit.
3.3.2. Cấu trúc dòng bit video MPEG-2
Dòng bit MPEG-2 về cơ bản t−ơng hợp với MPEG-1, tức là cũng gồm cấu trúc 6 lớp nh− đã trình bày trong mục 3.2.1
Tên gọi và chức năng các lớp đ−ợc liệt kê lại nh− sau:
Lớp Chức năng
Lớp chuỗi (Sequence Layer) Đơn vị nội dung
Lớp nhóm ảnh (GOP Layer) Đơn vị truy nhập ngẫu nhiên dòng video mã hóa.
Lớp ảnh (Picture Layer) Đơn vị mã hóa cơ bản Lớp lát (Slice Layer) Đơn vị tái đồng bộ Lớp Macro Block (MB Layer) Đơn vị bù chuyển động Lớp khối (Block Layer) Đơn vị chuyển đổi DCT
Bảng II.3.4: Dạng lớp của cú pháp dòng bit MPEG-2
∗ Lớp chuỗi là đại diện mã hóa cho một chuỗi ảnh (Video Sequence).
∗ Lớp nhóm ảnh cung cấp điểm truy cập ngẫu nhiên. ảnh bắt đầu của chuỗi bao giờ cũng là một ảnh I. ảnh I này cung cấp điểm truy cập vào dòng bit mã hóa.
∗ Lớp lát có chức năng hồi phục đồng bộ. Khi dòng bit có lỗi, bộ giải mã có thể bỏ qua slice có lỗi và bắt đầu bằng một slice mới. Mỗi lát chứa một hoặc một số MB.
∗ Mỗi macro block (MB) là một đơn vị đ−ợc −ớc l−ợng chuyển động và có vecto chuyển động riêng trong phần header của nó.
∗ Lớp khối là lớp thấp nhất. Mỗi khối là một đơn vị DCT gồm 64 hệ số (một hệ số DC và 63 hệ số AC nh− trình bày trong mục 2.2.2: phép chuyển đổi cosine rời rạc) của khối ảnh I hoặc khối sai số dự báo (ảnh P, B).
So với MPEG-1, cú pháp dòng bit MPEG-2 có thêm một số chức năng mở rộng. Do đó có 2 h−ớng đi trong dòng bit MPEG-2 nh− hình vẽd−ới đây: hoặc theo quy trình MPEG-1 hoặc theo các chức năng mở rộng riêng của MPEG-2.
3.3.3. Khả năng co giãn của MPEG-2
Một trong những đặc điểm quan trọng nhất của MPEG-2 là sự phù hợp với nhiều ứng dụng video. Có thể sử dụng MPEG-2 cho phân phối truyền hình tiêu chuẩn (Standard Television), truyền hình phân giải cao (HDTV: High Definition Television) hoặc cho truyền dẫn tín hiệu truyền hình thông qua các mạng truyền thông.
Tính co giãn của dòng bít MPEG-2 là khả năng giải mã đ−ợc một phần dòng bít MPEG-2 độc lập với phần còn lại của dòng bít đó nhằm khôi phục video với chất l−ợng hạn chế ( hạn chế độ phân giải không gian, độ phân giải thời gian hoặc hạn chế về SNR...). Dựa theo tính co giãn, dòng bít đ−ợc phân thành hai hay nhiều lớp. Tập con nhỏ nhất của cú pháp dòng bít có thể giải mã một cách độc lập đ−ợc gọi là lớp cơ bản. Các lớp còn lại đ−ợc gọi là các lớp nâng cao. Có nhiều loại co giãn khác nhau nh−:
∗ Co giãn không gian: Dòng bít gồm hai hay nhiều lớp video có độ phân giải không gian khác nhau.
∗ Co giãn SNR: dòng bít gồm hai hay nhiều lớp video có cùng độ phân giải không gian nh−ng tỉ số tín hiệu trên nhiễu SNR là khác nhau.
∗ Co giãn thời gian:dòng bít gồm hai hay nhiều lớp video có cùng độ phân giải không gian nh−ng có độ phân giải thời gian khác nhau.
∗ Co giãn phân chia số liệu: dòng bít video đ−ợc chia làm hai phần : phần −u tiên cao (lớp cơ bản) gồm các hệ số DCT tần số thấp, phần −u tiên thấp (lớp nâng cao) gồm các hệ số DCT tần số cao.
∗ Co giãn phân chia số liệu chính là một dạng cơ bản của co giãn tần số.
Tiêu chuẩn MPEG-2 đã qui định chính thức hai loại co giãn : co giãn không gian và co giãn SNR. Các loại co giãn khác chỉ mới ở dạng dự thảo.
Sequence header (đầu đề chuỗi) Extended Sequence (chuỗi mở rộng) MPEG-1 ISO/IEC 11172-2 Dòng bit Hình II.3.9: Cú pháp dòng bít MPEG-2