M B: Thông tin về acroblock, gồm:
c. Chuẩn nén MPEG-2 audio:
Dựa trên cơ sở MPEG-1, năm 1994, chuẩn MPEG-2 audio (IOS/IEC 13818-3) ra đời nhằm đáp ứng các áp dụng mới, với các yêu cầu:
- Đa năng, chất lượng audio cao và có thể thay đổi trong phạm vi rộng tùy tốc độ bit từ thấp đến cao (32 Kbps đến 1066 Kbps). Phạm vi rộng được thực hiện nhờ chia khung MPEG–2 audio thành 2 phần: Dòng bit sơ cấp (dòng bit gốc) tương thích với MPEG – 1 (384 Kb/s cho Player II) và dòng bit mở rộng .
Với Player III, tại 64 Kb/s trên một kênh, 5 kênh audio đầy đủ băng tần có thể được mã hoá với tốc độ 320 Kb/s.
- Mã hoá 6 kênh audio, bao gồm một kênh phụ nâng cao tần số thấp, để làm âm thanh tròn nhiều kênh.
- Sự mở rộng trên có thể thực hiện được nhờ cộng thêm vào mỗi player :
Tăng kênh và phát hiện lỗi, sữa sai DCT Quá trình ngược của băng lọc (32 băng phụ) Giải mã Thông tin phụ Tín hiệu Audio Stereo 31 0 Dữ liệu audio đã mã hóa Dữ liệu phụ Giải lượng tử 575 0 DCT 575 0 31 0
PTIT 93
2 1
tần số lấy mẫu (16; 22.05; 24 KHz) cho phép truyền băng tần trong khoảng 7.5 – 11 KHz và cho chất lượng cao khi tốc độ dòng số liệu < 64 Kb/s cho một kênh .
Dung lượng đa kênh ( tốc độ bit đa kênh mở rộng đến 1 Mb/s, cho phép đạt chất lượng cao). Các dữ liệu này được cấy vào không gian dữ liệu phụ của cấu trúc MPEG-1 Audio frame.
Header CRC Phân bố bit
SCFSI Hệ số thang độ
Mẫu băng tần con
MC Header Header MC RCR MC bit phân bố MC SCFSI MC SCF MC Dự báo
Mẫu băng tần con MC
Tiêu chuẩn MPEG-2 audio tương thích chuẩn MPEG-1. Tuy nhiên bộ giải mã MPEG-1 chỉ có thể giải mã các kênh trái và phải của dòng dữ liệu MPEG-2 audio.
Hình 3.31: Các lớp audio theo tiêu chuẩn MPEG-2
Tại tần số lấy mẫu thấp, độ phân giải tần số khoảng 21 Hz với tần số lấy mẫu 24 KHz. Nó cho phép các băng tần có hệ số thang đo phù hợp tốt hơn với độ rộng băng tần tới hạn và
MPEG-2
Tần số lấy mẫu thấp 5 kênh
Layer I Layer II Layer III
16; 22.05; 24 KHz
Layer I Layer II Layer III
32; 44.1; 48 KHz Multi-channel Mono và stereo Dữ liệu phụ 1 Dữ liệu phụ 2
Thông tin dữ liệu nhiều kênh
L0/R0 stereo cơ sở
Chú thích đa âm
SCFSI : Scale Factor Selection Information = thông tin chọn hệ số tỉ lệ MC : Multi-channel = đa kênh
PTIT 94
cho chất lượng audio tốt hơn tại các tốc độ bit thấp, mặc dù độ rộng băng tần tín hiệu audio được giảm tối đa là 12 KHz. Mô hình các lớp của MPEG-2 audio như hình 3.31.
Hình 3.32 là Định dạng dòng bit số liệu audio lớp I, II, III tiêu chuẩn MPEG-2. Các lớp MPEG-2 giống như ở MPEG-1 có đặc điểm như sau:
Hình 3.33: Cấu trúc Frame của layer I, MPEG-2
Header CRC Bit
allocation factors Scale Sample Ancillary data
(32) (0,16) (128-256) (0-384) (384)
Header CRC Bit
allocation SCFSI factors Scale Sample Ancillary data
(32) (0,16) (128-256) (0-60) (0-1080) (384)
Header CRC Side
information Bit reservoir Ancillary data
(32) (0,16) (128-256) (384) Layer I Layer I
Layer II
Layer III
Phân bố Hệ số bit thang đo CRC
Dữ liệu phụ
CRC = Cyclic Redundancy Check (Kiểm tra độ dư thừa có chu kỳ)
1 frame của audio
CR0 CR1 CR2 CR11 32 mẫu 0 1 31 Từ đồng bộ Từ hệ thống 12 bits 22 bits Bits Mục đích 12 Từ đồng bộ 1 10(MPEG = 1) 2 Layer 1 Tách lỗi 4 Chỉ sô tốc độ bit 2 Tần số lấy mẫu 1 Bit đồng chỉnh 1 Bit riêng 2 mode 2 Mode mở rộng 1 Bản quyền 1 Gốc/copy 2 Mức nhấn Fr ame h ae der
SCFSI : Scale Factor Selection Information = thông tin chọn hệ số tỉ lệ
CRC : Bit kiểm tra độ dư thừa tuần hoàn ; Header = Tiêu đề khung ; Bit allocation = Bit chỉ định Scale factor = Hệ số tỉ lệ ; Ancillary data = Số liệu phụ ; Bit Reservoir = Bit cung cấp (các số liệu chính từ một hoặc hai khung trước)
PTIT 95
Layer I
Tốc độ dữ liệu : 32 448 Kbps (tổng cộng).
Tín hiệu vào chia thành các khung bao gồm 348 mẫu trên một kênh .
Chu kỳ khung là 8 ms (123220.83s ) cho kênh 48 KHz.
32 băng tần con (Sub – band) có kích thước bằng nhau, tạo ra từ các khối (block) gồm 12 mẫu (3212384 mẫu).
Hệ số tỉ lệ 6 bit trên một băng (dải động âm thanh là 120 dB), hệ số tỉ lệ khác nhau cho mỗi băng.
Phân phối bit theo phương thức thích ứng trước.
Mỗi mẫu băng tần con được lượng tử hóa một cách chính xác bằng các tính toán phấn bố các bit.
Kênh đơn hoặc kép, stereo hoặc joint stereo (mã hóa kết hợp kênh trái và kênh phải của tín hiệu stereo audio).
Hầu hết thích hợp cho các ứng dụng như ghi âm hoặc trong studio vì kích thước khung (frame) chỉ là 8 ms.
Layer II
Loại này là kết quả nâng cao phương thức hoạt động của player I, tỉ lệ nén cao hơn. Tốc độ bit xấp xỉ xung quanh 128 Kb/s.
Tốc độ dữ liệu 32 – 384 Kb/s
Tín hiệu vào chia thành các khung, chứa 1152 mẫu /kênh
32 băng tần con có kích thước bằng nhau, tạo các khối 36 mẫu (32 36 = 1152 mẫu).
Chu kỳ khung là 24 ms cho kênh 48 KHz (384320.8324ms)
Hệ thống thang độ 6 bit/băng (dải động 120 dB), mỗi băng khác nhau, các nhóm 12, 24, 36 mẫu (8, 16 hoặc 24 ms) để loại trừ méo âm thanh.
Vị trí bit tiến thích nghi, khung 24 ms cố định và sử dụng lượng tử hoá bit chia nhỏ.
Kênh đơn hoặc kênh kép, stereo hoặc joint stereo.
Dùng rộng rải tiêu chuẩn MPEG trong CD– ROM, DVB, DAB, DBS, multimedia…
Layer III
Tốc độ dữ liệu 32 – 384 Kb/s
PTIT 96
Tạo khung 24 ms.
32 băng tần con có kích thước bằng nhau, được chia tiếp thành 18 băng tần MDCT (tổng cộng 576 kênh), có khả năng chuyển mạch khối tức thời thành 192 băng.
Các hệ số thang độ được dùng để cải thiện cấu trúc và mức nhiễu lượng tử.
Vị trí bit tiên thích nghi.
Mã hoá VLC (Huffman) các giá trị lượng tử.
Kênh đơn và kép, stereo hoặc joint stereo.
Dùng cho tốc độ bit thấp, ví dụ như ISDN, viễn thông, đường truyền vệ tinh và âm thanh chất lượng cao qua internet.
Tốc độ lấy mẫu Tốc độ lấy mẫu một nữa Âm thanh đa kênh
32 KHz 44.1 KHz 48 KHz 16 KHz 22.05 KHz 24 KHz Mono 2 kênh stereo Joint stereo
Đa kênh âm thanh vòng
Bảng 3.34: Chi tiết hệ thống audio chung.
Chuẩn MPEG được ứng dụng rộng rãi trong HDTV, CATV, DVB, Internet...
3.3.3. Một số chuẩn nén khác