3. 3/ Quá trình mã hoá audio.
3.4. 1/ Chuẩn nén audio MPEG-1.
Tiêu chuẩn MPEG-1 (ISO/IEC 11172) đợc phát triển vào năm 1991 cho mã hoá hình ảnh chuyển động kết hợp với audio cho các phơng tiện lu trữ tốc độ dới 1,5Mb/s. Phần audio của tiêu chuẩn này định nghĩa 3 lớp cho mã hoá tín hiệu PCM có tốc độ lấy mẫu là 32KHz, 44,1KHz và 48 Khz với 16 bit/mẫu.
Quá trình nén theo chuẩn này thờng đợc thực hiện theo ba bớc:
• Chuyển tín hiệu audio về miền tần số, toàn bộ dải phổ của nó đợc chia thành 32 băng con nhờ bộ lọc băng con.
• Xác định mức biên độ và mức nhiễu cho mỗi băng con bằng mô hình cảm nhận. Tỉ lệ signal-mask xác định cho mỗi băng đợc sử dụng để xác định số bit cho quá trình lợng tử hoá mỗi băng.
• Lợng tử hoá các băng con thông qua lợng tử các thành phần nghe thấy trong mỗi băng. Quá trình này thờng bao gồm cả mã hoá Huffman.
Cơ bản của bộ mã hoá và giải mã audio đợc thể hiện trong hình dới đây.
Hình 3.7 : Cấu trúc cơ bản của bộ mã hoá audio MPEG.
Temporal/ frequence mapping Joint coding Scaling Quatizing coding Frame buffer Psychoacoustic model ancillary data (option) PCM audio samples @32; 44,1; 48Khz compressed data
Hình 3.8 : Cấu trúc cơ bản của bộ giải mã audio MPEG.
Có ba lớp phân biệt trong tiêu chuẩn audio MPEG để cung cấp cho cấc chế độ hoạt động sau :
• Chế độ mono.
• Chế độ hai kênh audio độc lập.
• Chế độ stereo .
• Chế độ stereo kết hợp.
Trong MPEG -I lớp I dùng FFT cho mẫu có cửa sổ 512. trong MPEG-I lớp II và III dùng phân tích FFT của mẫu có cửa sổ 1024. Lớp I dùng trong các thiết bị dân dụng, lớp II dùng trong các thiết bị chuyên dụng và multimedia, lớp III dùng trong các hệ thống mã hoá tiếng nói và mã hoá chất lợng cao cho tín hiệu âm nhạc. Lớp I là thuật toán cơ sở, lớp II và III bao gồm nhiều phần nâng cao của lớp I.
Sơ đồ khối của bộ mã hoá và giải mã audio MPEG (theo tiêu chuẩn ISO/IEC 11172- 3) lớp I và lớp II đợc đa ra nh sau: Frame unpacking Recontruction frequence/ temporal mapping PCM audio samples @32;44,1;48Khz Ancillary data (Option) Encoded data stream
Hình 3.9 : Sơ đồ khối của bộ mã hoá audio MPEG-1(lớpI, II).
Các đặc điểm của lớp 1
Cấu trúc khung MPEG lớp 1 audio đợc trình bày nh hình dới đây :
CRC GR0 GR1 GR2 GR11
0 1 32 mẫu 31
Cấu trúc một khung audio
Frame header Cấp phát bit Các hệ số tỷ lệ Đồng bộ Từ m∙ hệ thống Các bit Mục đích Từ đồng bộ 12 bit "1" ID ( MPEG=1) Lớp Bảo vệ lỗi Chỉ số tốc độ bit Tần số lấy mẫu Bit đệm Bit dành riêng Chế độ Mở rộng chế độ Bản quyền
Nguyên thuỷ hoặc copy Mức quan trọng 12 1 2 1 4 2 1 1 2 2 1 1 2 Số liệu phụ
Hình 3.11 : Cấu trúc khung MPEG audio lớp 1
• Tốc độ số liệu từ 32 đến 448Kbps (tổng cộng).
• Tín hiệu đầu vào đợc phân thành các khung có 384 mẫu trên một kênh.
• Khung có chiều dài 8ms tần số lấy mẫu 48Khz (12x32x20.83 = 8ms).
• 32 dải con kích cỡ tơng đơng, tạo thành các khối 12 mẫu (32x12=384 mẫu).
• Các hệ số bậc thang 6 bit trên một dải (dải động 120 dB), và hệ số tỉ lệ khác nhau cho mỗi dải.
• Mỗi mẫu băng con đợc lợng tử hóa một cách chính xác bởi bộ tính toán cấp phát các bit.
• Tín hiệu audio có thể là mono, stereo, hoặc stereo kết hợp.
• Thích hợp cho hầu hết các ứng dụng thơng mại.
Các đặc điểm của lớp II:
MPEG audio lớp 2 cải thiện tính năng của lớp I cho phép nén tốt hơn. Tốc độ bit cuối cùng khoảng128kp/s.
• Tốc độ số liệu từ 32 đến 384 kb/s.
• Tín hiệu đầu vào đợc phân thành các khung chứa 1152 mẫu (trên một kênh).
• 32 dải kích cỡ tơng đơng tạo ra tử các khối 36 mẫu (32x36=1152 mẫu).
• Khung có chiều dài 24ms@48Khz (384x3x20,83= 24ms).
• Các hệ số bậc thang 6 bit trên một dải, khác nhau cho mỗi dải. Hệ số bậc thang có thể đợc chia sẻ bởi các nhóm 12; 24 và 36 mẫu để trách làm méo tín hiệu audio.
• Tín hiệu audio có thể là mono, hai kênh, stereo, stereo kết hợp.
• Cấp phát bít thích nghi hớng đi.
• Đợc sử dụng rộng rãi nhất trong CD-ROM, DVB,DAB,DBS, ...
Các đặc điểm của lớp III .
Lớp III cung cấp chất lợng tốt nhất ở tốc độ bit thấp. Băng bộ lọc miền thời gian đến băng lọc miền tần số cung cấp độ phân giải phổ, tần số,và thời gian thích nghi cao để phù hợp với sự biến đổi nội dung của tín hiệu đầu vào. Tốc độ bit khoảng 64 Kb/s. Các đặc điểm của lớp III nh sau :
• Tốc độ số liệu từ 32 đến 320 kb/s.
• 32 dải kích cỡ tơng đơng sau đó đợc phân thành 18 dải MDCT (tổng số là 576 dải) có khả năng tơng thích chuyển xuống thành 192 dải.
• Khung có chiều dài 24ms@48Khz (384x3x20,83= 24ms).
• Các hệ số bậc thang đợc sử dụng để sửa đổi cấu trúc và các mức nhiễu do lợng tử.
• Cấp phát bit thích nghi hớng phát.
• Sử dụng phơng pháp mã hoá VLC (Huffman) cho các giá trị lợng tử.
• Tín hiệu audio có thể là mono, hai kênh, stereo, stereo kết hợp.
• Đợc sử dụng rộng trong các ứng dụng tốc độ bit thấp nh ISDN, viễn thông, audio chất lợng cao qua internet...
3.4.2 / Chuẩn nén audio MPEG-2.
Trong tiêu chuẩn thứ 2 đợc thiết lập vào năm 1994, MPEG-2 (ISO/IEC 13818) sự mở rộng tiêu chuẩn MPEG-1 đã đợc xác định để đáp ứng đợc các nhu cầu trong các ứng dụng mới nh :
• Một dải rộng chất lợng audio từ tốc độ bit thấp đén tốc độ bit cao (32- 1066Kbit/s). Dải rộng này đợc thực thiện bởi tách khung audio MPEG-2 thành 2 phần, một luồng bit cơ sở tơng thích với MPEG-1 (384 kbit/s cho lớp II) và một luồng bit mở rộng. Với lớp III với tốc độ 64 kbit/s trên một kênh 5 kênh audio với độ rộng băng đầy đủ có thể đợc mã hoá với tốc độ số liệu 320 Kbit/s.
• Mã hoá lên tới 6 kênh audio bao gồm một kênh tần số thấp, để hỗ trợ các yêu cầu âm thanh surround đa kênh.
CRC SCFSI Các mẫu băng con
Frame header Cấp phát bit Các hệ số tỷ lệ Số liệu phụ 2 Số liệu phụ 1 Lớp II
Ro/Lo Basic stereo
MCHeader Header MC CRC MC bit Allocation MC SCFSI MC SCF MC
Predictor MC Sub band samples Multi-lingual commentary
Multi- channel (MC) audio data information
Hình 3.12 : Sự mở rộng MPEG-2 Audio trong định dạng luồng bit MPEG-1. Chuẩn audio MPEG-2 có thêm một số tần số lấy mẫu mới: 16; 22,05 và 24 KHz. Nó cho phép truyền băng tần trong khoảng 7.5 KHz đến 11 KHz và cho chất lợng cao khi tốc độ dòng số liệu nhỏ hơn 64 Kbps cho mỗi kênh.
Tiêu chuẩn MPEG-2 đợc phát triển sau và tơng thích xuống với MPEG-1. Nhng MPEG-1 chỉ có thể giải mã đợc các kênh trái phải của luồng audio MPEG-2. Tất cả các lớp của MPEG -1 và MPEG-2 đều giống nhau.
Sự tơng thích ngợc của của chuẩn audio MPEG-2 với MPEG-1 (ISO/IEC11172) đợc thể hiện trong sơ đồ sau:
L L R C Ls Rs LFE Lo = L + xC + yLs Ro = R + xC + yRs T4 = Ls T5 = Rs T3 = C MATRIX MC-Encoder ISO 11172-3 Stereo Decoder Multichannel Decoder ISO 13818-3 Dematrix Basic-Stereo ISO 11172-3 plus MC-Extension (C, Ls, Rs, LFE) Lo' Ro' L' R' C' Ls' Rs' LFE
Hình 3.13 : Nguyên lý tơng thích ngợc của chuẩn audio MPEG-2 với MPEG-1(ISO/IEC11172).