Tiêu chuẩn nén audio MPEG-1 (ISO/IEC 11172-3) thường ựược biết dưới tên MUSICAM gồm 3 lớp mã hóa I, II, III tương ứng với hiệu quả nén và ựộ phức tạp tăng dần, ựược ứng dụng trong nhiều lĩnh vực khác nhau, ựặc biệt là trong Phát thanh - Truyền hình. Tiêu chuẩn nén audio MPEG-2 (ISO/IEC 13818-3) là bước phát triển mở rộng dựa trên cơ sở MPEG-1. Phương thức nén Dolby AC3 ứng dụng trong HDTV số cũng là biến thể từ Audio MPEG-2. đối với lĩnh vực truyền hình tiêu chuẩn MPEG-2 có ưu ựiểm nổi bật là ựảm bảo khả năng ựồng bộ giữa Audio và Video sau khi phân kênh và giải nén. đặc tắnh kỹ thuật của audio MPEG-1 và MPEG-2 ựược tóm tắt trong bảng saụ
Bảng -đặc tắnh kỹ thuật của audio MPEG-1 và MPEG-2
đặc tắnh MPEG-1 MPEG-2
độ phân giải 16 bit 16 bit - 24 bit
Tần số lấy mẫu 48 , 44.1 , 32 (KHz) 48 , 44.1, 32 , 24 , 22.05 , 16 KHz Tốc ựộ bit Tự do và có thể lên ựến
448 Kbps
Tự do và có thể lên ựến 256 Kbps
Số lượng kênh Lên ựến 2 kênh với các mode: mono, stereo, dual
Lên ựến 6 kênh: Left, Right, Center, L Surround, R Surround và LEF.
Co dãn Kênh Left, Light có thể ựược giải
mã ựộc lập.
Tương hợp Thuận và ngược
Nguyên lý nén audio MPEG chủ yếu dựa vào khả năng bị hạn chế(masking) của hệ thống thắnh giác ựược trình bày trên hình vẽ dưới .
- Mô hình cảm thụ thắnh giác (Psychoacoustic Model): Khối này mô phỏng hiệu ứng che lấp, làm cơ sở cho việc cấp phát bit cho các mẫu một cách hợp lý, tăng hiệu quả nén Audiọ Có hai dạng che lấp :
Băng
lọc hóa, mã hóaLượng tử
Phân phối bit Mô hình cảm thụ Ghép kênh Tắn hiệu vào Dòng bit mã hoá Dòng mã hoá Phân phối dòng bit
+ Che lấp về phổ : Khi tồn tại cùng một lúc hai âm thanh có tần số khác nhau, âm thanh có mức lớn hơn có thể che lấp âm thanh có mức nhỏ hơn. Do ựó, ựường cong Ộngưỡng nghe thấyỢ sẽ luôn luôn thay ựổi tuỳ thuộc vào phổ của các mẫu âm thanh ựang xét. Chỉ có các ựoạn vạch phổ nằm trên ựường cong này mới thực sự ựược mã hóạ
+ Che lấp về thời gian : Tai người chỉ cảm nhận âm thanh sau khi âm thanh ựó bắt ựầu khoảng 200ms, và có cảm tưởng âm thanh còn kéo dài 200ms nữa khi âm thanh ựã dứt. Ngoài ra thắnh giác cũng không phân biệt ựược khoảng ngừng nhỏ hơn 50ms giữa hai âm thanh giống nhau ựi liền nhaụ
+ Các bộ lọc dãy 32 băng con (Filter bank 32 Subband): Khối này biến ựổi số liệu Audio trong miền thời gian thành số liệu của 32 băng con trong miền tần số. Dựa theo hiệu ứng che lấp, ựộ dư thừa trong các số liệu này sẽ ựược loại bỏ. Phổ tắn hiệu ựược chia thành các băng tần con có ựộ rộng bằng nhau (32 băng trong MPEG-Layer I và II). Mỗi tắn hiệu băng con sau ựó ựược lượng tử hóa ựều .
+ Cấp phát bit, lượng tử và mã hoá (Bit/Noise Allocation Quantizing and Coding). Lựa chọn dải xấp xỉ ngưỡng nghe và cấp phát bit trên cơ sở năng lượng phổ tắn hiệu Audio và mô hình tâm sinh lý nghẹ Lượng tử hoá các phần cần thiết trong số liệu của 32 băng con với số bit thắch hợp và sử dụng mã hóa số liệu PCM.
+ định dạng dòng bit (Bit stream formatting) : Có nhiệm vụ ựịnh dạng lại dòng bit theo tiêu chuẩn của MPEG.
+ Bộ ghép kênh dữ liệu Audio: Nhận dữ liệu lượng tử hóa và cộng các thông tin vị trắ bit và hệ số thanh ựộ cho quá trình giải mã hiệu quả.