1/ Chuẩn nộn audio MPEG-1.

Một phần của tài liệu Luan van chuyen de 186101 xu ly tin hieu video bao gom so hoa va chuan (Trang 63 - 70)

3. 3/ Quỏ trỡnh mó hoỏ audio.

3.4.1/ Chuẩn nộn audio MPEG-1.

Tiờu chuẩn MPEG-1 (ISO/IEC 11172) được phỏt triển vào năm 1991 cho mó hoỏ hỡnh ảnh chuyển động kết hợp với audio cho cỏc phương tiện lưu trữ tốc độ dưới 1,5Mb/s. Phần audio của tiờu chuẩn này định nghĩa 3 lớp cho mó hoỏ tớn hiệu PCM cú tốc độ lấy mẫu là 32KHz, 44,1KHz và 48 Khz với 16 bit/mẫu.

Quỏ trỡnh nộn theo chuẩn này thường được thực hiện theo ba bước:

• Chuyển tớn hiệu audio về miền tần số, toàn bộ dải phổ của nú được chia thành 32 băng con nhờ bộ lọc băng con.

• Xỏc định mức biờn độ và mức nhiễu cho mỗi băng con bằng mụ hỡnh cảm nhận. Tỉ lệ signal-mask xỏc định cho mỗi băng được sử dụng để xỏc định số bit cho quỏ trỡnh lượng tử hoỏ mỗi băng.

• Lượng tử hoỏ cỏc băng con thụng qua lượng tử cỏc thành phần nghe thấy trong mỗi băng. Quỏ trỡnh này thường bao gồm cả mó hoỏ Huffman.

Cơ bản của bộ mó hoỏ và giải mó audio được thể hiện trong hỡnh dưới đõy.

63

MPEG-2

Tần số lấy

mẫu thấp Đa kênh

Lớp 1 Lớp II Lớp III MPEG-1 Lớp 1 Lớp II Lớp III 32 44,1 48 Khz Mono và setereo Lớp 1 Lớp II Lớp III 16 22,05 24 Khz 32 44,1 48 Khz Temporal/ frequence mapping Joint coding Scaling Quatizing coding Frame buffer ancillary PCM audio samples @32; 44,1; 48Khz compressed data

Hỡnh 3.7 : Cấu trỳc cơ bản của bộ mó hoỏ audio MPEG.

Hỡnh 3.8 : Cấu trỳc cơ bản của bộ giải mó audio MPEG.

Cú ba lớp phõn biệt trong tiờu chuẩn audio MPEG để cung cấp cho cấc chế độ hoạt động sau :

• Chế độ mono.

• Chế độ hai kờnh audio độc lập.

• Chế độ stereo .

• Chế độ stereo kết hợp.

Trong MPEG -I lớp I dựng FFT cho mẫu cú cửa sổ 512. trong MPEG-I lớp II và III dựng phõn tớch FFT của mẫu cú cửa sổ 1024. Lớp I dựng trong cỏc thiết bị dõn dụng, lớp II dựng trong cỏc thiết bị chuyờn dụng và multimedia, lớp III dựng trong cỏc hệ thống mó hoỏ tiếng núi và mó hoỏ chất lượng cao cho tớn hiệu õm nhạc. Lớp I là thuật toỏn cơ sở, lớp II và III bao gồm nhiều phần nõng cao của lớp I.

64Frame Frame unpacking Recontruction frequence/ temporal mapping PCM audio samples @32;44,1;48Khz Ancillary data (Option) Encoded data stream

Sơ đồ khối của bộ mó hoỏ và giải mó audio MPEG (theo tiờu chuẩn ISO/IEC 11172-3) lớp I và lớp II được đưa ra như sau:

Hỡnh 3.10 : Sơ đồ khối của bộ giải mó audio MPEG-1(lớpI, II).

Cỏc đặc điểm của lớp 1

Cấu trỳc khung MPEG lớp 1 audio được trỡnh bày như hỡnh dưới đõy :

CRC GR0 GR1 GR2 GR11

0 1 32 mẫu 31

Cấu trúc một khung audio

Frame header Cấp phát bit Các hệ số tỷ lệ Đồng bộ Từ m∙ hệ thống Các bit Mục đích Từ đồng bộ 12 bit "1" ID ( MPEG=1) Lớp Bảo vệ lỗi Chỉ số tốc độ bit Tần số lấy mẫu Bit đệm Bit dành riêng Chế độ Mở rộng chế độ Bản quyền (adsbygoogle = window.adsbygoogle || []).push({});

Nguyên thuỷ hoặc copy Mức quan trọng 12 1 2 1 4 2 1 1 2 2 1 1 2 Số liệu phụ

Hỡnh 3.11 : Cấu trỳc khung MPEG audio lớp 1

• Tốc độ số liệu từ 32 đến 448Kbps (tổng cộng).

• Tớn hiệu đầu vào được phõn thành cỏc khung cú 384 mẫu trờn một kờnh.

• Khung cú chiều dài 8ms tần số lấy mẫu 48Khz (12x32x20.83 = 8ms).

• 32 dải con kớch cỡ tương đương, tạo thành cỏc khối 12 mẫu (32x12=384 mẫu).

• Cỏc hệ số bậc thang 6 bit trờn một dải (dải động 120 dB), và hệ số tỉ lệ khỏc nhau cho mỗi dải.

• Cấp phỏt bớt thớch nghi hướng đi.

• Mỗi mẫu băng con được lượng tử húa một cỏch chớnh xỏc bởi bộ tớnh toỏn cấp phỏt cỏc bit.

• Tớn hiệu audio cú thể là mono, stereo, hoặc stereo kết hợp.

• Thớch hợp cho hầu hết cỏc ứng dụng thương mại.

Cỏc đặc điểm của lớp II:

MPEG audio lớp 2 cải thiện tớnh năng của lớp I cho phộp nộn tốt hơn. Tốc độ bit cuối cựng khoảng128kp/s.

• Tốc độ số liệu từ 32 đến 384 kb/s.

• Tớn hiệu đầu vào được phõn thành cỏc khung chứa 1152 mẫu (trờn một kờnh).

• 32 dải kớch cỡ tương đương tạo ra tử cỏc khối 36 mẫu (32x36=1152 mẫu).

• Khung cú chiều dài 24ms@48Khz (384x3x20,83= 24ms).

• Cỏc hệ số bậc thang 6 bit trờn một dải, khỏc nhau cho mỗi dải. Hệ số bậc thang cú thể được chia sẻ bởi cỏc nhúm 12; 24 và 36 mẫu để trỏch làm mộo tớn hiệu audio.

• Tớn hiệu audio cú thể là mono, hai kờnh, stereo, stereo kết hợp.

• Cấp phỏt bớt thớch nghi hướng đi.

• Được sử dụng rộng rói nhất trong CD-ROM, DVB,DAB,DBS, ...

Cỏc đặc điểm của lớp III .

Lớp III cung cấp chất lượng tốt nhất ở tốc độ bit thấp. Băng bộ lọc miền thời gian đến băng lọc miền tần số cung cấp độ phõn giải phổ, tần số,và thời gian thớch nghi cao để phự hợp với sự biến đổi nội dung của tớn hiệu đầu vào. Tốc độ bit khoảng 64 Kb/s. Cỏc đặc điểm của lớp III như sau :

• Tốc độ số liệu từ 32 đến 320 kb/s.

• 32 dải kớch cỡ tương đương sau đú được phõn thành 18 dải MDCT (tổng số là 576 dải) cú khả năng tương thớch chuyển xuống thành 192 dải.

• Khung cú chiều dài 24ms@48Khz (384x3x20,83= 24ms).

• Cỏc hệ số bậc thang được sử dụng để sửa đổi cấu trỳc và cỏc mức nhiễu do lượng tử.

• Cấp phỏt bit thớch nghi hướng phỏt. (adsbygoogle = window.adsbygoogle || []).push({});

• Sử dụng phương phỏp mó hoỏ VLC (Huffman) cho cỏc giỏ trị lượng tử.

• Tớn hiệu audio cú thể là mono, hai kờnh, stereo, stereo kết hợp.

• Được sử dụng rộng trong cỏc ứng dụng tốc độ bit thấp như ISDN, viễn thụng, audio chất lượng cao qua internet...

3.4.2 / Chuẩn nộn audio MPEG-2.

Trong tiờu chuẩn thứ 2 được thiết lập vào năm 1994, MPEG-2 (ISO/IEC 13818) sự mở rộng tiờu chuẩn MPEG-1 đó được xỏc định để đỏp ứng được cỏc nhu cầu trong cỏc ứng dụng mới như :

• Một dải rộng chất lượng audio từ tốc độ bit thấp độn tốc độ bit cao (32- 1066Kbit/s). Dải rộng này được thực thiện bởi tỏch khung audio MPEG-2 thành 2 phần, một luồng bit cơ sở tương thớch với MPEG-1 (384 kbit/s cho lớp II) và một luồng bit mở rộng. Với lớp III với tốc độ 64 kbit/s trờn một kờnh 5 kờnh audio với độ rộng băng đầy đủ cú thể được mó hoỏ với tốc độ số liệu 320 Kbit/s.

• Mó hoỏ lờn tới 6 kờnh audio bao gồm một kờnh tần số thấp, để hỗ trợ cỏc yờu cầu õm thanh surround đa kờnh.

CRC SCFSI Các mẫu băng con

Frame header Cấp phát bit Các hệ số tỷ lệ Số liệu phụ 2 Số liệu phụ 1 Lớp II

Ro/Lo Basic stereo

MCHeader Header MC CRC MC bit Allocation MC SCFSI MC SCF MC

Predictor MC Sub band samples Multi-lingual commentary

Multi- channel (MC) audio data information

Hỡnh 3.12 : Sự mở rộng MPEG-2 Audio trong định dạng luồng bit MPEG-1.

Chuẩn audio MPEG-2 cú thờm một số tần số lấy mẫu mới: 16; 22,05 và 24 KHz. Nó cho phộp truyền băng tần trong khoảng 7.5 KHz đến 11 KHz và cho chất lượng cao khi tốc độ dũng số liệu nhỏ hơn 64 Kbps cho mỗi kờnh.

Tiờu chuẩn MPEG-2 được phỏt triển sau và tương thớch xuống với MPEG-1. Nhưng MPEG-1 chỉ cú thể giải mó được cỏc kờnh trỏi phải của luồng audio MPEG-2. Tất cả cỏc lớp của MPEG -1 và MPEG-2 đều giống nhau.

Sự tương thớch ngược của của chuẩn audio MPEG-2 với MPEG-1 (ISO/IEC11172) được thể hiện trong sơ đồ sau:

L L R C Ls Rs LFE Lo = L + xC + yLs Ro = R + xC + yRs T4 = Ls T5 = Rs T3 = C MATRIX MC-Encoder ISO 11172-3 Stereo Decoder Multichannel Decoder ISO 13818-3 Dematrix Basic-Stereo ISO 11172-3 plus MC-Extension (C, Ls, Rs, LFE) Lo' Ro' L' R' C' Ls' Rs' LFE

Hỡnh 3.13 : Nguyờn lý tương thớch ngược của chuẩn audio MPEG-2 với MPEG-1(ISO/IEC11172).

Một phần của tài liệu Luan van chuyen de 186101 xu ly tin hieu video bao gom so hoa va chuan (Trang 63 - 70)