Kỹ thuật nén âm thanh kỹ thuật số.

Một phần của tài liệu Giáo trình truyền thông và đa phương tiện (Trang 41 - 44)

L: Cường độ sáng nhỏ nhất,

3. Kỹ thuật nén âm thanh kỹ thuật số.

3.1. Lượng hóa phi tuyến (non-linear quantization)

Lượng hóa tuyến tính / đều: Kích thước bước lượng hóa bằng nhau với mọi biên

độ tín hiệu.

– Vùng biên độ tín hiệu cao hơn, hệ số nhiểu tín hiệu (SNR - Signal-to-noise ratio) cao hơn.

– SNR tăng cao ở biên độ tín hiệu cao không làm tăng chất lượng âm thanh cảm nhận: Vì con người nhạy cảm nhất với thành phần biên độ thấp và trung bình.

Lượng hóa phi tuyến: Bước lượng hóa nhỏ hơn khi biên độ thấp hơn và lớn hơn khi biên độ cao hơn.

Lượng hóa đều trên tín hiệu phi tuyến đã được biến đổi & lượng hóa phi tuyến trên tín hiệu tuyến tính cho ra cùng kết quả. Trong thực tế, người ta áp dụng lượng hóa tuyến tính trên tín hiệu phi tuyến được biến đổi.

– Quá trình biến đổi tín hiệu tuyến tính thành tín hiệu phi tuyến được gọi là

companding. Số hóa đều trên tín hiệu companded gọi là companded PCM (PCM – Pulse-Code Modulation).

– Hàm biến đổi tín hiệu tuyến tính thành phi tuyến A-law:

– Hàm biến đổi tín hiệu tuyến tính thành phi tuyến µ-law:

– Companding là k thut nén analog:

3.2. Mã hóa tiên đoán – Predictive Coding

Thay vì truyền giá trị mẫu, trong mã hóa tiên đoán, sai khác giữa một tiên đoán đối với giá trị mẫu và giá trị mẫu hiện tại được mã hóa và truyền đi.

Nếu sai khác này (còn gọi là lỗi tiên đoán) được lượng hóa và mã hóa. Sơ đồ mã hóa tiên đoán được gọi là biến điệu mã hóa xung vi sai (Differential pulse-coded modulation –DPCM). Từ mã độ dài cố định thường được dùng để mã hóa lỗi tiên đoán lượng hóa. Giá trị tiên đoán đối với mỗi giá trị mẫu được tính từ “lịch sử” của tín hiệu (không cần truyền vì bộ giải mã biết cách tính giá trị này)

Để dựng lại một mẫu, bộ giải mã cộng lỗi tiên đoán với giá trị tiên đoán của mẫu. Lỗi tiên đoán có khoảng biên độ nhỏ, cần ít bit hơn để mã hóa nó.

ADPCM (Adaptive DPCM - biến điệu mã hóa xung vi sai thích ứng): Kích cỡ bước lượng hóa giữa các mẫu liền kề biến thiên theo tín hiệu, dạng sóng (của tín hiệu) thay đổi nhanh, bước lượng hóa lớn và ngược lại. Kỹ thuật ADPCM cải thiện hiệu năng của DPCM. ADPCM phù hợp trong nén tiếng nói.

MPEG-Audio

Một âm thanh có thể làm cho không thể nghe thấy âm thanh khác hoặc làm dịch chuyển độ ồn của âm thanh khác: che mặt nạ (masking).

Che mặt nạ một âm thanh có thể che toàn bộ hay một phần. Âm thanh bị che mặt nạ

không thể nghe thấy có thể bị vứt bỏ mà không ảnh hưởng tới chất lượng thính giác: chiến lược được dùng bởi chuẩn MPEG-audio.

MPEG-audio là kỹ thuật nén không chặt, giả thiết về bản chất nguồn âm thanh. MPEG-audio khai thác giới hạn nhận thức của hệ thống thính giác con người xóa bỏ

tín hiệu audio không phù hợp với nhận thức thính giác con người. MPEG-audio cho phép ba hệ số mẫu: 32, 44.1 và 48 kHz.

MPEG-audio là một họ ba sơ đồ nén: MPEG-audio layer 1, layer 2, layer 3 với độ

phức tạp tăng dần và tỷ suất nén cũng tăng dần. Bộ giải nén tầng cao, có thể giải nén encoded stream được mã hóa bởi bộ mã hóa tầng thấp hơn.

– Khối “Time to frequency mapping”: Chia mẫu audio thành nhiều băng tần con. – Khối “Psycho-acoustic model”: Tạo ra một tập dữ liệu để điều khiển hoạt động

của khối Quantizer and coding

– Khối “Quantizer and coding”: Dựa trên tập dữ liệu điều khiển được chuyển đến từ khối PAM (Psycho- acoustic model), tạo ra một tập các ký hiệu từ các mẫu input ánh xạ qua, các băng tần con không quan trọng hay “không nghe thấy” bị

xóa bỏ hoặc mã hóa bởi một vài bit.

– Khối “Frame packing”: Tập hợp và định dạng các ký hiệu mã hóa, thêm các thông tin nếu cần thiết để tạo ra dòng audio được mã hóa

Một phần của tài liệu Giáo trình truyền thông và đa phương tiện (Trang 41 - 44)

Tải bản đầy đủ (PDF)

(96 trang)