CHƢƠNG 3 : MÃ HÓA TIẾNG NÓI
3.6. ĐÁNH GIÁ CHẤT LƢỢNG MÃ HÓA TIẾNG NÓI
Một đánh giá đơn giản và hay sử dụng là cách đánh giá định lƣợng thông qua tỷ số SNR: tỷ số cơng suất trung bình tín hiệu trên nhiễu. Nhƣ đã đề cập trong phần mã hóa PCM, SNR đƣợc xác định theo công thức tổng quát:
e (n) E ) n ( s E SNR 22
Trong đó E{} là giá trị trung bình thống kê.
SNR là một thơng số mang tính chất kỹ thuật mang tính chất khách quan mà gần nhƣ khơng có một mối quan hệ chặt chẽ đến sự cảm nhận của tai ngƣời. Do đó, ngồi đánh giá khách quan bằng tỷ số SNR, ngƣời ta còn đánh giá chất lƣợng mã hóa thơng qua một thơng số mang tính chất chủ quan là thang đo điểm ý kiến (còn đƣợc biết đến là thang đo độ hài lòng – Mean Opinion Score). Đây là thang đo đánh giá tính chủ quan cảm nhận của ngƣời nghe sau khi đƣợc hỏi ý kiến về chất lƣợng tiếng nói thu đƣợc của bộ mã hóa và giải mã. Thơng thƣờng thang này gồm có 5 cấp độ: 1- Tồi; 2-Kém; 3-Chấp nhận đƣợc; 4-Tốt; 5-Rất tốt. Mặc dù nó phản ánh đƣợc đặc điểm nghe của con ngƣời, nhƣng đây là một tham số mang tính định tính, khó có thể có đƣợc cơng thức tính trực tiếp. Nhƣ vậy, nó khơng thể đƣợc dùng nhƣ là một điều kiện trong bài toán thiết kế xây dựng bộ mã tối ƣu.
Một đánh giá nữa là tốc độ mã hóa: là số bít trung bình cần phải truyền trong một đơn vị thời gian.
Trong các ứng dụng mã hóa tiếng nói của các hệ thống thơng tin, một yêu cầu quan trọng khơng kém đó là khả năng đáp ứng thời gian thực, hay độ trễ của phép mã hóa. Trong mã hóa tiếng nói của hệ thống thoại tƣơng tác thời gian thực, độ trễ >150ms là không thể chấp nhận đƣợc.
3.7. CÂU HỎI VÀ BÀI TẬP CUỐI CHƢƠNG
1. Mục đích của việc mã hóa tín hiệu tiếng nói? 2. Có những lớp mã hóa tiếng nói nào?
CHƢƠNG 3. MÃ HĨA TIẾNG NĨI
89 3. Các phƣơng pháp mã hóa dạng sóng tín hiệu tiếng nói: ý tƣởng, ngun lý
thực hiện, ƣu/nhƣợc điểm?
4. Các phƣơng pháp mã hóa tham số: ý tƣởng, nguyên lý thực hiện, ƣu/nhƣợc điểm?
5. Các phƣơng pháp mã hóa lai ghép: ý tƣởng, nguyên lý thực hiện, ƣu/nhƣợc điểm?
6. (Matlab) Sử dụng máy tính cá nhân và phần mềm Matlab (hoặc các ngơn ngữ lập trình khác) thực hiện các cơng việc sau:
i. Ghi âm một đoạn tín hiệu tiếng nói bất kỳ, lƣu ở định dạng *.wav ii. Sử dụng hàm thƣ viện của Matlab hoặc cơng cụ thích hợp:
1. Kiểm nghiệm một số phƣơng pháp mã hóa dạng sóng cơ bản (PCM, DPCM, …), đánh giá SNR, chất lƣợng âm thanh cảm thụ, dung lƣợng file dữ liệu sau mã hóa
2. Kiểm nghiệm một số phƣơng pháp mã hóa tham số cơ bản (LPC, CELP, …), đánh giá SNR, chất lƣợng âm thanh cảm thụ, dung lƣợng file dữ liệu sau mã hóa
BỘ THƠNG TIN VÀ TRUYỀN THƠNG
HỌC VIỆN CƠNG NGHỆ BƢU CHÍNH VIỄN THƠNG ******************************* BÀI GIẢNG XỬ LÝ TIẾNG NÓI BIÊN SOẠN: PHẠM VĂN SỰ LÊ XUÂN THÀNH HÀ NỘI - 2014