ĐÁNH GIÁ CHẤT LƢỢNG MÃ HÓA TIẾNG NÓI

Một phần của tài liệu Bài giảng Xử lý tiếng nói: Phần 1 (Trang 90)

Một đánh giá đơn giản và hay sử dụng là cách đánh giá định lƣợng thông qua tỷ số SNR: tỷ số công suất trung bình tín hiệu trên nhiễu. Nhƣ đã đề cập trong phần mã hóa PCM, SNR đƣợc xác định theo công thức tổng quát:

   e (n) E ) n ( s E SNR 2 2 

Trong đó E{} là giá trị trung bình thống kê.

SNR là một thông số mang tính chất kỹ thuật mang tính chất khách quan mà gần nhƣ không có một mối quan hệ chặt chẽ đến sự cảm nhận của tai ngƣời. Do đó, ngoài đánh giá khách quan bằng tỷ số SNR, ngƣời ta còn đánh giá chất lƣợng mã hóa thông qua một thông số mang tính chất chủ quan là thang đo điểm ý kiến (còn đƣợc biết đến là thang đo độ hài lòng – Mean Opinion Score). Đây là thang đo đánh giá tính chủ quan cảm nhận của ngƣời nghe sau khi đƣợc hỏi ý kiến về chất lƣợng tiếng nói thu đƣợc của bộ mã hóa và giải mã. Thông thƣờng thang này gồm có 5 cấp độ: 1- Tồi; 2-Kém; 3-Chấp nhận đƣợc; 4-Tốt; 5-Rất tốt. Mặc dù nó phản ánh đƣợc đặc điểm nghe của con ngƣời, nhƣng đây là một tham số mang tính định tính, khó có thể có đƣợc công thức tính trực tiếp. Nhƣ vậy, nó không thể đƣợc dùng nhƣ là một điều kiện trong bài toán thiết kế xây dựng bộ mã tối ƣu.

Một đánh giá nữa là tốc độ mã hóa: là số bít trung bình cần phải truyền trong một đơn vị thời gian.

Trong các ứng dụng mã hóa tiếng nói của các hệ thống thông tin, một yêu cầu quan trọng không kém đó là khả năng đáp ứng thời gian thực, hay độ trễ của phép mã hóa. Trong mã hóa tiếng nói của hệ thống thoại tƣơng tác thời gian thực, độ trễ >150ms là không thể chấp nhận đƣợc.

3.7. CÂU HỎI VÀ BÀI TẬP CUỐI CHƢƠNG

1. Mục đích của việc mã hóa tín hiệu tiếng nói? 2. Có những lớp mã hóa tiếng nói nào?

3. Các phƣơng pháp mã hóa dạng sóng tín hiệu tiếng nói: ý tƣởng, nguyên lý thực hiện, ƣu/nhƣợc điểm?

4. Các phƣơng pháp mã hóa tham số: ý tƣởng, nguyên lý thực hiện, ƣu/nhƣợc điểm?

5. Các phƣơng pháp mã hóa lai ghép: ý tƣởng, nguyên lý thực hiện, ƣu/nhƣợc điểm?

6. (Matlab) Sử dụng máy tính cá nhân và phần mềm Matlab (hoặc các ngôn ngữ lập trình khác) thực hiện các công việc sau:

i. Ghi âm một đoạn tín hiệu tiếng nói bất kỳ, lƣu ở định dạng *.wav ii. Sử dụng hàm thƣ viện của Matlab hoặc công cụ thích hợp:

1. Kiểm nghiệm một số phƣơng pháp mã hóa dạng sóng cơ bản (PCM, DPCM, …), đánh giá SNR, chất lƣợng âm thanh cảm thụ, dung lƣợng file dữ liệu sau mã hóa

2. Kiểm nghiệm một số phƣơng pháp mã hóa tham số cơ bản (LPC, CELP, …), đánh giá SNR, chất lƣợng âm thanh cảm thụ, dung lƣợng file dữ liệu sau mã hóa

Một phần của tài liệu Bài giảng Xử lý tiếng nói: Phần 1 (Trang 90)