Phương pháp đánh giá khách quan

Một phần của tài liệu Đồ án Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói (Trang 28 - 30)

Đánh giá chất lượng khách quan là phương pháp đánh giá chất lượng dựa trên các

phép đo thuộc tính của tín hiệu, thường được dùng trong việc đánh giá các phương

pháp nâng cao chất lượng tiếng nói được phân chia trong ba miền: miền thời gian như phép đo tỉ số tín hiệu trên nhiễu tiếng vang; miền phổ gồm các phép đo dựa trên các hệ

số tuyến tính như khoảng cách Log Likehook Ratio (LLR) Itakura Saito (IS), và khoảng cách phổ (CEP) và miền tri giác gồm phép đo khoảng cách độ dốc phổ (WSS)

và các phép đo đánh giá theo cảm nhận chủ quan (PESQ) bao gồm:

Weighted Spectral Slope (WSS) distance: Là phương pháp đo theo trọng số của phổ phép đo này được tính bằng cách tìm độ dốc phổ Spectral Slope đầu tiên của mỗi

band. Sau đó tính toán sự khác nhau giữa hai Spectral Slope của hai tín hiệu.Phương pháp đánh giá WSS là bước đầu làm mẫu cho việc làm thếnào đểcon người nhận biết

được tiếng nói, đặc biệt là nguyên âm. Các phương pháp đánh giá sau này càng dựa vào sự xử lý âm thanh của tai người, cách mà thính giác con người xử lý âm thanh và nhiễu. Những phương pháp đánh giá mới này đã dựa trên những lập luận sau:

 Sự phân tích tần số của tai người là không thay đổi, tức là sự phân tích tần số

của tín hiệu âm thanh không dựa trên phạm vi tần số tuyến tính.  Độ nhạy của tai người phụ thuộc vào tần số âm thanh.

 Âm thanh to tương ứng với độ mạnh của tín hiệu trong miền phi tuyến tính.

Thính giác con người mô phỏng theo một loạt biến đổi của tín hiệu âm thanh. Cả

tín hiệu gốc và tín hiệu đã qua xử lý phải trải qua hàng loạt các biến đổi này, dẫn đến cái gọi là phổâm lượng.

 Perceptual Evaluation of Speech Quality (PESQ): Trong các phương pháp đánh giá OE thì PESQ là phương pháp đánh giá phức tạp nhất và được khuyến nghị

bởi ITU_T cho đánh giá chất lượng thoại băng hẹp (3,2KHz) và là một phương pháp đánh giá khách quan có tính tương quan cao với đánh giá theo cảm nhận của người nghe.

2.4 Kết luận chương

Chương này đã trình bày một số phương pháp đánh giá chất lượng tiếng nói sau khi xử lý giảm nhiễu bằng các thuật toán tăng cường tiếng nói. Các đánh giá được giới thiệu gồm có các phương pháp đánh giá tuyệt đối và đánh giá tương đối, đánh giá chủ quan và đánh giá khách quan.

CHƯƠNG 3: THUT TOÁN SPECTRALSUBTRACTION

3.1 Giới thiệu chương

Nội dung của chương này trình bày nguyên lý của thuật toán Spectral subtraction, các bước thực hiện cần thiết để phân tích liên kết tín hiệu, đề cập đến vấn đề ước luợng nhiễu, vấn đề này ảnh hưởng rất lớn đến quá trình xử lý.

Một phần của tài liệu Đồ án Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói (Trang 28 - 30)

Tải bản đầy đủ (PDF)

(54 trang)