1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Đánh giá giải pháp giảm nhiễu cho tín hiệu tiếng nói sử dụng các phép biến đổi Wavelet

5 12 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 5
Dung lượng 1,03 MB

Nội dung

Bài viết tập trung trình bày kỹ thuật giảm nhiễu nâng cao chất lượng cho tín hiệu tiếng nói sử dụng các phép biến đổi trong miền Wavelet.

ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 05(114).2017-Quyển ĐÁNH GIÁ GIẢI PHÁP GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG CÁC PHÉP BIẾN ĐỔI WAVELET EVALUATING SOLUTIONS TO NOISE REDUCTION FOR SPEECH USING WAVELET TRANSFORMATIONS Dương Ngọc Pháp, Võ Thị Diệu Hạnh Trường Cao đẳng Công nghệ Thông tin, Đại học Đà Nẵng; dnphap@cit.udn.vn, dieuhanh3107@gmail.com Tóm tắt - Bài báo tập trung trình bày kỹ thuật giảm nhiễu nâng cao chất lượng cho tín hiệu tiếng nói sử dụng phép biến đổi miền Wavelet Phương pháp xác định nhiễu sử dụng lọc phần trăm (PF: Percentile Filter) [6] sử dụng để thực tiền xử lý cho kỹ thuật nén nhiễu, bao gồm hàm nén nhiễu ngưỡng cứng, nén nhiễu ngưỡng mềm nén nhiễu thích nghi sử dụng phương pháp lọc Wavelet thống kê có tính cảm quan (PSWF) Phần mơ trình bày kết đánh giá hiệu giảm nhiễu ba phương pháp môi trường nhiễu khác nhau, đồng thời thực so sánh, đánh giá với phương pháp giảm nhiễu miền tần số nghiên cứu Kết cho thấy kỹ thuật miền Wavelet cho hiệu giảm nhiễu tốt, đặc biệt nhiễu màu Abstract - The article focuses on demonstrating noise reduction techniques for enhancing speech signaling using transformations in the Wavelet domain Noise determination with Percentile Filter is used to perform preprocessing for interference suppression techniques including hard-edge interference compression, soft-band interference compression, and noise correction using sensory Wavelet filtering (PSWF) The simulation will show the results of the noise reduction of the three above methods in different noise environments, and will also make comparisons with the noise reduction methods in the research frequency domain The results show that the techniques in the Wavelet domain for noise reduction are good, especially for color noise Từ khóa - Wavelet; giảm nhiễu; tiếng nói; PSWF, miền Wavelet Key words - Wavelet; noise reduction; speech; PSWF; Wavelet domain Đặt vấn đề Trong sống người, phương thức giao tiếp chủ yếu với tiếng nói Hầu hết chất lượng tiếng nói hệ thống thông tin liên lạc bị suy giảm tác động nhiễu Vì vậy, việc nghiên cứu đưa kỹ thuật nhằm loại bỏ nhiễu đóng vai trị quan trọng việc đảm bảo chất lượng tính trung thực tín hiệu tiếng nói hệ thống thông tin liên lạc Việc nâng cao chất lượng tiếng nói bao gồm việc cải thiện chất lượng, tính dễ hiểu giảm khó chịu cho người nghe cách giảm tối đa nhiễu tác động vào tiếng nói Các kỹ thuật sử dụng để giảm nhiễu cho tín hiệu tiếng nói bao gồm trừ phổ (SS) [2], ước lượng MMSE [3], log MMSE [12], lọc Wiener (WF) [4], biến đổi Wavelet… Nội dung báo tập trung đánh giá hàm nén nhiễu miền Wavelet bao gồm hàm nén nhiễu ngưỡng cứng [8], nén nhiễu ngưỡng mềm [9] nén nhiễu thích nghi sử dụng phương pháp lọc Wavelet thống kê có tính cảm quan (PSWF) [1], [7] dựa việc xác định ngưỡng nhiễu với lọc phần trăm PF [6] Trong miền Wavelet, tín hiệu tiếng nói phân tích thành sóng con, ứng với hệ số Wavelet đóng góp vào mức nhiễu với phương sai 𝜎 cho phép xác định xác hệ số nhiễu Kết thực so sánh, đánh giá với kỹ thuật đề xuất cho thấy rằng, hàm nén nhiễu miền Wavelet tỏ hiệu với loại nhiễu khác môi trường thực Phép biến đổi Wavelet Gọi f(x) tín hiệu ban đầu, phép biến đổi Wavelet f(x) sử dụng hàm Wavelet ψ0 biểu diễn [5]: W(s, b) = +∞ ∫ f(x) ψ∗0 √s −∞ ( x−b s ) dx (1) Trong đó: - W(s,b) hệ số biến đổi Wavelet f(x), với s tỉ lệ (nghịch đảo tần số) b dịch chuyển đặc trưng vị trí - ψ∗0 (x) hàm liên hiệp phức Wavelet, ψ0 (x) gọi hàm Wavelet phân tích Biểu thức (1) viết lại dạng tích nội sau: W(s, b) = 〈f(x), ψ0(s,b) (x)〉 (2) Trong đó: ψ0(s,b) (x) = √s ( x−b s ) (3) Hình Miền phân tích phép biến đổi Wavelet Mỗi tín hiệu phân tích thành hai thành phần: thành phần xấp xỉ A “tương ứng với thành phần tần số thấp” thành phần chi tiết D “tương ứng thành phần tần số cao” thông qua hai lọc thơng thấp thơng cao, đó, lọc thông cao sử dụng hàm Wavelet Ψ(x) lọc thông thấp sử dụng hàm tỉ lệ (scaling function) Φ(x) Mối quan hệ hàm tỉ lệ hàm Wavelet cho bởi: Φ(x) = ∑N−1 k=0 ck Φ(2x − k) Ψ(x) = k ∑N−1 k=0 (−1) ck Φ(2x + k − N + 1) (4) (5) Trong đó, Ψ(x) hàm tỉ lệ cho hàm Wavelet Φ ck hệ số Wavelet Dương Ngọc Pháp, Võ Thị Diệu Hạnh Mơ hình nhiễu cộng miền Wavelet Do tính chất tuyến tính biến đổi Wavelet rời rạc DWT (Discrete Wavelet Transform), mô hình nhiễu cộng miền tần số miền Wavelet [7]: 𝑘 𝑘 𝑘 (𝑛) = 𝑋𝑚,𝑖 (𝑛) + 𝐷𝑚,𝑖 (𝑛) 𝑌𝑚,𝑖 𝑘 (𝑛), 𝑌𝑚,𝑖 𝑘 (𝑛) 𝑋𝑚,𝑖 (6) 𝑘 (𝑛) 𝐷𝑚,𝑖 đó, mơ tả chuỗi hệ số gói Wavelet tín hiệu bị nhiễu, tín hiệu tín hiệu nhiễu tương ứng tính tỷ lệ thứ m cho frame thứ i (k = 1, 2, 3, …2m) Trong nghiên cứu ứng dụng phân tích gói Wavelet nhị phân WPD (Wavelet Packet Decomposition) thực tỷ lệ phân tích m = Hình mơ tả cấu trúc phân chia gói Wavelet 𝑇𝑘,𝑖 = 𝜎𝑀𝐴𝐷 𝑘,𝑖 √2𝑙𝑜𝑔𝑁𝑘,𝑖 Trong đó, 𝜎𝑀𝐴𝐷 𝑘,𝑖 = 0.6745 (8) 𝑀𝑒𝑑𝑖𝑎𝑛(|𝑌𝑘,𝑖 (𝑛)|) ước lượng bền vững độ lệch chuẩn cách tính Median Absolute Deviation (MAD) chuỗi hệ số Thuật toán giảm nhiễu miền Wavelet 5.1 Kỹ thuật nén nhiễu ngưỡng cứng ngưỡng mềm Kỹ thuật khử nhiễu miền Wavelet xuất phát từ nguyên tắc: Mỗi hệ số Wavelet đóng góp vào mức nhiễu với phương sai 𝜎 , có vài số hệ số Wavelet ảnh hưởng tới tín hiệu [10] Điều cho phép thay hệ số nhiễu zero Các kỹ thuật nén ngưỡng cứng nén ngưỡng mềm hàm khử nhiễu đơn giản chưa tối ưu Các Hình mơ tả mối quan hệ ngõ vào ngõ đặc tuyến hàm nén nhiễu ngưỡng cứng ngưỡng mềm miền Wavelet Hình Cấu trúc phân chia gói Kỹ thuật chọn ngưỡng Giải pháp khử nhiễu Wavelet xem phương pháp ước lượng thống kê khơng có tham số Ngun lý thực dựa việc định ngưỡng nén hệ số Wavelet mà giá trị chúng thấp ngưỡng nhiễu Việc chọn ngưỡng tác động đến làm trơn làm cho khớp với tín hiệu khử nhiễu Cụ thể ngưỡng giá trị nhỏ dẫn đến khử nhiễu nhẹ, hệ nhiễu tồn đọng nhiều sau xử lý Ngược lại, ngưỡng với giá trị lớn nén nhiều hệ số Wavelet, dẫn đến làm trơn tín hiệu đồng thời làm suy hao thành phần unvoiced (ví dụ âm /s/) tiếng nói, gây méo tín hiệu tiếng nói sau khử nhiễu Trong cơng bố [10], tác giả đề xuất cơng thức tính ngưỡng nhiễu tồn cục UT (Universal Threshold) dựa nguyên tắc tối thiểu hóa hàm rủi ro (risk function) tín hiệu mong muốn tín hiệu khử nhiễu: Hình Đặc tuyến hàm nén nhiễu ngưỡng cứng miền Wavelet [7], [8] 𝐸{𝑅(𝑇)} = 𝐸 {‖𝐸{𝑋̂𝑘 (𝑛)} − 𝐸{𝑋𝑘 (𝑛)}‖ } + 𝐸{‖𝑋̂𝑘 (𝑛) − 𝐸{𝑋̂𝑘 (𝑛)}‖ }            ER(T )  E  E  X k (n)  EX k (n)   E  X k (n)  E  X k (n)                (7) ̂𝑘 (𝑛)là Trong E{.} tốn tử trung bình thống kê, 𝑋 hệ số Wavelet cải thiện Với giả thiết tính trực giao biến đổi Wavelet phân bố nhiễu với phương sai 𝜎 , ngưỡng UT tỷ lệ thuận với độ lệch chuẩn 𝜎 chiều dài N chuỗi hệ số Wavelet Để ước lượng tốt nhiễu màu, UT tính tốn cho gói Wavelet độc lập khung tín hiệu sau: Hình Đặc tuyến hàm nén nhiễu ngưỡng mềm miền Wavelet [7], [9] Hàm nén hard-threshold GH (T) nén tất hệ số Wavelet nhỏ ngưỡng nhiễu tối thiểu hệ số lại khơng tác động (n) , if |Yk (n)| > T ̂ kH (n) = GH (T, Y) = {Yk X (9) , if |Yk (n)| ≤ T ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 05(114).2017-Quyển Với hàm nén ngưỡng mềm đề xuất [9], điểm gián đoạn đặc tuyến ngõ hàm nén ngưỡng cứng loại bỏ cách nén hệ số Wavelet mức ngưỡng giá trị, giá trị ngưỡng T ước lượng: 𝑋̂𝑘𝑆 (𝑛) = 𝐺 𝑆 (𝑇, 𝑌) = 𝑠𝑔𝑛(𝑌𝑘 (𝑛))(|𝑌𝑘 (𝑛)| − 𝑇) , 𝑖𝑓 |𝑌𝑘 (𝑛)| > 𝑇 { (10) , 𝑖𝑓 |𝑌𝑘 (𝑛)| ≤ 𝑇 Hàm nén ngưỡng mềm dù cải thiện chưa đạt tối ưu quy luật nén tuyệt đối hệ số ngưỡng 0, phá hủy hệ số Wavelet tín hiệu tiếng nói vơ thanh, tương tự tiếng nói vơ số mức nhiễu Hàm nén ngưỡng cứng dẫn đến phương sai lớn tính chất khơng liên tục hàm gain, ngưỡng mềm dẫn đến mức độ dịch chuyển lớn hơn, tất hệ số lớn ngưỡng giảm lượng giá trị ngưỡng T 5.2 Thuật toán giảm nhiễu dùng phương pháp lọc Wavelet thống kê có tính cảm quan PSWF Phần trình bày phương pháp giảm nhiễu Wavelet tối ưu (Optimal Shrinkage) dùng thuật tốn phân tích gói Wavelet WPD (Wavelet Packet Decomposition), thuật toán lọc Wavelet thống kê có tính cảm quan PSWF (Perceptually Statistical Wavelet Filter) với mức nhiễu toàn cục UT (Universal Threshold) gọi tắt ShrinkingUT-PF, với sơ đồ khối Hình 1, 𝐻𝑘,𝑖 = { H k ,i 𝑖𝑓 𝛾𝑘,𝑖 < 𝑠𝑔𝑛 {𝑌𝑘,𝑖 (𝑝) 𝛾𝑘,𝑖 −1 (1+𝜇𝑘,𝑖 ) 𝜇𝑘,𝑖 𝛾𝑘,𝑖 } , 𝑖𝑓 𝛾𝑘,𝑖 < if  k ,i  1 ,    (1   k ,i ) k ,i    sgn ( ) , if  k ,i  Y p k ,i    k , i k , i  (11) Ở đây, 𝛾𝑘,𝑖 ≜ định nghĩa [1]: 𝜇𝑘,𝑖 = exp(𝛽 |𝑌𝑘,𝑖 (𝑝)| 𝛤𝑘,𝑖 thông số thích nghi 𝜇𝑘,𝑖 max{|𝑌𝑘,𝑖 (𝑝)|} ̃𝑘,𝑖 𝛤 𝑝 ) ̃𝑘,𝑖 } ̃𝑘,𝑖 max{𝛤 𝛤 𝑖  k ,i ~   max | Y ( p) |   p k ,i  k ,i  exp   ~ ~  max{  k ,i }   k ,i i   (12) Trong đó, phần mũ exp tự thích nghi với ngưỡng nhiễu làm trơn chuẩn hóa 𝛤̃𝑘,𝑖 với số độ dốc 𝛽 = 5,8 Hình Sơ đồ thuật toán PSWF [1], [7] Trước hết, ngưỡng 𝑇𝑘,𝑖 tính từ hệ số Wavelet 𝑌𝑘,𝑖 (𝑛) gói Sau đó, ngưỡng nhiễu cảm quan 𝑃𝑗 ,𝑖 tính cho CWS (critical Wavelet subband) thơng qua ánh xạ ngưỡng Tiếp theo, áp dụng kỹ thuật lọc percentile thống kê để ước lượng ngưỡng nhiễu percentile 𝛤̃𝑗,𝑖 cho CWS cách thích nghi Các ngưỡng ước lượng lại tiếp tục tinh chỉnh trọng số hóa miền thời gian miền tần số Cuối cùng, sau qua ánh xạ ngược ngưỡng từ CWS sang toàn băng tương ứng gói phân tích Wavelet, ngưỡng 𝛤̃𝑗,𝑖 đưa vào hàm nén nhiễu thích nghi để khử nhiễu hệ số Wavelet Các mẫu tiếng nói khơi phục phép khơi phục gói Wavelet (WPR) Thuật toán sử dụng hàm Wavelet nén nhiễu cải tiến, mà chất hàm ngưỡng cứng làm trơn theo sở luật µ Quy tắc nén thể hàm ước lượng sau (posteriori function) tỷ số tín hiệu ngưỡng phân đoạn trước 𝛾𝑘,𝑖 sau: Hình Đặc tuyến hàm nén nhiễu thích nghi miền Wavelet [7] Hình mô tả mối quan hệ ngõ vào ngõ đặc tuyến hàm nén nhiễu thích nghi miền Wavelet Kỹ thuật nén theo luật µ biểu diễn thỏa hiệp ngưỡng cứng ngưỡng mềm Trong hàm ngưỡng cứng có phương sai lớn bias nhỏ hơn, hàm ngưỡng mềm có bias lớn phương sai nhỏ Nói cách khác, ngưỡng cứng có xu hướng giữ dạng gốc tín hiệu, cịn ngưỡng mềm có xu hướng làm mịn tín hiệu [9] Một ưu điểm lớn nén luật µ so với luật khác khơng thiết lập tất phần hệ số Wavelet, mà trị tuyệt đối hệ số thấp ngưỡng, thực ngưỡng cứng mềm Thực giảm nhiễu đánh giá kết 6.1 Cơ sở liệu Cơ sở liệu đánh giá lấy từ thư viện NOIZEUS [13] gồm 30 câu thoại được ghi âm phòng thí nghiệm Dương Ngọc Pháp, Võ Thị Diệu Hạnh theo chuẩn IEEE tín hiệu thoại Mỗi câu dài trung bình khoảng s Năm loại nhiễu chọn để nghiên cứu nhiễu ô tô (Car), nhiễu đám đông (Babble), nhiễu trắng (White), nhiễu từ tàu hỏa (Train) nhiễu đường phố (Street) 6.2 Tiêu chí đánh giá Các phương pháp đánh giá khách quan khảo sát để thực đánh giá chất lượng tín hiệu tiếng nói qua tiêu chí đánh giá, bao gồm: - Segmental Signal-to-Noise Ratio (SegSNR); - Log Likelihood Ratio (LLR); - Cepstrum Distance (CEP); - Perceptual Evaluation of Speech Quanlity (PESQ); - Weighted Spectral Slope (WSS) 6.3.3 Đánh giá theo phương pháp WSS Hình Kết đánh giá WSS thuật toán tăng cường chất lượng tiếng nói với loại nhiễu tiếng ồn đám đông (Babble) 6.3.4 Đánh giá theo phương pháp SegSNR 6.3 Kết đánh giá phân tích Bài báo thực đánh giá, so sánh kỹ thuật nghiên cứu NSS-PF, MMSE-PF LogMMSE-PF ước lượng nhiễu sử dụng lọc phần trăm (PF) với kỹ thuật giảm nhiễu miền Wavelet HardThr-PF, SoftThrPF, Shriking-UT-PF 6.3.1 Đánh giá theo phương pháp LLR Phương pháp đo LLR lựa chọn để đánh giá kỹ thuật giảm nhiễu với mức nhiễu khác nhau, kết thực với nhiễu tiếng ồn đám đơng Hình - LLR - babble 1.6 HardThr-PF SoftThr-PF Shrinking-UT-PF LogMMSE-PF NSS-PF MMSE-PF 1.4 LLR 1.2 0.8 0.6 0.4 10 15 SNR Hình Kết đánh giá LLR thuật toán tăng cường chất lượng tiếng nói với loại nhiễu tiếng ồn đám đông (Babble) Kết so sánh số LLR lọc nhiễu dùng thuật toán miền Wavelet cho kết tốt thuật toán so sánh 6.3.2 Đánh giá theo phương pháp CEP Hình Kết đánh giá CEP thuật tốn tăng cường chất lượng tiếng nói với loại nhiễu tiếng ồn đám đơng (Babble) Hình 10 Kết đánh giá SegSNR thuật toán tăng cường chất lượng tiếng nói với loại nhiễu tiếng ồn đám đơng (Babble) 6.3.5 Đánh giá theo phương pháp cảm quan PESQ Thực đánh giá PESQ cho kỹ thuật giảm nhiễu sử dụng thuật toán miền Wavelet ứng với môi trường nhiễu khác cho kết Hình 11, Hình 12, Hình 13 Kết đánh giá cho thấy hàm nén nhiễu Wavelet PSWF cho số PESQ tốt hẳn hai kỹ thuật Wavelet lại, hàm ánh xạ ngưỡng tích hợp 128 mức ngưỡng toàn cục vào 17 giá trị ngưỡng tương ứng với 17 băng thứ yếu (CWS) [7], thay sử dụng trực tiếp giá trị ngưỡng toàn cục phép phân tích gói, đó, số ứng với loại nhiễu trắng (white) cao hẳn so với loại nhiễu cịn lại Hình 11 Kết đánh giá hàm nén ngưỡng cứng cho môi trường nhiễu ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 05(114).2017-Quyển nhiên thuật toán giảm nhiễu Shrinking-UT-PF cho kết tốt mức nhiễu thấp Hình 12 Kết đánh giá hàm nén ngưỡng mềm cho môi trường nhiễu Kết luận Kết đánh giá liệu tiếng nói sau tăng cường sử dụng thuật tốn trình bày, cho thấy tiêu chí đánh giá khác có thay đổi định môi trường nhiễu khác kỹ thuật giảm nhiễu khác Tuy nhiên, nhìn chung tín hiệu tiếng nói bị tác động nhiễu trắng cho kết sau tăng cường tốt hơn, có mật độ phổ phẳng Trong nhóm thuật tốn nén nhiễu miền Wavelet, thuật toán Shrinking-PF cho kết xử lý tốt hơn, khả nén nhiễu cao hơn, tín hiệu sau xử lý bị phá hủy, đảm bảo tính dễ nghe tín hiệu Kết hoàn toàn tương đồng sau nghe thử mẫu tín hiệu xử lý Trong số phương pháp đánh giá tìm hiểu, phép đánh giá PESQ SNRseg cho kết đáng tin cậy hơn, tương đồng cao với cảm nhận nghe chủ quan TÀI LIỆU THAM KHẢO Hình 13 Kết đánh giá hàm Wavelet PSWF cho mơi trường nhiễu Ngồi ra, đánh giá cảm quan PESQ mơi trường nhiễu khác cịn so sánh kỹ thuật giảm nhiễu với Hình 14 đánh giá nhiễu từ tàu hỏa (train) -PESQ-train 2.8 2.6 PESQ 2.4 2.2 NoisySignal HardThr-PF SoftThr-PF Shrinking-UT-PF LogMMSE-PF NSS-PF MMSE-PF 1.8 1.6 1.4 10 15 SNR Hình 14 Kết phương pháp đánh giá PESQ thuật toán tăng cường chất lượng tiếng nói với nhiễu tiếng ồn tàu hỏa Kết đánh giá cho thấy thuật toán miền Wavelet cho kết xử lý thấp mức nhiễu cao Tuy [1] Phạm Văn Tuấn, Hoàng Lê Uyên Thục, “Giải pháp giảm nhiễu miền Wavelet để nâng cao hiệu suất nhận dạng tiếng nói tự động”, Tạp chí Khoa học Cơng nghệ, Đại học Đà Nẵng, số 4(39), 2010 [2] Boll, S.F., “Suppression of acoustic noise in speech using spectral subtraction”, IEEE Trans, Acoust Speech Signal Process., 27(2), 113-120, 1979 [3] Ephraim, Yariv, and David Malah, Speech enhancement using optimal non-linear spectral amplitude estimation, Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP'83, Vol 8, IEEE, 1983 [4] Cohen, Israel, “Speech enhancement using a noncausal a priori SNR estimator”, IEEE signal processing letters, 11.9 (2004): 725-728 [5] Graps, Amara, “An introduction to Wavelets”, IEEE computational science and engineering, 2.2 (1995): 50-61 [6] Pham T.V., Gernot Kubin, “WPD-based Noise Suppression Using Nonlinearly Weighted Threshold Quantile Estimation and Optimal Wavelet Shrinking”, Proc Interspeech, Lisboa, Portugal, 4-8 Sep., 2005 [7] Van Pham, Tuan, Wavelet Analysis For Robust Speech Processing and Applications, Diss Ph D Thesis, 2007 [8] Donohol, M Johnstone, and M Johnsone, Ideal spatial adaptation via Wavelet shrinkage, Biometrika 12.8 (1994): 430-445 [9] Donoho D L., “De-noising by soft thresholding”, IEEE Trans Information Theory, 41:613–627, 1995 [10] Pham T.V., Gernot Kubin, Erhard Rank, Robust Speech Recognition Using Adaptive Noise Threshold Estimation And Wavelet Shrinkage, Proc IEEE ICCE, Hoi An, Vietnam, 04-06 Feb., 2008 [11] Ephraim Y and D Malah, “Speech enhancement using a minimum mean square error log-spectral amplitude estimator”, IEEE Transactions on Acoustics, Speech, and Signal Processing, 33:443– 445, 1985 [12] Ephraim, Yariv, and David Malah, “Speech enhancement using a minimum mean-square error log-spectral amplitude estimator”, IEEE Transactions on Acoustics, Speech and Signal Processing, 33.2 (1985): 443-445 [13] http://ecs.utdallas.edu/loizou/speech/noizeus/ truy cập lần cuối 20/03/2017 (BBT nhận bài: 03/05/2017, hoàn tất thủ tục phản biện: 27/05/2017) ... cường chất lượng tiếng nói với loại nhiễu tiếng ồn đám đông (Babble) 6.3.5 Đánh giá theo phương pháp cảm quan PESQ Thực đánh giá PESQ cho kỹ thuật giảm nhiễu sử dụng thuật toán miền Wavelet ứng với... nhiễu đường phố (Street) 6.2 Tiêu chí đánh giá Các phương pháp đánh giá khách quan khảo sát để thực đánh giá chất lượng tín hiệu tiếng nói qua tiêu chí đánh giá, bao gồm: - Segmental Signal-to-Noise... 6.3.3 Đánh giá theo phương pháp WSS Hình Kết đánh giá WSS thuật tốn tăng cường chất lượng tiếng nói với loại nhiễu tiếng ồn đám đông (Babble) 6.3.4 Đánh giá theo phương pháp SegSNR 6.3 Kết đánh giá

Ngày đăng: 13/03/2021, 10:44

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w