Nhiễu ảnh hưởng nhiều đến hiệu quả xử lý tín hiệu. Vì vậy, triệt nhiễu và nâng cao chất lượng tín hiệu là bước quan trọng trong các hệ thống các hệ thống xử lý tín hiệu thời gian thực.
Tạp chí Khoa học & Công nghệ - Số 1(45) Tp 2/Năm 2008 PHNG PHP TRIT NHIU TING NểI KT HỢP KỸ THUẬT TRỪ PHỔ VÀ KỸ THUẬT MMSE TRÊN MIỀN WAVELET Vũ Ngọc Phàn (Viện Công nghệ thông tin - Viện KHCN Việt Nam)Đỗ Huy Khôi - Phùng Trung Nghĩa (Khoa Công nghệ thông tin - ĐH Thái Nguyên) Tổng quan triệt nhiễu tín hiệu tiếng nói Nhiễu ảnh hưởng nhiều đến hiệu xử lý tín hiệu Vì vậy, triệt nhiễu nâng cao chất lượng tín hiệu bước quan trọng hệ thống hệ thống xử lý tín hiệu thời gian thực [3] Mơ hình chung tín hiệu có nhiễu là: xk = sk + nk , k = 0, , K − (1) Trong sk tín hiệu tiếng nói sạch, nk nguồn nhiễu độc lập với phương sai σ k (σ = 1) (giả sử nk nhiễu trắng) n Gọi sˆ giá trị ước lượng tín hiệu tiếng nói Mục đích phương pháp triệt nhiễu tín hiệu tiếng nói tối thiểu sai số trung bình phương E (| sˆ, s |2 ) K −1 E sˆ - s = ∑ E (sˆ k - s k )2 k =0 (2) Phương pháp trừ phổ Ý tưởng chung phương pháp trừ phổ [1, 5] chọn mức phổ sàn tương ứng với phổ nhiễu tách khỏi phổ tín hiệu lẫn nhiễu Giả thiết nhiễu nk trình ngẫu nhiên dừng khoảng thời gian khung tiếng nói khơng tương quan với tín hiệu tiếng nói Từ (1), sau cửa sổ hố ta được: xw(k) = sw(k) + nw(k) (3) Phổ tín hiệu lẫn nhiễu | X w ( w) | =| S w ( w) |2 + | N w ( w) |2 + S w ( w).N w* ( w) + S w* ( w).N w ( w) (4) Nếu cho n(k) có trung bình khơng tương quan với s(k) S w ( w).N w* ( w) + S w* ( w).N w ( w) tiến tới Do ta có : | S ( w) |2 =| X ( w) |2 − E | N ( w) |2 E | N ( w) |2 | S ( w) | =| X ( w) | 1 − X ( w) |2 2 | S ( w) |2 =| X ( w) |2 G ( w) (5) (6) (7) Gọi G(w) hệ số trọng số phổ Áp dụng biến đổi Wiener đơn giản hóa hàm biến đổi trọng số theo [1] ta có: 90 T¹p chÝ Khoa häc & Công nghệ - Số 1(45) Tp 2/Năm 2008 N ( w) G = Max 1 − α PSD , β (8) X w ( ) PSD Với α hệ số ước lượng β sàn phổ chọn tương ứng Phương pháp ước lượng trung bình phương tối thiểu MMSE Ephraim/Malah Trong phương pháp MMSE Ephraim/Malah [7], thành phần phổ tiếng nói nhiễu mơ hình thành biến ngẫu nhiên Gaussian Phân khung b ăng ti ếng nói th ứ i thành khung có độ dài b ằ ng Ngưỡ ng nhi ễu ướ c l ượ ng khung th ứ p b ăng th ứ i λ i , p đượ c xác đị nh theo Jansen [4] (R ) i post m (R ) i priori m tỉ lệ hệ số ngưỡng CTR (Cofficient to Thershold Ratio) tiền nghiệm hậu nghiệm: ( Rmi ) priori = | cmi | λmi (9) Các ngưỡng nhiễu hệ số cmi λmi ước lượng giống khung Nói cách khác khung p λmi = λ i , p CTR hậu nghiệm tương ứng (R ) i post m =α | cˆmi | λmi + (1 − α )max[0,(R im )priori -1] (10) Với α hệ số thay đổi < α 70 dB) phân biệt phương pháp khơng đáng kể Hình Hình ảnh âm trước sau triệt nhiễu 93 T¹p chÝ Khoa häc & Công nghệ - Số 1(45) Tp 2/Năm 2008 Kết luận Dựa kết nghiên cứu đánh giá phương pháp triệt nhiễu kết hợp kỹ thuật trừ phổ kỹ thuật MMSE Ephraim/Malah miền Wavelet kỹ thuật triệt nhiễu hiệu áp dụng khối tiền xử lý hệ thống xử lý tiếng nói thời gian thực mã hóa, nhận dạng tiếng nói thời gian thực Tóm tắt Báo cáo trình bày phương pháp triệt nhiễu nâng cao chất lượng tiếng nói kết hợp kỹ thuật trừ phổ kỹ thuật ước lượng trung bình phương tối thiểu MMSE Ephraim/Malah miền Wavelet rời rạc Các kết mô cho thấy tiếng nói có nhiễu triệt nhiễu phương pháp đề xuất có SNR cao phương pháp trừ phổ, phương pháp MMSE phương pháp Wavelet Dohono Summary THE SPECTRAL SUBTRACTION AND MMSE COMBINING METHOD IN THE WAVELET DOMAIN In this paper, we present a speech denoising approach using spectral subtraction and MMSE methods on discrete Wavelet domain The simulation results show that the noisy speech denoised by our proposed method has higher SNR than the spectral subtraction denoising, the MMSE denoising and the Wavelet denoising of Dohono Keyword: Wavelet, denoising, speech processing Tài liệu tham khảo [1] Hà Đình Dũng, Nguyễn Kim Quang (2003), “Xây dựng giảm nhiễu sử dụng phương pháp trừ phổ ứng dụng hệ thống nhận dạng tiếng nói”, Báo cáo hội thảo quốc gia CNTT, Thái Nguyên [2] Donoho, D L (1995), “Denoising via soft thresholding'', IEEE Trans Information Theory [3] Gibert Strang, Truong Nguyen (1996), Wavelet and Filter Banks, Weliesley- Cambridge Press, The United States of America [4] Jansen M.(2001), Noise Reduction by Wavelet Thresholding, Springer-Verlag, New York [5] S.F Boll, “Suppression of Acoustic Noise in Speech Using Spectral Subtraction”, IEEE Transactions on Acoustics, Speech, and Signal Processing, vol 27, April 1979, pp 113-120 [6] Stéphane Mallat (1999), A Wavelet Tour of Signal Processing, Second Edition [7] Y Ephraim and D Malah, “Speech enhancement using a minimum mean square error log-spectral amplitude estimator” IEEE Trans on ASSP, 1985, pp 443-445 94 ... rời rạc tiếng nói 4.2 Mơ hình triệt nhiễu kết hợp Phương pháp trừ phổ ước lượng phổ nhiễu toàn khung tiếng nói Phương pháp cho hiệu triệt nhiễu cao chọn mức phổ sàn thực nghiệm gần với phổ nhiễu. .. phương pháp MMSE Malah, phương pháp triệt nhiễu Wavelet Dohono [2] phương pháp đề xuất Bảng So sánh PSNR phương pháp triệt nhiễu Tín hiệu nhiễu Phương pháp trừ phổ Phương pháp trung bình phương tối... bày phương pháp triệt nhiễu nâng cao chất lượng tiếng nói kết hợp kỹ thuật trừ phổ kỹ thuật ước lượng trung bình phương tối thiểu MMSE Ephraim/Malah miền Wavelet rời rạc Các kết mô cho thấy tiếng