Mục tiêu nghiên cứu đề tài là nghiên cứu mô hình cấu trúc, thuật toán của bộ lọc Kalman ứng dụng trong việc giảm nhiễu cho tín hiệu tiếng nói. Đánh giá hiệu quả kỹ thuật giảm nhiễu cho tín hiệu tiếng nói sử dụng bộ lọc Kalman, qua đó so sánh với các kỹ thuật đã nghiên cứu trước đó.
ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ NGHIÊN CỨU GIẢI PHÁP GIẢM NHIỄU SỬ DỤNG BỘ LỌC KALMAN NHẰM NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI Mã số: T2015-07-03 Chủ nhiệm đề tài: ThS Dương Ngọc Pháp Đà Nẵng, 12/2015 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ NGHIÊN CỨU GIẢI PHÁP GIẢM NHIỄU SỬ DỤNG BỘ LỌC KALMAN NHẰM NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI Mã số: T2015-07-03 Xác nhận quan chủ trì đề tài Đà Nẵng, 12/2015 Chủ nhiệm đề tài MỤC LỤC MỤC LỤC DANH MỤC HÌNH VẼ DANH MỤC BẢNG BIỂU DANH MỤC TỪ VIẾT TẮT THÔNG TIN KẾT QUẢ NGHIÊN CỨU .6 MỞ ĐẦU I TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU THUỘC LĨNH VỰC ĐỀ TÀI TRONG VÀ NGOÀI NƯỚC NGOÀI NƯỚC TRONG NƯỚC .8 II TÍNH CẤP THIẾT CỦA ĐỀ TÀI III MỤC TIÊU CỦA ĐỀ TÀI IV ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU ĐỐI TƯỢNG NGHIÊN CỨU .9 PHẠM VI NGHIÊN CỨU V NỘI DUNG NGHIÊN CỨU .9 CHƯƠNG 1:TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI .10 1.1 GIỚI THIỆU CHƯƠNG .10 1.2 NHIỄU 10 1.3 NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI 13 1.4 CÁC KỸ THUẬT GIẢM NHIỄU 14 1.5 KẾT LUẬN CHƯƠNG 15 CHƯƠNG 2:THUẬT TOÁN GIẢM NHIỄU SỬ DỤNG BỘ LỌC KALMAN 16 2.1 GIỚI THIỆU CHƯƠNG .16 2.2 BỘ LỌC KALMAN 16 2.2.1 Tổng quan lọc Kalman 16 2.2.2 Mã hóa dự đốn tuyến tính 17 2.2.3 Cấu trúc lọc Kalman .17 2.2.4 Ưu nhược điểm lọc Kalman 23 2.2.5 Bộ lọc Kalman mở rộng 24 2.3 THUẬT TOÁN GIẢM NHIỄU SỬ DỤNG BỘ LỌC KALMAN 25 2.3.1 Sơ đồ khối hệ thống 25 2.3.2 Giảm nhiễu sử dụng lọc Kalman 27 2.3.3 Ước lượng hệ số mơ hình 31 2.3.4 Ước lượng nhiễu 32 2.4 KẾT LUẬN CHƯƠNG 35 CHƯƠNG 3:CƠ SỞ DỮ LIỆU VÀ TIÊU CHÍ ĐÁNH GIÁ .36 i MỤC LỤC 3.1 GIỚI THIỆU CHƯƠNG .36 3.2 CƠ SỞ DỮ LIỆU 36 3.3 CÁC TIÊU CHÍ ĐÁNH GIÁ 37 3.3.1 Phương pháp đánh giá chủ quan 37 3.3.2 Phương pháp đánh giá khách quan 40 3.4 KẾT LUẬN CHƯƠNG 44 CHƯƠNG 4:THỰC HIỆN GIẢM NHIỄU VÀ ĐÁNH GIÁ KẾT QUẢ .45 4.1 GIỚI THIỆU CHƯƠNG .45 4.2 KẾT QUẢ ĐÁNH GIÁ VÀ PHÂN TÍCH 45 4.2.1 Kết đánh giá theo phương pháp SegSNR 45 4.2.2 Kết đánh giá theo phương pháp LLR 48 4.2.3 Đánh giá theo phương pháp cảm quan PESQ môi trường nhiễu khác .51 4.2.4 Đánh giá hiệu giảm nhiễu môi trường nhiễu khác .54 4.2.5 Kết đánh giá CEP-PESQ-WSS-SegSNR với thuật toán giảm nhiễu 58 4.3 KẾT LUẬN CHƯƠNG 63 KẾT LUẬN 64 KIẾN NGHỊ 64 ii DANH MỤC HÌNH VẼ DANH MỤC HÌNH VẼ Hình 1.1 a) Biên độ b) Trung bình phổ biên độ nhiễu xe (Car) 10 Hình 1.2 a) Biên độ b) Trung bình phổ biên độ nhiễu đường phố (Street) 11 Hình 1.3 a) Biên độ b) Trung bình phổ biên độ nhiễu nhà hàng (Restaurant) 11 Hình 1.4 Mơ hình nhiễu cộng 12 Hình 1.5 Dạng sóng tín hiệu tiếng nói miền thời gian ứng với tín hiệu x(n), tín hiệu bị nhiễu y(n) tín hiệu sau giảm nhiễu 𝐱(𝐧) 12 Hình 1.6 Dạng sóng ảnh phổ tín hiệu tiếng nói: sạch, bị nhiễu 13 Hình 1.7 Sơ đồ khối tổng quát thuật toán giảm nhiễu 13 Hình 2.1 Cơ chế tạo tiếng nói theo mơ hình LPC 17 Hình 2.2 Quá trình thực lọc Kalman 22 Hình 2.3 Sơ đồ thực lọc Kalman với phương trình tốn 23 Hình 2.4 Sơ đồ khối toàn hệ thống 26 Hình 2.5 Kỹ thuật phân khung 26 Hình 2.6 Thuật tốn lọc Kalman 30 Hình 2.7 Sơ đồ khối ước lượng ma trận hệ số hồi quy 31 Hình 2.8 Sơ đồ ước lượng công suất nhiễu tác động 33 Hình 2.9 (a) Tín hiệu bị gây nhiễu 5dB, (b) SNR trước ξ ước lượng, (c) xác suất vắng mặt tiếng nói PH0|Y, (d) xác suất diện tiếng nói PH1|Y 34 Hình 3.1 Đáp ứng tần số lọc IRS 36 Hình 4.1 Kết đánh giá SegSNR thuật toán tăng cường chất lượng tiếng nói với loại nhiễu tiếng ồn ơtơ (Car) 45 Hình 4.2 Kết đánh giá SegSNR thuật tốn tăng cường chất lượng tiếng nói với loại nhiễu tiếng ồn đám đông (Bable) 46 Hình 4.3 Kết đánh giá SegSNR thuật toán tăng cường chất lượng tiếng nói với loại nhiễu trắng (White) 46 Hình 4.4 Kết đánh giá SegSNR thuật toán tăng cường chất lượng tiếng nói với loại nhiễu tàu hỏa (Train) 47 Hình 4.5 Kết đánh giá SegSNR thuật tốn tăng cường chất lượng tiếng nói với loại nhiễu đường phố (Street) 47 Hình 4.6 Kết đánh giá LLR thuật toán tăng cường chất lượng 48 Hình 4.7 Kết đánh giá LLR thuật toán tăng cường chất lượng 49 Hình 4.8 Kết đánh giá LLR thuật toán tăng cường chất lượng 49 Hình 4.9 Kết đánh giá LLR thuật toán tăng cường chất lượng tiếng nói với loại nhiễu tàu hỏa (Train) 50 Trang DANH MỤC HÌNH VẼ Hình 4.10 Kết đánh giá LLR thuật tốn tăng cường chất lượng 50 Hình 4.11 Kết đánh giá hàm giảm nhiễu Kalman miền thời gian theo thông số PESQ cho môi trường nhiễu 51 Hình 4.12 Kết đánh giá hàm giảm nhiễu Kalman miền tần số biến đổi Fourier nhanh theo thông số PESQ cho môi trường nhiễu 52 Hình 4.13 Kết đánh giá hàm giảm nhiễu Kalman miền tần số biến đổi Fourier thời gian ngắn theo thông số PESQ cho môi trường nhiễu 52 Hình 4.14 Kết đánh giá theo số CEP, PESQ, WSS, SegSNR cho thuật toán Kalman-TD 54 Hình 4.15 Kết đánh giá theo số CEP, PESQ, WSS, SegSNR cho thuật toán Kalman-FFT 55 Hình 4.16 Kết đánh giá theo số CEP, PESQ, WSS, SegSNR cho thuật toán Kalman-STFT 56 Hình 4.17 Kết đánh giá CEP, PESQ, WSS, SegSNR thuật tốn tăng cường chất lượng tiếng nói với nhiễu ôtô 58 Hình 4.18 Kết đánh giá CEP, PESQ, WSS, SegSNR thuật tốn tăng cường chất lượng tiếng nói với nhiễu đám đông 59 Hình 4.19 Kết đánh giá CEP, PESQ, WSS, SegSNR thuật toán tăng cường chất lượng tiếng nói với nhiễu trắng 60 Hình 4.20 Kết đánh giá CEP, PESQ, WSS, SegSNR thuật tốn tăng cường chất lượng tiếng nói với nhiễu tàu hỏa 61 Hình 4.21 Kết đánh giá CEP, PESQ, WSS, SegSNR thuật toán tăng cường chất lượng tiếng nói với nhiễu đường phố 62 Trang DANH MỤC BẢNG BIỂU DANH MỤC BẢNG BIỂU Bảng 3.1: Đánh giá liên quan đến tất trật tự thuận nghịch xếp tín hiệu cần đánh giá tín hiệu mẫu tất kết hợp tín hiệu mẫu 38 Bảng 3.2: Thang đánh giá DCR 38 Bảng 3.3: Thang đánh giá CCR 39 Bảng 3.4 Thang đánh giá MOS 40 Trang DANH MỤC TỪ VIẾT TẮT DANH MỤC TỪ VIẾT TẮT Từ viết tắt Tiếng Anh Tiếng Việt ACR Absolute Categories Rating Đánh giá theo giá trị tuyệt đối CCR Compison Category Rating Đánh giá cách so sánh CEP Cepstrum Distance Khoảng cách Cepstrum DCR Degradation Category Rating Đánh giá suy giảm chất lượng DFT Discrete Fourier Transform Phép biến đổi Fourier rời rạc DWT Discrete Wavelet Transform Phép biến đổi Wavelet rời rạc FFT Fast Fourier Transform Phép biến đổi Fourier nhanh FRs Frames Số khung Phép biến đổi ngược Fourier IDFT Inverse Discrete Fourier Transform IDWT Discrete Wavelet Transform Phép biến đổi ngược Wavelet rời rạc IEEE Institute of Electrical and Electronics Engineers Viện kỹ nghệ Điện Điện tử IRS ITU-T LLR Intermediate Reference System International Telecommunications Union-Telecomunication rời rạc Hệ thống tham chiếu trung gian Hiệp hội tiêu chuẩn viễn thông quốc tế Log Likelihood Ratio Logrithm Minium Mean-Squed Error Sai lệch trung bình bình phương tối thiểu-Logarit LPC Linear Predictive Coding Mã hóa dự đốn tuyến tính MIMO Multi Input Multi Output Multi đầu vào, Multi đầu MISO Multi Input Singel Output Multi đầu vào, đầu MMSE Minimum Mean Sque Error Sai lệch trung bình bình phương tối thiểu LogMMSE MOS Mean Opinion Scores MSS Magnitude Spectral Subtraction NOIZEUS Trừ phổ biên độ Noisy Speech Corpus NSS Non-line Spectral Subtraction Trừ phổ phi tuyến OE Objective Evaluation Đánh giá khách quan PDF Probability Density Function Hàm mật độ xác suất Trang DANH MỤC TỪ VIẾT TẮT Perceptual Evaluation of Speech Đánh giá cảm quan chất Quality lượng thoại Power Spectral Density Mật độ phổ công suất Perceptual speech quality measure Đo đạc cảm quan chất lượng thoại PSS Power Spectral Subtraction Trừ phổ công suất SE Subjective Evaluation Đánh giá chủ quan SE Speech Enhancement Tăng cường tiếng nói Segmental Signal-to-Noise Ratio SNR khung SIMO Singel Input Multi Output Một đầu vào, nhiều đầu SISO Singel Input Singel Output Một đầu vào, đầu SNR Signal-to-noise ratio Tỷ số tín hiệu nhiễu SPP Speech Presence Probability Xác suất diện tiếng nói SS Spectral Subtraction Phương pháp trừ phổ Short Time Fourier Transform Phép biến đổi Fourier thời gian ngắn Time Domain Miền thời gian Voice Activity Detection Thăm dò hoạt động tiếng nói WF Wiener Filter Bộ lọc Wiener WSS Weighted Spectral Slope Độ dốc phổ trọng số hóa PESQ PSD PSQM SegSNR STFT TD VAD Trang THÔNG TIN KẾT QUẢ NGHIÊN CỨU ĐẠI HỌC ĐÀ NẴNG CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN Độc lập – Tự – Hạnh phúc THƠNG TIN KẾT QUẢ NGHIÊN CỨU Thơng tin chung: - Tên đề tài: NGHIÊN CỨU GIẢI PHÁP GIẢM NHIỄU SỬ DỤNG BỘ LỌC - KALMAN NHẰM NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI Mã số: T2015-07-03 Chủ nhiệm: DƯƠNG NGỌC PHÁP - Thành viên tham gia: không Cơ quan chủ trì: Trường Cao đẳng Cơng nghệ thơng tin – Đại học Đà Nẵng - Thời gian thực hiện: từ ngày 01/01/2015 đến ngày 31/12/2015 Mục tiêu: - Nghiên cứu mơ hình cấu trúc, thuật tốn lọc Kalman ứng dụng việc giảm nhiễu cho tín hiệu tiếng nói Đánh giá hiệu kỹ thuật giảm nhiễu cho tín hiệu tiếng nói sử dụng lọc Kalman, qua so sánh với kỹ thuật nghiên cứu trước Tính sáng tạo: - Mơ hình hồi qui với hệ số lọc Kalman xây dụng cho tín hiệu tiếng nói nhiễu ước lượng cho kết giảm nhiễu tốt với nhiều loại nhiễu khác môi trường thực Tóm tắt kết nghiên cứu: - Nghiên cứu đặc điểm tiếng nói, tính chất nhiễu, ngun lý lọc Kalman ứng dụng xử lý tín hiệu thống kê Xây dựng thuật tốn giảm nhiễu sử dụng lọc Kalman với hệ số hồi qui thực cho tín hiệu tiếng nói nhiễu ước lượng Mơ thuật tốn với nhiều loại nhiễu mức nhiễu khác sử dụng ngôn ngữ lập trình Matlab So sánh, đánh giá kết mô với kỹ thuật giảm nhiễu nghiên cứu trước (kỹ thuật trừ phổ, kỹ thuật cực tiểu hóa bình phương biên độ,…sử dụng lọc phần trăm) Tên sản phẩm: - Báo cáo tổng kết đề tài; - Bài báo đăng kỷ yếu hội thảo cấp trường; Trang Chương 4: THỰC HIỆN GIẢM NHIỄU VÀ ĐÁNH GIÁ KẾT QUẢ Thuật toán Kalman-FFT Hình 4.12 Kết đánh giá hàm giảm nhiễu Kalman miền tần số biến đổi Fourier nhanh theo thông số PESQ cho môi trường nhiễu Thuật tốn Kalman-STFT Hình 4.13 Kết đánh giá hàm giảm nhiễu Kalman miền tần số biến đổi Fourier thời gian ngắn theo thông số PESQ cho môi trường nhiễu Dựa vào kết thu có nhận xét sau: - Đánh giá thuật toán giảm nhiễu sử dụng lọc Kalman theo phương pháp PESQ cho kết thấp cho tất loại nhiễu 52 Chương 4: THỰC HIỆN GIẢM NHIỄU VÀ ĐÁNH GIÁ KẾT QUẢ - Thuật toán sử dụng lọc Kalman miền thời gian Kalman-TD cho kết tốt hai thuật tốn cịn lại - Bộ lọc Kalman miền tần số (Kalman-FFT Kalman-STFT) cho kết tương đồng với nhau, nhiễu trắng cho số PESQ cao loại nhiễu khác Qua thông số cho thấy cần điều chỉnh thuật toán Kalman để cải thiện hiệu giảm nhiễu theo tiêu chí đánh giá PESQ 53 Chương 4: THỰC HIỆN GIẢM NHIỄU VÀ ĐÁNH GIÁ KẾT QUẢ 4.2.4 Đánh giá hiệu giảm nhiễu môi trường nhiễu khác Thuật tốn Kalman-TD Hình 4.14 Kết đánh giá theo số CEP, PESQ, WSS, SegSNR cho thuật toán Kalman-TD 54 Chương 4: THỰC HIỆN GIẢM NHIỄU VÀ ĐÁNH GIÁ KẾT QUẢ Thuật tốn Kalman-FFT Hình 4.15 Kết đánh giá theo số CEP, PESQ, WSS, SegSNR cho thuật toán Kalman-FFT 55 Chương 4: THỰC HIỆN GIẢM NHIỄU VÀ ĐÁNH GIÁ KẾT QUẢ Thuật toán Kalman-STFT Hình 4.16 Kết đánh giá theo số CEP, PESQ, WSS, SegSNR cho thuật toán Kalman-STFT 56 Chương 4: THỰC HIỆN GIẢM NHIỄU VÀ ĐÁNH GIÁ KẾT QUẢ - Nhìn chung thuật tốn cho thấy phương pháp CEP, WSS cho hiệu giảm nhiễu với loại nhiễu trắng cao so với loại nhiễu khác Các loại nhiễu lại cho kết kỹ thuật giảm nhiễu - Ở phương pháp đánh giá PESQ cho kết thấp cho tất loại nhiễu - Với phương pháp đánh giá SegSNR, thuật toán Kalman-TD cho kết với nhiễu trắng có số cao hơn, phương pháp lại cho thấy kết với nhiễu trắng không cao loại nhiễu khác Để đánh giá phương pháp khác với loại nhiễu khác nhau, qua so sánh thuật tốn giảm nhiễu, phần trình bày kết đánh giá theo phương pháp với kỹ thuật giảm nhiễu đề cập 57 Chương 4: THỰC HIỆN GIẢM NHIỄU VÀ ĐÁNH GIÁ KẾT QUẢ 4.2.5 Kết đánh giá CEP-PESQ-WSS-SegSNR với thuật toán giảm nhiễu Nhiễu tiếng ồn ơtơ (Car) Hình 4.17 Kết đánh giá CEP, PESQ, WSS, SegSNR thuật toán tăng cường chất lượng tiếng nói với nhiễu ơtơ 58 Chương 4: THỰC HIỆN GIẢM NHIỄU VÀ ĐÁNH GIÁ KẾT QUẢ Nhiễu tiếng ồn đám đơng (Babble) Hình 4.18 Kết đánh giá CEP, PESQ, WSS, SegSNR thuật toán tăng cường chất lượng tiếng nói với nhiễu đám đơng 59 Chương 4: THỰC HIỆN GIẢM NHIỄU VÀ ĐÁNH GIÁ KẾT QUẢ Nhiễu trắng (White) Hình 4.19 Kết đánh giá CEP, PESQ, WSS, SegSNR thuật toán tăng cường chất lượng tiếng nói với nhiễu trắng 60 Chương 4: THỰC HIỆN GIẢM NHIỄU VÀ ĐÁNH GIÁ KẾT QUẢ Nhiễu tàu hỏa (Train) Hình 4.20 Kết đánh giá CEP, PESQ, WSS, SegSNR thuật toán tăng cường chất lượng tiếng nói với nhiễu tàu hỏa 61 Chương 4: THỰC HIỆN GIẢM NHIỄU VÀ ĐÁNH GIÁ KẾT QUẢ Nhiễu đường phố (Street) Hình 4.21 Kết đánh giá CEP, PESQ, WSS, SegSNR thuật tốn tăng cường chất lượng tiếng nói với nhiễu đường phố 62 Chương 3: THỰC HIỆN GIẢM NHIỄU VÀ ĐÁNH GIÁ KẾT QUẢ Kết đánh giá cho thấy rằng: - Nhìn chung thuật tốn giảm nhiễu cho kết tiếng nói tăng cường có số đánh giá tốt so với chưa xử lý - Phương pháp SegSNR cho thấy số kết thu cao, đặc biệt môi trường nhiễu trắng, loại trừ thuật tốn Kalman-STFT chưa có điều chỉnh thuật toán phù hợp - Chỉ số PESQ cho kết tốt với thuật tốn Kalman-TD, cịn thuật toán giảm nhiễu Kalman miền tần số chưa thu kết khả quan - Bên cạnh đó, phương pháp đánh giá CEP WSS cho thấy chất lượng thoại môi trường nhiễu xấu Hai kỹ thuật giảm nhiễu Kalman-FFT Kalman-STFT cho kết tốt với phương pháp CEP; đồng thời kỹ thuật giảm nhiễu Kalman, đặc biệt Kalman-TD cho kết tốt với phương pháp đánh giá WSS nhiễu tiếng ồn đám đơng Cịn loại nhiễu xe cho kết đánh giá tương đồng với nhiễu tiếng ồn đám đông, cho thấy khả giảm nhiễu kỹ thuật với loại nhiễu gần giống theo tham số đánh giá - Các phương pháp đánh giá dựa vào việc phân tích phổ tín hiệu, thuật tốn nén nhiễu mạnh dễ dàng làm mát phần tín hiệu tiếng nói có ích, phát sinh nhiễu âm học “musical tone” gây méo dạng tín hiệu, cho kết đánh giá theo số không cao - Đối với loại nhiễu tác động tương ứng SNR thấp cho thấy thuật toán giảm nhiễu sử dụng hàm LogMMSE-PF Kalman-TD cho kết tốt, đặc biệt trường hợp nhiễu trắng 4.3 KẾT LUẬN CHƯƠNG Kết đánh giá liệu tiếng nói sau tăng cường sử dụng thuật tốn trình bày cho thấy tiêu chí đánh giá khác có thay đổi định môi trường nhiễu khác kỹ thuật giảm nhiễu khác Tuy nhiên, nhìn chung tín hiệu tiếng nói bị tác động nhiễu trắng cho kết sau tăng cường tốt có mật độ phổ phẳng Trong kỹ thuật giảm nhiễu sử dụng lọc Kalman, kỹ thuật giảm nhiễu miền thời gian điều chỉnh cho kết tốt Việc ước lượng nhiễu lớn gây ảnh hưởng đến phổ tiếng nói tăng cường, làm méo dạng tín hiệu cho kết đánh giá không tốt theo số WSS, PESQ, CEP 63 KẾT LUẬN VÀ KIẾN NGHỊ KẾT LUẬN Đề tài trình bày thuật tốn giảm nhiễu sử dụng lọc Kalman miền thời gian miền tần số Việc ước lượng công suất nhiễu thực sử dụng kỹ thuật ước lượng dựa xác suất diện tiếng nói SPP, qua cho kết ước lượng tốt Việc sử dụng lọc Kalman điều chỉnh làm nhiệm vụ ước lượng tín hiệu tiếng nói kết hợp với mơ hình hồi quy cho tiếng nói nhiễu có khả làm tăng hiệu ước lượng cho tín hiệu tiếng nói tốt Tuy nhiên, việc sử dụng mơ hình hồi quy bậc cao làm cho thuật toán thực nhiều vòng lặp, làm tăng thời gian xử lý hệ thống, gây khó khăn cho việc thực hệ thống thời gian thực KIẾN NGHỊ Bên cạnh kết thu được, tác giả định hướng tiếp tục nghiên cứu, tìm hiểu vấn đề sau: - Các thuật toán giảm nhiễu sử dụng lọc Kalman miền tần số cho cho kết chưa cao, tiếp tục điều chỉnh thông số hệ thống gắn liền với việc so sánh đánh giá để cải thiện đặc tính thuật toán - Việc điều chỉnh hệ thống nhằm cải thiện thời gian xử lý thuật toán trọng nhằm mục đích đưa vào phát triển hệ thống xử lý thời gian thực, kit phát triển DSP, FPGA để kiểm chứng thuật toán thiết bị phần cứng thực - Tiếp tục nghiên cứu, phát triển, đánh giá lọc Kalman miền biến đổi Wavelet để tiến hành đánh giá hiệu lọc Kalman ứng với miền xử lý khác 64 TÀI LIỆU THAM KHẢO TÀI LIỆU THAM KHẢO Tiếng Anh: [1] Benesty, Jacob “Springer handbook of speech processing” Springer Science & Business Media, 2008 [2] Ephraim, Yariv, and David Malah “Speech enhancement using a minimum mean-square error log-spectral amplitude estimator” Acoustics, Speech and Signal Processing, IEEE Transactions on 33.2 (1985): 443-445 [3] Gerkmann, Timo, and Richard C Hendriks “Noise power estimation based on the probability of speech presence” Applications of Signal Processing to [4] Audio and Acoustics (WASPAA), 2011 IEEE Workshop on IEEE, 2011 Hansen, John HL, and Bryan L Pellom “An effective quality evaluation protocol for speech enhancement algorithms” ICSLP Vol 1998 [5] [6] [7] [8] [9] [10] [11] [12] [13] Hu, Yi, and Philipos C Loizou “Evaluation of objective quality measures for speech enhancement” Audio, Speech, and Language Processing, IEEE Transactions on 16.1 (2008): 229-238 Hu, Yi, and Philipos C Loizou “Subjective comparison of speech enhancement algorithms” Acoustics, Speech and Signal Processing, 2006 ICASSP 2006 Proceedings 2006 IEEE International Conference on Vol IEEE, 2006 Kalman, Rudolph Emil “A new approach to linear filtering and prediction problems” Journal of Fluids Engineering 82.1 (1960): 35-45 Kuldip K Paliwal, A Basu, “A speech enhancement method based on Kalman filtering” Proc IEEE ICASSP (IEEE, Dallas 1987) pp 177–180 Klatt, Dennis “Prediction of perceived phonetic distance from critical-band spectra: A first step” Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP'82 Vol IEEE, 1982 Philipos C Loizou “Speech enhancement: theory and practice” CRC press, 2013 Martin, Rainer “Spectral subtraction based on minimum statistics” power (1994): M.H Hayes “Statistical Digital Signal Processing and Modeling” Wiley, New York 1996 Kuldip K Paliwal, Kuldip, Kamil Wójcicki, and Belinda Schwerin “Singlechannel speech enhancement using spectral subtraction in the short-time iv TÀI LIỆU THAM KHẢO modulation domain” Speech communication 52.5 (2010): 450-475 [14] [15] Popescu, Dimitrie C., and Ilija Zeljkovic “Kalman filtering of colored noise for speech enhancement” Acoustics, Speech and Signal Processing, 1998 Proceedings of the 1998 IEEE International Conference on Vol IEEE, 1998 Recommendation, I T U T “Perceptual evaluation of speech quality (PESQ), an objective method for end-to-end speech quality assessment of narrowband telephone networks and speech codecs” ITU-T Recommendation (2001): 862 [16] S.F Boll, “Suppression of acoustic noise in speech using spectral subtraction” IEEE T Acoust Speech 24(April), 113–120 (1979) So, Stephen, Kamil K Wójcicki, and Kuldip K Paliwal “Single-channel speech enhancement using kalman filtering in the modulation domain” INTERSPEECH 2010 Trang Web: [18] Philipos C Loizou “NOIZEUS: A noisy speech corpus for evaluation of speech enhancement algorithms” [17] http://ecs.utdallas.edu/loizou/speech/noizeus/ truy cập lần cuối 30/11/15 v ...ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ NGHIÊN CỨU GIẢI PHÁP GIẢM NHIỄU SỬ DỤNG BỘ LỌC KALMAN NHẰM NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI... có khả giảm nhiễu cho tín hiệu tiếng nói mơi trường với nhiều loại nhiễu mức nhiễu khác Đề tài ? ?Nghiên cứu giải pháp giảm nhiễu sử dụng lọc Kalman nhằm nâng cao chất lượng tiếng nói? ?? đề xuất... CĐ CÔNG NGHỆ THÔNG TIN Độc lập – Tự – Hạnh phúc THÔNG TIN KẾT QUẢ NGHIÊN CỨU Thông tin chung: - Tên đề tài: NGHIÊN CỨU GIẢI PHÁP GIẢM NHIỄU SỬ DỤNG BỘ LỌC - KALMAN NHẰM NÂNG CAO CHẤT LƯỢNG TIẾNG