1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu kỹ thuật giảm nhiễu cho tín hiệu tiếng nói sử dụng bộ lọc kalman thích nghi

70 21 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - LUẬN VĂN THẠC SĨ KHOA HỌC NGÀNH: ĐO LƯỜNG VÀ CÁC HỆ THỐNG ĐIỀU KHIỂN NGHIÊN CỨU KĨ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI ĐẶNG QUANG HẢI Người hướng dẫn Luận văn: NGUYỄN QUỐC CƯỜNG Hà Nội, 2010 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI MỤC LỤC trang DANH SÁCH CÁC HÌNH……………………………………………………………4 DANH SÁCH CÁC BẢNG……………………………………………………… .6 LỜI MỞ ĐẦU…………………………………………………………………………7 CHƯƠNG I: ĐẶT VẤN ĐỀ………………………………………………………….9 1.1 Nâng cao chất lượng tiếng nói gì? 1.2 Đánh giá chất lượng thuật toán nâng cao chất lượng tiếng nói nào? 11 1.2.1 Tỷ số SNR (signal to noise ratio)…………………………………… 12 1.2.2 PESQ (Perceptual Evaluation of Speech Quality)……………………12 1.2.3 Log-Spectral Distortion (LSD)……………………………………….13 CHƯƠNG II: CÁC PHƯƠNG PHÁP NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI 15 2.1 Các phương pháp thao tác miền phổ biên độ………………………………… 15 2.2 Các phương pháp dùng lọc thích nghi ………………………………………… 16 2.3 Các phương pháp dùng mơ hình tiếng nói ………………………………………… 17 2.4 Các phương pháp dùng phân li không gian …………………………………… 18 2.5 Các phương pháp ước lượng nhiễu ………………………………………………….18 CHƯƠNG III: MƠ HÌNH HỐ TÍN HIỆU TIẾNG NĨI VÀ TÍN HIỆU NHIỄU 20 3.1 Tín hiệu tiếng nói mơ hình tiếng nói………………………………………… 20 3.1.1 Tín hiệu tiếng nói……………………………………………………….20 Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI 3.1.2 Mơ hình tiếng nói……………………………………………………….24 3.1.3 Mơ hình kích thích…………………………………………………… 25 3.1.4 Mơ hình mở rộng……………………………………………………….26 3.1.5 Mơ hình nhiễu………………………………………………………… 27 3.2 Tín hiệu nhiễu……………………………………………………………………27 3.2.1 Nhiễu méo dạng tín hiệu…………………………………………….27 3.2.2 Các loại nhiễu thường gặp………………………………………… .28 CHƯƠNG IV: BỘ LỌC KALMAN THÍCH NGHI VÀ ỨNG DỤNG TRONG XỬ LÝ TIẾNG NÓI………………………………………………………….30 4.1 Khái quát lọc số lọc thích nghi……………………………………… 30 4.1.1 Bộ lọc số……………………………………………………………… 30 4.1.2 Bộ lọc thích nghi……………………………………………………… 31 4.2 Bộ lọc Kalman ứng dụng xử lý tiếng nói………………………………34 4.2.1 Lý thuyết chung lọc Kalman…………………………………… 34 4.2.2 Bộ lọc Kalman nâng cao chất lượng tiếng nói……………………40 4.2.2.1 Lọc nhiễu màu…………………………………………………42 4.2.2.2 Bổ sung vecto trạng thái………………………………… 43 4.2.2.3 Đo sai lệch…………………………………………………… 44 4.2.2.4 Phép lọc Kalman sử dụng băng con………………………… 46 CHƯƠNG V: CƠ SỞ DỮ LIỆU VÀ THUẬT TOÁN……………………………… 49 5.1 Cơ sở liệu…………………………………………………………………… 49 5.1.1 NOIZEUS database……………………………………………… 49 5.1.2 Dữ liệu thực tế (Thu âm môi trường thực tế)…………………….49 Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI 5.2 Chương trình thuật tốn………………………………………………………….49 5.2.1 Sơ đồ khối………………………………………………………………49 5.2.2 Khối phân chia tín hiệu thành băng con……………………………51 5.2.3 Khối ước lượng nhiễu………………………………………………… 60 5.2.4 Khối ước lượng thơng số mơ hình tiếng nói………………… 61 5.2.5 Khối sử dụng mơ hình tiếng nói ước lượng để khơi phục tiếng nói dùng lọc Kalman…………………………………… 61 CHƯƠNG VI: KẾT QUẢ, ĐÁNH GIÁ VÀ HƯỚNG PHÁT TRIỂN ………………62 TÀI LIỆU THAM KHẢO………………………………………………………………67 Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI DANH SÁCH CÁC HÌNH Hình 1.1: Các phương pháp nâng cao chất lượng tiếng nói……………………………10 Hình 1.2: Tỷ số tín hiệu nhiễu…………………………………………………………12 Hình 2.1 : Phương pháp trừ phổ kinh điển……………………………………………….15 Hình 2.2: Hệ thống nâng cao chất lượng tiếng nói sử dụng microphone……….16 Hình 3.1 : Mơ hình tạo tiếng nói……………………………………………………… 21 Hình 3.2: Ảnh phổ tiếng nói phụ nữ phát âm cụm từ “ Argue history”……23 Hình 3.3: Ảnh phổ tín hiệu kích thích thu từ q trình lọc đảo LPC tín hiệu tiếng nói hình 3.2…………………………………………………………………… 24 Hình 3.4: Nhiễu trắng……………………………………………………………………….29 Hình 3.5: Nhiễu khơng ổn định…………………………………………………………….29 Hình 4.1: Mơ hình lọc số……………………………………………………………… 30 Hình 4.2: Mơ hình lọc nhiễu lọc thích nghi…………………………………… 33 Hình 4.3: Vịng quay liên tục lọc Kalman rời rạc…………………………… 38 Hình 4.4: Hoạt động lọc Kalman…………………………………………………….39 Hình 4.5 : Mơ hình hệ thống tuyến tính động……………………………………………40 Hình 4.6: Q trình lọc Kalman………………………………………………………… 42 Hình 4.7: Quá trình lọc Kalman băng con…………………………………………47 Hình 4.8 : Q trình ước lượng thơng số mơ hình tiếng nói………………………… 47 Hình 4.9 : Thuật tốn phát triển tiếng nói sử dụng lọc Kalman………………… 48 Hình 5.1: Sơ đồ ngun lí chung thuật tốn……………………………………… 50 Hình 5.2: Cấu trúc băng lọc phân tích………………………………………………….51 Hình 5.3 : Cấu trúc phần lọc băng lọc phân tích………………………… 52 Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Hình 5.4 : Cấu trúc phân chia băng lọc phân tích……………………… 53 Hình 5.5: Đáp ứng xung h(n)………………………………………………………54 Hình 5.6: Dải thơng h(n)……………………………………………………………54 Hình 5.7: Dải thơng lọc Hi(ejw) trường hợp lý tưởng (a) Và thực tế đạt (b)H1(ejw)÷H7(ejw)…………………………………55 Hình 5.8: Cấu trúc lọc tổng hợp……………………………………………….57 Hình 5.9: Phép nội suy hệ số 2………………………………………………………….57 Hình 5.10: Hiện tượng tạo ảnh nội suy…………………………………….58 Hình 5.11: Loại bỏ thành phần ảnh phụ lọc nội suy………………………59 Hình 5.12: Ước lượng phổ cơng suất nhiễu…………………………………… 61 Hình 6.1: Đoạn âm trước (a) sau (b) đưa qua thuật toán………… 64 Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI DANH SÁCH CÁC BẢNG Bảng 4-1: Các biểu thức Update thời gian lọc Kalman tuyến tính……………………38 Bảng 4-2: Các biểu thức Update giá trị đo lọc Kalman tuyến tính………………… 38 Bảng 5-1: Tỉ số tín hiệu nhiễu (SNR) kết sử dụng lọc Kalman…….62 Bảng 5-2: Độ méo kết sử dụng lọc Kalman……………………………….62 Bảng 5-3: Chỉ số điểm PESQ sử dụng lọc Kalman……………………………… 63 Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI LỜI MỞ ĐẦU Trải qua hàng nghìn năm việc giao tiếp người với người hầu hết thông qua ngôn ngữ giao tiếp hàng ngày Trong thời đại công nghệ bùng nổ việc giao tiếp người người lại mở rộng phương diện người máy Ở thời điểm việc trao đổi thơng tin qua ngơn ngữ giao tiếp lời nói người nói người nghe cần thiết quan trọng, đặc biệt giao tiếp người máy có đặc thù riêng Vấn đề hiểu thơng tin từ phía người nói thơng qua ngơn ngữ truyền đạt điều kiện có nhiều trở ngại tiếng ồn, khó khăn phần cứng đặt chục năm trở lại Vấn đề nâng cao chất lượng trao đổi thơng tin nói chung, nâng cao chất lượng tiếng nói nói riêng, thu hút nhiều nhà nghiên cứu Cải thiện tiếng nói nâng cao chất lượng tiếng nói hay tính hiểu tiếng nói mơi trường có trở ngại cho việc truyền đạt Trong năm gần đây, khái niệm lọc Kalman trở nên phổ biến lĩnh vực nghiên cứu đặc tính ước lượng xác Các nhà kỹ thuật vận dụng ưu điểm lọc Kalman nhằm tạo kết hữu dụng q trình xử lý tín hiệu tiếng nói Ngày nay, lọc Kalman trở thành kỹ thuật lọc tiếng, đưa đánh giá ước lượng loại trừ sai lệch nhiễu dư cịn tồn tiếng nói Với mục đích nghiên cứu thử nghiệm kỹ thuật dựa tảng lọc Kalman, nhằm đưa kết xử lý tiếng nói cao hơn, luận văn này, tác giả lựa chọn sử dụng lọc thích nghi Kalman, thao tác miền khơng gian trạng thái mơ hình tín hiệu tiếng nói tín hiệu nhiễu, kết hợp với thuật toán ước lượng nhiễu Doblinger thuật toán LSL (Least Squares Lattice) ước lượng tham số hồi quy tiếng nói, để khơi phục tín hiệu tiếng nói gốc từ tín hiệu tiếng nói có nhiễu Chương trình xử lý chạy thử nghiệm với sở liệu chuẩn NOIZEUS liệu thu âm thực tế để đưa kết đánh giá Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Để hồn thành luận văn này, ngồi nỗ lực cố gắng thân, phải kể đến dẫn tận tình giáo viên hướng dẫn – TS Nguyễn Quốc Cường, trao đổi kiến thức giúp đỡ bạn bè, hỗ trợ động viên từ phía gia đình suốt thời gian qua Em xin chân thành cảm ơn thầy, bạn bè gia đình ! Hà Nội, ngày tháng năm 2010 Đặng Quang Hải Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI CHƯƠNG I: ĐẶT VẤN ĐỀ 1.1 Nâng cao chất lượng tiếng nói gì? Nhiễu có mặt nơi hầu hết ứng dụng liên quan đến xử lí âm tiếng nói, ví dụ hệ thống giao tiếp người - máy, hệ thống giao tiếp “hand-free”, hệ thống VoiIP, máy trợ thính, hệ thống hội thảo trực tuyến, phịng thí nghiệm trực tuyến, nhiều hệ thống khác Các tín hiệu mà quan tâm thông thường tiếng nói trước đưa đến microphone, thường tồn nhiễu làm giảm chất lượng tiếng nói Do đó, tín hiệu tiếng nói đến microphone cần phải loại bỏ nhiễu nâng cao chất lượng (bằng cơng cụ xử lí tín hiệu) trước lưu trữ, phân tích, truyền phát, phát lại Các trình loại bỏ nhiễu thường gọi “giảm nhiễu” (noise reduction) Vấn đề giảm nhiễu thu hút lượng lớn nhà nghiên cứu hàng chục năm qua đạt kết định Giảm nhiễu hay nâng cao chất lượng tiếng nói nói Cả hai khái niệm đến phương pháp loại bỏ thành phần làm suy giảm chất lượng tiếng nói, mà cụ thể nhiễu hay tiếng ồn, để từ nâng cao tính hiểu tiếng nói chất lượng tiếng nói Nâng cao chất lượng tiếng nói mơi trường có tiếng ồn (ví dụ như: đường phố, ô tô, tàu hỏa, sân bay hay nhiễu mơi trường có đơng người), việc cải thiện chất lượng tính hiểu tiếng nói làm giảm khó khăn gặp phải giao tiếp tiếng nói Hiện có nhiều phương pháp để nâng cao chất lượng tiếng nói, đồng thời có nhiều cách đánh giá phương pháp Do đó, khó đưa nhận định xác, toàn diện phương pháp tốt phương pháp Các kỹ thuật nâng cao chất lượng tiếng nói chia đơn giản theo số lượng sử dụng microphone: loại sử dụng microphone, loại sử dụng hai microphone loại sử dụng mảng microphone Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI π H i (e ) có độ rộng khơng đổi 32 , với độ rộng phổ H (e jω ) nằm liên jω tiếp trục tần số, có tên gọi Polyphase Filterbank Minh họa : Hi(ejw) H(ejw) H0(ejw) H1(ejw) H31(ejw) w -π/64 π/64 π/32 3π/64 π/16 31π/32 63π/64 π (a) 0.8 0.6 0.4 0.2 0 10 20 30 40 50 60 (b) Hình 5.7: Dải thông lọc Hi(ejw) trường hợp lý tưởng (a) Và thực tế đạt (b)H1(ejw)÷H7(ejw) Với 32 mẫu đầu vào x(n) lọc tạo mẫu đầu cho subband,như với 32 subband ta có 32 đầu s(n),các đầu mang xử lí sau Thay cơng thức hàm lọc vào, ta có: M −1 ⎡ ⎛ 2i + ⎛ N ⎞⎞ ⎤ xi ( n ) = ∑ ⎢ 2cos ⎜ π ⎜ k − ⎟ ⎟ hk ⎥x ( n − k ) ⎠⎠ ⎦ k =0 ⎣ ⎝ 2N ⎝ Đặt n = kN+l với l = 0÷N-1: Đặng Quang Hải - 55 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI 15 N −1 ⎛ 2i + ⎛ N ⎞⎞ si ( m) = 2∑∑ 2cos ⎜ π ⎜ kN + l − ⎟ ⎟ hkN +l x ( ( m − k ) N − l ) ⎠⎠ k =0 l =0 ⎝ 2N ⎝ d Thực băng lọc: Với 32 mẫu đầu vào x(n) lọc tạo mẫu đầu cho subband,như với 32 subband ta có 32 đầu s(n),các đầu mang mã hóa Đầu lọc phân tích tính theo cơng thức: xi (n) = ∑ hk x(n − k ) k Thay công thức hàm cửa sổ vào ta có: M −1 ⎡ ⎛ 2i + ⎛ N ⎞⎞ ⎤ xi ( n ) = ∑ ⎢ 2cos ⎜ π ⎜ k − ⎟ ⎟ hk ⎥x ( n − k ) ⎠⎠ ⎦ k =0 ⎣ ⎝ 2N ⎝ Tín hiệu đầu si(m) tính sau: si (m) = x↓32i(m) = xi(32m) M −1 ⎡ ⎛ 2i + ⎛ N ⎞⎞ ⎤ k = ∑ ⎢2cos ⎜ π − ⎜ ⎟ ⎟ hk ⎥x ( N.m − k ) ⎠⎠ ⎦ k =0 ⎣ ⎝ 2N ⎝ Đặt n = kN+l với l = 0÷N-1: 15 N −1 ⎛ 2i + ⎛ N ⎞⎞ = 2∑∑ 2cos ⎜ π ⎜ kN + l − ⎟ ⎟ hkN +l x ( ( m − k ) N − l ) ⎠⎠ k =0 l =0 ⎝ 2N ⎝ Si(m) Từ cơng thức tính giá trị đầu : 15 N −1 ⎛ 2i + ⎛ N ⎞⎞ si ( m) = 2∑∑ cos ⎜ π ⎜ kN + l − ⎟ ⎟ hkN +l x ( ( m − k ) N − l ) ⎠⎠ k =0 l =0 ⎝ 2N ⎝ 5.2.2.2 Bộ lọc tổng hợp a Cấu trúc Cấu trúc băng lọc tổng hợp ngược lại với cấu trúc lọc phân tích Bao gồm bước thực hiện: - Bước 1: Tín hiệu băng (subband samples) si (m) đưa qua nội suy với hệ số 32 nhằm trả lại tần số lấy mẫu tín hiệu gốc x(n) - Bước 2: Tín hiệu nội suy yi(n) đưa qua băng lọc nội suy để loại bỏ thành phần phổ phụ (được sinh hiệu ứng tạo ảnh nội suy), tổng hợp tín hiệu nội suy lại thành tín hiệu khơi phục u(n) Đặng Quang Hải - 56 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Cấu trúc sau: s0(0÷31) s1(0÷31) K0(e ) u1(0÷1024) y1(0÷1024) K1(ejw) ↑32 s31(0÷31) u(0÷1024) jw ↑32 u0(0÷1024) y0(0÷1024) u31(0÷1024) y31(0÷1024) K31(ejw) ↑32 Hình 5.8: Cấu trúc lọc tổng hợp b Nguyên lý lọc: Phần trình bày nguyên lý hoạt động băng lọc tổng hợp với khung liệu (1024 mẫu vào 1024 mẫu) Các tín hiệu subband si(m) (đầu vào 32 subband subband gồm 32 mẫu) đưa qua nội suy hệ số nội suy 32 để trở lại tần số lấy mẫu giống với tín hiệu gốc Phép nội suy chèn thêm 31 mẫu có giá trị vào sau mẫu si(m), m = 0÷31, để tạo tín hiệu nội suy yi (n) với n = 0÷1023 Minh họa phép nội suy hệ số 2: Hình 5.9: Phép nội suy hệ số Đặng Quang Hải - 57 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Sau bước tín hiệu yi (n) có tần số lấy mẫu với x(n) tín hiệu (tính Frame) gồm 32x32=1024 mẫu Tuy nhiên phép nội suy sinh thành phần phổ không mong muốn hiệu ứng tạo ảnh sinh (lý thuyết lọc số nhiều nhịp) Đó lý người ta đặt sau nội suy lọc K i (e jω ) để loại bỏ phổ Minh họa trường hợp nội suy hệ số 2: Si(ejw) -3π/2 -π -π/2 π/2 π 3π/2 Yi(ejw) Ảnh -3π/2 -π Ảnh -π/2 π/2 π 3π/2 Hình 5.10: Hiện tượng tạo ảnh nội suy Các lọc K i (e jω ) K (e jω ) lọc thông thấp tần số cắt wc = π 32 , lọc K (e jω ) ÷ K 30 (e jω ) lọc thơng dải có dải thơng nằm sát có π độ rộng 32 ,các lọc loại bỏ thành phần phổ nằm ngồi dải thơng (chính thành phần ảnh phụ) đầu lọc ui(n) nằm dải tần mong muốn khơng có thành phần ảnh phụ Đặng Quang Hải - 58 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Dải thông K i (e jω ) giống với H i (e jω ) tương ứng băng lọc phân tích khơng cần minh họa Minh họa trường hợp hệ số nội suy 2: Si(ejw) -3π/2 -π -π/2 π/2 π 3π/2 π 3π/2 π 3π/2 π 3π/2 Yi(ejw) -3π/2 -π -π/2 π/2 jw Ki(e ) -3π/2 -π -π/2 π/2 Ui(ejw) -3π/2 -π -π/2 π/2 Hình 5.11: Loại bỏ thành phần ảnh phụ lọc nội suy Đặng Quang Hải - 59 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Tín hiệu khơi phục u(n) sau tính tổng tín hiệu thành phần ui(n) miền thời gian 5.2.3 Khối ước lượng nhiễu Tín hiệu tiếng nói có nhiễu khung liệu gồm 1024 mẫu đưa vào để phân tích biến đổi Furier 1024 điểm để tính phổ cơng suất tiếng nói có nhiễu Từ để ước lượng phổ công suất nhiễu Nhiễu ước lượng theo phương pháp Doblinger [9] Gọi Sk (n) phổ cơng suất tín hiệu tiếng nói có nhiễu khung liệu thứ n băng thứ k Phổ cơng suất tiếng nói có nhiễu làm trơn miền thời gian sau: Psk (n) = α Psk (n − 1) + (1 − α ) Sk (n) Trong thừa số ghi nhớ α lựa chọn nằm khoảng 0.7 đến 0.9 Phổ cơng suất nhiễu tính theo hàm đệ quy với hệ số đệ quy phi tuyến sau: Nếu PNk ( n − 1) < Psk (n) PNk ( n) = γ PNk (n − 1) + Trái lại 1− γ ( Psk (n) − β Psk (n − 1) ) 1− β PNk ( n) = Psk (n) Các hệ số α β thường lựa chọn xấp xỉ gần Phổ cơng suất nhiễu sau tính cho phổ cơng suất nhiễu băng Hình vẽ họa cho phổ công suất nhiễu ước lượng từ phổ cơng suất tiếng nói lọc thứ 18 với tần số trung tâm 1062Hz Đặng Quang Hải - 60 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Hình 5.12: Ước lượng phổ công suất nhiễu Đường nét đậm phổ cơng suất tín hiệu tiếng nói có nhiễu đường nét đứt minh họa phổ cơng suất tín hiệu nhiễu 5.2.4 Khối ước lượng thơng số mơ hình tiếng nói Tín hiệu tiếng nói từ “downsample” trước tiên dùng để ước lượng hệ số hồi quy tín hiệu tiếng nói cách sử dụng thuật toán Least Square Lattice [18] Các hệ số hồi quy tiếng nói ước lượng sau a= 2∑ sn sn −1 n =1 8 ∑s +∑s n n −1 Các hệ số hồi quy ước lượng lại sau mẫu 5.2.5 Khối sử dụng mơ hình tiếng nói ước lượng để khơi phục tiếng nói dùng lọc Kalman Sau có giá trị ước lượng hệ số hồi quy tiếng nói biên độ nhiễu tín hiệu tiếng nói ước lượng cách sử dụng lọc Kalman sau: mẫu tín hiệu tiếng nói có nhiễu vào dùng để ước lượng mẫu tín hiệu tiếng nói % Kalman Filter iteration Pt = a*P*a + sigmaw2; J = Pt/(Pt + sigmav2); x = a*x; x = x + J*(z - x); P = Pt - J*Pt; y=x Trong a hệ số hồi quy ước lượng từ phần Ngồi sigmaw2 cơng suất tín hiệu kích thích trường hợp chọn nhiễu trắng Phổ công suất nhiễu sigmav2 tính từ q trình ước lượng nhiễu trên; y tín hiệu tiếng nói có nhiễu; x tín hiệu ước lượng Tín hiệu tiếng nói sau ước lượng nhờ lọc Kalman khôi phục lại cách “upsample” lên 32 lần trước đưa vào lọc tổng hợp Đầu 32 lọc tương ứng cộng với để tạo tín hiệu Đặng Quang Hải - 61 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI CHƯƠNG VI: KẾT QUẢ, ĐÁNH GIÁ VÀ HƯỚNG PHÁT TRIỂN Đưa thuật toán nâng cao chất lượng tiếng nói sử dụng lọc Kalman vào chạy mô với số liệu NOIZEUS, thiết lập thơng số sau: Phân tích phổ: Khung liệu 1024 mẫu, số điểm FFT 1024 Bộ lọc băng con: 32 băng lọc phân tích 32 băng lọc tổng hợp Ước lượng nhiễu: β = 0.96 α = 0.7 γ = 0.998 * Các kết thu được: Bảng 5-1: Tỉ số tín hiệu nhiễu (SNR) kết sử dụng lọc Kalman Input SegSNR[dB] Nhiễu Phương pháp 10 15 Airport Kalman 4.1514 7.9276 12.1550 16.4763 Car Kalman 5.0411 8.5973 12.2671 16.3480 Babble Kalman 3.7012 7.1934 12.0214 16.1977 Train Kalman 4.5040 8.6895 12.6273 16.7843 Exhibition Kalman 4.6979 8.4634 12.5004 16.4952 Station 4.3214 7.9707 12.1346 16.1901 Kalman Bảng 5-2: Độ méo kết sử dụng lọc Kalman Input SegSNR[dB] Nhiễu Phương pháp 10 15 Airport Kalman 9.4447 6.1657 3.8284 2.1945 Car Kalman 12.1660 7.2552 5.0069 2.9250 Babble Kalman 10.2219 6.9396 4.0484 2.3939 Train Kalman 13.2710 8.6413 5.4797 3.5038 Exhibition Kalman 11.1914 7.5990 4.9900 3.3590 Đặng Quang Hải - 62 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Station Kalman 12.1112 7.9512 4.3889 2.7817 Bảng 5-3: Chỉ số điểm PESQ sử dụng lọc Kalman Input SegSNR[dB] Nhiễu Phương pháp 10 15 Airport Kalman 1.5666 2.4696 2.3167 2.7068 Car Kalman 1.6887 2.0527 2.4516 2.8072 Babble Kalman 1.5441 1.9302 2.3119 2.6937 Train Kalman 1.5433 1.9176 2.2655 2.6826 Exhibition Kalman 1.4915 1.9270 2.3189 2.6749 Station 1.6096 2.0484 2.4112 2.7526 Kalman Ngồi ra, đánh giá thuật tốn số liệu thu thực tế, với kết thu cho thấy thuật toán đảm bảo chạy tốt Đặng Quang Hải - 63 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Hình 6.1: Đoạn âm trước (a) sau (b) đưa qua thuật toán * Kết luận chung: - Ưu điểm: phương pháp cải thiện tiếng nói sử dụng lọc Kalman băng lọc đạt tỉ số tín hiệu nhiễu cao, độ méo thấp số PESQ tương đối cao Ngoài ra, ưu điểm trội thuật tốn khơng có tượng “musical noise” - Nhược điểm: Phương pháp cải thiện tiếng nói sử dụng lọc Kalman băng lọc có nhược điểm thời gian thực chậm bám nhiễu không tốt khả bám nhiễu phụ thuộc hồn tồn vào thuật tốn ước lượng nhiễu Doblinger[9] Đặng Quang Hải - 64 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI * Hướng phát triển đề tài Do hạn chế thời gian khả thân, nên luận văn em thực xây dựng thuật toán chương trình chạy offline với số liệu thu thập sẵn có Tuy nhiên, có điều kiện nghiên cứu phát triển hơn, thuật tốn hồn tồn chạy online có khả bám nhiễu tốt trường hợp nhiễu không ổn định Thực kiểm tra chất lượng hệ thống nhận dạng kết hợp với khối cải thiện tiếng nói này, nhằm nâng cao kết xử lý thuật toán phát triển tiếng nói Tiếp việc đưa thuật toán xuống số thiết bị phần cứng DPS hay FPGA Đặng Quang Hải - 65 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI KẾT LUẬN Mặc dù cố gắng để thực mục tiêu đề ra, nhiên, hạn chế thời gian kiến thức, nên trình thực đồ án, chắn khơng tránh khỏi sai sót Em mong tiếp tục nhận ý kiến đóng góp từ thầy cơ, bạn bè Cuối cùng, lần nữa, em xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo hướng dẫn – TS Nguyễn Quốc Cường, xin chân thành cảm ơn bạn bè gia đình người hỗ trợ, giúp đỡ em nhiều q trình nghiên cứu hồn thành luận văn Hà Nội, ngày tháng năm 2010 Đặng Quang Hải Đặng Quang Hải - 66 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI TÀI LIỆU THAM KHẢO Adaptive Filters I: Fundamentals Bernard Widrow Technical Report No 6764-6, December 1966 Stanford Electronics Laboratories, Standford University, Stanford, California A Speech Enhancement Method Based on Kalman Filtering K.K Paliwal and Anjan Basu Computer Systems and Communication Group, Tata Institute of Fundamental Research, Homi Bhabha Road, Bombay 400005, India Enhancement of noisy speech utilizing the Kalman filter Murat Deviren Electrical and Electronics Engineering Thesis, September 2000 The Department of Electrical and Electronics Engineering, The Middle East Technical University, Speech Processing Using Kalman Filter Yong How Tong Electrical Engineering Thesis, October 2001 Department of Electrical Engineering, University of Queensland Quality Improvement of Speech Signals Using LPC Analysis N Esfandian and E Nadernejad Adv Studies Theor Phys., Vol.2, 2008, no.14, 673-685 Islamic Azad University Ghaemshahr, Iran Filtering of Colored Noise for Speech Enhancement and Coding Jerry D Gibson, Boneung Koo and Steven D Gray, IEEE Transactions on Signal Processing, Vol 39, No.8, August 1991 A Single Microphone Kalman Filter – Based Noise Canceller Đặng Quang Hải - 67 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI M Gabrea, E Grivel, and M Najim IEEE Signal Processing Letters, Vol.6, No.3, March 1999 Improved Colored Noise Handling in Kalman Filter – Based Speech Enhancement Algorithms Frédéric Mustière, Miodrag Bolíc, and Martin Bouchard School of Information Technology and Engineering University of Ottawa, Ottawa, Canada Computationally Efficient Speech Enhancement by Spectral Minima Tracking in Subband Gerhard Doblinger Vienna University of Technology, Austria 10 An Adaptive Kalman Filter for The Enhancement of Noisy AR Signals Gerhard Doblinger Vienna University of Technology, Austria 11 An Introduction to the Kalman Filter Greg Welch and Gary Bishop Department of Computer Science, University of North Carolina at Chapel Hill, February 8, 2001 12 Accuracy of the Perceptual Evaluation of Speech Quality (PESQ) algorithm Scott Pennock Lucent Technologies 13 Nghiên cứu kỹ thuật nén giải nén âm theo chuẩn MPEG Lê Duy Hải, Trần Tiến Dũng Đồ án tốt nghiệp chuyên ngành Kỹ thuật đo Tin học cơng nghiệp, K48 ĐHBKHN 14 Xử lý tín hiệu lọc số Nguyễn Quốc Trung NXB Khoa học Kỹ thuật, Hà Nội, 2003 Đặng Quang Hải - 68 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI 15 Matlab & Simulink dành cho kỹ sư điều khiển tự động Nguyễn Phùng Quang NXB Khoa học Kỹ thuật, Hà Nội, 2005 16 http://www.clear-labs.com/Tutorial-LitReview/index.html 17 http://www.utdallas.edu/~loizou/speech/noizeus/ 18 http://sepwww.stanford.edu/public/docs/sep65/gilles1/paper_html/node2.html Đặng Quang Hải - 69 - Lớp: CH Đo lường 2007-2009 ... 2007-2009 NGHI? ?N CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI CHƯƠNG IV: BỘ LỌC KALMAN THÍCH NGHI VÀ ỨNG DỤNG TRONG XỬ LÝ TIẾNG NÓI 4.1 Khái quát lọc số lọc thích nghi. .. 2007-2009 NGHI? ?N CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Theo tín hiệu tiếng nói giả định tạo với mơ hình này, thuật tốn phát triển tiếng nói nghi? ?n cứu dựa... 2007-2009 NGHI? ?N CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NĨI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI nghi? ?n cứu luận văn mơ hình tiếng nói có kích thích đa dải Tín hiệu kích thích mơ hình hố kết hợp M tín

Ngày đăng: 28/02/2021, 09:23

Xem thêm:

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w