Xử lý tiếng nói dùng bộ lọc mờ thích nghi hồi quy

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA ĐIỆN – ĐIỆN TỬ CHÂU ĐÌNH THỤY XỬ LÝ TIẾNG NÓI DÙNG BỘ LỌC MỜ THÍCH NGHI HỒI QUY Chuyên ngành: KỸ THUẬT VÔ TUYẾN-ĐIỆN TỬ Mã số ngành: 2.07.01 LUẬN VĂN THẠC SĨ Thành phố Hồ Chí Minh, 10/2006 CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH Cán hướng dẫn khoa học: PGS-TS LÊ TIẾN THƯỜNG TS HỒNG ĐÌNH CHIẾN Ký tên Ký tên Cán chấm nhận xét 1: Ký tên Cán chấm nhận xét 2: Ký tên Luận văn thạc sĩ bảo vệ HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày tháng năm 2006 CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM ĐỘC LẬP – TỰ DO – HẠNH PHÚC TRƯỜNG ĐẠI HỌC BÁCH KHOA PHÒNG ĐÀO TẠO SĐH Tp.HCM, ngày tháng năm 2006 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: CHÂU ĐÌNH THỤY Phái: Nam Ngày, tháng, năm sinh: 02 – 10 – 1978 Nơi sinh: An Giang Chuyên ngành: Kỹ thuật Vô tuyến – Điện tử MSHV: 01404352 I- TÊN ĐỀ TÀI: Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy II- NHIỆM VỤ VÀ NỘI DUNG: - Tìm hiểu vấn đề xử lý tiếng nói - Tìm hiểu lọc mờ thích nghi hồi quy - Xây dựng lọc mờ thích nghi hồi quy - Mô matlab ứng dụng lọc mờ thích nghi hồi quy triệt nhiễu thích nghi III- NGÀY GIAO NHIỆM VỤ: 06 − 02 − 2006 IV- NGÀY HOÀN THÀNH NHIỆM VỤ: 26 − 12 − 2006 V- CÁN BỘ HƯỚNG DẪN: PGS-TS LÊ TIẾN THƯỜNG TS HOÀNG ĐÌNH CHIẾN CÁN BỘ HƯỚNG DẪN CHỦ NHIỆM NGÀNH CN BỘ MÔN QL CHUYÊN NGÀNH Nội dung đề cương luận văn thạc só Hội đồng chuyên ngành thông qua TRƯỞNG PHÒNG ĐT − SĐH Ngày tháng năm TRƯỞNG KHOA QL NGÀNH LỜI CẢM ƠN Tôi xin bày tỏ lòng biết ơn chân thành sâu sắc đến PGS-TS Lê Tiến Thường TS Hoàng Đình Chiến Các Thầy tận tình hướng dẫn tạo điều kiện thuận lợi tài liệu điều kiện vật chất khác để hoàn thành luận văn Tôi xin chân thành cảm ơn quý thầy cô khoa Điện-Điện tử trường Đại Học Bách Khoa Tp HCM tận tình truyền đạt kiến thức vô bổ ích suốt trình học tập nghiên cứu trường Xin cảm ơn Cha Mẹ gia đình tạo điều kiện, động viên ủng hộ suốt trình học tập thực luận văn Và cuối xin chân thành cảm tạ tất bạn bè nhiệt tình giúp đỡ suốt thời gian vừa qua Xin trân trọng ghi nhớ Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến ABSTRACT Speech enhancement and noisy speech signal recognition are two important problems in noisy speech processing field There are many techniques were proposed to solve these problems however it has been shown that their performance was not good enough when working in real world condition or their filters’ size was too big to carry out To solve above problems, noisy speech processing using recurrently adaptive fuzzy filters ( RAFF ) method was proposed and used widely When processing English and Chinese it works effectively and the result gained is so high So in this thesis we will continue to develop the noisy speech processing ability of RAFF in Vietnamese environment The recurrently adaptive fuzzy filter in fact is a recurrent multilayer connectionist network used to find the basic elements and functions of a dynamic fuzzy inference system and the network may be constructed from a series of dynamic fuzzy rules RAFF becomes more effective compared with other existing nonlinear filters because it has three strong points: firstly, a priori knowledge can be integrated in RAFF to combine numerical data and linguistic information together; secondly, the exact lagged order of the input variables need not be known in advance; and lastly we not need to configure parameters like the number of hidden nodes because RAFF can find its optimal structure and parameters automatically The performance of recurrently adaptive fuzzy filter will be demonstrated by several examples about adaptive noise cancellation using RAFF illustrated in this thesis Keywords: Adaptive noise cancellation, noisy speech signal recognition, fuzzy filter, nonlinear filter, connectionist network, structure identification, fuzzy inference, hidden node, fuzzy rule… Abstract HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến TÓM TẮT LUẬN VĂN Làm tín hiệu tiếng nói nhận dạng tiếng nói bị nhiễu hai vấn đề thường đề cập tới công việc xử lý tiếng nói Có nhiều phương pháp nghiên cứu để xử lý tiếng nói song chúng hoạt động không hiệu điều kiện thực tế kích thước lọc sử dụng phương pháp lớn nên triển khai khó khăn, phức tạp Để giải vấn đề phương pháp xử lý tiếng nói dùng lọc mờ thích nghi hồi quy đề xuất áp dụng rộng rãi Trong lónh vực xử lý tiếng Anh, Hoa phương pháp hoạt động tốt cho kết cao Vì đề tài ta tiếp tục nghiên cứu xử lý tiếng nói dùng lọc mờ thích nghi hồi quy cho đối tượng tiếng Việt điều kiện môi trường khác Bộ lọc mờ thích nghi hồi quy mà ta nghiên cứu mạng connectionist đa tầng hồi quy mà ta sử dụng để tìm biến hàm hệ suy luận mờ động xây dựng từ chuỗi luật mờ động So sánh với lọc phi tuyến khác lọc mờ thích nghi hồi quy có ba ưu điểm sau: Một ta đưa tri thức vào lọc RAFF để tích hợp liệu số với thông tin ngôn ngữ; Hai ta không cần quan tâm đến bậc trễ biến đầu vào RAFF có đặc tính động; Và ưu điểm thứ ba ta không cần phải khai báo điệu kiện ban đầu số lượng nút ẩn RAFF tự tìm biến số nhận dạng cấu trúc tối ưu cho Nhiều ví dụ triệt nhiễu thích nghi sử dụng lọc mờ thích nghi hồi quy trình bày luận văn minh họa rõ hoạt động lọc Từ khóa : triệt nhiễu thích nghi, nhận dạng tiếng nói, lọc mờ, lọc phi tuyến, mạng connectionist, nhận dạng cấu trúc, suy luận mờ, nút ẩn, luật mờ… Tóm tắt luận văn HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến MỤC LỤC ABSTRACT TOÙM TẮT LUẬN VĂN DANH SÁCH CÁC HÌNH VẼ .6 CÁC TỪ VIẾT TẮT .8 CHƯƠNG 1: GIỚI THIỆU 1.1 Đặt vấn đề 1.2 Tình hình nghiên cứu 10 1.3 Mục tiêu, đối tượng phạm vi nghiên cứu .11 1.4 Nội dung nghiên cứu 12 1.5 Bố cục luận vaên 12 1.6 Ý nghóa đề tài .13 CHƯƠNG 2: 2.1 CƠ SỞ LÝ THUYẾT 14 Logic mờ 14 2.1.1 Tập mờ hàm thuộc 14 2.1.2 Các phép toán tập mờ 16 2.1.3 Biến ngôn ngữ 18 2.1.4 Luaät hợp thành mờ 20 2.1.5 Hệ thống logic mờ 22 2.2 Maïng neural .25 2.2.1 Khái niệm 25 2.2.2 Mạng perceptron lớp 29 2.2.3 Mạng truyền thẳng nhiều lớp 32 2.2.4 Mạng hồi quy 36 2.2.5 Maïng Hopfield .37 2.3 Kỹ thuật lọc thích nghi 38 2.3.1 Bộ lọc thích nghi 38 2.3.2 Ứng dụng lọc thích nghi .39 Từ viết tắt HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy 2.4 THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến Các vấn đề xử lý tiếng nói 41 2.4.1 Triệt nhiễu thích nghi 41 2.4.2 Nhận dạng tiếng nói bị nhiễu 43 2.5 Bộ lọc mờ thích nghi hồi quy 44 2.5.1 Cấu trúc lọc mờ thích nghi hồi quy 44 2.5.2 Thuật toán học cấu trúc 47 2.5.3 Thuật toán học biến số 52 2.6 Nhiễu âm tỷ số nhiễu tín hiệu .55 2.6.1 Nhiễu âm 55 2.6.2 Tỷ số nhiễu tín hiệu( SNR) 57 CHƯƠNG 3: THỰC HIỆN BỘ LỌC MỜ THÍCH NGHI HỒI QUY .58 3.1 Quá trình thực 58 3.2 Giai đoạn học cấu trúc .59 3.3 Giai đoạn học biến số 61 CHƯƠNG 4: MÔ PHỎNG BẰNG MATLAB 63 4.1 Quá trình mô 63 4.2 Giao diện chương trình triệt nhiễu thích nghi .67 4.3 Mô thu thập kết 72 4.3.1 Các thông số cài đặt ban ñaàu 72 4.3.2 So sánh kết triệt nhiễu RAFF lọc khác 74 4.3.3 Mô với tín hiệu tiếng nói khác 76 4.3.4 Mô với nguồn nhiễu khác 78 4.3.5 Mô với độ trễ khác 80 CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 83 5.1 Kết đề tài .83 5.2 Đánh giá kết hướng phát triển đề tài 83 TÀI LIỆU THAM KHẢO 84 LÝ LỊCH TRÍCH NGANG 87 Từ viết tắt HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến DANH SÁCH CÁC HÌNH VẼ Hình 2.1: Hàm thuộc tập mờ âm,zero, dương 14 Hình 2.2 : Mô tả giá trị ngôn ngữ tập mờ .18 Hình 2.3: Sơ đồ khối hệ thống logic mờ .22 Hình 2.4: Mô hình hệ suy diễn mờ Mamdani 24 Hình 2.5: Mô hình mạng neural 25 Hình 2.6 : Mạng truyền thẳng lớp 27 Hình 2.7 : Mạng truyền thẳng nhiều lớp 27 Hình 2.8: Nút đơn có hồi tiếp .27 Hình 2.9 : Mạng hồi quy nhiều lớp 28 Hình 2.10: Các phương pháp học 29 Hình 2.11: Luật học trọng số 29 Hình 2.12: Mạng Perceptron lớp 30 Hình 2.13: Mạng hồi quy 36 Hình 2.14 : Mạng Hopfield 37 Hình 2.15 : Bộ lọc thích nghi 38 Hình 2.16: Bộ nhận dạng hệ thống chưa biết .39 Hình 2.17: Bộ nhận dạng hệ thống đảo 40 Hình 2.18: Bộ dự baùo 41 Hình 2.19: Hệ thống triệt nhiễu thích nghi .42 Hình 2.20 : Cấu trúc hệ thống nhận dạng tiếng nói bị nhiễu sử dụng lọc giảm nhiễu 43 Hình 2.21: Cấu trúc lọc mờ thích nghi hồi quy .45 Hình 2.22: Tín hiệu nhiễu trắng 55 Hình 2.23: Phổ tín hiệu nhiễu trắng 56 Hình 2.24: Tín hiệu nhiễu màu hồng 56 Hình 2.25: Phổ tín hiệu nhiễu màu hồng .57 Hình 3.1: Cấu trúc lọc mờ thích nghi hồi quy 58 Từ viết tắt HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến Hình 3.2: Sơ đồ giai đoạn học cấu trúc 60 Hình 3.3: Sơ đồ giai đoạn học biến số 61 Hình 4.1 Hệ thống mô triệt nhiễu thích nghi sử dụng lọcRAFF 63 Hình 4.2: Quá trình thực mô Matlab 64 Hình 4.3: Sơ đồ mô tả huấn luyện lọc RAFF 65 Hình 4.4: Sơ đồ mô tả hoạt động triệt nhiễu sử dụng RAFF 66 Hình 4.5: Cửa sổ giới thiệu chương trình mô 67 Hình 4.6: Nạp tín hiệu tiếng nói nguồn nhiễu .68 Hình 4.7: Tạo tín hiệu nhiễu xâm hại 68 Hình 4.8: Cửa sổ huấn luyện RAFF .69 Hình 4.9: Nạp giá trị ban đầu 69 Hình 4.10: Thực huấn luyện mạng .70 Hình 4.11: Cửa sổ sai số huấn luyện 70 Hình 4.12: Triệt tín hiệu nhiễu .71 Hình 4.13: Luật mờ lọc RAFF 72 Hình 4.14: Sai số sau huấn luyện 73 Hình 4.15: Triệt nhiễu dùng lọc RAFF 74 Hình 4.16 : Triệt nhiễu dùng lọc Spectral .75 Hình 4.17 : Triệt nhiễu dùng lọc Adaptive Spectral .75 Hình 4.18: Mô với tín hiệu tiếng nói “một” nhiễu trắng .76 Hình 4.19: Mô với tín hiệu tiếng nói “hai” nhiễu trắng 77 Hình 4.20: Mô với tín hiệu tiếng nói “một” nhiễu trắng .78 Hình 4.21: Mô với tín hiệu tiếng nói “một” nhiễu hồng 79 Hình 4.22: Mô với tín hiệu tiếng nói “một” nhiễu hồng độ trễ khác 80 Hình 4.23: Mô với tín hiệu tiếng nói “hai” nhiễu hồng độ trễ khác 81 Hình 4.24: Mô với tín hiệu tiếng nói “ba” nhiễu Hồng độ trễ khaùc .82 Từ viết tắt HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến Hình 4.14: Sai số sau huấn luyện Luật mờ thu được: RULE1:IF r(k) is μ(-0.077 ,-0.262) and h1(k) is G THEN y(k) is μ(-0.116 ,0.050) and h1(k+1) is 0.401 and h2(k+1) is 0.401 and h3(k+1) is 0.400 and h4(k+1) is 0.401 RULE2:IF r(k) is μ(0.040 ,0.034) and h2(k) is G THEN y(k) is μ(0.115 ,0.002) and h1(k+1) is 0.401 and h2(k+1) is 0.401 and h3(k+1) is 0.400 and h4(k+1) is 0.401 RULE3:IF r(k) is μ(-0.039 ,0.000) and h3(k) is G THEN y(k) is μ(-0.035 ,0.004) and h1(k+1) is 0.400 and h2(k+1) is 0.400 and h3(k+1) is 0.400 and h4(k+1) is 0.400 RULE4:IF r(k) is μ(0.088 ,-0.130) and h4(k) is G THEN y(k) is μ(0.123 ,0.015) and Kết luận 73 HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến h1(k+1) is 0.401 and h2(k+1) is 0.401 and h3(k+1) is 0.400 and h4(k+1) is 0.401 Hình (4.14) cho ta thấy sai số giai đoạn huấn luyện, hàm sai số nhỏ dần thể chênh lệch đầu lọc tín hiệu mong muốn ngày nhỏ Sau huấn luyện có bốn luật mờ tạo chứng tỏ cấu trúc lọc đơn giản kích thước lọc nhỏ 4.3.2 So sánh kết triệt nhiễu RAFF lọc khác Với luật mờ triệt nhiễu dùng lọc RAFF cho ta kết ( tín hiệu tiếng nói “Một” ; tín hiệu nhiễu nhiễu trắng ): Hình 4.15: Triệt nhiễu dùng lọc RAFF SNRtrước lọc = dB SNRsau lọc = 4.73 dB Kết luận 74 HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến Kết triệt nhiễu với lọc spectral [30]: Recovered "mot" by spectral filter amplitude 0.5 -0.5 -1 500 1000 1500 2000 2500 sample 3000 3500 4000 4500 500 4000 4500 500 Hình 4.16 : Triệt nhiễu dùng lọc Spectral Kết triệt nhiễu với lọc Adaptive spectral [30]: Recovered "mot" by adaptieve spectral filter amplitude 0.5 -0.5 -1 500 1000 1500 2000 2500 sample 3000 3500 Hình 4.17 : Triệt nhiễu dùng lọc Adaptive Spectral Từ kết hình (4.15), (4.16), (4.17) ta thấy so với hai lọc Spectral Adaptive Spectral lọc RAFF hình dạng tín hiệu sau lọc giống tín hiệu tiếng nói gốc tỷ số SNR sau lọc tăng lên 3,7 dB ( hai lọc Spectral Adaptive Spectral không tính SNR chương trình lọc Nred không hỗ trợ option này) Hai kết (4.16), (4.17) cho ta thấy tác dụng lọc hiệu không cao lọc RAFF Kết luận 75 HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến 4.3.3 Mô với tín hiệu tiếng nói khác Trong phần ta thực triệt nhiễu với nhiều trường hợp khác nhau, trường hợp ta đo tỷ số SNR trước sau triệt nhiễu • Trường hợp 1: Tín hiệu tiếng nói âm “một”, nhiễu nhiễu trắng , kết thu được: Trước triệt nhiễu: SNR = dB Sau triệt nhiễu : SNR = 4.729 dB Hình 4.18: Mô với tín hiệu tiếng nói “một” nhiễu trắng Trong trường hợp nhiễu tham khảo nhiễu huấn luyện nhiễu trắng phổ rộng nên kết mang không cao Sau lọc tín hiệu khôi phục diện nhiễu nhiên biên độ thấp so với ban đầu • Trường hợp 2: Tín hiệu tiếng nói âm “hai”, nhiễu nhiễu trắng, kết thu hình (4.19) Trước triệt nhiễu: SNR = dB Sau triệt nhiễu : SNR = 4.8 dB Kết luận 76 HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến Hình 4.19: Mô với tín hiệu tiếng nói “hai” nhiễu trắng Trường hợp giống trường hợp 1, độ chênh lệch tỷ số SNR trước sau lọc 3.8 dB, tín hiệu sau lọc có hình dạng tương đối giống tín hiệu gốc Tóm lại qua hai trường hợp trên, nguồn nhiễu ta nhận thấy việc lọc ổn định kết mang lại giống điều chứng tỏ lọc mờ thích nghi hồi quy không phụ thuộc vào đặc tính tín hiệu tiếng nói Kết luận 77 HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến 4.3.4 Mô với nguồn nhiễu khác Trong phần ta thực triệt nhiễu tín hiệu với tín hiệu tiếng nói ban đầu “một” nguồn nhiễu trường hợp khác để xem xét ảnh hưởng đặc tính nhiễu lên lọc mờ thích nghi hồi quy • Trường hợp 1: Tín hiệu tiếng nói âm “một”, nhiễu nguồn nhiễu trắng, kết thu hình (4.20) Hình 4.20: Mô với tín hiệu tiếng nói “một” nhiễu trắng Trước triệt nhiễu: SNR = dB Sau triệt nhiễu : SNR = 4.729 dB Trong trường hợp ta thấy rằng, dạng sóng tín hiệu khôi phục tương đối giống tín hiệu gốc ban đầu chưa tốt Ta xem xét tiếp trường hợp bên thu thập kết • Trường hợp 2: Tín hiệu tiếng nói âm “một”, nhiễu nhiễu màu hồng, kết thu hình (4.21) Kết luận 78 HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến Hình 4.21: Mô với tín hiệu tiếng nói “một” nhiễu hồng Trước triệt nhiễu: SNR = dB Sau triệt nhiễu : SNR = 7.74 dB Trường hợp nhiễu tham khảo mô khác nhiễu huấn luyện kết triệt nhiễu cao, độ chênh lệch tần số 6.74 dB, dạng sóng khôi phục tốt chứng tỏ lọc RAFF trường hợp lọc tốt tín hiệu nhiễu màu hồng Tóm lại qua trường hợp ta thấy cho dù tín hiệu gốc có thay đổi, nhiễu thay đổi tính chất nguồn nhiễu giống kết mang lại tương tự Kết lọc chịu ảnh hưởng dạng tín hiệu nhiễu, nguồn nhiễu biến thiên phức tạp kết lọc Kết luận 79 HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến 4.3.5 Mô với độ trễ khác Phần ta mô triệt nhiễu với độ trễ khác tín hiệu gây nhiễu so với nhiễu tham khảo để quan sát ảnh hưởng độ trễ lên lọc Ghi chú: − Các điểm ký hiệu “o” tỷ số SNR trước triệt nhiễu ứng với giá trị trễ − Các điểm ký hiệu “*” tỷ số SNR sau triệt nhiễu ứng với giá trị trễ • Trường hợp 1: Tín hiệu tiếng nói âm “một”, nhiễu màu hồng, kết thu được: "Mot" - Pink noise SNR (dB) 0.5 1.5 2.5 delay ( sample) 3.5 4.5 Hình 4.22: Mô với tín hiệu tiếng nói “một” nhiễu hồng độ trễ khác Trong trường hợp ta thấy độ delay có làm ảnh hưởng đến tín hiệu gây nhiễu( điển hình SNR khác nhau) làm thay đổi SNR sau lọc hiệu lọc ổn định với độ tăng SNR gần Kết luận 80 HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến Ta xem xét thêm trường hợp bên • Trường hợp 2: Tín hiệu tiếng nói âm “hai”, nhiễu hồng, kết thu được: "Hai " - Pink noise SNR (dB) 0.5 1.5 2.5 delay ( sample) 3.5 4.5 Hình 4.23: Mô với tín hiệu tiếng nói “hai” nhiễu màu hồng độ trễ khác Trường hợp kết mang lại giống trường hợp với độ chênh lệch SNR trước sau Kết luận 81 HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến • Trường hợp 3: Tín hiệu tiếng nói âm “ba”, nhiễu hồng, kết thu được: "Ba" - Pink noise SNR ( dB) 0.5 1.5 2.5 delay ( sample) 3.5 4.5 Hình 4.24: Mô với tín hiệu tiếng nói “ba” nhiễu Hồng độ trễ khác Trường hợp cho kết tương tự với độ tăng tỷ số SNR không ổn định hai trường hợp trước Thông qua kết thu ba trường hợp ta nhận thấy độ trễ ảnh hưởng đến hoạt động lọc, giá trị trễ lớn tỉ số SNR trước lọc lớn so với giá trị trễ nhỏ sau qua lọc SNR thu tăng lượng nhỏ tương ứng độ chênh lệch SNR trước sau triệt nhiễu giá trị delay ổn định Kết luận 82 HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 5.1 Kết đề tài Luận văn thực kết sau: • Luận văn trình bày hai thuật toán học cấu trúc học biến số để xây dựng nên lọc mờ thích nghi hồi quy • Khi sử dụng lọc mờ thích nghi hồi quy ta không cần biết xác bậc tín hiệu đầu vào không cần khai báo trước kích thước lọc • Khi ứng dụng lọc RAFF triệt tín hiệu nhiễu thích nghi để lọc tín hiệu tiếng nói tiếng Việt (“ Một”, “hai”…) với nguồn nhiễu nhiễu trắng tỷ số SNR sau lọc tăng lên khoảng dB nhiễu hồng dB so với trước lọc • Khi mô với tín hiệu tiếng nói khác hay độ trễ khác kết lọc cho tỷ số SNR gần trường hợp 5.2 Đánh giá kết hướng phát triển đề tài Do điều kiện khả hạn chế nên đề tài dừng việc áp dụng lọc mờ thích nghi hồi quy triệt nhiễu thích nghi mà chưa triển khai vào ứng dụng nhận dạng tín hiệu tiếng nói Qua trường hợp mô ta thấy lọc ổn định tín hiệu tiếng nói độ trễ thay đổi lại chịu ảnh hưởng nhiều đến đặc tính tín hiệu nhiễu Kết lọc thu cho thấy hiệu lọc nhiên kết thu chưa cao Qua nhận định ta đề hướng phát triển đề tài sau: • Cải thiện chất lượng lọc mờ thích nghi hồi quy cách đưa tri thức vào lọc dạng luật mờ • Triển khai triệt nhiễu tín hiệu sử dụng lọc mờ thích nghi hồi quy phần cứng( vd: FPGA ,… ) • Cố gắng tối ưu lọc để hoạt động theo thời gian thực • Không dừng lại đối tượng xử lý tiếng nói, bước nghiên cứu mở rộng phạm vi hoạt động RAFF ứng dụng khác xử lý âm thanh, hình ảnh…, ứng dụng điều khiển Kết luận 83 HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến TÀI LIỆU THAM KHẢO [1] B.Widrow and S.D.Stearns, Adaptive Signal Processing, Englewood Cliffs, NJ: Prentice – Hall, 1985 [2] M.J.Coker and D.J.Simkins, “A nonlinear adaptive noise canceller” in IEEE Int Conf Acoust., Speech, Signal Processing, Denver, CO, Apr 1980, pp 470-473 [3] W G Knecht, M E Schenkel, and G.S Moschytz, “Neural network filters for speech enhancement”, IEEE Trans Speech Audio Processing, vol 3, pp 433-438, Nov 1995 [4] C.T.Lin and C.F.Juang, “An adaptive neural fuzzy filter and its applications”, IEEE Trans Syst Man, Cybern., vol 27, pp 635-656, Aug 1997 [5] A.Varga and H.J.M Steeneken, “Assessment for automatic speech recognition: II NOISEX – 92: A database and an experiment to study the effect of additive noise on speech recognition systems”, Speech Communication 12, pp 247-251, 1993 [6] L X Wang and J M Mendel, “Fuzzy adaptive filters with application to nonlinear channel equalization,” IEEE Trans Fuzzy Syst., vol 1, pp 161– 170, Aug 1993 [7] M Bellanger, Adaptive Digital Filters and Signal Analysis Newyork: Marcel – Deckker , 1987 [8] C T Lin and C S G Lee, “Neural-network-based fuzzy logic control and decision system,” IEEE Trans Comput., vol 40, no 12, pp 1320–1336, 1991 [9] L Yin, J Astola, and Y Neuvo, “ A new class of nonlinear filters – Neural filters,” IEEE Trans, Signal Processing, vol 41, pp 1201 – 1222, Mar 1993 Tài liệu tham khảo 84 HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến [10] W G Knecht, M E Schenkel, and G S Moschytz, “Neural network Filters for speech enhancement,” IEEE Trans Speech Audio Processing, vol 3, pp 433–438, Nov 1995 [11] S A Billings and C.F.Fung, “ Recurrent radial basis function networks for adaptive noise cancellation,” Neural Networks, vol 8, no 2, pp 273–290, 1995 [12] G J Gibson, S Siu, and C F N Cowan, “The application of nonlinear structures to the reconstruction of binary signals,” IEEE Trans Signal Processing, vol 39, pp 1877–1884, Aug 1991 [13] K A Al-Mashouq and I S Reed, “The use of neural nets to combine equalization with decoding for severe intersymbol interference channels, ”IEEE Trans Neural Networks, vol 5, pp.982–988, Nov 1994 [14] S Tamura and A Waibel, “Noise reduction using connectionist models,” in Proc Int Conf Acoust., Speech, Signal Processing, New York, Apr 1988, pp 553–556 [15] S Tamura, “An analysis of a noise reduction neural network,” in Proc Int Conf Acoust., Speech, Signal Processing, Glasgow, U.K., May 1989, pp 2001–2004 [16] H B D Sorensen, “A cepstral noise reduction multi-layer neural network,” in Proc IEEE Int Conf Acoust., Speech, Signal Processing, 1991, pp 933– 936 [17] “Speech recognition in noise using a self-structuring noise reduction model and hidden control models,” in Proc IJCNN, 1992, pp 279–284 [18] M Trompf, “Neural network development for noise reduction inrobust speech recognition,” in Proc IJCNN, vol 4, 1992, pp 722–727 [19] S Moon and T N Hwang, “Coordinated training of noise removing networks,” in Proc Int Conf Acoust , Speech, SignalProcessing, Minneapolis, MN, Apr 1993, pp 573–576 Taøi liệu tham khảo 85 HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến [20] H S Lee and A C Tsoi, “Application of multilayer perceptron in estimating speech/noise characteristics for speech recognition in noisy environment,” Speech Commun., vol 17, pp 59–76, 1995 [21] R J Williams and D Zipser, “A learning algorithm for continually running recurrent neural networks,” Neural Comput., vol 1, no 2, pp 270–280, 1989 [22] A Varga, H J M Steeneken, M Tomlinson, and D Jones, “The NOISEX92 study on the effect of additive noise automatic speech recognition,” in Description of RSG.10 and Esprit SAM Experiment and Database, Malvern, U.K.: DRA Speech Res., 1992 [23] C.F Juang, C.T Lin, “Noisy Speech Processing by Recurrently Adaptive Fuzzy Filters” IEEE Trans Fuzzy systems, vol 9, No 1, Feb 2001 [24] P X Minh N D Phước, “Lý thuyết điều khiển mờ”, tái lần 4, Nhà xuất khoa học kỹ thuật, năm 2004 [25] Bài giảng môn học logic mờ mạng neural Ts Dương Hoài Nghóa Trường Đại Học Bách Khoa Tp.HCM [26] Lê Tiến Thường, “Xử lý số tín hiệu Wavelets – tập 1”, NXB Đại Học Quốc Gia Tp.HCM, năm 2003 [27] Phần mềm Matlab R2006a [28] Các tài liệu mạng internet [29] Phần mềm Cool Edit Pro 2.0 – SynTrillium Software [30] Phần mềm Nred Tài liệu tham khảo 86 HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy THD: PGS.TS Lê Tiến Thường TS Hoàng Đình Chiến LÝ LỊCH TRÍCH NGANG Họ tên : CHÂU ĐÌNH THỤY Ngày tháng năm sinh: 02-10-1978 Nơi sinh: An Giang Địa liên lạc: 38/12B, đường Nguyễn Thiện Thuật, Q Bình Thạnh, Tp.HCM Quá trình đào tạo: 1996-2001: Học Trường ĐH Bách Khoa Tp.HCM, khoa Điện-Điện tử, chuyên ngành Điện Tử – Viễn thông 2004-nay : Học cao học Trường ĐH Bách Khoa Tp.HCM, khoa Điện – Điện tử, chuyên ngành Kỹ thuật vô tuyến điện tử Quá trình làm việc: 2001-2001: làm việc Cty TNHH Nidec-Tosok KCX Tân Thuận 2002-nay : làm việc Cty CP DV BC VT Sài Gòn( SaiGon Postel) Kỹ năng: Đọc hiểu tiếng Anh: tốt; Nghe, nói viết tiếng Anh: Có khả lập trình ngôn ngữ thông dụng: Visual basic , C/C++, vi xử lý Có kiến thức tốt hệ thống viễn thông( tổng đài, truyền dẫn), mạng máy tính Lónh vực quan tâm: Mạng máy tính Các công nghệ viễn thông IP Mạng neural logic mờ Sở thích: Đọc sách báo khoa học kỹ thuật, văn hóa, xã hội Âm nhạc, điện ảnh Thể thao: cầu lông, bơi lội Lý lịch trích ngang 87 HVTH: KS Châu Đình Thụy ... ĐỀ TÀI: Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy II- NHIỆM VỤ VÀ NỘI DUNG: - Tìm hiểu vấn đề xử lý tiếng nói - Tìm hiểu lọc mờ thích nghi hồi quy - Xây dựng lọc mờ thích nghi hồi quy - Mô... 2.15 : Bộ lọc thích nghi Có nhiều loại lọc thích nghi: − Bộ lọc thích nghi dựa kỹ thuật LMS − Bộ lọc thích nghi dựa kỹ thuật RLS − Bộ lọc thích nghi dựa lọc lưới − Bộ lọc thích nghi hoạt động... thuật lọc thích nghi 38 2.3.1 Bộ lọc thích nghi 38 2.3.2 Ứng dụng lọc thích nghi .39 Từ viết tắt HVTH: KS Châu Đình Thụy Xử lý tiếng nói dùng lọc mờ thích nghi hồi quy

Định dạng
Số trang	90
Dung lượng	1,32 MB