1. Trang chủ
  2. » Luận Văn - Báo Cáo

Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf

77 1K 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 77
Dung lượng 1,48 MB

Nội dung

Đồ án tốt nghiệp Thuật toán xử tiếng nói trong Speech Enhancement đánh giá tính hiệu quả của thuật toán Đồ án tốt nghiệp PDF by http://www.ebook.edu.vn SVTH: Nguyễn Thị Ngọc Diệp Trang 1 CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh phúc LỜI CAM ĐOAN Kính gửi: Hội đồng bảo vệ đồ án tốt nghiệp Khoa Điện tử _ Viễn thông _ Trường Đại học Bách Khoa Đà Nẵng. Em tên là: Nguyễn Thị Ngọc Diệp Hiện đang học lớp 04ĐT1- Khoa: Điện tử - Viễn thông – Trường: Đại học Bách Khoa Đà Nẵng. Nhóm em xin cam đoan nội dung của đồ án này không phải là bản sao chép của bất cứ đồ án hoặc công trình đã có từ trước. Sinh viên thực hiện Nguyễn Thị Ngọc Diệp Đồ án tốt nghiệp PDF by http://www.ebook.edu.vn SVTH: Nguyễn Thị Ngọc Diệp Trang 2 MỤC LỤC LỜI CAM ĐOAN 1 MỤC LỤC 2 DANH MỤC CÁC TỪ VIẾT TẮT CÁC THUẬT NGỮ TIẾNG ANH 8 MỞ ĐẦU 10 CHƯƠNG 1: TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI 13 1.1 Giới thiệu chương 13 1.2 Nâng cao chất lượng tiếng nói là gì ? 13 1.3 thuyết về tín hiệu nhiễu 15 1.3.1 Tín hiệu, hệ thống xử tín hiệu 15 1.3.1.1 Tín hiệu 15 1.3.1.2 Nguồn tín hiệu 15 1.3.1.3 Hệ thống xử tín hiệu 16 1.3.1.4 Phân loại tín hiệu 16 1.4 thuyết về nhiễu 17 1.4.1 Nguồn nhiễu 17 1.4.2 Nhiễu mức tín hiệu tiếng nói trong các môi trường khác nhau 19 1.5 Tín hiệu rời rạc theo thời gian 20 1.5.1 Tín hiệu bước nhảy đơn vị 21 1.5.2 Tín hiệu xung đơn vị 21 1.5.3 Tín hiệu hàm mũ 21 1.5.4 Tín hiệu hàm sin rời rạc 21 1.6 Phép biến đổi Fourier của tín hiệu rời rạc DTFT 22 1.6.1 Sự hội tụ của phép biến đổi Fourier 22 Đồ án tốt nghiệp PDF by http://www.ebook.edu.vn SVTH: Nguyễn Thị Ngọc Diệp Trang 3 1.6.2 Quan hệ giữa biến đổi Z biến đổi Fourier 22 1.6.3 Phép biến đổi Fourier ngược 23 1.6.4 Các tính chất của phép biến đổi Fourier 23 1.6.5 Phân tích tần số (phổ) cho tín hiệu rời rạc 24 1.6.6 Phổ tín hiệu phổ pha 25 1.7 Các thuật toán sử dụng nâng cao chất lượng tiếng nói 26 1.7.1 Trừ phổ 26 1.7.2 Mô hình thống kê 26 1.8 Tín hiệu tiếng nói 26 1.9 Cơ chế tạo tiếng nói 28 1.9.1.1 Bộ máy phát âm của con người 28 1.9.2 Mô hình kỹ thuật của việc tạo tiếng nói 28 1.9.3 Phân loại âm 29 1.9.4 Thuộc tính âm học của tiếng nói 29 1.10 Kết luận chương 29 CHƯƠNG 2 : ĐÁNH GIÁ CHẤT LƯỢNG TIẾNG NÓI 30 2.1 Giới thiệu chương 30 2.2 Phương pháp đánh giá chủ quan 30 2.2.1 Các phương pháp đánh giá tuyệt đối 31 2.2.1.1 Phương pháp đánh giá tuyệt đối ACR 31 2.2.2 Các phương pháp đánh giá tương đối 31 2.2.2.1 Đánh giá bằng phương pháp so sánh các mẫu tín hiệu 31 2.2.2.2 Phương pháp đánh giá theo sự suy giảm chất lượng 32 2.3 Phương pháp đánh giá khách quan 33 Đồ án tốt nghiệp PDF by http://www.ebook.edu.vn SVTH: Nguyễn Thị Ngọc Diệp Trang 4 2.3.1 Đo tỷ số tín hiệu trên nhiễu trên từng khung 33 2.3.2 Đo khoảng cách phổ dựa trên LPC 35 2.3.2.1 Phương pháp đo LLR 35 2.3.2.2 Phương pháp đo IS 36 2.3.2.3 Phương pháp đo theo khoảng cách cepstrum 36 2.3.3 Đánh giá mô phỏng theo cảm nhận nghe của con người 37 2.3.3.1 Phương pháp đo Weighted Spectral Slope 37 2.3.3.2 Phương pháp đo Bark Distortion 38 2.3.3.3 Phương pháp đánh giá cảm nhận chất lượng thoại PESQ 39 2.4 Kết luận chương 39 CHƯƠNG 3: THUẬT TOÁN SPECTRAL–SUBTRACTION WIENER FILTERING 41 3.1 Giới thiệu chương 41 3.2 Sơ đồ khối chung của Spectral Subtraction Wiener Filtering 41 3.3 Thuật toán Spectral Subtraction 41 3.3.1 Giới thiệu chung 41 3.3.2 Spectral subtraction đối với phổ biên độ 42 3.3.3 Spectral subtraction đối với phổ công suất 43 3.4 Thuật toán Wiener Filtering 45 3.4.1 Giới thiệu chung 45 3.4.2 Nguyên cơ bản của Wiener Filtering 46 3.5 Overlap Adding trong quá trình xử tín hiệu tiếng nói 48 3.5.1 Phân tích tín hiệu theo từng frame 48 3.5.2 Overlap Adding 49 Đồ án tốt nghiệp PDF by http://www.ebook.edu.vn SVTH: Nguyễn Thị Ngọc Diệp Trang 5 3.6 Ước lượng cập nhật nhiễu 50 3.6.1 Voice activity detection 51 3.6.2 Quá trình ước lượng cập nhật nhiễu 51 3.7 Kết luận chương 52 CHƯƠNG 4: THỰC HIỆN ĐÁNH GIÁ CÁC THUẬT TOÁN 53 4.1 Giới thiệu chương 53 4.2 Quy trình thực hiện đánh giá thuật toán 53 4.3 Lưu đồ thuật toán Spectral Subtraction 55 4.4 Lưu đồ thuật toán Wiener Filtering 56 4.5 Thực hiện thuật toán 57 4.6 Đánh giá chất lượng tiếng nói đã được xử 59 4.6.1 Cơ sở dữ liệu cho việc đánh giá 59 4.6.2 Tổng quan về quy trình đánh giá 59 4.6.3 Kiểm tra độ tin cậy của các phương pháp đánh giá 60 4.6.4 Thực hiện đánh giá 62 4.6.4.1 Đánh giá thuật toán với các hệ số dự đoán ban đầu 62 4.6.4.2 Tối ưu hệ số alpha cho thuật toán WF 65 4.6.4.3 Hệ số gamma cho thuật toán SS 67 4.6.4.4 Đánh giá thuật toán sau khi đã tối ưu 68 4.6.4.5 Đánh giá độ ổn định của thuật toán trong môi trường nhiễu khác 69 4.6.5 Kết luận chương 71 TÀI LIỆU THAM KHẢO 72 KẾT LUẬN ĐỒ ÁN HƯỚNG PHÁT TRIỂN ĐỀ TÀI 75 PHỤ LỤC 76 Đồ án tốt nghiệp PDF by http://www.ebook.edu.vn SVTH: Nguyễn Thị Ngọc Diệp Trang 6 DANH MỤC CÁC HÌNH VẼ BẢNG Hình 1.1 Tín hiệu tiếng nói [2]. 15 Hình 1.2 Dạng sự phân bố phổ năng lượng trung bình nhiễu trên xe [4]. 18 Hình 1.3 Dạng sự phân bố phổ năng lượng trung bình của nhiễu trên tàu [4]. 18 Hình 1.4 Dạng sự phân bố phổ năng lượng trung bình của nhiễu trong nhà hàng[4]. 19 Hình 1.5 Mức nhiễu tiếng nói (được đo bằng SPL dB) trong các môi trường khác nhau [4]. 20 Hình 1.6 Mẫu tiếng nói “eee” được lấy mẫu với tần số lấy mẫu 8kHz [11]. 25 Hình 1.7 Dạng sóng tín hiệu tiếng nói của câu “The wife helped her husband” dạng sóng của phụ âm “f” trong từ “wife, dạng sóng của đoạn nguyên âm “er” trong từ “her” [11]. 27 Hình 1.8 mặt cắt dọc của cơ quan tạo tiếng nói [11]. 28 Hình 1.9 mô hình kỹ thuật tạo tiếng nói[11]. 28 Hình 1.10 bảng phân loại âm vị trong tiếng Anh của người Mỹ [11] 29 Bảng 2.1.Thang điểm đánh giá chất lượng tiếng nói theo MOS [12] 31 Bảng 2.4. Thang điểm đánh giá chất lượng tín hiệu tiếng nói theo CCR 32 Bảng 2.5. Thang đánh giá DCR 32 Hình 3.1 Sơ đồ khối cho hai thuật toán SS WF 41 Hình 3.2 Sơ đồ khối của thuật toán Spectral subtraction [26]. 45 Hình 3.3 Sơ đồ khối của thuật toán Wiener Filtering. 48 Hình 3.4 Phân tích tín hiệu thành các frame [31]. 49 Hình 3.5 quá trình thực hiện overlap adding [32]. 50 Hình 4.1. Sơ đồ thực hiện đánh giá thuật toán tăng cường 53 Hình 4.2 Lưu đồ thuật toán SS 55 Hình 4.3 Lưu đồ thuật toán WF 56 Hình 4.4 dạng sóng spectrogram của tín hiệu sạch 57 Hình 4.5 Dạng sóng phổ của tín hiệu bị nhiễu xe hơi với SNR = 10dB 57 Đồ án tốt nghiệp PDF by http://www.ebook.edu.vn SVTH: Nguyễn Thị Ngọc Diệp Trang 7 Hình 4.6 Dạng sóng spectrogram của tín hiệu sau khi xử nhiễu xe hơi bằng SS với SNR = 10dB. 58 Hình 4.7 Dạng sóng spectrogram của tín hiệu sau khi xử nhiễu xe hơi bằng WF với SNR = 10dB. 58 Hình 4.8 Quy trình thực hiện đánh giá 60 Hình 4.9. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu xe hơi 61 Hình 4.10. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu người nói xung quanh 61 Hình 4.11 Đồ thị đánh giá Objective với hệ số IS=0.2, NoiseMargin=3 63 Hình 4.12 Đồ thị đánh giá Objective với hệ số IS=0.15, NoiseMargin=2. 64 Hình 4.14 Đồ thị đánh giá objective với hệ số alpha=0.5, 0.8,0.9 với IS=0.15 NoiseMargin = 2 66 Hình 4.15 Đồ thị đánh giá objective với hệ số gamma = 1 gamma = 2. 67 Hình 4.16 Đồ thị đánh giá với IS=0.15 NoiMargin= 2 alpha = 0.8 cho thuật toán WF, gama=1 cho thuật toán SS. 69 Hình 4.17 Đồ thị đánh giá OE với nhiễu người nói xung quanh. 70 Đồ án tốt nghiệp PDF by http://www.ebook.edu.vn SVTH: Nguyễn Thị Ngọc Diệp Trang 8 DANH MỤC CÁC TỪ VIẾT TẮT CÁC THUẬT NGỮ TIẾNG ANH Từ viết tắt Tiếng Anh Nghĩa tiếng Việt SNR Signal Noise Ratio Tỉ số tín hiệu trên nhiễu PC Personal Computer Máy tính cá nhân SPL Sound Pressure Level Mức áp suất của âm thanh MMSE Minium Mean-Squared Error Tối thiểu hoá sai lệch trung bình bình phương SVD Singular Value Decomposition Phép phân tích giá trị đơn DFT Discrete Fourier Transform Phép biến đổi Fourier rời rạc FFT Fast Fourier Transform Phép biến đổi Fourier nhanh DTFT Discrete-Time Fourier Transform Phép biến đổi Fourier của tín hiệu rời rạc. ZT Z Transform Phép biến đổi Z ROC Region of Convergence Miền hội tụ IDTFT Inverse Discrete Fourier Transform Phép biến đổi ngược Fourier rời rạc LTI Linear Time-Invariant Hệ thống tuyến tính bất biến theo thời gian ITU-T InternationalTelecommunications Union-Telecommunication Hiệp hội tiêu chuẩn viễn thông quốc tế ACR Absolute Categories Rating Đánh giá theo giá trị tuyệt đối MOS Mean Opinion Scores Đánh giá theo quan điểm người nghe CCR Comparison Category Rating Đánh giá bằng cách so sánh DCR Degradation Category Rating Đánh giá suy giảm chất lượng Đồ án tốt nghiệp PDF by http://www.ebook.edu.vn SVTH: Nguyễn Thị Ngọc Diệp Trang 9 SE Subjective Evaluation Đánh giá chủ quan OE Objective Evaluation Đánh giá khách quan IS Itakura_Saito LLR Log likehook Raito WSS Weighted Spectral Slope Đo theo trọng số của phổ LPC Linear Prediction Coefficients Hệ số dự đoán tuyến tính VAD Voice Activity Detection Thăm sự hoạt động của tiếng nói Speech Enhancement Nâng cao chất lượng tiếng nói SS Spectral Subtraction Thuật toán giảm nhiễu tín hiệu tiếng nói bằng phương pháp trừ phổ. WF Wiener Filter Thuật toán giảm nhiễu tín hiệu tiếng nói bằng cách sử dụng bộ lọc Wiener. Statistical-model-based Thuật toán giảm nhiễu tín hiệu tiếng nói dựa trên nguyên thống kê Frame Khung tín hiệu. Hamming Cửa sổ Hamming Overlap Adding Xếp chồng cộng [...]... Đồng thời so sánh kết quả thu được bằng cách dùng các phương pháp đánh giá đã được giới thiệu ở chương 2 Phương pháp nghiên cứu của đồ án là xây dựng lưu đồ của thuật toán, thực hiện xử tiếng nói bằng các thuật toán đó Dựa trên các kết quả đạt được sau khi xử lý, sau đó sử dụng các phương pháp đánh giá khách quan để đánh giá tính hiệu quả của các thuật toán xử trong môi trường thực tế Đồ án của. .. nhiễu trong tiếng nói Gồm có đánh giá chủ quan đánh giá khách quan Chương 3 : Thuật toán Spectral Subtraction Wiener Filtering Chương này đi sâu vào nghiên cứu nguyên cơ bản của từng thuật toán Phần 2 : Thực hiện đánh giá Chương 4 : Thực hiện đánh giá thuật toán Chương này trình bày các kết quả nhóm đã làm được gồm có thực hiện giảm nhiễu tín hiệu tiếng nói bằng hai thuật toán đã nghiên... án của nhóm đã thực hiện được 2 thuật toán xử tiếng nói trong Speech Enhancement đưa ra được các kết quả đánh giá khách quan làm cơ sở để đánh giá tính hiệu quả của 2 thuật toán trên Đó chính là điểm mới trong đồ án của nhóm so với các đồ án đã có trước trong cùng chủ đề nghiên cứu SVTH: Nguyễn Thị Ngọc Diệp Trang 11 Đồ án tốt nghiệp SVTH: Nguyễn Thị Ngọc Diệp PDF by http://www.ebook.edu.vn Trang... tín hiệu số, các phép biến đổi, tìm hiểu về các SVTH: Nguyễn Thị Ngọc Diệp Trang 10 Đồ án tốt nghiệp PDF by http://www.ebook.edu.vn loại nhiễu , tín hiệu tiếng nói sự hình thành tiếng nói Bên cạnh đó còn giới thiệu khái quát về một số thuật toán trong Speech Enhancement Chương 2 : Đánh giá chất lượng tiếng nói Chương này giới thiệu một số phương pháp đánh giá hiệu quả của thuật toán giảm nhiễu trong. .. GIÁ CHẤT LƯỢNG TIẾNG NÓI 2.1 Giới thiệu chương Cho đến nay đã có rất nhiều thuật toán nâng cao chất lượng tiếng nói, nhưng làm thế nào để đánh giá đúng hiệu quả của chúng Phần này cung cấp các phương pháp đánh giá khác nhau được sử dụng để đánh giá hiệu quả của thuật toán nâng cao tiếng nói Đánh giá chất lượng có thể thực hiện bằng cách sử dụng phương pháp đánh giá theo cảm nhận của người nghe theo... trò rất quan trọng trong lĩnh vực thoại Xuất phát từ thực tế này nhóm đã bắt tay vào tìm hiểu về Speech Enhancement, nghiên cứu các thuật toán của nó để thực hiện đánh giá hiệu quả của các thuật toán đó trong môi trường thực tế Để thực hiện được đồ án, nhóm đã phân chia thành 3 phần tương ứng với 3 thành viên : - Nguyễn Ngọc Trung : nghiên cứu thực hiện thuật toán xử tiếng nói sử dụng phương... gặp trong môi trường thực tế Điều này rất quan trọng để đánh giá tính hiệu quả của các thuật toán Speech enhancement trong việc nén nhiễu cải thiện chất lượng của tiếng nói trong dải biến thiên của mức SNR Mức độ của tiếng nói nhiễu được đo lường bằng mức độ âm thanh Phép đo lường ở đây là đo mức độ áp suất của âm thanh tính bằng dB SPL(sound pressure level)[4] Khoảng cách giữa người nói người... chất lượng tiếng nói CHƯƠNG 1: TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI 1.1 Giới thiệu chương Nội dung của chương trình bày mục đích của nâng cao chất lượng tiếng nói là gì, các loại nhiễu trong tiếng nói, cách hình thành của tiếng nói các đặc điểm cuả tín hiệu tiếng nói Chương này còn giới thiệu khái quát về các thuật toán sử dụng trong speech enhancement 1.2 Nâng cao chất lượng tiếng nói là gì... trong các thuộc tính của tín hiệu tiếng nói Về bản chất thì chất lượng có tính chủ quan cao khó có thể đánh giá một cách đáng tin cậy.Nó chỉ đóng vai trò phần nào trong kỹ thuật đánh giá vì mỗi cá nhân người nghe có những tiêu chuẩn riêng về chất lượng tốt hay “xấu”, chất lượng là kết quả của sự cảm nhận phán đoán chủ quan của người nghe, dẫn đến sự chênh lệch lớn trong kết quả đánh giá Chất lượng... các thuộc tính của tín hiệu (Objective Evaluation_ OE) Dù OE có giá trị thì nó vẫn phải tương quan với cảm nhận của người nghe Phần này sẽ cung cấp một cái nhìn tổng quan về các phương pháp đánh giá chất lượng của tiếng nói đã được xử 2.2 Phương pháp đánh giá chủ quan Đánh giá chất lượng chủ quan là đánh giá chất lượng dựa trên cảm nhận nghe của con người đối với tiếng nói Chất lượng là một trong các . Đồ án tốt nghiệp Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán Đồ án tốt nghiệp PDF by http://www.ebook.edu.vn. để đánh giá tính hiệu quả của các thuật toán xử lý trong môi trường thực tế. Đồ án của nhóm đã thực hiện được 2 thuật toán xử lý tiếng nói trong Speech Enhancement và đưa ra được các kết quả. một số phương pháp đánh giá hiệu quả của thuật toán giảm nhiễu trong tiếng nói. Gồm có đánh giá chủ quan và đánh giá khách quan. Chương 3 : Thuật toán Spectral Subtraction và Wiener Filtering.

Ngày đăng: 18/06/2014, 20:20

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[3].Hu, Y. and Loizou, P(2006), Subjective comparison of speech enhancement algorithms, Proc. IEEE Int.Conf. Acoust. Speech Signal Process, I Sách, tạp chí
Tiêu đề: Proc. IEEE Int.Conf. Acoust. Speech Signal Process
Tác giả: Hu, Y. and Loizou, P
Năm: 2006
[5]. Long, M. (2005), Dinner Conversation (An oxymoron?), Acoustics Today,l(1), pp. 25-27 Sách, tạp chí
Tiêu đề: Acoustics Today
Tác giả: Long, M
Năm: 2005
[6]. Lombard, E.(1911), Le signe de lelevation de la voix, Ann. Mal. Oreil. Larynx.,37, 101-119 Sách, tạp chí
Tiêu đề: Ann. Mal. Oreil. "Larynx
Tác giả: Lombard, E
Năm: 1911
[8]. Lim, J. and Oppenheim, A.V.(1979), Enhancement and bandwidth compression of noisy speech, Proc. IEEE, 67(12),pp. 1586-1604 Sách, tạp chí
Tiêu đề: Proc. IEEE
Tác giả: Lim, J. and Oppenheim, A.V
Năm: 1979
[10]. Boll, S.F. (1979), Suppression of acoustic noise in speech using spectral subtraction, IEEE Trans, Acoust. Speech Signal Process.,27(2), 113-120 Sách, tạp chí
Tiêu đề: IEEE Trans, Acoust. Speech Signal Process
Tác giả: Boll, S.F
Năm: 1979
[11] “Methods for Subjective Determination of Transmission Quality”, ITU_T Recommendation P.800, August 1996 Sách, tạp chí
Tiêu đề: Methods for Subjective Determination of Transmission Quality
[12] Philipos C.Loizou, “Speech Enhancement Theory and Practice”, CRC Press, Taylor and Francis Group Sách, tạp chí
Tiêu đề: Speech Enhancement Theory and Practice
[13] Friedrich Schafer, “Artificial Bandwidth Extension of Narrowband Speech”, Signal Processing and Speech Communication Lab, Technical University Graz Sách, tạp chí
Tiêu đề: Artificial Bandwidth Extension of Narrowband Speech
[1]. Ramabadran, T.,Ashley, J., and McLaughin, M.(1997), Background noise suppression for speech enhancement and coding, Proc. IEEE Workshop Speech Coding Telecommun Khác
[2]. Ths.Hoàng Lê Uyên Thục, Giáo trình xử lý tín hiệu số, Đại học Bách Khoa – Đại học Đà Nẵng Khác
[4]. Philippos C.Loizou, Speech Enhancement Theory and Practice,pp. 2-7 Khác
[7]. Nguyễn Quốc Trung, Xử lý tín hiệu số - tập 1, NXB Khoa học kĩ thuật Khác
[9]. Weiss, M., Aschkenasy, E., and Parsons, T.(1974), Study and the development of the INTEL technique for improving speech intelligibility, Technical Report NSC-FR/ 4023 Khác
[10]. Philippos C.Loizou, Speech Enhancement Theory and Practice,pp. 46-57 Khác

HÌNH ẢNH LIÊN QUAN

Hình 1.1 Tín hiệu tiếng nói [2]. - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 1.1 Tín hiệu tiếng nói [2] (Trang 16)
Hình 1.2 Dạng và sự phân bố phổ năng lượng trung bình nhiễu trên xe [4]. - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 1.2 Dạng và sự phân bố phổ năng lượng trung bình nhiễu trên xe [4] (Trang 19)
Hình 1.3 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trên  tàu [4]. - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 1.3 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trên tàu [4] (Trang 19)
Hình 1.4 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trong  nhà hàng[4]. - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 1.4 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trong nhà hàng[4] (Trang 20)
Hình 1.5 Mức nhiễu và tiếng nói (được đo bằng SPL dB) trong các môi  trường khác nhau [4] - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 1.5 Mức nhiễu và tiếng nói (được đo bằng SPL dB) trong các môi trường khác nhau [4] (Trang 21)
Hình 1.6 Mẫu tiếng nói “eee” được lấy mẫu với tần số lấy mẫu 8kHz [11]. - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 1.6 Mẫu tiếng nói “eee” được lấy mẫu với tần số lấy mẫu 8kHz [11] (Trang 26)
Hình 1.7 Dạng sóng tín hiệu tiếng nói của câu “The wife helped her  husband” và dạng sóng của phụ âm “f” trong từ “wife, dạng sóng của đoạn - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 1.7 Dạng sóng tín hiệu tiếng nói của câu “The wife helped her husband” và dạng sóng của phụ âm “f” trong từ “wife, dạng sóng của đoạn (Trang 28)
Hình 1.10 bảng phân loại âm vị trong tiếng Anh của người Mỹ [11] - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 1.10 bảng phân loại âm vị trong tiếng Anh của người Mỹ [11] (Trang 30)
Bảng 2.4. Thang điểm đánh giá chất lượng tín hiệu tiếng nói theo CCR - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Bảng 2.4. Thang điểm đánh giá chất lượng tín hiệu tiếng nói theo CCR (Trang 33)
Bảng 2.5. Thang đánh giá DCR - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Bảng 2.5. Thang đánh giá DCR (Trang 33)
3.2  Sơ đồ khối chung của Spectral Subtraction và Wiener Filtering - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
3.2 Sơ đồ khối chung của Spectral Subtraction và Wiener Filtering (Trang 42)
Sơ đồ khối của thuật toán Spectral Subtraction : - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Sơ đồ kh ối của thuật toán Spectral Subtraction : (Trang 46)
Hình 3.3 Sơ đồ khối của thuật toán Wiener Filtering. - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 3.3 Sơ đồ khối của thuật toán Wiener Filtering (Trang 49)
Hình 3.4 Phân tích tín hiệu thành các frame [31]. - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 3.4 Phân tích tín hiệu thành các frame [31] (Trang 50)
Hình 3.5 quá trình thực hiện overlap và adding [32]. - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 3.5 quá trình thực hiện overlap và adding [32] (Trang 51)
Hình 4.1. Sơ đồ thực hiện và đánh giá thuật toán tăng cường - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 4.1. Sơ đồ thực hiện và đánh giá thuật toán tăng cường (Trang 54)
Hình 4.2 Lưu đồ thuật toán SS - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 4.2 Lưu đồ thuật toán SS (Trang 56)
Hình 4.3 Lưu đồ thuật toán WF - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 4.3 Lưu đồ thuật toán WF (Trang 57)
Hình 4.4 dạng sóng và spectrogram của tín hiệu sạch - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 4.4 dạng sóng và spectrogram của tín hiệu sạch (Trang 58)
Hình 4.5 Dạng sóng và phổ của tín hiệu bị nhiễu xe hơi với SNR = 10dB - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 4.5 Dạng sóng và phổ của tín hiệu bị nhiễu xe hơi với SNR = 10dB (Trang 58)
Hình 4.6 Dạng sóng và spectrogram của tín hiệu sau khi xử lý nhiễu xe hơi  bằng SS với SNR = 10dB - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 4.6 Dạng sóng và spectrogram của tín hiệu sau khi xử lý nhiễu xe hơi bằng SS với SNR = 10dB (Trang 59)
Hình 4.8 Quy trình thực hiện đánh giá - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 4.8 Quy trình thực hiện đánh giá (Trang 61)
Hình 4.10. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu người  nói xung quanh - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 4.10. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu người nói xung quanh (Trang 62)
Hình 4.9. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu xe hơi - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 4.9. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu xe hơi (Trang 62)
Hình 4.11 Đồ thị đánh giá Objective với hệ số IS=0.2, NoiseMargin=3 - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 4.11 Đồ thị đánh giá Objective với hệ số IS=0.2, NoiseMargin=3 (Trang 64)
Hình 4.12 Đồ thị đánh giá Objective với hệ số IS=0.15, NoiseMargin=2. - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 4.12 Đồ thị đánh giá Objective với hệ số IS=0.15, NoiseMargin=2 (Trang 65)
Hình 4.14 Đồ thị đánh giá objective với hệ số alpha=0.5, 0.8,0.9 với  IS=0.15 và NoiseMargin = 2 - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 4.14 Đồ thị đánh giá objective với hệ số alpha=0.5, 0.8,0.9 với IS=0.15 và NoiseMargin = 2 (Trang 67)
Hình 4.15 Đồ thị đánh giá objective với hệ số gamma = 1 và gamma = 2. - Đồ án tốt nghiệp: Thuật toán xử lý tiếng nói trong Speech Enhancement và đánh giá tính hiệu quả của thuật toán pdf
Hình 4.15 Đồ thị đánh giá objective với hệ số gamma = 1 và gamma = 2 (Trang 68)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w