1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xử lý nâng cao chất lượng tiếng nói

92 780 7
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 92
Dung lượng 3,16 MB

Nội dung

Xử lý nâng cao chất lượng tiếng nói

Đồ án tốt nghiệp PDF by http://www .ebook.edu.vn SVTH: Nguyễn Thị Ngọc Diệp Trang 1 CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh phúc LỜI CAM ĐOAN Kính g ửi: Hội đồng bảo vệ đồ án tốt nghiệp Khoa Điện tử _ Viễn thông _ Trường Đại học Bách Khoa Đà Nẵng. Em tên là: Nguyễn Thị Ngọc Diệp Hiện đang học lớp 04ĐT1- Khoa: Điện tử - Viễn thông – Trường: Đại học Bách Khoa Đà Nẵng. Nhóm em xin cam đoan nội dung của đồ án này không phải là bản sao chép của bất cứ đồ án hoặc công trình đã có từ trước. Sinh viên thực hiện Nguyễn Thị Ngọc Diệp SVTH: Nguyễn Thị Ngọc Diệp Trang 2 Đồ án tốt nghiệp PDF by http://www .ebook.edu.vn MỤC LỤC LỜI CAM ĐOAN 1 MỤC LỤC 2 DANH MỤC CÁC TỪ VIẾT TẮT VÀ CÁC THUẬT NGỮ TIẾNG ANH 8 MỞ ĐẦU 10 CHƯƠNG 1: TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI . 13 1.1 Giới thiệu chương 13 1.2 Nâng cao chất lượng tiếng nói là gì ? 13 1.3 thuyết về tín hiệu và nhiễu . 15 1.3.1 Tín hiệu, hệ thống và xử tín hiệu .15 1.3.1.1 Tín hiệu 15 1.3.1.2 Nguồn tín hiệu 15 1.3.1.3 Hệ thống và xử tín hiệu 16 1.3.1.4 Phân loại tín hiệu 16 1.4 thuyết về nhiễu . 17 1.4.1 Nguồn nhiễu .17 1.4.2 Nhiễu và mức tín hiệu tiếng nói trong các môi trường khác nhau .19 1.5 Tín hiệu rời rạc theo thời gian . 20 1.5.1 Tín hiệu bước nhảy đơn vị .21 1.5.2 Tín hiệu xung đơn vị 21 1.5.3 Tín hiệu hàm mũ 21 1.5.4 Tín hiệu hàm sin rời rạc .21 1.6 Phép biến đổi Fourier của tín hiệu rời rạc DTFT 22 1.6.1 Sự hội tụ của phép biến đổi Fourier .22 SVTH: Nguyễn Thị Ngọc Diệp Trang 3 Đồ án tốt nghiệp PDF by http://www .ebook.edu.vn 1.6.2 Quan hệ giữa biến đổi Z và biến đổi Fourier .22 1.6.3 Phép biến đổi Fourier ngược 23 1.6.4 Các tính chất của phép biến đổi Fourier 23 1.6.5 Phân tích tần số (phổ) cho tín hiệu rời rạc .24 1.6.6 Phổ tín hiệu và phổ pha 25 1.7 Các thuật toán sử dụng nâng cao chất lượng tiếng nói 26 1.7.1 Trừ phổ .26 1.7.2 Mô hình thống kê .26 1.8 Tín hiệu tiếng nói . 26 1.9 Cơ chế tạo tiếng nói . 28 1.9.1.1 Bộ máy phát âm của con người 28 1.9.2 Mô hình kỹ thuật của việc tạo tiếng nói .28 1.9.3 Phân loại âm .29 1.9.4 Thuộc tính âm học của tiếng nói 29 1.10 Kết luận chương 29 CHƯƠNG 2 : ĐÁNH GIÁ CHẤT LƯỢNG TIẾNG NÓI 30 2.1 Giới thiệu chương 30 2.2 Phương pháp đánh giá chủ quan 30 2.2.1 Các phương pháp đánh giá tuyệt đối 31 2.2.1.1 Phương pháp đánh giá tuyệt đối ACR . 31 2.2.2 Các phương pháp đánh giá tương đối 31 2.2.2.1 Đánh giá bằng phương pháp so sánh các mẫu tín hiệu 31 2.2.2.2 Phương pháp đánh giá theo sự suy giảm chất lượng . 32 2.3 Phương pháp đánh giá khách quan 33 SVTH: Nguyễn Thị Ngọc Diệp Trang 4 Đồ án tốt nghiệp PDF by http://www .ebook.edu.vn 2.3.1 Đo tỷ số tín hiệu trên nhiễu trên từng khung .33 2.3.2 Đo khoảng cách phổ dựa trên LPC 35 2.3.2.1 Phương pháp đo LLR . 35 2.3.2.2 Phương pháp đo IS . 36 2.3.2.3 Phương pháp đo theo khoảng cách cepstrum . 36 2.3.3 Đánh giá mô phỏng theo cảm nhận nghe của con người .37 2.3.3.1 Phương pháp đo Weighted Spectral Slope . 37 2.3.3.2 Phương pháp đo Bark Distortion . 38 2.3.3.3 Phương pháp đánh giá cảm nhận chất lượng thoại PESQ . 39 2.4 Kết luận chương 39 CHƯƠNG 3: THUẬT TOÁN SPECTRAL–SUBTRACTION VÀ WIENER FILTERING . 41 3.1 Giới thiệu chương 41 3.2 Sơ đồ khối chung của Spectral Subtraction và Wiener Filtering 41 3.3 Thuật toán Spectral Subtraction 41 3.3.1 Giới thiệu chung .41 3.3.2 Spectral subtraction đối với phổ biên độ .42 3.3.3 Spectral subtraction đối với phổ công suất 43 3.4 Thuật toán Wiener Filtering 45 3.4.1 Giới thiệu chung .45 3.4.2 Nguyên cơ bản của Wiener Filtering .46 3.5 Overlap và Adding trong quá trình xử tín hiệu tiếng nói 48 3.5.1 Phân tích tín hiệu theo từng frame .48 3.5.2 Overlap và Adding .49 SVTH: Nguyễn Thị Ngọc Diệp Trang 5 Đồ án tốt nghiệp PDF by http://www .ebook.edu.vn 3.6 Ước lượng và cập nhật nhiễu . 50 3.6.1 Voice activity detection .51 3.6.2 Quá trình ước lượng và cập nhật nhiễu 51 3.7 Kết luận chương 52 CHƯƠNG 4: THỰC HIỆN VÀ ĐÁNH GIÁ CÁC THUẬT TOÁN 53 4.1 Giới thiệu chương 53 4.2 Quy trình thực hiện và đánh giá thuật toán . 53 4.3 Lưu đồ thuật toán Spectral Subtraction . 55 4.4 Lưu đồ thuật toán Wiener Filtering . 56 4.5 Thực hiện thuật toán 57 4.6 Đánh giá chất lượng tiếng nói đã được xử 59 4.6.1 Cơ sở dữ liệu cho việc đánh giá .59 4.6.2 Tổng quan về quy trình đánh giá .59 4.6.3 Kiểm tra độ tin cậy của các phương pháp đánh giá .60 4.6.4 Thực hiện đánh giá .62 4.6.4.1 Đánh giá thuật toán với các hệ số dự đoán ban đầu . 62 4.6.4.2 Tối ưu hệ số alpha cho thuật toán WF . 65 4.6.4.3 Hệ số gamma cho thuật toán SS . 67 4.6.4.4 Đánh giá thuật toán sau khi đã tối ưu . 68 4.6.4.5 Đánh giá độ ổn định của thuật toán trong môi trường nhiễu khác . 69 4.6.5 Kết luận chương .71 TÀI LIỆU THAM KHẢO . 72 KẾT LUẬN ĐỒ ÁN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI . 75 PHỤ LỤC . 76 SVTH: Nguyễn Thị Ngọc Diệp Trang 6 Đồ án tốt nghiệp PDF by http://www .ebook.edu.vn DANH MỤC CÁC HÌNH VẼ VÀ BẢNG Hình 1.1 Tín hiệu tiếng nói [2]. . 15 Hình 1.2 Dạng và sự phân bố phổ năng lượng trung bình nhiễu trên xe [4] . 18 Hình 1.3 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trên tàu [4]. 18 Hình 1.4 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trong nhà hàng[4]. 19 Hình 1.5 Mức nhiễu và tiếng nói (được đo bằng SPL dB) trong các môi trường khác nhau [4]. . 20 Hình 1.6 Mẫu tiếng nói “eee” được lấy mẫu với tần số lấy mẫu 8kHz [11]. 25 Hình 1.7 Dạng sóng tín hiệu tiếng nói của câu “The wife helped her husband” và dạng sóng của phụ âm “f” trong từ “wife, dạng sóng của đoạn nguyên âm “er” trong từ “her” [11] 27 Hình 1.8 mặt cắt dọc của cơ quan tạo tiếng nói [11] . 28 Hình 1.9 mô hình kỹ thuật tạo tiếng nói[11]. 28 Hình 1.10 bảng phân loại âm vị trong tiếng Anh của người Mỹ [11] . 29 Bảng 2.1.Thang điểm đánh giá chất lượng tiếng nói theo MOS [12] 31 Bảng 2.4. Thang điểm đánh giá chất lượng tín hiệu tiếng nói theo CCR 32 Bảng 2.5. Thang đánh giá DCR . 32 Hình 3.1 Sơ đồ khối cho hai thuật toán SS và WF 41 Hình 3.2 Sơ đồ khối của thuật toán Spectral subtraction [26]. . 45 Hình 3.3 Sơ đồ khối của thuật toán Wiener Filtering. 48 Hình 3.4 Phân tích tín hiệu thành các frame [31] 49 Hình 3.5 quá trình thực hiện overlap và adding [32]. . 50 Hình 4.1. Sơ đồ thực hiện và đánh giá thuật toán tăng cường 53 Hình 4.2 Lưu đồ thuật toán SS 55 Hình 4.3 Lưu đồ thuật toán WF . 56 Hình 4.4 dạng sóng và spectrogram của tín hiệu sạch 57 Hình 4.5 Dạng sóng và phổ của tín hiệu bị nhiễu xe hơi với SNR = 10dB 57 SVTH: Nguyễn Thị Ngọc Diệp Trang 7 Đồ án tốt nghiệp PDF by http://www .ebook.edu.vn Hình 4.6 Dạng sóng và spectrogram của tín hiệu sau khi xử nhiễu xe hơi bằng SS với SNR = 10dB. 58 Hình 4.7 Dạng sóng và spectrogram của tín hiệu sau khi xử nhiễu xe hơi bằng WF với SNR = 10dB. . 58 Hình 4.8 Quy trình thực hiện đánh giá 60 Hình 4.9. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu xe hơi 61 Hình 4.10. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu người nói xung quanh . 61 Hình 4.11 Đồ thị đánh giá Objective với hệ số IS=0.2, NoiseMargin=3 63 Hình 4.12 Đồ thị đánh giá Objective với hệ số IS=0.15, NoiseMargin=2 64 Hình 4.14 Đồ thị đánh giá objective với hệ số alpha=0.5, 0.8,0.9 với IS=0.15 và NoiseMargin = 2 66 Hình 4.15 Đồ thị đánh giá objective với hệ số gamma = 1 và gamma = 2. 67 Hình 4.16 Đồ thị đánh giá với IS=0.15 NoiMargin= 2 và alpha = 0.8 cho thuật toán WF, gama=1 cho thuật toán SS 69 Hình 4.17 Đồ thị đánh giá OE với nhiễu người nói xung quanh. . 70 SVTH: Nguyễn Thị Ngọc Diệp Trang 8 Đồ án tốt nghiệp PDF by http://www .ebook.edu.vn DANH MỤC CÁC TỪ VIẾT TẮT VÀ CÁC THUẬT NGỮ TIẾNG ANH Từ viết tắt Tiếng Anh Nghĩa tiếng Việt SNR Signal Noise Ratio Tỉ số tín hiệu trên nhiễu PC Personal Computer Máy tính cá nhân SPL Sound Pressure Level Mức áp suất của âm thanh MMSE Minium Mean-Squared Error Tối thiểu hoá sai lệch trung bình bình phương SVD Singular Value Decomposition Phép phân tích giá trị đơn DFT Discrete Fourier Transform Phép biến đổi Fourier rời rạc FFT Fast Fourier Transform Phép biến đổi Fourier nhanh DTFT Discrete-Time Fourier Transform Phép biến đổi Fourier của tín hiệu rời rạc. ZT Z Transform Phép biến đổi Z ROC Region of Convergence Miền hội tụ IDTFT Inverse Discrete Fourier Transform Phép biến đổi ngược Fourier rời rạc LTI Linear Time-Invariant Hệ thống tuyến tính và bất biến theo thời gian ITU-T InternationalTelecommunications Union-Telecommunication Hiệp hội tiêu chuẩn viễn thông quốc tế ACR Absolute Categories Rating Đánh giá theo giá trị tuyệt đối MOS Mean Opinion Scores Đánh giá theo quan điểm người nghe CCR Comparison Category Rating Đánh giá bằng cách so sánh DCR Degradation Category Rating Đánh giá suy giảm chất lượng SVTH: Nguyễn Thị Ngọc Diệp Trang 9 Đồ án tốt nghiệp PDF by http://www .ebook.edu.vn SE Subjective Evaluation Đánh giá chủ quan OE Objective Evaluation Đánh giá khách quan IS Itakura_Saito LLR Log likehook Raito WSS Weighted Spectral Slope Đo theo trọng số của phổ LPC Linear Prediction Coefficients Hệ số dự đoán tuyến tính VAD Voice Activity Detection Thăm dò sự hoạt động của tiếng nói Speech Enhancement Nâng cao chất lượng tiếng nói SS Spectral Subtraction Thuật toán giảm nhiễu tín hiệu tiếng nói bằng phương pháp trừ phổ. WF Wiener Filter Thuật toán giảm nhiễu tín hiệu tiếng nói bằng cách sử dụng bộ lọc Wiener. Statistical-model-based Thuật toán giảm nhiễu tín hiệu tiếng nói dựa trên nguyên thống kê Frame Khung tín hiệu. Hamming Cửa sổ Hamming Overlap và Adding Xếp chồng và cộng SVTH: Nguyễn Thị Ngọc Diệp Trang 10 Đồ án tốt nghiệp PDF by http://www .ebook.edu.vn MỞ ĐẦU Trong cuộc sống, tiếng nói đóng một vai trò rất quan trọng đối với con người. Cùng với tiếng nói là sự xuất hiện của rất nhiều các loại dịch vụ thoại như ngày nay. Tuy nhiên việc bảo toàn được tín hiệu tiếng nói trên các dịch vụ này là điều vô cùng khó khăn do sự mất mát và suy giảm tín hiệu và nhất là ảnh hưởng của nhiễu sẽ làm cho tín hiệu tiếng nói không còn như ban đầu. Vì do đó mà các thuật toán về Speech Enhancement ra đời. Tuy không thể bảo toàn được y nguyên tín hiệu ban đầu nhưng sử dụng các thuật toán này ta có thể tăng cường được chất lượng tiếng nói và giảm bớt nhiễu nền để tín hiệu sau khi xử đến người nghe vẫn mang đầy đủ nội dung thông tin và không gây khó chịu bởi nhiễu đối với người nghe. Vì vậy, Speech Enhancement đóng một vai trò rất quan trọng trong lĩnh vực thoại. Xuất phát từ thực tế này nhóm đã bắt tay vào tìm hiểu về Speech Enhancement, nghiên cứu các thuật toán của nó để thực hiện và đánh giá hiệu quả của các thuật toán đó trong môi trường thực tế. Để thực hiện được đồ án, nhóm đã phân chia thành 3 phần tương ứng với 3 thành viên : - Nguyễn Ngọc Trung : nghiên cứu và thực hiện thuật toán xử tiếng nói sử dụng phương pháp Spectral Subtraction. - Nguyễn Phúc Nguyên : nghiên cứu và thực hiện thuật xử tiếng nói sử dụng bộ lọc Wiener. - Nguyễn Thị Ngọc Diệp : nghiên cứu và thực hiện các phương pháp đánh giá từ các kết quả đạt được của 2 thuật toán trên trong môi trường thực tế. Để thực hiện được nội dung phần của em thì đồ án của em được kết cấu thành 2 phần, gồm 5 chương : Phần 1 : thuyết Chương 1 : Tổng quan về nâng cao chất lượng tiếng nói. Chương này giới thiệu một số khái niệm cơ bản về tín hiệu số, các phép biến đổi, tìm hiểu về các [...]... về nâng cao chất lượng tiếng nói CHƯƠNG 1: TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI 1.1 Giới thiệu chương Nội dung của chương trình bày mục đích của nâng cao chất lượng tiếng nói là gì, các loại nhiễu trong tiếng nói, cách hình thành của tiếng nói và các đặc điểm cuả tín hiệu tiếng nói Chương này còn giới thiệu khái quát về các thuật toán sử dụng trong speech enhancement 1.2 Nâng cao chất lượng tiếng. .. enhancement 1.2 Nâng cao chất lượng tiếng nói là gì ? Nâng cao chất lượng tiếng nói liên quan đến việc cải thiện cảm nhận đối với tiếng nói bị suy giảm chất lượng do sự có mặt của nhiễu trong tiếng nói Trong hầu hết các ứng dụng, thì mục đích của nâng cao chất lượng tiếng nói là sự cải thiện chất lượng và tính dễ nghe của tiếng nói đã bị suy giảm do nhiễu Sự cải thiện về chất lượng mà tốt thì nó làm giảm đi... Chính vì vậy mà các thuật toán trong nâng cao chất lượng tiếng nói có thể được sử dụng để cải thiện chất lượng của tiếng nói tại điểm thu, mặt khác, nó có thể được sử dụng trong các khối tiền xử của hệ thống mã hoá tiếng nói dùng trong các điện thoại tế bào chuẩn [1] Khi nhận dạng tiếng nói, tiếng nói bị nhiễu được tiền xử bởi các thuật toán nâng cao chất lượng trước khi được nhận dạng Trong... khi được nhận dạng Trong thông tin liên lạc hàng không, các kỹ thuật nâng cao tiếng nói cần được sử dụng để cải thiện chất lượng và tính SVTH: Nguyễn Thị Ngọc Diệp Trang 13 Chương 1 : Tổng quan về nâng cao chất lượng tiếng nói dễ nghe của tiếng nói của phi công bị ảnh hưởng bởi nhiễu trong buồng lái Vì vậy mà nâng cao chất lượng tiếng nói cũng rất cần thiết trong thông tin liên lạc của quân sự Trong hệ... cung cấp một cái nhìn tổng quan về các phương pháp đánh giá chất lượng của tiếng nói đã được xử 2.2 Phương pháp đánh giá chủ quan Đánh giá chất lượng chủ quan là đánh giá chất lượng dựa trên cảm nhận nghe của con người đối với tiếng nói Chất lượng là một trong các thuộc tính của tín hiệu tiếng nói Về bản chất thì chất lượng có tính chủ quan cao và khó có thể đánh giá một cách đáng tin cậy.Nó chỉ đóng... tín hiệu tiếng nói đã bị nhiễu Ngoài ra, nội dung của chương cũng đã nêu rõ được các loại nhiễu xuất hiện trong từng môi trường cụ thể để từ đó chúng ta có tìm ra được thuật toán xử thích hợp ứng với mỗi trường hợp cụ thể Chương 2 : Đánh giá chất lượng tiếng nói CHƯƠNG 2 : ĐÁNH GIÁ CHẤT LƯỢNG TIẾNG NÓI 2.1 Giới thiệu chương Cho đến nay đã có rất nhiều thuật toán nâng cao chất lượng tiếng nói, nhưng... này là so sánh tín hiệu đã qua xử với tín hiệu gốc chuẩn mà độ suy giảm chất lượng của nó có thể được kiểm soát Được đề ra trong chuẩn ITU-T Rec.P.810 2.2.2.2 Phương pháp đánh giá theo sự suy giảm chất lượng Đánh giá sự suy giảm chất lượng Degradation Category Rating (DCR) Sự giảm sút về chất lượng của tín hiệu đã qua xử so với tín hiệu chất lượng cao chưa qua xử được xác định qua năm thang... khoảng cách đó tăng gấp đôi thì SVTH: Nguyễn Thị Ngọc Diệp Trang 19 Chương 1 : Tổng quan về nâng cao chất lượng tiếng nói mức cường độ âm giảm đi 6 dB[6] SVTH: Nguyễn Thị Ngọc Diệp Trang 20 Chương 1 : Tổng quan về nâng cao chất lượng tiếng nói Hình bên dưới này là sự tổng hợp về mức độ âm trung bình giữa tiếng nói và nhiễu trong các môi trường khác nhau Mức độ của nhiễu nhỏ nhất ở trong các môi trường... có những tiêu chuẩn riêng về chất lượng “tốt” hay “xấu”, chất lượng là kết quả của sự cảm nhận và phán đoán chủ quan của người nghe, dẫn đến sự chênh lệch lớn trong kết quả đánh giá Chất lượng có rất nhiều chỉ tiêu không thể đếm hết được Tùy vào các mục đích thực tế và tùy vào mỗi ứng dụng mà chỉ tập trung vào một số chỉ tiêu chất lượng tiếng nói Đánh giá chất lượng tiếng nói là một công việc đầy khó... được nghe hai mẫu thoại và sẽ đánh giá thích mẫu tín hiệu nào hơn Chương 2 : Đánh giá chất lượng tiếng nói Đánh giá bằng cách so sánh Comparison Category Rating (CCR) được khuyến nghị bởi ITU-T để đánh giá các hệ thống dùng nâng cao chất lượng tiếng nói [13] Bảng 2.4 Thang điểm đánh giá chất lượng tín hiệu tiếng nói theo CCR Rating Quality of Speech 3 Much better 2 Better 1 Slightly Better 0 About . NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI ... 13 1.1 Giới thiệu chương ................................................................................ 13 1.2 Nâng cao. đánh giá Objective với hệ số IS=0.2, NoiseMargin=3............ 63 Hình 4.12 Đồ thị đánh giá Objective với hệ số IS=0.15, NoiseMargin=2.......... 64 Hình 4.14

Ngày đăng: 24/04/2013, 08:07

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[3].Hu, Y. and Loizou, P(2006), Subjective comparison of speech enhancement algorithms, Proc. IEEE Int.Conf. Acoust. Speech Signal Process, I Sách, tạp chí
Tiêu đề: Proc. IEEE Int.Conf. Acoust. Speech Signal Process
Tác giả: Hu, Y. and Loizou, P
Năm: 2006
[5]. Long, M. (2005), Dinner Conversation (An oxymoron?), Acoustics Today,l(1), pp. 25-27 Sách, tạp chí
Tiêu đề: AcousticsToday
Tác giả: Long, M
Năm: 2005
[6]. Lombard, E.(1911), Le signe de lelevation de la voix, Ann. Mal. Oreil. Larynx.,37, 101-119 Sách, tạp chí
Tiêu đề: Ann. Mal. Oreil. "Larynx
Tác giả: Lombard, E
Năm: 1911
[8]. Lim, J. and Oppenheim, A.V.(1979), Enhancement and bandwidth compression of noisy speech, Proc. IEEE, 67(12),pp. 1586-1604 Sách, tạp chí
Tiêu đề: Proc. IEEE
Tác giả: Lim, J. and Oppenheim, A.V
Năm: 1979
[10]. Boll, S.F. (1979), Suppression of acoustic noise in speech using spectral subtraction, IEEE Trans, Acoust. Speech Signal Process.,27(2), 113-120 Sách, tạp chí
Tiêu đề: IEEE Trans, Acoust. Speech Signal Process
Tác giả: Boll, S.F
Năm: 1979
[11] “Methods for Subjective Determination of Transmission Quality”, ITU_T Recommendation P.800, August 1996 Sách, tạp chí
Tiêu đề: Methods for Subjective Determination of Transmission Quality
[12] Philipos C.Loizou, “Speech Enhancement Theory and Practice”, CRC Press, Taylor and Francis Group Sách, tạp chí
Tiêu đề: Speech Enhancement Theory and Practice
[13] Friedrich Schafer, “Artificial Bandwidth Extension of Narrowband Speech”, Signal Processing and Speech Communication Lab, Technical University Graz Sách, tạp chí
Tiêu đề: Artificial Bandwidth Extension of Narrowband Speech
[14] Hansen J. and Pellon B. , “An effective quality evaluation protocol for Speech Enhancement algorithms”, Proc. Int Conf. Spoken Language Process, 1998 Sách, tạp chí
Tiêu đề: An effective quality evaluation protocol forSpeech Enhancement algorithms
[16] Beey Y. , Shpiro Z. , Simchony T. , Shatz L. and Piasetzky J., “An efficient variable_bit_rate_low_delay (VBR_LP_CELP) code” , New York, Marcel Pekker, 1990 Sách, tạp chí
Tiêu đề: An efficient variable_bit_rate_low_delay (VBR_LP_CELP) code
[17] Yi Hu and Philipos C. Loizou, “Evaluation of Objective Quality Measures for Speech Enhancement”, IEEE Sách, tạp chí
Tiêu đề: Evaluation of Objective Quality Measures for Speech Enhancement
[18] Klatt D., “Prediction of perceived phonetic distance from critical band spectra”, Proc IEEE Int. Conf. Acoust. Speech Signal Process Sách, tạp chí
Tiêu đề: Prediction of perceived phonetic distance from critical band spectra
[19] Kitawaki N., Nagabuchi H., and Itoh K., “Objective Evaluation for low bit_rate Speech Coding systems”, IEEE J, Sel. Areas Commun Sách, tạp chí
Tiêu đề: Objective Evaluation for low bit_rate Speech Coding systems
[20] Quackenbush S., Barnwell T. and Clements M., “Objective Measure of Speech Quality”, Englewood Cliffs NJ: Prenticư Hall Sách, tạp chí
Tiêu đề: Objective Measure ofSpeech Quality
[21]. Boll, S.F(1979), Suppression of acoustic noise in speech using spectral subtraction, IEEE Trans. Acoust. Speech Signal Process., 27(2), 113-120 Sách, tạp chí
Tiêu đề: IEEE Trans. Acoust. Speech Signal Process
Tác giả: Boll, S.F
Năm: 1979
[22]. Paliwal, K. and Alsteris, L.(2005), On the usefulness of STFT phase spectrum in human listening tests, Speech Commun., 45(2), 153-170 Sách, tạp chí
Tiêu đề: Speech Commun
Tác giả: Paliwal, K. and Alsteris, L
Năm: 2005
[24]. Deller, J., Hansen, J.H.L., and Proakis, J. (2000), Discrete –time Processing of Speech Signals, New York : IEEE Press Sách, tạp chí
Tiêu đề: Discrete –time Processingof Speech Signals
Tác giả: Deller, J., Hansen, J.H.L., and Proakis, J
Năm: 2000
[25]. Guastafsson, H., Nordholm, S., and Claesson, I.(2001), Spectral subtraction using reduced delay convolution and adaptive averaging, IEEE Trans. Speech Audio Process., 9(8), 799-807 Sách, tạp chí
Tiêu đề: IEEE Trans. Speech Audio Process
Tác giả: Guastafsson, H., Nordholm, S., and Claesson, I
Năm: 2001
[27]. Paliwal, K. and Alsteris, L.(2005), On the usefulness of STFT phase spectrum in human listening tests, Speech Commun., 45(2), 153-170 Sách, tạp chí
Tiêu đề: Speech Commun
Tác giả: Paliwal, K. and Alsteris, L
Năm: 2005
[28]. Lim, Oppenheim, Speech Enhancement Using a Soft-Decision noise Suppression EEE Trans. Acoustics, Speech and Signal Processing, vol. assp-28, no.2, april 1980 Sách, tạp chí
Tiêu đề: EEE Trans. Acoustics, Speech and Signal Processing

HÌNH ẢNH LIÊN QUAN

Hình 1.1 Tín hiệu tiếng nói [2]. - Xử lý nâng cao chất lượng tiếng nói
Hình 1.1 Tín hiệu tiếng nói [2] (Trang 15)
Hình 1.1 Tín hiệu tiếng nói [2]. - Xử lý nâng cao chất lượng tiếng nói
Hình 1.1 Tín hiệu tiếng nói [2] (Trang 15)
Hình 1.2 Dạng và sự phân bố phổ năng lượng trung bình nhiễu trên xe [4]. - Xử lý nâng cao chất lượng tiếng nói
Hình 1.2 Dạng và sự phân bố phổ năng lượng trung bình nhiễu trên xe [4] (Trang 18)
Hình 1.3 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trên - Xử lý nâng cao chất lượng tiếng nói
Hình 1.3 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trên (Trang 18)
Hình 1.2 Dạng và sự phân bố phổ năng lượng trung bình nhiễu trên xe [4]. - Xử lý nâng cao chất lượng tiếng nói
Hình 1.2 Dạng và sự phân bố phổ năng lượng trung bình nhiễu trên xe [4] (Trang 18)
Hình 1.3 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trên  tàu [4]. - Xử lý nâng cao chất lượng tiếng nói
Hình 1.3 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trên tàu [4] (Trang 18)
Hình 1.4 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trong - Xử lý nâng cao chất lượng tiếng nói
Hình 1.4 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trong (Trang 19)
Hình 1.4 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trong nhà hàng[4]. - Xử lý nâng cao chất lượng tiếng nói
Hình 1.4 Dạng và sự phân bố phổ năng lượng trung bình của nhiễu trong nhà hàng[4] (Trang 19)
Hình bên dưới này là sự tổng hợp về mức độ âm trung bình giữa tiếng nói và nhiễu trong các môi trường khác nhau - Xử lý nâng cao chất lượng tiếng nói
Hình b ên dưới này là sự tổng hợp về mức độ âm trung bình giữa tiếng nói và nhiễu trong các môi trường khác nhau (Trang 21)
Hình bên dưới này là sự tổng hợp về mức độ âm trung bình giữa tiếng nói và nhiễu trong các môi trường khác nhau - Xử lý nâng cao chất lượng tiếng nói
Hình b ên dưới này là sự tổng hợp về mức độ âm trung bình giữa tiếng nói và nhiễu trong các môi trường khác nhau (Trang 21)
Hình 1.6 Mẫu tiếng nói “eee” được lấy mẫu với tần số lấy mẫu 8kHz [11]. - Xử lý nâng cao chất lượng tiếng nói
Hình 1.6 Mẫu tiếng nói “eee” được lấy mẫu với tần số lấy mẫu 8kHz [11] (Trang 29)
Hình 1.7 Dạng sóng tín hiệu tiếng nói của câu “The wife helped her - Xử lý nâng cao chất lượng tiếng nói
Hình 1.7 Dạng sóng tín hiệu tiếng nói của câu “The wife helped her (Trang 31)
Hình 1.7 Dạng sóng tín hiệu tiếng nói của câu “The wife helped her husband” và dạng sóng của phụ âm “f” trong từ “wife, dạng sóng của đoạn - Xử lý nâng cao chất lượng tiếng nói
Hình 1.7 Dạng sóng tín hiệu tiếng nói của câu “The wife helped her husband” và dạng sóng của phụ âm “f” trong từ “wife, dạng sóng của đoạn (Trang 31)
1.9.2 Mô hình kỹ thuật của việc tạo tiếng nói - Xử lý nâng cao chất lượng tiếng nói
1.9.2 Mô hình kỹ thuật của việc tạo tiếng nói (Trang 32)
Hình 1.8 mặt cắt dọc của cơ quan tạo tiếng nói[11]. - Xử lý nâng cao chất lượng tiếng nói
Hình 1.8 mặt cắt dọc của cơ quan tạo tiếng nói[11] (Trang 32)
Hình 1.8 mặt cắt dọc của cơ quan tạo tiếng nói [11]. - Xử lý nâng cao chất lượng tiếng nói
Hình 1.8 mặt cắt dọc của cơ quan tạo tiếng nói [11] (Trang 32)
Hình 1.10 bảng phân loại âm vị trong tiếng Anh của người Mỹ [11] - Xử lý nâng cao chất lượng tiếng nói
Hình 1.10 bảng phân loại âm vị trong tiếng Anh của người Mỹ [11] (Trang 33)
Hình 1.10 bảng phân loại âm vị trong tiếng Anh của người Mỹ [11] - Xử lý nâng cao chất lượng tiếng nói
Hình 1.10 bảng phân loại âm vị trong tiếng Anh của người Mỹ [11] (Trang 33)
Bảng 2.4. Thang điểm đánh giá chất lượng tín hiệu tiếng nói theo CCR - Xử lý nâng cao chất lượng tiếng nói
Bảng 2.4. Thang điểm đánh giá chất lượng tín hiệu tiếng nói theo CCR (Trang 36)
Hình 3.1 Sơ đồ khối cho hai thuật toán SS và WF - Xử lý nâng cao chất lượng tiếng nói
Hình 3.1 Sơ đồ khối cho hai thuật toán SS và WF (Trang 46)
Sơ đồ khối chung cho cả 2 thuật toán : - Xử lý nâng cao chất lượng tiếng nói
Sơ đồ kh ối chung cho cả 2 thuật toán : (Trang 46)
Hình 3.2 Sơ đồ khối của thuật toán Spectral subtraction [26]. - Xử lý nâng cao chất lượng tiếng nói
Hình 3.2 Sơ đồ khối của thuật toán Spectral subtraction [26] (Trang 54)
Sơ đồ khối của thuật toán Spectral Subtraction : - Xử lý nâng cao chất lượng tiếng nói
Sơ đồ kh ối của thuật toán Spectral Subtraction : (Trang 54)
Hình 3.3 Sơ đồ khối của thuật toán Wiener Filtering. - Xử lý nâng cao chất lượng tiếng nói
Hình 3.3 Sơ đồ khối của thuật toán Wiener Filtering (Trang 60)
Sơ đồ khối của thuật toán Wiener Filtering: - Xử lý nâng cao chất lượng tiếng nói
Sơ đồ kh ối của thuật toán Wiener Filtering: (Trang 60)
Hình 3.5 quá trình thực hiện overlap và adding [32]. - Xử lý nâng cao chất lượng tiếng nói
Hình 3.5 quá trình thực hiện overlap và adding [32] (Trang 62)
Hình 3.5 quá trình thực hiện overlap và adding [32]. - Xử lý nâng cao chất lượng tiếng nói
Hình 3.5 quá trình thực hiện overlap và adding [32] (Trang 62)
Hình 4.1. Sơ đồ thực hiện và đánh giá thuật toán tăng cường - Xử lý nâng cao chất lượng tiếng nói
Hình 4.1. Sơ đồ thực hiện và đánh giá thuật toán tăng cường (Trang 65)
Hình 4.1. Sơ đồ thực hiện và đánh giá thuật toán tăng cường - Xử lý nâng cao chất lượng tiếng nói
Hình 4.1. Sơ đồ thực hiện và đánh giá thuật toán tăng cường (Trang 65)
Hình 4.2 Lưu đồ thuật toán SS - Xử lý nâng cao chất lượng tiếng nói
Hình 4.2 Lưu đồ thuật toán SS (Trang 67)
Hình 4.2 Lưu đồ thuật toán SS - Xử lý nâng cao chất lượng tiếng nói
Hình 4.2 Lưu đồ thuật toán SS (Trang 67)
Hình 4.3 Lưu đồ thuật toán WF - Xử lý nâng cao chất lượng tiếng nói
Hình 4.3 Lưu đồ thuật toán WF (Trang 68)
Hình 4.3 Lưu đồ thuật toán WF - Xử lý nâng cao chất lượng tiếng nói
Hình 4.3 Lưu đồ thuật toán WF (Trang 68)
Hình 4.5 Dạng sóng và phổ của tín hiệu bị nhiễu xe hơi với SNR=10dB - Xử lý nâng cao chất lượng tiếng nói
Hình 4.5 Dạng sóng và phổ của tín hiệu bị nhiễu xe hơi với SNR=10dB (Trang 69)
Hình 4.4 dạng sóng và spectrogram của tín hiệu sạch - Xử lý nâng cao chất lượng tiếng nói
Hình 4.4 dạng sóng và spectrogram của tín hiệu sạch (Trang 69)
Hình 4.4 dạng sóng và spectrogram của tín hiệu sạch - Xử lý nâng cao chất lượng tiếng nói
Hình 4.4 dạng sóng và spectrogram của tín hiệu sạch (Trang 69)
Hình 4.5 Dạng sóng và phổ của tín hiệu bị nhiễu xe hơi với SNR = 10dB - Xử lý nâng cao chất lượng tiếng nói
Hình 4.5 Dạng sóng và phổ của tín hiệu bị nhiễu xe hơi với SNR = 10dB (Trang 69)
Hình 4.7 Dạng sóng và spectrogram của tín hiệu sau khi xử lý nhiễu xe hơi - Xử lý nâng cao chất lượng tiếng nói
Hình 4.7 Dạng sóng và spectrogram của tín hiệu sau khi xử lý nhiễu xe hơi (Trang 70)
Hình 4.6 Dạng sóng và spectrogram của tín hiệu sau khi xử lý nhiễu xe hơi - Xử lý nâng cao chất lượng tiếng nói
Hình 4.6 Dạng sóng và spectrogram của tín hiệu sau khi xử lý nhiễu xe hơi (Trang 70)
Hình 4.6 Dạng sóng và spectrogram của tín hiệu sau khi xử lý nhiễu xe hơi bằng SS với SNR = 10dB. - Xử lý nâng cao chất lượng tiếng nói
Hình 4.6 Dạng sóng và spectrogram của tín hiệu sau khi xử lý nhiễu xe hơi bằng SS với SNR = 10dB (Trang 70)
Hình 4.8 Quy trình thực hiện đánh giá - Xử lý nâng cao chất lượng tiếng nói
Hình 4.8 Quy trình thực hiện đánh giá (Trang 72)
Hình 4.8 Quy trình thực hiện đánh giá - Xử lý nâng cao chất lượng tiếng nói
Hình 4.8 Quy trình thực hiện đánh giá (Trang 72)
Hình 4.10. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu người - Xử lý nâng cao chất lượng tiếng nói
Hình 4.10. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu người (Trang 73)
Hình 4.9. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu xe hơi - Xử lý nâng cao chất lượng tiếng nói
Hình 4.9. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu xe hơi (Trang 73)
Hình 4.10. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu người nói xung quanh - Xử lý nâng cao chất lượng tiếng nói
Hình 4.10. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu người nói xung quanh (Trang 73)
Hình 4.9. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu xe hơi - Xử lý nâng cao chất lượng tiếng nói
Hình 4.9. Đồ thị kiểm tra độ ổn định của đánh giá OE đối với nhiễu xe hơi (Trang 73)
Hình 4.11 Đồ thị đánh giá Objective với hệ số IS=0.2, NoiseMargin=3 - Xử lý nâng cao chất lượng tiếng nói
Hình 4.11 Đồ thị đánh giá Objective với hệ số IS=0.2, NoiseMargin=3 (Trang 75)
Hình 4.11 Đồ thị đánh giá Objective với hệ số IS=0.2, NoiseMargin=3 - Xử lý nâng cao chất lượng tiếng nói
Hình 4.11 Đồ thị đánh giá Objective với hệ số IS=0.2, NoiseMargin=3 (Trang 75)
Hình 4.12 Đồ thị đánh giá Objective với hệ số IS=0.15, NoiseMargin=2. - Xử lý nâng cao chất lượng tiếng nói
Hình 4.12 Đồ thị đánh giá Objective với hệ số IS=0.15, NoiseMargin=2 (Trang 76)
Hình 4.12 Đồ thị đánh giá Objective với hệ số IS=0.15, NoiseMargin=2. - Xử lý nâng cao chất lượng tiếng nói
Hình 4.12 Đồ thị đánh giá Objective với hệ số IS=0.15, NoiseMargin=2 (Trang 76)
Hình 4.14 Đồ thị đánh giá objective với hệ số alpha=0.5, 0.8,0.9 với - Xử lý nâng cao chất lượng tiếng nói
Hình 4.14 Đồ thị đánh giá objective với hệ số alpha=0.5, 0.8,0.9 với (Trang 78)
Hình 4.14 Đồ thị đánh giá objective với hệ số alpha=0.5, 0.8,0.9 với IS=0.15 và NoiseMargin = 2 - Xử lý nâng cao chất lượng tiếng nói
Hình 4.14 Đồ thị đánh giá objective với hệ số alpha=0.5, 0.8,0.9 với IS=0.15 và NoiseMargin = 2 (Trang 78)
Hình 4.15 Đồ thị đánh giá objective với hệ số gamma=1 và gamma= 2. - Xử lý nâng cao chất lượng tiếng nói
Hình 4.15 Đồ thị đánh giá objective với hệ số gamma=1 và gamma= 2 (Trang 79)
Hình 4.15 Đồ thị đánh giá objective với hệ số gamma = 1 và gamma = 2. - Xử lý nâng cao chất lượng tiếng nói
Hình 4.15 Đồ thị đánh giá objective với hệ số gamma = 1 và gamma = 2 (Trang 79)
Hình 4.16 Đồ thị đánh giá với IS=0.15 NoiMargin =2 và alpha=0.8 cho - Xử lý nâng cao chất lượng tiếng nói
Hình 4.16 Đồ thị đánh giá với IS=0.15 NoiMargin =2 và alpha=0.8 cho (Trang 81)
Hình 4.16 Đồ thị đánh giá với IS=0.15 NoiMargin= 2 và alpha = 0.8 cho thuật toán WF, gama=1 cho thuật toán SS. - Xử lý nâng cao chất lượng tiếng nói
Hình 4.16 Đồ thị đánh giá với IS=0.15 NoiMargin= 2 và alpha = 0.8 cho thuật toán WF, gama=1 cho thuật toán SS (Trang 81)
Hình 4.17 Đồ thị đánh giá OE với nhiễu người nói xung quanh. - Xử lý nâng cao chất lượng tiếng nói
Hình 4.17 Đồ thị đánh giá OE với nhiễu người nói xung quanh (Trang 82)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w