(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói

54 0 0
(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói(Đồ án tốt nghiệp) Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói

LỜI CẢM ƠN Trước tiên em xin gửi lời cảm ơn chân thành đến trường Cao Đẳng CNTT Hữu Nghị Việt Hàn tạo điều kiện thuận lợi cho em ngồi học lớp học Tin Học Viễn Thông Khóa trường, em gửi lời cảm ơn chân thành đến quý thầy cô môn thuộc khoa công nghệ thơng tin ứng dụng nhiệt tình giảng dạy, cung cấp kiến thức giúp đỡ động viên để em hồn thành đồ án Đặc biệt gửi lời cảm ơn chân thành tới cô Phan Thị Lan Anh hướng dẫn tận tình cho em suốt thời gian làm đồ án Xin cảm ơn người thân gia đình tơi, cảm ơn người bạn thân thiết giúp đỡ lúc khó khăn Sinh viên thực hiện: Lương Văn Phượng i MỤC LỤC LỜI CẢM ƠN i MỤC LỤC ii DANH MỤC CÁC TỪ VIẾT TẮT VÀ CÁC THUẬT NGỮ TIẾNG ANH v DANH MỤC BẢNG BIỂU vii DANH MỤC HÌNH ẢNH viii MỞ ĐẦU CHƯƠNG 1: TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI 1.1 Giới thiệu chương 1.2 Nâng cao chất lượng tiếng nói ? 1.3 Tín hiệu, hệ thống xử lý tín hiệu 1.3.1 Tín hiệu 1.3.2 Nguồn tín hiệu 1.3.3 Hệ thống xử lý tín hiệu 1.3.4 Phân loại tín hiệu 1.4 Lý thuyết nhiễu 1.4.1 Nguồn nhiễu 1.4.2 Nhiễu mức tín hiệu tiếng nói mơi trường khác 1.5 Tín hiệu rời rạc theo thời gian 1.5.1 Tín hiệu bước nhảy đơn vị 1.5.2 Tín hiệu xung đơn vị 1.5.3 Tín hiệu hàm mũ 1.5.4 Tín hiệu hàm sin rời rạc 1.6 Phép biến đổi Fourier tín hiệu rời rạc DTFT 1.6.1 Sự hội tụ phép biến đổi Fourier 10 1.6.2 Quan hệ biến đổi Z biến đổi Fourier 10 1.6.3 Phép biến đổi Fourier ngược 10 1.6.4 Các tính chất phép biến đổi Fourier 11 1.6.5 Phân tích tần số (phổ) cho tín hiệu rời rạc 12 ii 1.6.6 Phổ biên độ phổ pha 12 1.7 Các thuật toán sử dụng nâng cao chất lượng tiếng nói 13 1.7.1 Trừ phổ 13 1.7.2 Mơ hình thống kê 13 1.8 Tín hiệu tiếng nói 13 1.9 Cơ chế tạo tiếng nói 15 1.9.1 Bộ máy phát âm người 15 1.9.2 Mô hình kỹ thuật việc tạo tiếng nói 16 1.9.3 Phân loại âm 16 1.9.4 Thuộc tính âm học tiếng nói 16 1.10 Kết luận chương 17 CHƯƠNG : ĐÁNH GIÁ CHẤT LƯỢNG TIẾNG NÓI 18 2.1 Giới thiệu chương 18 2.2 Phương pháp đánh giá chủ quan 18 2.2.1 Các phương pháp đánh giá tuyệt đối 18 2.2.2 Các phương pháp đánh giá tương đối 19 2.2.2.1 Đánh giá phương pháp so sánh mẫu tín hiệu 19 2.2.2.2 Phương pháp đánh giá theo suy giảm chất lượng 20 2.3 Phương pháp đánh giá khách quan 20 2.4 Kết luận chương 21 CHƯƠNG 3: THUẬT TOÁN SPECTRAL–SUBTRACTION 22 3.1 Giới thiệu chương 22 3.2 Thuật toán Spectral Subtraction 22 3.2.1 Giới thiệu chung 22 3.2.2 Nguyên tắc thuật toán 22 3.2.3 Spectral subtraction phổ biên độ 23 3.2.4 Spectral subtraction phổ công suất 24 3.3 Sơ đồ khối thuật toán Spectral Subtraction 25 3.3.1 Phân tích tín hiệu theo frame 26 iii 3.3.2 Overlap Adding 26 3.3.3 Hàm xử lý giảm nhiễu 27 3.3.4 Ước lượng cập nhật nhiễu 28 3.3.4.1 Voice activity detection 28 3.3.4.2 Quá trình ước lượng cập nhật nhiễu 29 3.4 Kết luận chương 29 CHƯƠNG 4: MÔ PHỎNG BẰNG MATLAP 30 4.1 Giới thiệu chương 30 4.2 Giới thiệu chung phần mềm Matlab 30 4.2.1 Khái niệm Matlab 30 4.2.2 Các tính 30 4.3 Quy trình thực đánh giá thuật toán 31 4.4 Lưu đồ thuật toán Spectral Subtraction 32 4.5 Thực đánh giá thuật toán 33 4.6 Kết luận chương 36 4.7 Matlap Code thuận toán giảm nhiễu 36 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI 43 TÀI LIỆU THAM KHẢO ix PHỤ LỤC x NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN xi iv DANH MỤC CÁC TỪ VIẾT TẮT VÀ CÁC THUẬT NGỮ TIẾNG ANH Từ viết Nghĩa tiếng Việt Tiếng Anh tắt ACR Absolute Categories Rating Đánh giá theo giá trị tuyệt đối CCR Comparison Category Rating Đánh giá cách so sánh DCR Degradation Category Rating Đánh giá suy giảm chất lượng DFT Discrete Fourier Transform Phép biến đổi Fourier rời rạc DTFT Discrete- Time Fourier Transform FFT Fast Fourier Transform IDTFT ITU-T Inverse Discrete Fourier Transform Phép biến đổi Fourier tín hiệu rời rạc Phép biến đổi Fourier nhanh Phép biến đổi ngược Fourier rời rạc International Telecommunications Hiệp hội tiêu chuẩn viễn thông Union Telecommunication quốc tế IS IS Itakura_Saito LLR Log Likehook Raito LPC LPC Linear Prediction Coefficients Hệ số dự đốn tuyến tính LTI Linear Time-Invariant MMSE Minium Mean-Squared Error MOS Mean Opinion Scores Đánh giá theo quan điểm người nghe OE Objective Evaluation Đánh giá khách quan PC Personal Computer Máy tính cá nhân ROC Region of Convergence Miền hội tụ SE Subjective Evaluation Đánh giá chủ quan SNR Signal Noise Ratio Tỉ số tín hiệu nhiễu SPL Sound Pressure Level Mức áp suất âm SVD Singular Value Decomposition Phép phân tích giá trị đơn SS Spectral Subtraction Thuật tốn giảm nhiễu tín hiệu Hệ thống bất biến biến thiên theo thời gian Tối thiểu hố sai lệch trung bình bình phương v tiếng nói phương pháp trừ phổ Thăm dị hoạt động tiếng nói VAD Voice Activity Detection SMB Statistical Model Based WSS Weighted Spectral Slope Đo theo trọng số phổ Frame Khung tín hiệu Overlap Addin Xếp chồng cộng Hamming Cửa sổ Hammingg Speech Enhancement Nâng cao chất lượng tiếng nói Thuật tốn giảm nhiễu tín hiệu tiếng nói dựa ngun lý thống kê vi DANH MỤC BẢNG BIỂU Bảng 2.1.Thang điểm đánh giá chất lượng tiếng nói theo MOS 19 Bảng 2.2 Thang điểm đánh giá chất lượng tín hiệu tiếng nói theo CCR 19 Bảng 2.3 Thang đánh giá DCR 20 vii DANH MỤC HÌNH ẢNH Hình 1.1 Tín hiệu tiếng nói Hình 1.2 Dạng phân bố phổ lượng trung bình nhiễu xe Hình 1.3 Dạng phân bố phổ lượng trung bình nhiễu tàu Hình 1.4 Dạng phân bố phổ lượng trung bình nhiễu nhà hàng Hình 1.5 Mức nhiễu tiếng nói (được đo SPL dB) mơi trường khác Hình 1.6 Mẫu tiếng nói “eee” lấy mẫu với tần số lấy mẫu 8kHz 13 Hình 1.7 Dạng sóng tín hiệu tiếng nói câu “The wife helped her husband” dạng sóng phụ âm “f” từ “wife, dạng sóng đoạn nguyên âm “er” từ “her” 14 Hình 1.8 Mặt cắt dọc quan tạo tiếng nói 15 Hình 1.9 Mơ hình kỹ thuật tạo tiếng nói 16 Hình 1.10 Bảng phân loại âm vị tiếng Anh người Mỹ 16 Hình 3.2 Phân tích tín hiệu thành frame 26 Hình 4.1 Sơ đồ thực đánh giá thuật tốn tăng cường 31 Hình 4.2 Lưu đồ thuật toán SS 32 Hình 4.3 Dạng sóng phổ tín hiệu 33 Hình 4.4 Dạng sóng phổ tín hiệu bị nhiễu với SNR = 15dB 33 Hình 4.5 Dạng sóng phổ tín hiệu sau xử lý nhiễu thuật toán trừ phổ biên độ 34 Hình 4.6 Dạng sóng phổ tín hiệu sau xử lý nhiễu thuật tốn trừ phổ cơng suất 34 Hình 4.7 Dạng sóng phổ tín hiệu 34 Hình 4.8 Dạng sóng phổ tín hiệu bị nhiễu với SNR = 5dB 35 Hình 4.9 Dạng sóng phổ tín hiệu sau xử lý nhiễu thuật toán trừ phổ biên độ 35 Hình 4.10 Dạng sóng phổ tín hiệu sau xử lý nhiễu thuật tốn trừ phổ cơng suất 35 viii Tìm hiểu thuật tốn trừ phổ xử lý tiếng nói MỞ ĐẦU Tiếng nói đóng vai trị quan trọng thơng tin liên lạc Q trình truyền tín hiệu tiếng nói truyền qua phương tiện thông tin bị loại nhiễu tác động nên chất lượng suy giảm Cùng với tiếng nói xuất nhiều loại dịch vụ thoại ngày Tuy nhiên việc bảo toàn tín hiệu tiếng nói dịch vụ điều vơ khó khăn mát suy giảm tín hiệu ảnh hưởng nhiễu làm cho tín hiệu tiếng nói khơng cịn ban đầu Vì vậy, thuật tốn Speech Enhancement đời Tuy khơng thể bảo tồn y nguyên tín hiệu ban đầu sử dụng thuật tốn ta tăng cường chất lượng tiếng nói giảm bớt nhiễu để tín hiệu sau xử lý đến người nghe mang đầy đủ nội dung thơng tin khơng gây khó chịu nhiễu người nghe Vì vậy, Speech Enhancement đóng vai trị quan trọng lĩnh vực thoại Trong đồ án tìm hiểu thuật tốn trừ phổ xử lý tiếng nói Thuật tốn dựa ngun tắc thừa nhận có mặt nhiễu đạt mục đích ước lượng phổ tiếng nói cách trừ phổ nhiễu với phổ tiếng nói bị nhiễu Ta phân tích phần theo phát triển thuật toán đánh giá kết mà thuật toán mang lại Để thực nội dung đồ án em kết cấu gồm chương : Chương : Tổng quan nâng cao chất lượng tiếng nói: Chương giới thiệu số khái niệm tín hiệu số, phép biến đổi, tìm hiểu loại nhiễu, tín hiệu tiếng nói hình thành tiếng nói Bên cạnh cịn giới thiệu khái qt số thuật toán Speech Enhancement Chương : Đánh giá chất lượng tiếng nói: Chương giới thiệu số phương pháp đánh giá khác sử dụng để đánh giá hiệu thuật toán nâng cao tiếng nói Chương : Thuật tốn Spectral Subtraction : Chương sâu vào nghiên cứu nguyên lý thuật tốn Chương : Mơ phần mềm matlap: Chương mô phần mềm matlap thực giảm nhiễu tín hiệu tiếng nói thuật tốn nghiên cứu chương từ đưa nhận xét đánh giá Phương pháp nghiên cứu đồ án tìm hiểu lý thuyết thuật tốn để xây dựng lưu đồ thuật toán, thực xử lý tiếng nói thuật tốn Dựa kết đạt sau sử dụng phương pháp đánh giá khách quan để đánh giá tính hiệu thuật tốn xử lý mơi trường thực tế SVTH: Lương Văn Phượng_CCVT03A Tìm hiểu thuật tốn trừ phổ xử lý tiếng nói CHƯƠNG 1: TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI 1.1 Giới thiệu chương Nội dung chương trình bày mục đích nâng cao chất lượng tiếng nói gì, loại nhiễu tiếng nói, cách hình thành tiếng nói đặc điểm cuả tín hiệu tiếng nói Chương cịn giới thiệu khái qt thuật toán sử dụng speech enhancement 1.2 Nâng cao chất lượng tiếng nói ? Nâng cao chất lượng tiếng nói liên quan đến việc cải thiện cảm nhận tiếng nói bị suy giảm chất lượng có mặt nhiễu tiếng nói Trong hầu hết ứng dụng, mục đích nâng cao chất lượng tiếng nói cải thiện chất lượng tính dễ nghe tiếng nói bị suy giảm nhiễu Sự cải thiện chất lượng mà tốt làm giảm khó khăn cho người nghe nghe nhiều trường hợp cịn giúp cho người nghe nghe mơi trường có nhiễu với mức độ cao nhiễu tồn thời gian dài Các thuật tốn nâng cao chất lượng tiếng nói làm giảm nén nhiễu đến mức độ xem thuật toán nén nhiễu Trong nhiều trường hợp, cần thiết việc tăng cường tín hiệu tiếng nói xuất tín hiệu tiếng nói hình thành vùng có nhiễu ảnh hưởng nhiễu kênh truyền thơng Có nhiều kịch yêu cầu đặt Speech enhancement nhiều trường hợp khác nhau, ví dụ thông tin thoại, hệ thống điện thoại tế bào chịu ảnh hưởng nhiễu từ ô tô, nhà hàng, truyền đến đích Chính mà thuật toán nâng cao chất lượng tiếng nói sử dụng để cải thiện chất lượng tiếng nói điểm thu, mặt khác, sử dụng khối tiền xử lý hệ thống mã hố tiếng nói dùng điện thoại tế bào chuẩn Khi nhận dạng tiếng nói, tiếng nói bị nhiễu tiền xử lý thuật toán nâng cao chất lượng trước nhận dạng Trong thông tin liên lạc hàng không, kỹ thuật nâng cao tiếng nói cần sử dụng để cải thiện chất lượng tính dễ nghe tiếng nói phi cơng bị ảnh hưởng nhiễu buồng lái Vì mà nâng cao chất lượng tiếng nói cần thiết thơng tin liên lạc quân Trong hệ thống hội nghị qua thoại, nguồn nhiễu xuất vùng truyền đến tất vùng khác Các thuật toán nâng cao chất SVTH: Lương Văn Phượng_CCVT03A ... vực thoại Trong đồ án tìm hiểu thuật tốn trừ phổ xử lý tiếng nói Thuật tốn dựa ngun tắc thừa nhận có mặt nhiễu đạt mục đích ước lượng phổ tiếng nói cách trừ phổ nhiễu với phổ tiếng nói bị nhiễu... tín hiệu tiếng nói thuật tốn nghiên cứu chương từ đưa nhận xét đánh giá Phương pháp nghiên cứu đồ án tìm hiểu lý thuyết thuật tốn để xây dựng lưu đồ thuật toán, thực xử lý tiếng nói thuật tốn... truyền đến tất vùng khác Các thuật toán nâng cao chất SVTH: Lương Văn Phượng_CCVT03A Tìm hiểu thuật tốn trừ phổ xử lý tiếng nói lượng tiếng nói sử dụng tiền xử lý làm nhiễu tiếng trước khuếch đại Như

Ngày đăng: 27/11/2022, 10:46

Tài liệu cùng người dùng

Tài liệu liên quan