1. Trang chủ
  2. » Thể loại khác

Luận văn Đề tài: "Tìm hiểu về Speech Enhancement"

20 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Đồ án tốt nghiệp Luận văn Đề tài: "Tìm hiểu Speech Enhancement" SVTH: Nguyễn Thị Ngọc Diệp Trang Đồ án tốt nghiệp CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc LỜI CAM ĐOAN Kính gửi: Hội đồng bảo vệ đồ án tốt nghiệp Khoa Điện tử _ Viễn thông _ Trường Đại học Bách Khoa Đà Nẵng Em tên là: Nguyễn Thị Ngọc Diệp Hiện học lớp 04ĐT1- Khoa: Điện tử - Viễn thông – Trường: Đại học Bách Khoa Đà Nẵng Nhóm em xin cam đoan nội dung đồ án chép đồ án cơng trình có từ trước Sinh viên thực Nguyễn Thị Ngọc Diệp SVTH: Nguyễn Thị Ngọc Diệp Trang Đồ án tốt nghiệp MỤC LỤC LỜI CAM ĐOAN MỤC LỤC DANH MỤC CÁC TỪ VIẾT TẮT VÀ CÁC THUẬT NGỮ TIẾNG ANH MỞ ĐẦU 11 CHƯƠNG 1: TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI 14 1.1 Giới thiệu chương 14 1.2 Nâng cao chất lượng tiếng nói ? .14 1.3 Lý thuyết tín hiệu nhiễu 16 1.3.1 Tín hiệu, hệ thống xử lý tín hiệu 16 1.3.1.1 Tín hiệu 16 1.3.1.2 Nguồn tín hiệu 16 1.3.1.3 Hệ thống xử lý tín hiệu 17 1.3.1.4 Phân loại tín hiệu .17 1.4 Lý thuyết nhiễu 18 1.4.1 Nguồn nhiễu 18 1.4.2 Nhiễu mức tín hiệu tiếng nói mơi trường khác 20 1.5 Tín hiệu rời rạc theo thời gian 21 1.5.1 Tín hiệu bước nhảy đơn vị 22 1.5.2 Tín hiệu xung đơn vị 22 1.5.3 Tín hiệu hàm mũ 22 1.5.4 Tín hiệu hàm sin rời rạc 22 1.6 1.6.1 Phép biến đổi Fourier tín hiệu rời rạc DTFT 23 Sự hội tụ phép biến đổi Fourier 23 SVTH: Nguyễn Thị Ngọc Diệp Trang Đồ án tốt nghiệp 1.6.2 Quan hệ biến đổi Z biến đổi Fourier 23 1.6.3 Phép biến đổi Fourier ngược 24 1.6.4 Các tính chất phép biến đổi Fourier 24 1.6.5 Phân tích tần số (phổ) cho tín hiệu rời rạc 25 1.6.6 Phổ tín hiệu phổ pha 26 1.7 Các thuật toán sử dụng nâng cao chất lượng tiếng nói .27 1.7.1 Trừ phổ 27 1.7.2 Mơ hình thống kê 27 1.8 Tín hiệu tiếng nói 27 1.9 Cơ chế tạo tiếng nói 29 1.9.1.1 Bộ máy phát âm người 29 1.9.2 Mơ hình kỹ thuật việc tạo tiếng nói 29 1.9.3 Phân loại âm 30 1.9.4 Thuộc tính âm học tiếng nói 30 1.10 Kết luận chương 30 CHƯƠNG : ĐÁNH GIÁ CHẤT LƯỢNG TIẾNG NÓI 31 2.1 Giới thiệu chương 31 2.2 Phương pháp đánh giá chủ quan 31 2.2.1 Các phương pháp đánh giá tuyệt đối 32 2.2.1.1 Phương pháp đánh giá tuyệt đối ACR 32 2.2.2 Các phương pháp đánh giá tương đối 32 2.2.2.1 Đánh giá phương pháp so sánh mẫu tín hiệu 32 2.2.2.2 Phương pháp đánh giá theo suy giảm chất lượng 33 2.3 Phương pháp đánh giá khách quan 34 SVTH: Nguyễn Thị Ngọc Diệp Trang Đồ án tốt nghiệp 2.3.1 Đo tỷ số tín hiệu nhiễu khung 34 2.3.2 Đo khoảng cách phổ dựa LPC 36 2.3.2.1 Phương pháp đo LLR .36 2.3.2.2 Phương pháp đo IS 37 2.3.2.3 Phương pháp đo theo khoảng cách cepstrum 37 2.3.3 Đánh giá mô theo cảm nhận nghe người 38 2.3.3.1 Phương pháp đo Weighted Spectral Slope 38 2.3.3.2 Phương pháp đo Bark Distortion 39 2.3.3.3 Phương pháp đánh giá cảm nhận chất lượng thoại PESQ 40 2.4 Kết luận chương 40 CHƯƠNG 3: THUẬT TOÁN SPECTRAL–SUBTRACTION VÀ WIENER FILTERING 42 3.1 Giới thiệu chương 42 3.2 Sơ đồ khối chung Spectral Subtraction Wiener Filtering .42 3.3 Thuật toán Spectral Subtraction .42 3.3.1 Giới thiệu chung 42 3.3.2 Spectral subtraction phổ biên độ 43 3.3.3 Spectral subtraction phổ công suất 44 3.4 Thuật toán Wiener Filtering .46 3.4.1 Giới thiệu chung 46 3.4.2 Nguyên lý Wiener Filtering 47 3.5 Overlap Adding q trình xử lý tín hiệu tiếng nói 49 3.5.1 Phân tích tín hiệu theo frame 49 3.5.2 Overlap Adding 50 SVTH: Nguyễn Thị Ngọc Diệp Trang Đồ án tốt nghiệp 3.6 Ước lượng cập nhật nhiễu .51 3.6.1 Voice activity detection 52 3.6.2 Quá trình ước lượng cập nhật nhiễu 52 3.7 Kết luận chương 53 CHƯƠNG 4: THỰC HIỆN VÀ ĐÁNH GIÁ CÁC THUẬT TOÁN 54 4.1 Giới thiệu chương 54 4.2 Quy trình thực đánh giá thuật toán 54 4.3 Lưu đồ thuật toán Spectral Subtraction 56 4.4 Lưu đồ thuật toán Wiener Filtering 57 4.5 Thực thuật toán 58 4.6 Đánh giá chất lượng tiếng nói xử lý .60 4.6.1 Cơ sở liệu cho việc đánh giá 60 4.6.2 Tổng quan quy trình đánh giá 60 4.6.3 Kiểm tra độ tin cậy phương pháp đánh giá 61 4.6.4 Thực đánh giá 63 4.6.4.1 Đánh giá thuật toán với hệ số dự đoán ban đầu 63 4.6.4.2 Tối ưu hệ số alpha cho thuật toán WF 66 4.6.4.3 Hệ số gamma cho thuật toán SS .68 4.6.4.4 Đánh giá thuật toán sau tối ưu .69 4.6.4.5 Đánh giá độ ổn định thuật tốn mơi trường nhiễu khác .70 4.6.5 Kết luận chương 72 TÀI LIỆU THAM KHẢO .73 KẾT LUẬN ĐỒ ÁN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI .76 PHỤ LỤC 77 SVTH: Nguyễn Thị Ngọc Diệp Trang Đồ án tốt nghiệp DANH MỤC CÁC HÌNH VẼ VÀ BẢNG Hình 1.1 Tín hiệu tiếng nói [2] 16 Hình 1.2 Dạng phân bố phổ lượng trung bình nhiễu xe [4] .19 Hình 1.3 Dạng phân bố phổ lượng trung bình nhiễu tàu [4] 19 Hình 1.4 Dạng phân bố phổ lượng trung bình nhiễu nhà hàng[4] 20 Hình 1.5 Mức nhiễu tiếng nói (được đo SPL dB) môi trường khác [4] 21 Hình 1.6 Mẫu tiếng nói “eee” lấy mẫu với tần số lấy mẫu 8kHz [11] 26 Hình 1.7 Dạng sóng tín hiệu tiếng nói câu “The wife helped her husband” dạng sóng phụ âm “f” từ “wife, dạng sóng đoạn nguyên âm “er” từ “her” [11] 28 Hình 1.8 mặt cắt dọc quan tạo tiếng nói [11] 29 Hình 1.9 mơ hình kỹ thuật tạo tiếng nói[11] 29 Hình 1.10 bảng phân loại âm vị tiếng Anh người Mỹ [11] .30 Bảng 2.1.Thang điểm đánh giá chất lượng tiếng nói theo MOS [12] 32 Bảng 2.4 Thang điểm đánh giá chất lượng tín hiệu tiếng nói theo CCR 33 Bảng 2.5 Thang đánh giá DCR 33 Hình 3.1 Sơ đồ khối cho hai thuật toán SS WF 42 Hình 3.2 Sơ đồ khối thuật tốn Spectral subtraction [26] .46 Hình 3.3 Sơ đồ khối thuật toán Wiener Filtering .49 Hình 3.4 Phân tích tín hiệu thành frame [31] .50 Hình 3.5 trình thực overlap adding [32] 51 Hình 4.1 Sơ đồ thực đánh giá thuật toán tăng cường 54 Hình 4.2 Lưu đồ thuật tốn SS 56 Hình 4.3 Lưu đồ thuật toán WF 57 Hình 4.4 dạng sóng spectrogram tín hiệu .58 Hình 4.5 Dạng sóng phổ tín hiệu bị nhiễu xe với SNR = 10dB .58 SVTH: Nguyễn Thị Ngọc Diệp Trang Đồ án tốt nghiệp Hình 4.6 Dạng sóng spectrogram tín hiệu sau xử lý nhiễu xe SS với SNR = 10dB 59 Hình 4.7 Dạng sóng spectrogram tín hiệu sau xử lý nhiễu xe WF với SNR = 10dB 59 Hình 4.8 Quy trình thực đánh giá 61 Hình 4.9 Đồ thị kiểm tra độ ổn định đánh giá OE nhiễu xe 62 Hình 4.10 Đồ thị kiểm tra độ ổn định đánh giá OE nhiễu người nói xung quanh 62 Hình 4.11 Đồ thị đánh giá Objective với hệ số IS=0.2, NoiseMargin=3 64 Hình 4.12 Đồ thị đánh giá Objective với hệ số IS=0.15, NoiseMargin=2 .65 Hình 4.14 Đồ thị đánh giá objective với hệ số alpha=0.5, 0.8,0.9 với IS=0.15 NoiseMargin = 67 Hình 4.15 Đồ thị đánh giá objective với hệ số gamma = gamma = 68 Hình 4.16 Đồ thị đánh giá với IS=0.15 NoiMargin= alpha = 0.8 cho thuật toán WF, gama=1 cho thuật toán SS .70 Hình 4.17 Đồ thị đánh giá OE với nhiễu người nói xung quanh 71 SVTH: Nguyễn Thị Ngọc Diệp Trang Đồ án tốt nghiệp DANH MỤC CÁC TỪ VIẾT TẮT VÀ CÁC THUẬT NGỮ TIẾNG ANH Từ viết Tiếng Anh Nghĩa tiếng Việt SNR Signal Noise Ratio Tỉ số tín hiệu nhiễu PC Personal Computer Máy tính cá nhân SPL Sound Pressure Level Mức áp suất âm MMSE Minium Mean-Squared Error SVD Singular Value Decomposition Phép phân tích giá trị đơn DFT Discrete Fourier Transform Phép biến đổi Fourier rời rạc FFT Fast Fourier Transform Phép biến đổi Fourier nhanh DTFT Discrete-Time Fourier Transform ZT Z Transform Phép biến đổi Z ROC Region of Convergence Miền hội tụ Inverse Discrete Fourier Phép biến đổi ngược Fourier Transform rời rạc tắt IDTFT LTI ITU-T Linear Time-Invariant Tối thiểu hoá sai lệch trung bình bình phương Phép biến đổi Fourier tín hiệu rời rạc Hệ thống tuyến tính bất biến theo thời gian InternationalTelecommunications Hiệp hội tiêu chuẩn viễn Union-Telecommunication thông quốc tế ACR Absolute Categories Rating Đánh giá theo giá trị tuyệt đối MOS Mean Opinion Scores CCR Comparison Category Rating Đánh giá cách so sánh DCR Degradation Category Rating Đánh giá suy giảm chất lượng SVTH: Nguyễn Thị Ngọc Diệp Đánh giá theo quan điểm người nghe Trang Đồ án tốt nghiệp SE Subjective Evaluation Đánh giá chủ quan OE Objective Evaluation Đánh giá khách quan IS Itakura_Saito LLR Log likehook Raito WSS Weighted Spectral Slope Đo theo trọng số phổ LPC Linear Prediction Coefficients Hệ số dự đốn tuyến tính VAD Voice Activity Detection Speech Enhancement Thăm dò hoạt động tiếng nói Nâng cao chất lượng tiếng nói Thuật tốn giảm nhiễu tín SS Spectral Subtraction hiệu tiếng nói phương pháp trừ phổ Thuật tốn giảm nhiễu tín WF Wiener Filter hiệu tiếng nói cách sử dụng lọc Wiener Thuật tốn giảm nhiễu tín Statistical-model-based hiệu tiếng nói dựa ngun lý thống kê Frame Khung tín hiệu Hamming Cửa sổ Hamming Overlap Adding Xếp chồng cộng SVTH: Nguyễn Thị Ngọc Diệp Trang 10 Đồ án tốt nghiệp MỞ ĐẦU Trong sống, tiếng nói đóng vai trị quan trọng người Cùng với tiếng nói xuất nhiều loại dịch vụ thoại ngày Tuy nhiên việc bảo tồn tín hiệu tiếng nói dịch vụ điều vơ khó khăn mát suy giảm tín hiệu ảnh hưởng nhiễu làm cho tín hiệu tiếng nói khơng cịn ban đầu Vì lý mà thuật tốn Speech Enhancement đời Tuy khơng thể bảo tồn y ngun tín hiệu ban đầu sử dụng thuật tốn ta tăng cường chất lượng tiếng nói giảm bớt nhiễu để tín hiệu sau xử lý đến người nghe mang đầy đủ nội dung thơng tin khơng gây khó chịu nhiễu người nghe Vì vậy, Speech Enhancement đóng vai trò quan trọng lĩnh vực thoại Xuất phát từ thực tế nhóm bắt tay vào tìm hiểu Speech Enhancement, nghiên cứu thuật tốn để thực đánh giá hiệu thuật tốn mơi trường thực tế Để thực đồ án, nhóm phân chia thành phần tương ứng với thành viên : - Nguyễn Ngọc Trung : nghiên cứu thực thuật tốn xử lý tiếng nói sử dụng phương pháp Spectral Subtraction - Nguyễn Phúc Nguyên : nghiên cứu thực thuật xử lý tiếng nói sử dụng lọc Wiener - Nguyễn Thị Ngọc Diệp : nghiên cứu thực phương pháp đánh giá từ kết đạt thuật toán môi trường thực tế Để thực nội dung phần em đồ án em kết cấu thành phần, gồm chương : Phần : Lý thuyết Chương : Tổng quan nâng cao chất lượng tiếng nói Chương giới thiệu số khái niệm tín hiệu số, phép biến đổi, tìm hiểu SVTH: Nguyễn Thị Ngọc Diệp Trang 11 Đồ án tốt nghiệp loại nhiễu , tín hiệu tiếng nói hình thành tiếng nói Bên cạnh cịn giới thiệu khái qt số thuật toán Speech Enhancement Chương : Đánh giá chất lượng tiếng nói Chương giới thiệu số phương pháp đánh giá hiệu thuật tốn giảm nhiễu tiếng nói Gồm có đánh giá chủ quan đánh giá khách quan Chương : Thuật toán Spectral Subtraction Wiener Filtering Chương sâu vào nghiên cứu nguyên lý thuật toán Phần : Thực đánh giá Chương : Thực đánh giá thuật tốn Chương trình bày kết nhóm làm gồm có thực giảm nhiễu tín hiệu tiếng nói hai thuật tốn nghiên cứu chương Đồng thời so sánh kết thu cách dùng phương pháp đánh giá giới thiệu chương Phương pháp nghiên cứu đồ án xây dựng lưu đồ thuật tốn, thực xử lý tiếng nói thuật tốn Dựa kết đạt sau xử lý, sau sử dụng phương pháp đánh giá khách quan để đánh giá tính hiệu thuật tốn xử lý mơi trường thực tế Đồ án nhóm thực thuật tốn xử lý tiếng nói Speech Enhancement đưa kết đánh giá khách quan làm sở để đánh giá tính hiệu thuật tốn Đó điểm đồ án nhóm so với đồ án có trước chủ đề nghiên cứu SVTH: Nguyễn Thị Ngọc Diệp Trang 12 Đồ án tốt nghiệp SVTH: Nguyễn Thị Ngọc Diệp Trang 13 Chương : Tổng quan nâng cao chất lượng tiếng nói CHƯƠNG 1: TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI 1.1 Giới thiệu chương Nội dung chương trình bày mục đích nâng cao chất lượng tiếng nói gì, loại nhiễu tiếng nói, cách hình thành tiếng nói đặc điểm cuả tín hiệu tiếng nói Chương cịn giới thiệu khái qt thuật toán sử dụng speech enhancement 1.2 Nâng cao chất lượng tiếng nói ? Nâng cao chất lượng tiếng nói liên quan đến việc cải thiện cảm nhận tiếng nói bị suy giảm chất lượng có mặt nhiễu tiếng nói Trong hầu hết ứng dụng, mục đích nâng cao chất lượng tiếng nói cải thiện chất lượng tính dễ nghe tiếng nói bị suy giảm nhiễu Sự cải thiện chất lượng mà tốt làm giảm khó khăn cho người nghe nghe nhiều trường hợp cịn giúp cho người nghe nghe mơi trường có nhiễu với mức độ cao nhiễu tồn thời gian dài Các thuật tốn âng cao chất lượng tiếng nói làm giảm nén nhiễu đến mức độ xem thuật toán nén nhiễu Trong nhiều trường hợp, cần thiết việc tăng cường tín hiệu tiếng nói xuất tín hiệu tiếng nói hình thành vùng có nhiễu ảnh hưởng nhiễu kênh truyền thơng Có nhiều kịch yêu cầu đặt Speech enhancement nhiều trường hợp khác nhau, ví dụ thông tin thoại, hệ thống điện thoại tế bào chịu ảnh hưởng nhiễu từ tơ, nhà hàng, truyền đến đích Chính mà thuật toán nâng cao chất lượng tiếng nói sử dụng để cải thiện chất lượng tiếng nói điểm thu, mặt khác, sử dụng khối tiền xử lý hệ thống mã hố tiếng nói dùng điện thoại tế bào chuẩn [1] Khi nhận dạng tiếng nói, tiếng nói bị nhiễu tiền xử lý thuật toán nâng cao chất lượng trước nhận dạng Trong thông tin liên lạc hàng khơng, kỹ thuật nâng cao tiếng nói cần sử dụng để cải thiện chất lượng tính SVTH: Nguyễn Thị Ngọc Diệp Trang 14 Chương : Tổng quan nâng cao chất lượng tiếng nói dễ nghe tiếng nói phi cơng bị ảnh hưởng nhiễu buồng lái Vì mà nâng cao chất lượng tiếng nói cần thiết thơng tin liên lạc quân Trong hệ thống hội nghị qua thoại, nguồn nhiễu xuất vùng truyền đến tất vùng khác Các thuật toán nâng cao chất lượng tiếng nói sử dụng tiền xử lý làm nhiễu tiếng trước khuếch đại Như ví dụ minh họa mục tiêu thuật toán tăng cường tuỳ thuộc vào ứng dụng mà dùng Xét phương diện lý tưởng, mong muốn Speech enhancement cải thiện chất lượng tính dễ nghe hay suốt tiếng nói Tuy nhiên, xét phương diện thực tế thuật tốn Speech enhancement cải thiện chất lượng tiếng nói Nó làm giảm nhiễu tiếng nói làm gia tăng thêm độ méo tín hiệu tiếng nói, điều làm giảm tính dễ nghe tiếng nói Do đó, u cầu việc thiết kế thuật toán Speech enhancement phải đảm bảo nén nhiễu không gây méo cảm nhận tín hiệu tiếng nói Giải pháp tổng qt vẩn đề Speech enhancement phụ thuộc lớn vào ứng dụng cần sử dụng, vần đề nguồn nhiễu giao thoa gây nhiễu, mối liên hệ nhiễu tín hiệu sạch, số microphone cảm biến có Sự giao thoa xem nhiễu xem tín hiệu tiếng nói, tuỳ thuộc vào mơi trường ta xét, xem tranh chấp speaker Đặc tính âm nhiễu cộng thêm vào tín hiệu âm hình thành phịng bị dội âm Hơn nữa, nhiễu có tính tương quan khơng tương quan mặt thống kê với tín hiệu Số lượng microphone có khả ảnh hưởng đến tính hiệu thuật toán Speech enhancement SVTH: Nguyễn Thị Ngọc Diệp Trang 15 Chương : Tổng quan nâng cao chất lượng tiếng nói 1.3 Lý thuyết tín hiệu nhiễu 1.3.1 Tín hiệu, hệ thống xử lý tín hiệu 1.3.1.1 Tín hiệu Tín hiệu(signal) dùng để đại lượng vật lý mang tin tức Về mặt toán học, ta mơ tả tín hiệu hàm theo biến thời gian, không gian hay biến độc lập khác Chẳng hạn như, hàm: x(t) = 20t2 mơ tả tín hiệu biến thiên theo biến thời gian t Hay ví dụ khác, hàm: s(x,y) = 3x + 5xy + y2 mơ tả tín hiệu hàm theo hai biến độc lập x y, x y biểu diễn cho hai tọa độ mặt phẳng [2] Hai tín hiệu ví dụ lớp tín hiệu biểu diễn xác hàm theo biến độc lập Tuy nhiên, thực tế, mối quan hệ giưa đại lượng vật lý biến độc lập thường phức tạp nên khơng thể biểu diễn tín hiệu hai ví dụ vừa nêu Hình 1.1 Tín hiệu tiếng nói [2] Lấy ví dụ tín hiệu tiếng nói – biến thiên áp suất khơng khí theo thời gian Chẳng hạn ta phát âm từ “away”, dạng sóng biểu diễn hình 1.3.1.2 Nguồn tín hiệu Tất tín hiệu nguồn tạo ra, theo cách thức Ví dụ tín hiệu tiếng nói tạo băngg cách ép khơng khí qua dây SVTH: Nguyễn Thị Ngọc Diệp Trang 16 Chương : Tổng quan nâng cao chất lượng tiếng nói âm Một ảnh có cách phơi sáng phim chụp cảnh/đối tượng Quá trình tạo tín hiệu thường liên quan đến hệ thống, hệ thống đáp ứng lại kích thích Trong tín hiệu tiếng nói, hệ thống hệ thống phát âm, gồm môi, răng, lưỡi, dây thanh…Kích thích liên quan đến hệ thống gọi nguồn tín hiệu Như ta có nguồn tiếng nói, nguồn ảnh nguồn tín hiệu khác 1.3.1.3 Hệ thống xử lý tín hiệu Hệ thống thiết bị vật lý thực tác động lên tín hiệu Ví dụ, lọc dùng để giảm nhiễu tín hiệu mang tin gọi hệ thống Khi ta truyền tín hiệu qua hệ thống, lọc chẳng hạn, ta nói xử lý tín hiệu Trong trường này, xử lý tín hiệu liên quan đến lọc nhiễu khỏi tín hiệu mong muốn Xử lý tín hiệu ý muốn nói đến loạt cơng việc hay phép tốn thực tín hiệu nhằm đạt mục đích đó, tách tin tức chứa bên tín hiệu truyền tín hiệu mang tin từ nơi đến nơi khác Ở ta cần lưu ý đến định nghĩa hệ thống, khơng đơn thiết bị vật lý mà cịn phần mềm xử lý tín hiệu kết hợp phần cứng phần mềm Ví dụ xử lý số tín hiệu mạch logic, hệ thống xử lý phần cứng Khi xử lý máy tính số, tác động lên tín hiệu bao gồm loạt phép tốn thực chương trình phần mềm Khi xử lý vi xử lý-hệ thống bao gồm kết hợp phần cứng phần mềm, phần thực cơng việc riêng 1.3.1.4 Phân loại tín hiệu Các phương pháp ta sử dụng xử lý tín hiệu phụ thuộc chặt chẽ vào đặc điểm tín hiệu Có phương pháp riêng áp dụng cho loại tín hiệu Do vậy, trước tiên ta cần xem qua cách phân loại tín hiệu liên quan đến ứng dụng cụ thể Chúng ta phân tín hiệu thành loại : - Tín hiệu nhiều hướng tín hiệu đa kênh - Tín hiệu liên tục tín hiệu rời rạc SVTH: Nguyễn Thị Ngọc Diệp Trang 17 Chương : Tổng quan nâng cao chất lượng tiếng nói - Tín hiệu biên độ liên tục tín hiệu biên độ rời rạc - Tín hiệu xác định tín hiệu ngẫu nhiên 1.4 Lý thuyết nhiễu 1.4.1 Nguồn nhiễu Nhiễu thực, tồn nơi, đường phố, xe, văn phòng, nhà hàng, tồ nhà Nó tiếng xe chạy đường, tiếng ồn công trường xây dựng, tiếng ồn phát từ quạt chạy PC, chng điện thoại…, tồn với hình dạng hình thức khác sống ngày Nhiễu hình thành nơi cố định, không thay đổi theo thời gian, ví dụ tiếng ồn phát từ quạt chạy PC Nhiễu khơng đứng yên chỗ, ví dụ nhiễu nhà hàng, tiếng nói nhiều người xen lẫn với nhiều cách khác với tiếng ồn phát từ nhà bếp Các đặc tính phổ thời gian nhiễu nhà hàng thay đổi không theo quy luật nên việc nén nhiễu môi trường có nhiễu thay đổi khó khăn nhiều so với nguồn nhiễu đứng yên không thay đổi Các đặc tính đặc biệt khác loại nhiễu hình dạng phổ phân bố lượng nhiễu miền tần số Ví dụ, nhiễu gây gió lượng tập trung tần số thấp 500Hz Nhưng nhiễu nhà hàng, xe, tàu khác, lượng phân bố dải tần số rộng [3] SVTH: Nguyễn Thị Ngọc Diệp Trang 18 Chương : Tổng quan nâng cao chất lượng tiếng nói Hình 1.2 Dạng phân bố phổ lượng trung bình nhiễu xe [4] Hình 1.3 Dạng phân bố phổ lượng trung bình nhiễu tàu [4] SVTH: Nguyễn Thị Ngọc Diệp Trang 19 Chương : Tổng quan nâng cao chất lượng tiếng nói Hình 1.4 Dạng phân bố phổ lượng trung bình nhiễu nhà hàng[4] 1.4.2 Nhiễu mức tín hiệu tiếng nói mơi trường khác Điểm tới hạn việc thiết kế thuật toán Speech enhancement nhận biết dải biến thiên tiếng nói mức độ cường độ nhiễu mơi trường thực tế Từ đó, mơ tả miền biến thiên mức độ tỷ số tín hiệu nhiễu(SNR) bắt gặp môi trường thực tế Điều quan trọng để đánh giá tính hiệu thuật toán Speech enhancement việc nén nhiễu cải thiện chất lượng tiếng nói dải biến thiên mức SNR Mức độ tiếng nói nhiễu đo lường mức độ âm Phép đo lường đo mức độ áp suất âm tính dB SPL(sound pressure level)[4] Khoảng cách người nói người nghe ảnh hưởng đến mức cường độ âm thanh, tương ứng với phép đo thực microphone đặt vị trí có khoảng cách khác Khoảng cách đặc trưng giao tiếp face-to-face 1m, khoảng cách tăng gấp đơi mức cường độ âm giảm dB[6] SVTH: Nguyễn Thị Ngọc Diệp Trang 20

Ngày đăng: 23/05/2021, 00:35

Xem thêm:

TỪ KHÓA LIÊN QUAN

w