1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói

76 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

HỌ TÊN HỌC VIÊN: NGUYỄN XUÂN VIỆT BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - NGUYỄN XN VIỆT CHUN NGÀNH: CƠNG NGHỆ THƠNG TIN TÌM HIỂU MỘT SỐ PHƢƠNG PHÁP TĂNG CƢỜNG CHẤT LƢỢNG TIẾNG NÓI (Study on the enhancement of speed signal quality) LUẬN VĂN THẠC SĨ KỸ THUẬT CƠNG NGHỆ THƠNG TIN KHỐ: 2012A-HY Hƣng Yên– Năm 2014 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI NGUYỄN XUÂN VIỆT TÌM HIỂU MỘT SỐ PHƢƠNG PHÁP TĂNG CƢỜNG CHẤT LƢỢNG TIẾNG NĨI Chun ngành :Cơng Nghệ thơng tin LUẬN VĂN THẠC SĨ KỸ THUẬT Công nghệ thông tin NGƢỜI HƢỚNG DẪN KHOA HỌC : PGS.TS Trịnh Văn Loan Hà Nội – Năm 2014 CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do- hạnh phúc ––––––––––––––– LỜI CAM ĐOAN Kính gửi : Hội đồng bảo vệ luận văn cao học Viện Công nghệ Thông tin Trƣờng Đại học Bách khoa Hà Nội Tên em là: Nguyễn Xuân Việt – Học viên lớp cao học 2012A-HY- Trƣờng Đại học Bách khoa Hà Nội Em xin cam đoan nội dung luận văn luận văn chép luận văn cơng trình trƣớc NGƢỜI CAM ĐOAN Nguyễn Xuân Việt MỤC LỤC LỜI CAM ĐOAN MỤC LỤC DANH MỤC HÌNH VÀ BẢNG BIỂU LỜI NÓI ĐẦU CHƢƠNG I: TỔNG QUAN VỀ NÂNG CAO CHẤT LƢỢNG TIẾNG NÓI 1.1 Tổng quan tiếng nói 1.1.1 Tổng quan tiếng nói ngƣời 1.1.2 Tổng quan nâng cao chất lƣợng tiếng nói 1.2 Tìm hiểu tín hiệu nhiễu 1.2.1 Tìm hiểu tín hiệu 1.2.2 Tìm hiểu nhiễu 1.3 Tín hiệu rời rạc theo thời gian 11 1.3.1 Tín hiệu xung đơn vị 12 1.3.2.Tín hiệu bậc đơn vị 12 1.3.3 Tín hiệu hàm sin rời rạc 12 1.3.4 Tín hiệu hàm mũ 12 CHƢƠNG II: XỬ LÝ VÀ ĐÁNH GIÁ CHẤT LƢỢNG TÍN HIỆU TIẾNG NĨI 13 2.1 Xử lý tiếng nói 13 2.1.1 Xử lý tín hiệu số 13 2.1.2 Phép biến đổi Fourier 14 2.2.Các thuật tốn sử dụng nâng cao chất lƣợng tín hiệu tiếng nói 15 2.2.1 Spectral-subtraction - Trừ phổ 15 2.2.2 Thuật tốn Mơ hình thống kê 15 2.3 Đánh giá chất lƣợng tiếng nói 15 2.3.2 Phƣơng pháp đánh giá khách quan 18 CHƢƠNG III MỘT SỐ THUẬT TOÁN TRONG XỬ LÝ VÀ TĂNG CƢỜNG CHẤT LƢỢNG TÍN HIỆU TIẾNG NĨI 23 3.1 Thuật toán Trừ phổ 23 3.1.1 Sơ đồ khối chung thuật toán 23 3.1.2 Thuật toán Spectral Subtraction (thuật toán trừ phổ) 23 3.1.3 Phƣơng pháp đánh giá mục tiêu thuật toán 28 3.2 Thuật toán lọc Wiener 30 3.2.1 Giới thiệu chung 30 3.2.2 Nguyên lý lọc Wiener 30 3.3 Xếp chồng cộng trình xử lý tín hiệu tiếng nói 32 3.3.1 Phân tích tín hiệu theo khung 32 3.3.2 Xếp chồng cộng (Overlap and adding) 35 3.3.3 Ƣớc lƣợng cập nhật nhiễu 37 3.3.4 Phát tiếng nói (Voice activity detection) 38 3.3.5 Quá trình ƣớc lƣợng cập nhật nhiễu 40 CHƢƠNG 4: THỰC HIỆN VÀ ĐÁNH GIÁ CÁC THUẬT TOÁN 41 4.1 Giới thiệu chƣơng 41 4.2 Lƣu đồ thực đánh giá thuật toán 41 4.3 Lƣu đồ thuật toán Trừ phổ 42 4.4 Lƣu đồ thuật toán lọc Wiener 43 4.5 Thực thuật toán 44 4.6 Các thơng số ảnh hƣởng đến thuật tốn 48 4.7 Phát triển thuật toán Trừ phổ từ thuật toán Lọc Wiener 49 4.8 Nhận xét kết luận 50 KẾT LUẬN LUẬN VĂN VÀ HƢỚNG PHÁT TRIỂN TRIỂN TIẾP THEO 51 PHỤ LỤC CHẠY THỰC NGHIỆM VÀ CÁC ĐOẠN CODE MATLAB 52 DANH MỤC HÌNH VÀ BẢNG BIỂU Hình 1.1 Mơ hình tạo tiếng nói Hình 1.2 Tín hiệu tiếng nói Hình 1.3 Dạng phân bố phổ lƣợng trung bình nhiễu xe 10 Hình 1.4 Mức nhiễu tiếng nói (đo SPL dB) môi trƣờng 11 khác 11 Bảng 2.2 Thang điểm đánh giá chất lƣợng tiếng nói theo MOS 16 Bảng 2.3 Thang điểm đánh giá chất lƣợng tín hiệu tiếng nói theo CCR 17 Bảng 2.4 Thang đánh giá DCR 18 Hình 3.1 Sơ đồ khối cho hai thuật toán SS WF 23 Hình 3.2 Sơ đồ khối thuật toán Trừ phổ 26 Hình 3.3 Sơ đồ khối thuật toán lọc Wiener 32 Hình 3.4 Phân tích tín hiệu thành khung 33 Hình 3.4 Sơ đồ thuật tốn phân tích tín hiệu thành khung 35 Hình 3.5 Quá trình thực xếp chồng cộng 36 Hình 3.5 Thuật toán xếp chồng cộng 37 Hình 4.2 Trừ phổ 42 Hình 4.3 Lƣu đồ thuật toán WF 43 Hình 4.4 Tín hiệu có nhiễu sau lọc nhiễu WF 45 Hình 4.5 Tín hiệu sau lọc nhiễu 45 DANH MỤC TỪ VIẾT TẮT Từ viết tắt TiếngAnh Nghĩa tiếng Việt ACR Absolute Categories Rating Đánh giá theo giá trị tuyệt đối CCR Comparison Category Rating Đánh giá cách so sánh DCR Degradation Category Rating Đánh giá suy giảm chất lƣợng DFT Discrete Fourier Transform Phép biến đổi Fourier rời rạc DTFT Discrete-Time Fourier Transform Phép biến đổi Fourier tín hiệu rời rạc FFT Fast Fourier Transform Phép biến đổi Fourier nhanh IDTFT Inverse Discrete Fourier Transform Phép biến đổi ngƣợc Fourier rời rạc IS Itakura_Saito ITU-T International Telecommunications UnionTelecommunication Hiệp hội tiêu chuẩn Viễn thông quốc tế LLR Log likehook Ratio Log tỷ lệ tƣơng đồng LPC Linear Prediction Coefficients Hệ số dự đốn tuyến tính LTI Linear Time-Invariant Hệ thống tuyến tính bất biến theo thời gian MMSE Minium Mean-Squared Error Tối thiểu hoá sai lệch trung bình bình phƣơng MOS Mean Opinion Scores Đánh giá theo quan điểm ngƣời nghe OE Objective Evaluation Đánh giá khách quan PC Personal Computer Máy tính cá nhân ROC Region of Convergence Miền hội tụ SE Subjective Evaluation Đánh giá chủ quan SNR Signal Noise Ratio Tỉ số tín hiệu nhiễu SPL Sound Pressure Level Mức áp suất âm SS Spectral Subtraction Trừ phổ SVD Singular Value Decomposition Phép phân tích giá trị đơn VAD Voice Activity Detection WF Wiener Filter WSS Weighted Spectral Slope Phát tiếng nói Thuật tốn giảm nhiễu tín hiệu tiếng nói cách sử dụng lọc Wiener Đo theo trọng số phổ ZT Z Transform Phép biến đổi Z Speech Enhancement Nâng cao chất lƣợng tiếng nói Statistical-model-based Dựa nguyên lý thống kê Frame Khung tín hiệu Hamming Window Cửa sổ Hamming Overlap Adding Xếp chồng thêm LỜI NÓI ĐẦU Trong thời đại công nghệ thông tin di dộng, chất lƣợng tín hiệu tiếng nói vấn đề quan trọng phổ biến Tăng cƣờng tín hiệu tiếng nói có nhiều ứng dụng hệ thống nhận dạng tiếng nói tự động nhƣ truyền thơng di động, đặc biệt mơi trƣờng có độ nhiễu cao, nơi mà tỷ số tín hiệu nhiễu (Signal Noise Ratio-SNR) thấp, làm suy giảm chất lƣợngtiếng nói cách đáng kể Trong hệ thống nhận dạng tiếng nói, việc áp dụng thuật tốn tăng cƣờng chất lƣợng tín hiệu nhằm mục đích giảm tác động nhiễu mang lại cải thiện đáng kể chất lƣợng nhận dạng Trong hệ thống thơng tin di động, chất lƣợng tín hiệu tiếng nói thƣờng bị thối hóa hay suy giảm chất lƣợng tác động nhiều loại nhiễu khác kênh truyền thơng Vì nâng cao chất lƣợng tín hiệu tiếng nói thực cần thiết hệ thống thông tin di động Nhiều hệ thống nâng cao chất lƣợng tín hiệu tiếng nói đƣợc phát triển tảng áp dụng trừ phổ tín hiệu[6] lọc lọc Wiener[7] Đặc điểm chung tất phƣơng pháp dự đốn cơng suất phổ tín hiệu tiếng nói cách sử dụng phổ lƣợng tín hiệu tiếng nói có nhiễu phổ lƣợng nhiễu Để có phổ lƣợng nhiễu âm thanh, thông thƣờng ngƣời ta thực ƣớc lƣợng phổ tín hiệu tiếng nói có nhiễu nhƣng vùng im lặng (vùng khơng xuất tiếng nói, hay vùng tín hiệu hai từ) Từ đó, hình thành nên số giải pháp truyền thống xử lý nâng cao chất lƣợng tiếng nói thực đánh giá ƣớc lƣợng phổ nhiễu dựa mơ hình thống kê Trong luận văn này, tơi trình bày tổng quan xử lý nâng cao chất lƣợng tiếng nói nhƣ nghiên cứu số thuật tốn khử nhiễu tín hiệu tiếng nói dựa kỹ thuật trừ phổ lọc Wienner Luận văn đƣợc tổ chức nhƣ sau: Chƣơng 1: Tìm hiểu chung tín hiệu tiếng nói chất lƣợng tiếng nói, nguyên lý hoạt động chế tín hiệu Chƣơng 2: Đƣa phƣơng pháp xử lý, đánh giá chất lƣợng tiếng nói giới thiệu chung thuật tốn thực giảm nhiễu để tăng cƣờng chất lƣợng tín hiệu tiếng nói Chƣơng 3: Trình bày chi tiết số thuật tốn nâng cao chất lƣợng tín hiệu tiếng nói nhƣ: thuật tốn giảm nhiễu phƣơng pháp trừ phổ (Spectral Subtraction), thuật toán giảm nhiễu lọc (Wiener Filte), số thuật toán khác Chƣơng 4: Trình bày lƣu đồ thuật tốn nhƣ chi tiết hóa bƣớc thực cho thuật tốn Thực nghiệm so sánh đánh giá cho số thuật toán * Các đoạn Code Matlab chƣơng trình Matlab Code thuật tốn phân đoạn tín hiệu function Seg=segment(signal,W,SP,Window) if nargin

Ngày đăng: 19/02/2022, 17:18

Xem thêm:

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w