1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói

76 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 76
Dung lượng 2,89 MB

Nội dung

HỌ TÊN HỌC VIÊN: NGUYỄN XUÂN VIỆT BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - NGUYỄN XN VIỆT CHUN NGÀNH: CƠNG NGHỆ THƠNG TIN TÌM HIỂU MỘT SỐ PHƢƠNG PHÁP TĂNG CƢỜNG CHẤT LƢỢNG TIẾNG NÓI (Study on the enhancement of speed signal quality) LUẬN VĂN THẠC SĨ KỸ THUẬT CƠNG NGHỆ THƠNG TIN KHỐ: 2012A-HY Hƣng Yên– Năm 2014 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI NGUYỄN XUÂN VIỆT TÌM HIỂU MỘT SỐ PHƢƠNG PHÁP TĂNG CƢỜNG CHẤT LƢỢNG TIẾNG NĨI Chun ngành :Cơng Nghệ thơng tin LUẬN VĂN THẠC SĨ KỸ THUẬT Công nghệ thông tin NGƢỜI HƢỚNG DẪN KHOA HỌC : PGS.TS Trịnh Văn Loan Hà Nội – Năm 2014 CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do- hạnh phúc ––––––––––––––– LỜI CAM ĐOAN Kính gửi : Hội đồng bảo vệ luận văn cao học Viện Công nghệ Thông tin Trƣờng Đại học Bách khoa Hà Nội Tên em là: Nguyễn Xuân Việt – Học viên lớp cao học 2012A-HY- Trƣờng Đại học Bách khoa Hà Nội Em xin cam đoan nội dung luận văn luận văn chép luận văn cơng trình trƣớc NGƢỜI CAM ĐOAN Nguyễn Xuân Việt MỤC LỤC LỜI CAM ĐOAN MỤC LỤC DANH MỤC HÌNH VÀ BẢNG BIỂU LỜI NÓI ĐẦU CHƢƠNG I: TỔNG QUAN VỀ NÂNG CAO CHẤT LƢỢNG TIẾNG NÓI 1.1 Tổng quan tiếng nói 1.1.1 Tổng quan tiếng nói ngƣời 1.1.2 Tổng quan nâng cao chất lƣợng tiếng nói 1.2 Tìm hiểu tín hiệu nhiễu 1.2.1 Tìm hiểu tín hiệu 1.2.2 Tìm hiểu nhiễu 1.3 Tín hiệu rời rạc theo thời gian 11 1.3.1 Tín hiệu xung đơn vị 12 1.3.2.Tín hiệu bậc đơn vị 12 1.3.3 Tín hiệu hàm sin rời rạc 12 1.3.4 Tín hiệu hàm mũ 12 CHƢƠNG II: XỬ LÝ VÀ ĐÁNH GIÁ CHẤT LƢỢNG TÍN HIỆU TIẾNG NĨI 13 2.1 Xử lý tiếng nói 13 2.1.1 Xử lý tín hiệu số 13 2.1.2 Phép biến đổi Fourier 14 2.2.Các thuật tốn sử dụng nâng cao chất lƣợng tín hiệu tiếng nói 15 2.2.1 Spectral-subtraction - Trừ phổ 15 2.2.2 Thuật tốn Mơ hình thống kê 15 2.3 Đánh giá chất lƣợng tiếng nói 15 2.3.2 Phƣơng pháp đánh giá khách quan 18 CHƢƠNG III MỘT SỐ THUẬT TOÁN TRONG XỬ LÝ VÀ TĂNG CƢỜNG CHẤT LƢỢNG TÍN HIỆU TIẾNG NĨI 23 3.1 Thuật toán Trừ phổ 23 3.1.1 Sơ đồ khối chung thuật toán 23 3.1.2 Thuật toán Spectral Subtraction (thuật toán trừ phổ) 23 3.1.3 Phƣơng pháp đánh giá mục tiêu thuật toán 28 3.2 Thuật toán lọc Wiener 30 3.2.1 Giới thiệu chung 30 3.2.2 Nguyên lý lọc Wiener 30 3.3 Xếp chồng cộng trình xử lý tín hiệu tiếng nói 32 3.3.1 Phân tích tín hiệu theo khung 32 3.3.2 Xếp chồng cộng (Overlap and adding) 35 3.3.3 Ƣớc lƣợng cập nhật nhiễu 37 3.3.4 Phát tiếng nói (Voice activity detection) 38 3.3.5 Quá trình ƣớc lƣợng cập nhật nhiễu 40 CHƢƠNG 4: THỰC HIỆN VÀ ĐÁNH GIÁ CÁC THUẬT TOÁN 41 4.1 Giới thiệu chƣơng 41 4.2 Lƣu đồ thực đánh giá thuật toán 41 4.3 Lƣu đồ thuật toán Trừ phổ 42 4.4 Lƣu đồ thuật toán lọc Wiener 43 4.5 Thực thuật toán 44 4.6 Các thơng số ảnh hƣởng đến thuật tốn 48 4.7 Phát triển thuật toán Trừ phổ từ thuật toán Lọc Wiener 49 4.8 Nhận xét kết luận 50 KẾT LUẬN LUẬN VĂN VÀ HƢỚNG PHÁT TRIỂN TRIỂN TIẾP THEO 51 PHỤ LỤC CHẠY THỰC NGHIỆM VÀ CÁC ĐOẠN CODE MATLAB 52 DANH MỤC HÌNH VÀ BẢNG BIỂU Hình 1.1 Mơ hình tạo tiếng nói Hình 1.2 Tín hiệu tiếng nói Hình 1.3 Dạng phân bố phổ lƣợng trung bình nhiễu xe 10 Hình 1.4 Mức nhiễu tiếng nói (đo SPL dB) môi trƣờng 11 khác 11 Bảng 2.2 Thang điểm đánh giá chất lƣợng tiếng nói theo MOS 16 Bảng 2.3 Thang điểm đánh giá chất lƣợng tín hiệu tiếng nói theo CCR 17 Bảng 2.4 Thang đánh giá DCR 18 Hình 3.1 Sơ đồ khối cho hai thuật toán SS WF 23 Hình 3.2 Sơ đồ khối thuật toán Trừ phổ 26 Hình 3.3 Sơ đồ khối thuật toán lọc Wiener 32 Hình 3.4 Phân tích tín hiệu thành khung 33 Hình 3.4 Sơ đồ thuật tốn phân tích tín hiệu thành khung 35 Hình 3.5 Quá trình thực xếp chồng cộng 36 Hình 3.5 Thuật toán xếp chồng cộng 37 Hình 4.2 Trừ phổ 42 Hình 4.3 Lƣu đồ thuật toán WF 43 Hình 4.4 Tín hiệu có nhiễu sau lọc nhiễu WF 45 Hình 4.5 Tín hiệu sau lọc nhiễu 45 DANH MỤC TỪ VIẾT TẮT Từ viết tắt TiếngAnh Nghĩa tiếng Việt ACR Absolute Categories Rating Đánh giá theo giá trị tuyệt đối CCR Comparison Category Rating Đánh giá cách so sánh DCR Degradation Category Rating Đánh giá suy giảm chất lƣợng DFT Discrete Fourier Transform Phép biến đổi Fourier rời rạc DTFT Discrete-Time Fourier Transform Phép biến đổi Fourier tín hiệu rời rạc FFT Fast Fourier Transform Phép biến đổi Fourier nhanh IDTFT Inverse Discrete Fourier Transform Phép biến đổi ngƣợc Fourier rời rạc IS Itakura_Saito ITU-T International Telecommunications UnionTelecommunication Hiệp hội tiêu chuẩn Viễn thông quốc tế LLR Log likehook Ratio Log tỷ lệ tƣơng đồng LPC Linear Prediction Coefficients Hệ số dự đốn tuyến tính LTI Linear Time-Invariant Hệ thống tuyến tính bất biến theo thời gian MMSE Minium Mean-Squared Error Tối thiểu hoá sai lệch trung bình bình phƣơng MOS Mean Opinion Scores Đánh giá theo quan điểm ngƣời nghe OE Objective Evaluation Đánh giá khách quan PC Personal Computer Máy tính cá nhân ROC Region of Convergence Miền hội tụ SE Subjective Evaluation Đánh giá chủ quan SNR Signal Noise Ratio Tỉ số tín hiệu nhiễu SPL Sound Pressure Level Mức áp suất âm SS Spectral Subtraction Trừ phổ SVD Singular Value Decomposition Phép phân tích giá trị đơn VAD Voice Activity Detection WF Wiener Filter WSS Weighted Spectral Slope Phát tiếng nói Thuật tốn giảm nhiễu tín hiệu tiếng nói cách sử dụng lọc Wiener Đo theo trọng số phổ ZT Z Transform Phép biến đổi Z Speech Enhancement Nâng cao chất lƣợng tiếng nói Statistical-model-based Dựa nguyên lý thống kê Frame Khung tín hiệu Hamming Window Cửa sổ Hamming Overlap Adding Xếp chồng thêm LỜI NÓI ĐẦU Trong thời đại công nghệ thông tin di dộng, chất lƣợng tín hiệu tiếng nói vấn đề quan trọng phổ biến Tăng cƣờng tín hiệu tiếng nói có nhiều ứng dụng hệ thống nhận dạng tiếng nói tự động nhƣ truyền thơng di động, đặc biệt mơi trƣờng có độ nhiễu cao, nơi mà tỷ số tín hiệu nhiễu (Signal Noise Ratio-SNR) thấp, làm suy giảm chất lƣợngtiếng nói cách đáng kể Trong hệ thống nhận dạng tiếng nói, việc áp dụng thuật tốn tăng cƣờng chất lƣợng tín hiệu nhằm mục đích giảm tác động nhiễu mang lại cải thiện đáng kể chất lƣợng nhận dạng Trong hệ thống thơng tin di động, chất lƣợng tín hiệu tiếng nói thƣờng bị thối hóa hay suy giảm chất lƣợng tác động nhiều loại nhiễu khác kênh truyền thơng Vì nâng cao chất lƣợng tín hiệu tiếng nói thực cần thiết hệ thống thông tin di động Nhiều hệ thống nâng cao chất lƣợng tín hiệu tiếng nói đƣợc phát triển tảng áp dụng trừ phổ tín hiệu[6] lọc lọc Wiener[7] Đặc điểm chung tất phƣơng pháp dự đốn cơng suất phổ tín hiệu tiếng nói cách sử dụng phổ lƣợng tín hiệu tiếng nói có nhiễu phổ lƣợng nhiễu Để có phổ lƣợng nhiễu âm thanh, thông thƣờng ngƣời ta thực ƣớc lƣợng phổ tín hiệu tiếng nói có nhiễu nhƣng vùng im lặng (vùng khơng xuất tiếng nói, hay vùng tín hiệu hai từ) Từ đó, hình thành nên số giải pháp truyền thống xử lý nâng cao chất lƣợng tiếng nói thực đánh giá ƣớc lƣợng phổ nhiễu dựa mơ hình thống kê Trong luận văn này, tơi trình bày tổng quan xử lý nâng cao chất lƣợng tiếng nói nhƣ nghiên cứu số thuật tốn khử nhiễu tín hiệu tiếng nói dựa kỹ thuật trừ phổ lọc Wienner Luận văn đƣợc tổ chức nhƣ sau: Chƣơng 1: Tìm hiểu chung tín hiệu tiếng nói chất lƣợng tiếng nói, nguyên lý hoạt động chế tín hiệu Chƣơng 2: Đƣa phƣơng pháp xử lý, đánh giá chất lƣợng tiếng nói giới thiệu chung thuật tốn thực giảm nhiễu để tăng cƣờng chất lƣợng tín hiệu tiếng nói Chƣơng 3: Trình bày chi tiết số thuật tốn nâng cao chất lƣợng tín hiệu tiếng nói nhƣ: thuật tốn giảm nhiễu phƣơng pháp trừ phổ (Spectral Subtraction), thuật toán giảm nhiễu lọc (Wiener Filte), số thuật toán khác Chƣơng 4: Trình bày lƣu đồ thuật tốn nhƣ chi tiết hóa bƣớc thực cho thuật tốn Thực nghiệm so sánh đánh giá cho số thuật toán * Các đoạn Code Matlab chƣơng trình Matlab Code thuật tốn phân đoạn tín hiệu function Seg=segment(signal,W,SP,Window) if nargin

Ngày đăng: 19/02/2022, 17:18

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[4] Dr.Philipos C.Loizou, chair(2004) -Noise estimation algorithms for highly non-stationary environments Sách, tạp chí
Tiêu đề: Noise estimation algorithms for highly non-stationary environments
Tác giả: Dr.Philipos C.Loizou
Năm: 2004
[7] Alan V. Oppenheim and George C. Verghese (2010)-Wiener Filtering Sách, tạp chí
Tiêu đề: Wiener Filtering
Tác giả: Alan V. Oppenheim, George C. Verghese
Năm: 2010
[9]. Nguyễn Quốc Trung, Xử lý tín hiệu số - tập 1, NXB Khoa học kĩ thuật Sách, tạp chí
Tiêu đề: Xử lý tín hiệu số - tập 1
Tác giả: Nguyễn Quốc Trung
Nhà XB: NXB Khoa học kĩ thuật
[11]. Lombard, E.(1911), Le signe de lelevation de la voix, Ann. Mal. Oreil. Larynx.,37, 101-119 Sách, tạp chí
Tiêu đề: Le signe de lelevation de la voix
Tác giả: Lombard, E
Nhà XB: Ann. Mal. Oreil. Larynx.
Năm: 1911
[12]. Philippos C.Loizou, Speech Enhancement Theory and Practice,pp. 2-7 Sách, tạp chí
Tiêu đề: Speech Enhancement Theory and Practice
Tác giả: Philippos C. Loizou
[14]. Lim, J. and Oppenheim, A.V.(1979), Enhancement and bandwidth compression of noisy speech, Proc. IEEE, 67(12),pp. 1586-1604 Sách, tạp chí
Tiêu đề: Proc. IEEE
Tác giả: Lim, J. and Oppenheim, A.V
Năm: 1979
[16] Speech Enhancement using a minimum mean-square ieee transactions on acoustics, speech, and signal processing, vol. assp-32, no. 6, december 1984 Sách, tạp chí
Tiêu đề: Speech Enhancement using a minimum mean-square
Nhà XB: IEEE Transactions on Acoustics, Speech, and Signal Processing
Năm: 1984
[17] ITU_T Recommendation P.800 ( August 1996) - “Methods for Subjective Determination of Transmission Quality” Sách, tạp chí
Tiêu đề: Methods for Subjective Determination of Transmission Quality
[18] Hansen J. and Pellon B(1998). , “An effective quality evaluation protocol for Speech Enhancement algorithms”, Proc. Int Conf. Spoken Language Process Sách, tạp chí
Tiêu đề: An effective quality evaluation protocol for Speech Enhancement algorithms
Tác giả: Hansen J., Pellon B
Nhà XB: Proc. Int Conf. Spoken Language Process
Năm: 1998
[1] N. Milivojevi´c and Dragiˇsa Z. Balaneskovi´c(December 2009) - Enhancement Of The Perceptive Quality Of The Noisy-Zoran Khác
[2] Mohamed M. E. EL-Halawany(February 2012) -Signal Quality Enhancement of Acousto Optic Modulators for both High Modulation Speed and Transmission Data Rates Khác
[3] Nils Westerlund (May 2003) -Applied Speech Enhancement for personal communication Khác
[5] Hoàng Minh Thảo (Jun 2012), speech enhencement algorithms Khác
[8] Ekaterina Verteletskaya, Boris Simak-Noise Reduction Based on Modified Spectral Subtraction Method (IAENG International Journal of Computer Science, 38:1, IJCS_38_1_10) Khác
[10] Analysis of VoIP Signal Processing for Performance Enhancement Khác
[13]. Ths.Hoàng Lê Uyên Thục, Giáo trình xử lý tín hiệu số, Đại học Bách Khoa –Đại học Đà Nẵng Khác
[15]. Weiss, M., Aschkenasy, E., and Parsons, T.(1974), Study and the development of the INTEL technique for improving speech intelligibility, Technical Report NSC-FR/ 4023 Khác

HÌNH ẢNH LIÊN QUAN

Hình 1.1 Mô hình tạo tiếng nói - Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói
Hình 1.1 Mô hình tạo tiếng nói (Trang 13)
Hình 1.2 Tín hiệu tiếng nói - Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói
Hình 1.2 Tín hiệu tiếng nói (Trang 16)
Hình 1.3 Dạng và sự phân bố phổ năng lƣợng trung bình nhiễu trên xe[12] - Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói
Hình 1.3 Dạng và sự phân bố phổ năng lƣợng trung bình nhiễu trên xe[12] (Trang 18)
Hình bên dưới này là sự tổng hợp về mức độ âm trung bình giữa tiếng nói và  nhiễu trong các môi trường khác nhau - Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói
Hình b ên dưới này là sự tổng hợp về mức độ âm trung bình giữa tiếng nói và nhiễu trong các môi trường khác nhau (Trang 19)
Bảng 2.1. Các định lý biểu diễn dãy số - Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói
Bảng 2.1. Các định lý biểu diễn dãy số (Trang 22)
Bảng 2.2 Thang điểm đánh giá chất lƣợng tiếng nói theo MOS[12] - Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói
Bảng 2.2 Thang điểm đánh giá chất lƣợng tiếng nói theo MOS[12] (Trang 24)
Bảng 2.3 Thang điểm đánh giá chất lƣợng tín hiệu tiếng nói theo CCR - Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói
Bảng 2.3 Thang điểm đánh giá chất lƣợng tín hiệu tiếng nói theo CCR (Trang 25)
Bảng 2.4 Thang đánh giá DCR - Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói
Bảng 2.4 Thang đánh giá DCR (Trang 26)
Hình 3.1 Sơ đồ khối cho hai thuật toán SS và WF - Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói
Hình 3.1 Sơ đồ khối cho hai thuật toán SS và WF (Trang 31)
Sơ đồ khối của thuật toán Trừ phổ : - Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói
Sơ đồ kh ối của thuật toán Trừ phổ : (Trang 34)
Sơ đồ khối của thuật toán lọc Wiener: - Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói
Sơ đồ kh ối của thuật toán lọc Wiener: (Trang 40)
Hình 3.4 Phân tích tín hiệu thành các khung[5]. - Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói
Hình 3.4 Phân tích tín hiệu thành các khung[5] (Trang 41)
Hình 3.4 Sơ đồ thuật toán phân tích tín hiệu thành các khung - Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói
Hình 3.4 Sơ đồ thuật toán phân tích tín hiệu thành các khung (Trang 43)
Hình 3.5 Quá trình thực hiện xếp chồng và cộng [5] . - Tìm hiểu một số phương pháp tăng cường chất lượng tiếng nói
Hình 3.5 Quá trình thực hiện xếp chồng và cộng [5] (Trang 44)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w