1. Trang chủ
  2. » Tất cả

Các tính năng âm thanh để nhận dạng giọng nói tự động và phân tích âm thanh

40 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 40
Dung lượng 2,27 MB

Nội dung

AUDIO AND SPEECH PROCESSING WITH Các tính năngMATLAB âm để nhận dạng giọng nói tự động phân tích âm 9.1 Đặc tính giọng nói: giới thiệu Trong chương xem xét phương pháp phân tích tín hiệu tiếng nói.Phân tích tiếng nói thực giải vấn đề tìm dạng thức tối ưu biển diễn tiếng nói cách hiệu Phân tích tiếng nói thực việc trích chọn chuyển đổi tín hiệu tiếng nói sang dạng biểu diễn khác cho biểu diễn thơng tin tiếng nói tốt theo cách mà cần 9.2 Cơng cụ phân tích giọng nói 9.2.1 Phân tích phổ dải băng rộng so với dải băng hẹp cho âm lời nói Một cách phổ biến thơng thường để phân tích trích xuất tính từ âm dựa giọng nói sử dụng ngân hàng lọc dải tần số liên quan cho phát biểu.Vấn đề việc sử dụng ngân hàng lọc độ phân giải tần số.Độ phân giải tần số thông thường (để phân tích giọng nói) chia thành loại "băng hẹp" "băng rộng" Phân tích băng rộng tổng hợp đường sóng hài kích thích nguồn dọc để tạo cấu trúc định dạng tiếng nói Phân tích băng hẹp sử dụng lọc có chiều rộng tương tự với chiều rộng sóng hài kích thích (khoảng cách sóng hài).Cấu trúc kích thích nguồn hài tiết lộ dải hẹpphân tích (tức vạch ngang hẹp quang phổ) 9.2.2 Phổ cho phân tích giọng nói Thơng số quan trọng biểu đồ quang phổ (hoặc Fourier thời gian ngắn liên quan Transform) độ dài FFT Phổ băng rộng phân tích giọng nói Chiều dài phân tích ngắn lược đồ phân tích spectrogram thu gọi spectrogram băng rộng Phổ băng hẹp phân tích giọng nói Ngược lại chiều dài phân tích lớn gọi lược đồ spectrogram băng hẹp 9.3 Cepstrum Analysis Cepstrum sử dụng để tách thành phần nguồn lọc giọng nói phương pháp quang phổ Lý thuyết lọc nguồn việc tạo tiếng nói phát biểu tín hiệu s [t] kết nguồn g [t] lọc h [t] (giả sử biểu diễn rời rạc g h lập mục theo số thời gian t) s[t] = g[t] ∗ h[t] (9.1) h[t] (9.1) Trong ∗ h[t] (9.1) tốn tử tích chập Đưa định lý tích chập phép biến đổi Fourier thực tế S, G H phép biến đổi Fourier s, g h, dẫn đến kết phép biến đổi Fourier tín hiệu phép biến đổi Fourier nguồn nhân với biến đổi Fourier lọc: S(ω) = G(ω) × H(ω) (9.2) ) = G(ω) = G(ω) × H(ω) (9.2) ) × H(ω) = G(ω) × H(ω) (9.2) ) (9.2) ... Đặc tính giọng nói: giới thiệu Trong chương xem xét phương pháp phân tích tín hiệu tiếng nói. Phân tích tiếng nói thực giải vấn đề tìm dạng thức tối ưu biển diễn tiếng nói cách hiệu Phân tích. .. tuyến tính LPC có vai trị quan trọng phân tích giọng nói, tổng hợp trích xuất tính để nhận dạng giọng nói LPC nhằm mục đích xác định lọc kỹ thuật số tất cực phù hợp với tín hiệu định Phân tích. .. cho âm lời nói Một cách phổ biến thơng thường để phân tích trích xuất tính từ âm dựa giọng nói sử dụng ngân hàng lọc dải tần số liên quan cho phát biểu.Vấn đề việc sử dụng ngân hàng lọc độ phân

Ngày đăng: 26/02/2023, 17:38

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w