TỔNG QUAN VỀ NHẬN DẠNG NGƯỜI NÓI

70 34 0
TỔNG QUAN VỀ NHẬN DẠNG NGƯỜI NÓI

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Chương 1 TỔNG QUAN VỀ NHẬN DẠNG NGƯỜI NÓI 1.1. Các lĩnh vực của xử lý tiếng nói 4 1.2. Nhận dạng người nói 5 1.2.1. Cơ sở lý thuyết của nhận dạng người nói 5 1.2.2. Phân loại bài toán nhận dạng người nói 6 1.2.3. Các ứng dụng của bài toán nhận dạng người nói 9 1.3. Xác thực người nói không phụ thuộc vào từ khóa 11 1.3.1. Giới thiệu chung 11 1.3.2. Các thành phần của một hệ thống xác thực người nói không phụ vào từ khóa 11 1.3.3. Các giai đoạn xử lý của một hệ thống xác thực người nói không phụ thuộc vào từ khóa 12 Chương 2 TRÍCH CHỌN ĐẶC TRƯNG NGƯỜI NÓI 2.1. Đặc điểm vật lý, âm học của tiếng nói 14 2.1.1. Đặc điểm vật lý của tiếng nói 14 2.1.2. Đặc điểm âm học của tiếng nói 17 2.2. Tiền xử lý tín hiệu tiếng nói. 22 2.2.1. Chuyển từ tín hiệu tương tự sang tín hiệu số 22 2.2.2. Chuẩn hóa biên độ 25 2.2.3. Biến đổi Fourier 26 2.2.4. Lọc nhiễu 27 2.2.5. Làm rõ tín hiệu 27 2.3. Trích chọn đặc trưng người nói. 28 2.3.1. Mục đích của trích chọn đặc trưng 28 2.3.2. Phân loại đặc trưng 29 2.3.3. Trích chọn đặc trưng MFCC 30 Chương 3 CÁC MÔ HÌNH ỨNG DỤNG XÁC THỰC NGƯỜI NÓI KHÔNG PHỤ THUỘC VÀO TỪ KHÓA 3.1. Phân loại các mô hình 39 3.1.1. Mô hình mẫu (Template Modeling) 39 3.1.2. Mô hình thống kê (Statistical Modeling) 39 3.2. Mô hình lượng tử hóa vector (Vector Quantization VQ) 40 3.2.1. Khái niệm phép lượng tử hóa 40 3.2.2. Độ biến dạng 42 3.2.3. Tính chất 42 3.2.4. Thiết kế codebook theo phương pháp LBG (Linde, Buzo, and Gray) 43 3.3. Mô hình hỗn hợp Gauss 46 3.3.1. Bài toán ước lượng mật độ 46 3.3.2. Thuật toán EM (Expectation Maximization) 48 3.4. Xây dựng mô hình người nói 49 3.4.1. Giới thiệu chung 49 3.4.2. Sử dụng mô hình VQ 49 3.4.3. Sử dụng GMM 51 3.5. So khớp 51 3.5.1. Giới thiệu chung 51 3.5.2. Phương pháp VQ 52 3.5.3. Phương pháp GMM 53 3.6. Tạo quyết định 53 Chương 4 CẤU HÌNH HỆ THỐNG VÀ KẾT QUẢ THỬ NGHỆM 4.1. Cấu trúc tổng quát của hệ thống 56 4.1.1. Module trích chọn đặc trưng MFCC 56 4.1.2. Module huấn luyện 57 4.1.3. Module xác thực 57 4.2. Dữ liệu tiếng nói 57 4.3. Tỷ lệ lỗi (Error rate) 58 4.4. Kết quả thực nghiệm 58 4.4.1. Số các hệ số MFCC 58 4.4.2. Mô hình VQ và GMM 59 4.4.3. Thời gian huấn luyện 59 4.4.4. Số các cụm của mô hình VQ 60 4.4.5. Số cụm của mô hình GMM 60

Ngày đăng: 14/01/2021, 00:53

Mục lục

  • Chương 1 TỔNG QUAN VỀ NHẬN DẠNG NGƯỜI NÓI

    • 1.1. Các lĩnh vực của xử lý tiếng nói

    • 1.2. Nhận dạng người nói

      • 1.2.1. Cơ sở lý thuyết của nhận dạng người nói

      • 1.2.2. Phân loại bài toán nhận dạng người nói

        • 1.2.2.1. Phân loại dựa vào chức năng của bài toán

        • 1.2.2.2. Phân loại dựa theo phương pháp

        • 1.2.3. Các ứng dụng của bài toán nhận dạng người nói

        • 1.3. Xác thực người nói không phụ thuộc vào từ khóa

          • 1.3.1. Giới thiệu chung

          • 1.3.2. Các thành phần của một hệ thống xác thực người nói không phụ vào từ khóa

          • 1.3.3. Các giai đoạn xử lý của một hệ thống xác thực người nói không phụ thuộc vào từ khóa

          • Chương 2 TRÍCH CHỌN ĐẶC TRƯNG NGƯỜI NÓI

            • 2.1. Đặc điểm vật lý, âm học của tiếng nói

              • 2.1.1. Đặc điểm vật lý của tiếng nói

                • 2.1.1.1. Độ cao (Pitch)

                • 2.1.1.2. Cường độ

                • 2.1.1.3. Trường độ

                • 2.1.1.4. Âm sắc

                • 2.1.2. Đặc điểm âm học của tiếng nói

                  • 2.1.2.1. Nguyên âm

                  • 2.1.2.2. Phụ âm

                  • 2.1.2.3. Tỷ suất thời gian

                  • 2.1.2.4. Hàm năng lượng thời gian ngắn

                  • 2.1.2.5. Tần số vượt điểm không

                  • 2.1.2.6. Phát hiện điểm cuối

                  • 2.1.2.7. Tần số cơ bản

                  • 2.1.2.8. Formant

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan