Rút trích đặc trưng

Một phần của tài liệu ĐỊNH DANH NGƯỜI NÓI ĐỘC LẬP VĂN BẢN BẰNG MÔ HÌNH THỐNG KÊ (Trang 26 - 28)

Rút trích đặc trưng được hiểu như là một quá trình biến đổi từ vector có kích thước lớn sang vector có kích thước nhỏ hơn. Như vậy, về mặt hình thức, rút trích đặc trưng có thểđược định nghĩa như một ánh xạ f:

f : RN→ Rd, trong đó d << N.

Thông thường, để các mô hình người nói có khả năng mô hình hóa tốt, số lượng các vector huấn luyện phải đủ lớn. Như vậy, việc giảm kích thước của từng vector huấn luyện thông qua bước rút trích đặc trưng sẽ giúp làm giảm độ phức tạp tính toán của bước huấn luyện và nhận dạng.

Đối với bài toán nhận dạng người nói, một đặc trưng được cho là tốt cần phải có các tính chất sau:

- Sai biệt giữa các vectors đặc trưng của những người nói khác nhau phải lớn. - Sai biệt giữa các vectors đặc trưng của cùng một người nói phải nhỏ.

- Kháng nhiễu tốt.

- Phân biệt được giả mạo tốt. - Độc lập với các đặc trưng khác.

Hai tính chất đầu đòi hỏi đặc trưng phải mang tính tách biệt càng nhiều càng tốt. Một ví dụ minh họa thể hiện trong hình 2.2 cho thấy tính tách biệt của 2 đặc trưng khác nhau. Dễ dàng thấy được đặc trưng 2 tốt hơn hẳn đặc trưng 1 trong việc phân biệt giữa những người nói.

Hinh 2.2: Ví dụ về tính tách biệt của 2 đặc trưng khác nhau.

Một đặc trưng được gọi là tốt cũng cần phải có tính kháng nhiễu và phân biệt giả

mạo tốt (đặc tính thứ 3 và thứ 4). Cuối cùng, nếu một hệ thống sử dụng nhiều hơn 1

đặc trưng, thì các đặc trưng này phải độc lập với nhau (tính chất 5); việc sử dụng các đặc trưng phụ thuộc lẫn nhau thường không đem lại kết quả tốt.

Một đặc trưng lý tưởng (có tất cả 5 tính chất tốt nêu trên) thường không tồn tại trong thực tế. Trong lĩnh vực nhận dạng người nói, các đặc trưng thường được sử

dụng là MFCC (Mel-Frequency Cepstral Coefficients), LSP (Line Spectral Pairs)…

Đề tài này chỉ tập trung vào đặc trưng MFCC cho bài toàn định danh người nói.

Hình 2.3 thể hiện các bước rút trích đặc trưng MFCC. Tín hiệu thô sẽ trải qua các bước xử lý chính: chia frame, biến đổi Fourier, áp dụng các Mel filter-banks, lấy log và biến đổi cosin rời rạc.

Hình 2.3: Các bước rút trích đặc trưng MFCC.

Một phần của tài liệu ĐỊNH DANH NGƯỜI NÓI ĐỘC LẬP VĂN BẢN BẰNG MÔ HÌNH THỐNG KÊ (Trang 26 - 28)

Tải bản đầy đủ (PDF)

(84 trang)