ˆm w mm
5.6.1.1. Bộ phân loại các âm vị nguyên âm
Ta cùng xem xét thủ tục gán nhãn trên một phân đoạn đƣợc phân loại nhƣ một nguyên âm. Sơ đồ hình 5.9 mô tả lƣu đồ phân loại nguyên âm theo phƣơng pháp acoustic-phonetic. Ta giả sử rằng có ba đặc trƣng đã đƣợc phát hiện trong phân đoạn là formant thứ nhất F1, formant thứ hai F2 và chiều dài của phân đoạn D. Thêm nữa ta chỉ xem xét tập các nguyên âm ổn định (steady), tức là loại bỏ các nguyên âm kép (diphthongs). Để phân loại một phân đoạn nguyên âm trong 10 nguyên âm ổn định, một số phép thử cần phải thực hiện để phân tách các nhóm nguyên âm. Nhƣ trình bày trong hình 5.9, phép thử đầu tiên tách các nguyên âm có tần số F1 thấp (còn gọi là các nguyên âm khuếch tán (diffuse) chẳng hạn nhƣ /i/, /i/, /u/, ...) với các nguyên âm có tần số cao (còn gọi là các nguyên âm gọn (compact) bao gồm /a/, ...). Mỗi tập con này lại đƣợc phân tách thêm dựa vào tần số F2, trong đó các nguyên âm acute (âm sắc) có tần số F2 cao và các nguyên âm grave (âm huyền) có tần số F2 thấp. Phép kiểm tra thứ ba dựa trên khoảng thời gian của phân đoạn sẽ phân tách các nguyên âm căng (tense vowel), tức là các nguyên âm có giá trị D lớn với các nguyên âm lax (thả lỏng), tức là các nguyên âm có giá trị D nhỏ. Cuối cùng, một phép kiểm tra mịn hơn (finer) đối với các giá trị formant để phân tách các nguyên âm chƣa phân tách còn lại tạo ra lớp các nguyên âm bằng (flat) tức là các nguyên âm có F1+F2 lớn hơn một ngƣỡng T nào đó và các nguyên âm đơn giản (plain) ( các nguyên âm có F1+F2 nằm dƣới một ngƣỡng T nào đó)
CHƢƠNG 5. NHẬN DẠNG TIẾNG NÓI
Cần chú ý rằng, có một số mức ngƣỡng đƣợc sử dụng trong bộ phân loại nguyên âm. Các mức ngƣỡng này thƣờng đƣợc xác định bằng thực nghiệm sao cho có thể tăng tối đa tính chính xác của phép phân loại trên một tập tín hiệu tiếng nói cho trƣớc.
Hình 5.9 Một phƣơng pháp đơn giản phân loại nguyên âm tiếng Anh