ˆm w mm
5.6.1.3. Một số tồn tại trong phƣơng pháp nhận dạng acoustic-phonetic
Có rất nhiều vấn đề tồn tại trong phƣơng pháp nhận dạng tín hiệu tiếng nói acoustic-phonetic. Những vấn đề này làm cho phƣơng pháp thiếu sự thành công trong các hệ thống nhận dạng tín hiệu tiếng nói thực tế. Trong các tồn tại phải kể đến là:
1. Phƣơng pháp này yêu cầu một khối lƣợng thông tin lớn (extensive) về các tính chất âm học của các đơn vị âm tiết. Những thông tin này thƣờng là không đầy đủ và không sẵn sàng ngoại trừ những trƣờng hợp đơn giản.
2. Việc chọn các đặc trƣng đƣợc thực hiện chủ yếu dựa trên các xem xét ad hoc. Với hầu hết các hệ thống, việc chọn các đặc trƣng dựa trên các nhận thức chứ không phải tối ƣu theo một tiêu chí định sẵn và có nghĩa (a well-defined and meaningful sense)
3. Thiết kế các bộ phân loại âm thanh cũng không phải là các thiết kế tối ƣu. Phƣơng pháp ad hoc thƣờng đƣợc sử dụng để xây dựng các cây nhị phân quyết định. Gần đây, các phƣơng pháp cây hồi quy (regression) và phân loại (CART) đƣợc sử dụng thay thế để cho phép các cây quyết định nhất quán hơn. Tuy vậy, vì việc lựa chọn các đặc trƣng chủ yếu là cận tối ƣu, các thực thi tối ƣu của CART thƣờng ít khi đạt đƣợc.
4. Không tồn tại một thủ tục định sẵn và tự động nào cho việc điều chỉnh phƣơng pháp (chẳng hạn nhƣ chỉnh các ngƣỡng quyết định, ...) trên các tín hiệu đƣợc gán nhãn thực. Thực tế, thậm chí còn không có một phƣơng pháp lý tƣởng của việc gán nhãn tín hiệu tiếng nói huấn luyện một cách nhất quán và đƣợc sự đồng ý rộng rãi của các chuyên gia ngôn ngữ học.
Do các tồn tại nêu trên, mặc dù phƣơng pháp nhận dạng acoustic-phonetic là một ý tƣởng khá thú vị nhƣng cần có nhiều nghiên cứu hiểu biết hơn nữa để có thể thực hiện thành công các hệ thống nhận dạng thực tế dựa trên phƣơng pháp này.