- Mở đầu
3.1.3 Các khiếm khuyết cơ bản của Lexicon
Để mơ hình chính xác hơn mối quan hệ giữa các từ và biểu diễn của chúng về các đơn vị phụ từ sub-word, qua đĩ nâng cao độ chính xác nhận dạng tổng thể của nhiệm vụ nhận dạng tiếng nĩi. Trước hết ta cần phải hiểu các lý do tại sao những từ cĩ thể được phát âm khác nhau (được gọi là các phát âm biến thể), khơng chỉ bởi những người nĩi khác nhau, mà cịn bởi cùng một người nĩi trong các tình huống khác nhau. Ngơn ngữ học đã nhận thức được các cơ chế khác nhau làm phát sinh cách phát âm khác nhau trong một thời gian. Atal [1976] lưu ý rằng đặc điểm giải phẫu học, như là hình dạng và kích thước của bộ máy phát âm của người nĩi, các hạn chế vật lý của âm thanh cĩ thể được phát ra, thĩi quen cá nhân khi nĩi hay hiệu ứng đặc biệt là nĩi nhấn giọng, và nhiều hiệu ứng khác như trạng thái cảm xúc cũng là các nguyên nhân. Cuối cùng, từ đồng âm rõ ràng cĩ tác dụng làm thay đổi cách phát âm cụ thể của một từ phụ thuộc vào ngữ cảnh mà trong đĩ từ này được phát âm ra.
Do các biến thể phát âm sinh ra ở trên, các nhà nghiên cứu đã hướng tới lexicon được cải thiện các khiếm khuyết. Stevens,1995; Sloboda và Waibel, 1996 đã đề xuất một lexicon lý tưởng như sau:
Chứa đầy đủ các từ đủ để mơ tả cho miền tiếng nĩi mẫu, tức là tất cả những từ mà một người cĩ thể sử dụng (gồm cả từ lặng silence và ký hiệu kết thúc).
Được lưu trữ trong một định dạng tương thích với các dạng dữ liệu âm thanh ghi nhận các tiếng nĩi.
Để tự động thích ứng với các phương ngữ của người nĩi, thơng qua áp dụng các quy tắc âm học hoặc cách chuyển đổi (được đưa ra bởi các chuyên gia ngơn ngữ học).
Cho phép các mục từ vựng được phục hồi khi người nĩi sửa đổi các mơ hình âm thanh cho các từ riêng lẻ.