Các khiếm khuyết cơ bản của Lexicon

Một phần của tài liệu Nhận dạng tiếng nói việt nam từ vựng lớn liên tục (Trang 49)

- Mở đầu

3.1.3 Các khiếm khuyết cơ bản của Lexicon

Để mô hình chính xác hơn mối quan hệ giữa các từ và biểu diễn của chúng về các đơn vị phụ từ sub-word, qua đó nâng cao độ chính xác nhận dạng tổng thể của nhiệm vụ nhận dạng tiếng nói. Trước hết ta cần phải hiểu các lý do tại sao những từ có thể được phát âm khác nhau (được gọi là các phát âm biến thể), không chỉ bởi những người nói khác nhau, mà còn bởi cùng một người nói trong các tình huống khác nhau. Ngôn ngữ học đã nhận thức được các cơ chế khác nhau làm phát sinh cách phát âm khác nhau trong một thời gian. Atal [1976] lưu ý rằng đặc điểm giải phẫu học, như là hình dạng và kích thước của bộ máy phát âm của người nói, các hạn chế vật lý của âm thanh có thể được phát ra, thói quen cá nhân khi nói hay hiệu ứng đặc biệt là nói nhấn giọng, và nhiều hiệu ứng khác như trạng thái cảm xúc cũng là các nguyên nhân. Cuối cùng, từ đồng âm rõ ràng có tác dụng làm thay đổi cách phát âm cụ thể của một từ phụ thuộc vào ngữ cảnh mà trong đó từ này được phát âm ra.

Do các biến thể phát âm sinh ra ở trên, các nhà nghiên cứu đã hướng tới lexicon được cải thiện các khiếm khuyết. Stevens,1995; Sloboda và Waibel, 1996 đã đề xuất một lexicon lý tưởng như sau:

ƒ Chứa đầy đủ các từ đủ để mô tả cho miền tiếng nói mẫu, tức là tất cả những từ mà một người có thể sử dụng (gồm cả từ lặng silence và ký hiệu kết thúc).

ƒ Được lưu trữ trong một định dạng tương thích với các dạng dữ liệu âm thanh ghi nhận các tiếng nói.

ƒ Để tự động thích ứng với các phương ngữ của người nói, thông qua áp dụng các quy tắc âm học hoặc cách chuyển đổi (được đưa ra bởi các chuyên gia ngôn ngữ học).

ƒ Cho phép các mục từ vựng được phục hồi khi người nói sửa đổi các mô hình âm thanh cho các từ riêng lẻ.

Một phần của tài liệu Nhận dạng tiếng nói việt nam từ vựng lớn liên tục (Trang 49)

Tải bản đầy đủ (PDF)

(121 trang)