CHƢƠNG 5 NHẬN DẠNG TIẾNG NÓI
5.7. MỘT SỐ ĐẶC ĐIỂM CỦA VIỆC NHẬN DẠNG TIẾNG VIỆT
Việc xây dựng một hệ thống nhận dạng tiếng Việt một cách chính xác với lƣợng từ vựng lớn và có đáp ứng thời gian thực là rất khó khăn vì tính phức tạp của ngơn ngữ. Cùng một âm vị phát ra bởi nhiều ngƣời sẽ có những đặc điểm về mặt âm học khác nhau. So với ngôn ngữ của nhiều nƣớc, thì tiếng Việt có sự phân hóa về mặt thổ ngữ tƣơng đối lớn. Có một sự thay đổi lớn giữa cách phát âm giữa ba miền Bắc, Trung, Nam. Ngay
trong một miền, ở các vùng địa phƣơng khác nhau cũng có sự phát âm dẫn khác nhau. Thêm nữa, cũng giống nhƣ ngôn ngữ của một số nƣớc khu vực Châu Á, tiếng Việt có thanh điệu. Sự khác biệt giữa các thanh điệu có khi rất nhỏ khi đƣợc phát âm bởi một số vùng miền. Chẳng hạn, phía Bắc có sự phát âm s và x tƣơng đƣơng nhau; hoặc dấu
“?” và “~” đƣợc phát âm giống nhau ở vùng Bắc Trung bộ.
Sự phức tạp này khiến cho những phƣơng pháp nhận dạng của các ngôn ngữ khác không hiệu quả khi áp dụng với tiếng Việt
5.8. CÂU HỎI VÀ BÀI TẬP CUỐI CHƢƠNG
1. Ý tƣởng cơ bản của phƣơng pháp đối sánh mẫu trong nhận dạng tiêng nói? 2. Ý tƣởng cơ bản của phƣơng pháp sử dụng mạng nơ-ron trong nhận dạng tiếng
nói?
3. Ý tƣởng cơ bản của việc sử dụng HMM trong nhận dạng tiếng nói?
4. Sự khác biệt của giác hệ thống nhân dạng tiếng nói: rời rạc và liên tục; nhận dạng tiếng nói và nhận dạng ngƣời nói?
CHƢƠNG 5. NHẬN DẠNG TIẾNG NĨI
5. (Matlab) Sử dụng máy tính cá nhân và phần mềm Matlab (hoặc các ngơn ngữ lập trình khác) thực hiện các cơng việc sau:
- Xây dựng hệ thống nhận dạng tiếng nói đơn giản (từ vựng hạn chế) dựa vào:
o Mạng nơ-ron