. P(S1| S1 ) P(S3| S1 ) P(S2| S3 ) P(S3| S2) = π3 a33 a33 a31 a11 a13 a32 a
Bit Tên bit Giá trị khởi tạo
TÓM TẮT LUẬN VĂN
Đề tài “Tổng hợp và nhận dạng tiếng Việt” trên hệ nhúng T-Engine được thực hiện bởi học viên Lã Thế Vinh dưới sự hướng dẫn của TS.Trịnh Văn Loan, đã đặt ra nhiệm vụ xây dựng một hệ thống kết hợp cả chức năng nhận dạng và tổng hợp tiếng Việt trên hệ thống nhúng T-Engine, nhằm hướng đến một ứng dụng tương tác người – máy. Bên cạnh đó tác giả của đề tài cũng đề xuất một số các giải pháp nhằm nâng cao chất lượng của tiếng Việt tổng hợp. Các vấn đề sau đã được tác giả giải quyết trong đề tài:
• Nghiên cứu và tìm hiểu hệ thống nhúng T-Engine, và phát triển ứng dụng trên hệ thống nhúng T-Engine với hệ điều hành nhúng thời gian thực (T- Kernel)
• Các vấn đề về nhận dạng tiếng nói tiếng Việt từ rời rạc
• Các vấn đề về tổng hợp tiếng Việt với số lượng từ vựng không giới hạn
• Kết hợp các module nhận dạng và tổng hợp tiếng Việt trên hệ thống nhúng T-Engine: Tác giả đã hoàn thành việc xây dựng một ứng dụng có khả năng kết hợp cả nhận dạng và tổng hợp tiếng Việt cho phép người dùng tương tác với máy nhờ sử dụng tiếng nói.
• Chất lượng tiếng nói tiếng Việt tổng hợp được đã được cải thiện đáng kể so với các đề tài tổng hợp tiếng Việt được thực hiện trước đó, nhờ việc tác giả đã đưa ra phương pháp ghép nối và cân bằng năng lượng tốt giữa diphone.
TỪ KHÓA: tiếng nói, tổng hợp tiếng việt, hệ nhúng, nhận dạng, t-Engine, psola, hmm, markov, tron, t-kernel, mfcc.
SUMMARY
The target of this thesis is to built a “Embedded Vietnamese speech synthesis and recognition system” with T-Engine embedded system, aimed at human-computer interaction using speech applications. To reach the desired purpose, the author have solved the following involved problems:
• Find out about T-Engine embedded system with T-Kernel realtime operating system, and application development environment on T-Engine.
• Speech recognition problems: feature extraction, pattern recognition model…
• Vietnamese speech synthesis problems: Vietnamese diphones, TD- PSOLA algorithm, and some enhancement in systhesizing Vietnamese speech.
• Implementation: the author have successfully combine the two problems of Vietnamese speech into one product in T-Engine embedded system.
KEYWORD: speech, tts, asr, td-psola, psola, t-engine, embedded system, t-kernel, diphones, concat, markov, hmm, mfcc.