2. Các âm vị khác
4.3.2 Một hướng phát triển dựa trên mạng neuro n Mô hinh lai ANN/HMM (Artificial Neural Network/Hidden Marko
Mô hinh lai ANN/HMM (Artificial Neural Network/Hidden Markov Model)
Mô hình sử dụng RTDNN một cách trực tiếp như được mô tả ở trên là một mô hình kinh điển, được nghiên cứu ngay từ thời gian đầu phát triển công cụ mạng neuron cho nhận dạng tiếng nói. Trong quá trình nghiên cứu, người ta thấy rằng, với trình độ phát triển hiện nay của Lý thuyết mạng neuron cũng như các lĩnh vực liên quan khác, còn có nhiều khó khăn trong việc xây dựng một hệ thống thuần tuý mạng nueron có khả năng nhận dạng một cách có hiệu quả các quá trình động như tín hiệu tiếng nói, đặc biệt là những hạn chế về quy mô mạng do khả năng lưu trữ. Chính vì thế, nhiều nghiên cứu quan trọng hiện nay đi theo hướng tích hợp mạng neuron với các phương pháp khác nhằm tăng tính năng bộ nhận dạng. Một mô hình cũng được coi là kinh điển trong hướng nghiên cứu này là mô hình lai ANN/HMM (Artificial Neural Network/Hidden Markov Model). (Trong phần này có sử dụng một số kiến thức về HMM mà chưa được đề cập tới trong bản luận văn, để có thể hiểu được chúng bạn đọc nên tham khảo các sách chuyên về Lý thuyết nhận dạng tiếng nói)
Trong mô hình này, ANN được sử dụng để đánh giá các xác suất cho các âm vị; và xác suất này được sử dụng bởi HMM. Đầu ra của ANN sẽ được biểu diễn như các xác suất âm vị thuộc một quan sát p(ci|O) và các xác suất quan sát p(O|ci) theo quy tắc xác suất Bayes. Các tần số lớp p(ci) được đánh giá trước từ tập hợp tích luỹ và xác suất quan sát không điều kiện p(O) là hằng số cho tất cả các lớp.
Chương 5