Mô hình ngôn ngữ trong HTK

Mô hình ngôn ngữ kết hợp với mô hình ngữ âm sẽ đưa ra kết quả nhận dạng tốt hơn, ví dụ như kết quả được nhận dạng của mô hình ngữ âm là từ “học hồ“ tuy nhiên trong thực tế rất ít có từ nào như vậy, do đó khi kết hợp với mô hình ngôn ngữ cho ra kết quả là việc so sánh hai từ có khả năng nhất trong kho từ

là “học hành“ và “học hồ“ thì từ “học hành“ cho xác xuất lớn hơn và do đó kết quả chính thức của hệ thống nhận dạng là từ “học hành“.

Mô hình ngôn ngữ được biểu diễn qua mạng ngữ nghĩa cho các từ có thể nhận dạng được thông qua hệ thống, một mạng ngữ nghĩa được tập hợp theo mô hình xác xuất, tính toán từ đi trước từ đi sau theo thống kê của dữ liệu thực tế cũng như văn phạm trong câu, các đường truyền từ trạng thái này sang trạng thái kia được biểu diễn bằng hàm xác xuất cho biết khả năng xác xuất từ này sang từ kia là bao nhiều đây là cơ sở để xác định từ đúng nhất. Trong HTK có một số công cụ được sử dụng cho công việc này là HParse, HSGen, HLStats.

HParse: dùng để chuyển một tập tin văn phạm sang một mạng ngữ nghĩa và có thể xảy ra theo một trật tự nhất định.

HGen: Chuyển tập tin văn theo mạng ngữ nghĩa nhất định sang một dãy từ theo đúng trình tự.

HLStats: đọc danh sách HMM và tập phiên âm tương ứng, tính toán thống kê khác nhau từ đó phân tích dữ liệu huấn luyện ngữ âm và phát sinh các mô hình ngôn ngữ đơn giản dùng để nhận dạng.

PHÂN TÍCH CÔNG CỤ QUAN TRỌNG HTK

Giới thiệu tổng đài Asterisk