Xây dựng mạng từ nhận dạng

Một phần của tài liệu Nghiên cứu một số phương pháp trong nhận dạng tiếng nói (Trang 93 - 94)

CHƢƠNG 4: XÂY DỰNG HỆ THỐNG NHẬN DẠNG BẰNG HMM

4.3.1Xây dựng mạng từ nhận dạng

Một mạng từ (word network) được định nghĩa dùng ngôn ngữ SLF (Standard Lattice Format). Đó là một tệp văn bản và có thể soạn bằng taỵ Tuy nhiên công việc định nghĩa bằng tay khá dài dòng và mất nhiều công sức. HTK có hai công cụ hỗ trợ để có thể sinh tự động tệp này, đó là HBuild và HParsẹ HParse cho phép sinh tự động SLF từ một tệp văn bản định nghĩa ngữ pháp của hệ thống nhận dạng dưới dạng BNF. Dù công cụ nào được dùng để định nghĩa mạng từ thì mạng từ đều được dùng để định nghĩa một ngữ pháp, mỗi liên hệ ngữ pháp giữa các từ được nhận dạng bởi hệ thống.

Một tệp SLF chứa một danh sách các nút biểu diễn các từ và một danh sách các cung biểu diễn chuyển dịch giữa các từ. Các chuyển dịch này có thể có các xác suất gắn liền với nó, ví dụ các xác suất của mô hình ngôn ngữ bigram. Ví dụ dưới đây là một mạng từ của một hệ thống nhận dạng mười chữ số liên tục và định nghĩa ngữ pháp của nó.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnụedụvn

$chuso = mootj | hai | ba | boons | nawm | saus | baayr | tams | chins | khoong ; (

[sil] < $chuso > [sil] )

Hình 4.9. Sơ đồ ngữ pháp của hệ thống nhận dạng mười chữ số liên tục

Đối với các hệ thống nhận dạng có số lượng từ vựng trung bình và lớn, định nghĩa ngữ pháp của hệ thống thường chỉ đơn thuần là cấu trúc vòng từ (word-loop), có nghĩa là bất kỳ một từ nào trong bộ từ điển của hệ thống đều có thể theo sau từ bất kỳ khác trong từ điển.

Một phần của tài liệu Nghiên cứu một số phương pháp trong nhận dạng tiếng nói (Trang 93 - 94)