GIỚI THIỆU

Một phần của tài liệu Nghiên cứu công nghệ nhận dạng tiếng nói tiếng việt và ứng dụng (Trang 52 - 53)

HTK (Hidden Markov Model Toolkit) là một tập các công cụ được xây dựng từ mô hình Markov ẩn(HMM). HTK được phát triển bởi đại học Cambridge, đây là công cụ để xây dựng mô hình ngữ âm cho mục đích nhận dạng tiếng nói, mô hình ngữ âm được được biết đó là mô hình HMM. Ngày ngay công cụ HTK được sử dụng nhiều trong học tập và nghiên cứu.

Hình 3.1: Nhận dạng tiếng nói với công cụ HTK

Hệ thống nhận dạng tiếng nói của HTK gồm hai thành phấn chính như được mô tả trung hình vẽ:

- Thành phần đầu tiên là các công cụ để huấn luyện tiếng nói, các công cụ này bao gồm xử lý text, rút trích đặc trưng, xây dựng từ điển âm tiết(phone), xây dựng cây tri-phone và huấn luyện mô hình HMM. Đây là công đoạn quan trọng để cung cấp dữ liệu cho bộ nhận tiếng nói.

- Phần thứ 2 đó là các công cụ hỗ trợ nhận dạng tiếng nói on-line lẫn off- line, âm thanh tiếng nói chưa biết sẽ được chuyển qua bộ nhận dạng, bộ nhận dạng thực hiện tìm kiếm trong tập dữ liệu huấn luyện có biết từ này này không, nếu có sẽ đưa ra kết quả dạng văn bản tương ứng.

được chỉnh sửa cho bài toán tổng hợp tiếng nói có tên là HTS, tuy nhiên phần này sẽ không đi sâu trong đề tài này. Nói chung bộ công cụ HTK cho phép chúng ta dễ dành huấn luyện với nhiều ngôn ngữ khác nhau chỉ cần điều chỉnh một số các thông số thích hợp. Mô hình huấn luyện ứng dụng cho đề tài này được thực hiện trên công cụ HTK có thay đổi phù hợp với ngôn ngữ tiếng nói Tiếng việt.

Một phần của tài liệu Nghiên cứu công nghệ nhận dạng tiếng nói tiếng việt và ứng dụng (Trang 52 - 53)