trả ra kết quả ngày càng tệ. Bộ công cụ Kaldi cho kết quả nhận dạng rất tốt với
40.62 40.02 24.59 24.55 21.52 21.58 18.47 18.4 0 5 10 15 20 25 30 35 40 45 32196 32196
Biểu đồ kết quả huấn luyện lần 4
Bảng 7: Kết quả quá trình đào tạo huấn luyện sau khi sử dụng phương pháp cải
thiện về language model
Dựa vào bảng trên chúng ta có biểu đồbiểu diễn vềsự tăng giảm điểm sốcủa kếtquả huấn luyện dữ liệu lần 4: quả huấn luyện dữ liệu lần 4:
Sơ đồ4: Biểu đồthể hiện sự tăng giảm của việc huấn luyện dữ liệu lần 4
Nhận xét: Sau khi thay đổi dữ liệu văn bản tương ứng, điểm số WER có kếtquả giảm dần từ ~0.1 đến ~1% quả giảm dần từ ~0.1 đến ~1%
5.Kết luận
Bài báo này đã mô tả phương pháp xây dựng hệthống nhận dạng tiếng Việt nói sửdụng bộcông cụKaldi dựa trên 4 lần huấn luyện đào tạo bằng các phương pháp sửdụng bộcông cụKaldi dựa trên 4 lần huấn luyện đào tạo bằng các phương pháp
cải tiến khác nhau nhằm đưa ra giải pháp cải thiện về chất lượng nhận dạng tiếng
nói. Chúng tôi đã thử nghiệm các phương pháp huấn luyện mô hình âm học khác
nhau được hỗ trợ bởi Kaldi. Các trọng số của mô hình ngôn ngữ cũng được xem
xét và đánh giá. Các thử nghiệm các giải pháp cải thiện được hệ thống ASR Kaldi giúp giải đáp các thắc mắc khó khăn khi gặp phải trường hợp huấn luyện hệ thống giúp giải đáp các thắc mắc khó khăn khi gặp phải trường hợp huấn luyện hệ thống trả ra kết quả ngày càng tệ. Bộ công cụ Kaldi cho kết quả nhận dạng rất tốt với
40.62 40.02 24.59 24.55 21.52 21.58 18.47 18.4 0 5 10 15 20 25 30 35 40 45 32196 32196
Biểu đồ kết quả huấn luyện lần 4
mono tri1 tri2b tri3b
Nhận xét: Sau khi thay đổi dữ liệu văn bản tương ứng, điểm số WER có kết quả giảm dần từ ~0.1 đến ~1%
5. Kết luận
Bài báo này đã mô tả phương pháp xây dựng hệ thống nhận dạng tiếng Việt nói sử dụng bộ công cụ Kaldi dựa trên 4 lần huấn luyện đào tạo bằng các phương pháp cải tiến khác nhau nhằm đưa ra giải pháp cải thiện về chất lượng nhận dạng tiếng nói. Chúng tôi đã thử nghiệm các phương pháp huấn luyện mô hình âm học khác nhau được hỗ trợ bởi Kaldi. Các trọng số của mô hình ngôn ngữ cũng được xem xét và đánh giá. Các thử nghiệm các giải pháp cải thiện được hệ thống ASR Kaldi giúp giải đáp các thắc mắc khó khăn khi gặp phải trường hợp huấn luyện hệ thống trả ra kết quả ngày càng tệ. Bộ công cụ Kaldi cho kết quả nhận dạng rất tốt với tiếng Việt nói. Ngoài ra các yếu tố như mô hình ngôn ngữ, mô hình âm thanh là một tham số quan trọng trong việc xây dựng hệ thống và cải thiện chất lượng nhận dạng.
TÀI LIỆU THAM KHẢO
[1]. Kaldi-asr.org.
[2]. Kaldi Troubleshooting Head-to-Toe- jrmeyer
27
TẠP CHÍ KHOA HỌC
QUẢN LÝ VÀ CÔNG NGHỆ
QUẢN LÝ - KINH TẾ