Xét và đánh giá Các thử nghiệm các giải pháp cải thiện được hệ thống ASR Kaldi giúp giải đáp các thắc mắc khó khăn khi gặp phải trường hợp huấn luyện hệthống

Một phần của tài liệu Tap chi so 14 (Trang 25 - 27)

trả ra kết quả ngày càng tệ. Bộ công cụ Kaldi cho kết quả nhận dạng rất tốt với

40.62 40.02 24.59 24.55 21.52 21.58 18.47 18.4 0 5 10 15 20 25 30 35 40 45 32196 32196

Biểu đồ kết quả huấn luyện lần 4

Bng 7: Kết quả quá trình đào tạo huấn luyện sau khi sử dụng phương pháp cải

thiện về language model

Dựa vào bảng trên chúng ta có biểu đồbiểu diễn vềsự tăng giảm điểm sốcủa kếtquả huấn luyện dữ liệu lần 4: quả huấn luyện dữ liệu lần 4:

Sơ đồ4: Biểu đồthể hiện sự tăng giảm của việc huấn luyện dữ liệu lần 4

Nhn xét: Sau khi thay đổi dữ liệu văn bản tương ứng, điểm số WER có kếtquả giảm dần từ ~0.1 đến ~1% quả giảm dần từ ~0.1 đến ~1%

5.Kết lun

Bài báo này đã mô tả phương pháp xây dựng hệthống nhận dạng tiếng Việt nói sửdụng bộcông cụKaldi dựa trên 4 lần huấn luyện đào tạo bằng các phương pháp sửdụng bộcông cụKaldi dựa trên 4 lần huấn luyện đào tạo bằng các phương pháp

cải tiến khác nhau nhằm đưa ra giải pháp cải thiện về chất lượng nhận dạng tiếng

nói. Chúng tôi đã thử nghiệm các phương pháp huấn luyện mô hình âm học khác

nhau được hỗ trợ bởi Kaldi. Các trọng số của mô hình ngôn ngữ cũng được xem

xét và đánh giá. Các thử nghiệm các giải pháp cải thiện được hệ thống ASR Kaldi giúp giải đáp các thắc mắc khó khăn khi gặp phải trường hợp huấn luyện hệ thống giúp giải đáp các thắc mắc khó khăn khi gặp phải trường hợp huấn luyện hệ thống trả ra kết quả ngày càng tệ. Bộ công cụ Kaldi cho kết quả nhận dạng rất tốt với

40.62 40.02 24.59 24.55 21.52 21.58 18.47 18.4 0 5 10 15 20 25 30 35 40 45 32196 32196

Biểu đồ kết quả huấn luyện lần 4

mono tri1 tri2b tri3b

Nhận xét: Sau khi thay đổi dữ liệu văn bản tương ứng, điểm số WER có kết quả giảm dần từ ~0.1 đến ~1%

5. Kết luận

Bài báo này đã mô tả phương pháp xây dựng hệ thống nhận dạng tiếng Việt nói sử dụng bộ công cụ Kaldi dựa trên 4 lần huấn luyện đào tạo bằng các phương pháp cải tiến khác nhau nhằm đưa ra giải pháp cải thiện về chất lượng nhận dạng tiếng nói. Chúng tôi đã thử nghiệm các phương pháp huấn luyện mô hình âm học khác nhau được hỗ trợ bởi Kaldi. Các trọng số của mô hình ngôn ngữ cũng được xem xét và đánh giá. Các thử nghiệm các giải pháp cải thiện được hệ thống ASR Kaldi giúp giải đáp các thắc mắc khó khăn khi gặp phải trường hợp huấn luyện hệ thống trả ra kết quả ngày càng tệ. Bộ công cụ Kaldi cho kết quả nhận dạng rất tốt với tiếng Việt nói. Ngoài ra các yếu tố như mô hình ngôn ngữ, mô hình âm thanh là một tham số quan trọng trong việc xây dựng hệ thống và cải thiện chất lượng nhận dạng.

TÀI LIỆU THAM KHẢO

[1]. Kaldi-asr.org.

[2]. Kaldi Troubleshooting Head-to-Toe- jrmeyer

27

TẠP CHÍ KHOA HỌC

QUẢN LÝ VÀ CÔNG NGHỆ

QUẢN LÝ - KINH TẾ

Một phần của tài liệu Tap chi so 14 (Trang 25 - 27)

Tải bản đầy đủ (PDF)

(90 trang)