Phân loại hệ thống nhận dạng tiếng nói

Một phần của tài liệu xây dựng hệ thống nhận dạng tiếng việt nói trên nền bộ công cụ kaldi tích hợp mạng nơ ron sâu (Trang 48 - 49)

1. Tổng quan về mạng Nơ ron sâụ

1.2.2.Phân loại hệ thống nhận dạng tiếng nói

Nhận dạng từ liên tục và nhận dạng từ rời rạc

Một hệ thống nhận dạng tiếng nói có thể được chia thành hai dạng là nhận dạng liên tục và nhận dạng từng từ. Nhận dạng liên tục nghĩa là nhận dạng tiếng nói được phát liên tục như một câu, một đoạn. Các hệ thống dạng này rất phức tạp, các từ được phát liên tục khó xử lý nếu cần thời gian thực, hoặc khó tách khi người nói liên tục không có khoảng nghỉ. Kết quả của việc tách từ ảnh hưởng lớn đến các bước sau, vì vậy cần xử lý thật tốt ở bước nàỵ

Đối với nhận dạng từng từ, mỗi từ cần nhận dạng được phát âm một cách rời rạc, có các khoảng nghỉ trước và sau mỗi từ. Mô hình này đơn giản hơn so với nhận

39

dạng liên tục và có một số ứng dụng thực tiễn trong các hệ thống điều khiển bằng lời nói, quay số bằng giọng nói… với độ chính xác caọ

Nhận dạng phụ thuộc người nói và độc lập người nói

Đối với hệ thống nhận dạng phụ thuộc người nói thì mỗi hệ nhận dạng chỉ thực hiện được một người nói, hệ thống sẽ không hiểu người khác nói nếu chưa được huấn luyện. Do đó, hệ thống không được áp dụng rộng rãị Đặc biệt hệ thống này không thể ứng dụng ở nơi công cộng.

Đối với hệ thống nhận dạng độc lập người nói được ứng dụng rộng rãi hơn, đáp ứng được nhiều yêu cầu, nhưng hệ thống gặp vấn đề về độ chính xác. Trong thực tế, giọng của mỗi người là khác nhau, giọng của một người cũng khác nhau ở những thời điểm khác nhaụ Điều này ảnh hưởng rất lớn đến việc nhận dạng, nó làm giảm độ chính xác của hệ thống. Để đảm bảo độ chính xác cao hơn hệ thống này đòi hỏi lượng dữ liệu huấn luyện phải đủ lớn (dữ liệu phải được thu từ nhiều giọng khác nhau của nhiều người). Trong thực tế thường sử dụng hệ thống bán độc lập người nóị Thực hiện bằng cách thu mẫu số lượng lớn người nóị Khi sử dụng hệ thống sẽ được điều chỉnh phù hợp với giọng của người dùng, bằng cách nó học thêm một vài câu chứa các từ cần thiết.

Một phần của tài liệu xây dựng hệ thống nhận dạng tiếng việt nói trên nền bộ công cụ kaldi tích hợp mạng nơ ron sâu (Trang 48 - 49)