Lựa chọn hệ tổng hợp cơ sở

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Nghiên cứu các phương pháp tổng hợp tiếng Việt cho hệ thống có tài nguyên hạn chế (Trang 44 - 45)

Trong phần này, chúng ta sẽ phân tích các ưu, nhược điểm của hai hệ tổng hợp HTS và VnVoice để lựa chọn ra một hệ tổng hợp cơ sở.

Đối với hệ tổng hợp HTS

Để cài đặt bộ tổng hợp HTS, ta cần có các chương trình sau:

 Cygwin

 ActiveTcl

 Festival

 SPTK

 Các gói hỗ trợ bc và sox

 Bộ HTS: HTK-3.4.tar.gz, HDecode-3.4.tar.gz, HTS-2.0_for_HTK- 3.4.tar.bz2

 CSDL tiếng nói: Sử dụng bộ dữ liệu Demen với 567 câu

 HTS_Engine: Để test

Sau khi huấn luyện thành công, ta thu được một bộ các file mô hình. Kích thước tổng cộng khoảng 1MB. Đây là một kích thước có thể nói là phù hợp đối với hệ thống tài nguyên bộ nhớ hạn chế. Với các file mô hình này, có thể sử dụng HTS_Engine để tiến hành tổng hợp tiếng nói. Qua khảo sát thực tế thấy rằng, bộ HTS có thể đọc với chất lượng giọng tổng hợp rất tốt đối với cụm từ dài, các câu và các đoạn văn. Tuy nhiên, với những từ, âm tiết và chữ cái thì rất không tốt. Các hệ thống hạn chế tài nguyên thường chứa các ứng dụng với nhu cầu đọc các từ, cụm từ ngắn như tên đường phố trong hệ thống bản đồ, … Do đó, bộ tổng hợp HTS gốc chưa thực sự phù hợp với các hệ thống tài nguyên hạn chế.

Đối với hệ tổng hợp VnVoice

Hệ tổng hợp VnVoice hiện tại sử dụng CSDL tiếng nói bao gồm tất cả các đoạn tín hiệu dạng PCM 16 bit của 22 phụ âm đầu và 800 vần có thanh điệu. Kích thước CSDL khoảng 5.6MB. VnVoice có thể đọc tốt cả chữ cái, âm tiết, từ, cụm từ, câu hay đoạn văn bản dài. Như vậy, ta có thể tiến hành tối ưu một số thành phần để chuyển VnVoice sang hệ thống tài nguyên hạn chế.

Dựa vào phân tích trên, luận văn quyết định chọn hệ tổng hợp VnVoice để chuyển vào hệ thống hạn chế tài nguyên. Trong các phần tiếp theo của chương, luận văn sẽ trình bày cách thức tối ưu lưu trữ và tính toán một số thành phần trong hệ tổng hợp VnVoice để xây dựng một hệ tổng hợp trên hệ thống hạn chế tài nguyên.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Nghiên cứu các phương pháp tổng hợp tiếng Việt cho hệ thống có tài nguyên hạn chế (Trang 44 - 45)

Tải bản đầy đủ (PDF)

(70 trang)