ỨNG DỤNG TỔNG HỢP TIẾNG VIỆ T

Một phần của tài liệu XÂY DỰNG CÔNG CỤKHẢO SÁT ẢNH HƯỞNG CỦA CÁC THAM SỐCƠBẢN ĐẾN CHẤT LƯỢNG TIẾNG NÓI BỘ TỔNG HỢP TIẾNG VIỆT DÙNG TD-PSOLA (Trang 70)

Ứng dụng xây dựng trong luận văn này nhằm mục đích minh hoạ các cơ sở lý thuyết đã trình bày ở những phần trên. Đây được xem như một công cụ thí nghiệm giúp người xử dụng thấy được một cách trực quan quá trình xây dựng và tổng hợp tiếng nói. Đây là một công cụ cho phép khảo sát các tham số cơ bản ảnh hưởng đến chất lượng tiếng nói tổng hợp theo phương pháp TD-PSOLA. Các tham số cơ bản mà ứng dụng cho phép khảo sát bao gồm:

• Tần số cơ bản Fo của tín hiệu: Ứng dụng cho phép thay đổi tần số cơ bản Fo của bất kỳ đoạn tín hiệu nào trên tín hiệu. Dạng tín hiệu sau khi thay đổi tần số có thể được hiển thị trên màn hình hoặc phát ra loa.

• Độ dài của tín hiệu: Ứng dụng cho phép điều chỉnh độ dài của từ tổng hợp. • Năng lượng: Ứng dụng cho phép tăng hoặc giảm năng lượng của bất kỳ

đoạn tín hiệu nào trên tín hiệu. Cho phép thay đổi đường bao của tín hiệu thành một dạng bất kỳ. Cho phép so sánh tín hiệu ban đầu với tín hiệu đã thay đổi năng lượng.

Ngoài chức năng khảo sát, thí nghiệm trên thì đây còn là một công cụ hoàn chỉnh cho phép tổng hợp tiếng nói với các chức năng sau:

• Cho phép xây dựng và quản lý cơ sở dữ liệu diphone từ các file âm thanh *.WAV. Xác định các điểm mốc, điểm phân cách vô thanh hữu thanh cho mỗi diphone.

• Cho phép đọc một đoạn văn bản bất kỳ ra loa. Sau đây là một số mô tả các chức năng của chương trình.

Một phần của tài liệu XÂY DỰNG CÔNG CỤKHẢO SÁT ẢNH HƯỞNG CỦA CÁC THAM SỐCƠBẢN ĐẾN CHẤT LƯỢNG TIẾNG NÓI BỘ TỔNG HỢP TIẾNG VIỆT DÙNG TD-PSOLA (Trang 70)