Cân bằng năng lượng

Một phần của tài liệu XÂY DỰNG CÔNG CỤKHẢO SÁT ẢNH HƯỞNG CỦA CÁC THAM SỐCƠBẢN ĐẾN CHẤT LƯỢNG TIẾNG NÓI BỘ TỔNG HỢP TIẾNG VIỆT DÙNG TD-PSOLA (Trang 47 - 49)

Quá trình thu âm diễn ra trong thời gian dài. Suốt quá trình thu, giọng của người phát âm có thể không đồng đều dẫn đến các từ mẫu thu được có mức độ to nhỏ khác nhau. Sau khi xử lý từ mẫu để tạo thành các diphone, các diphone có phân bố năng lượng cũng không bằng nhau, điều này dẫn đến việc khi tổng hợp từ tại điểm ghép nối giữa hai diphone có sự biến đổi đột ngột về năng lượng. Điều này dễ dàng nhận thấy trên dạng thời gian của tín hiệu sau khi tổng hợp, khi phát âm tín hiệu này, bằng tai người cũng có thể nhận ra được sự không đồng đều về năng lượng ở chỗ ghép nối.

Đề tài này đưa ra phương án cân bằng năng lượng giữa các diphone để khi ghép nối thành từ, tại điểm ghép nối không còn sự biến đổi đột ngột về năng lượng. Đề tài này cũng đưa ra công cụ cho phép khảo sát các các hình thức khác nhau về cân bằng năng lượng để người dùng có thể so sánh và lựa chọn hình thức cân bằng giúp tiếng nói tổng hợp đạt chất lượng tốt nhất.

Sau khi khảo sát các phương án cân bằng năng lượng khác nhau và đánh giá kết quả qua việc theo dõi dạng tín hiệu ra trên miền thời cũng như nghe thử tín hiệu, xin đưa ra phương án sau đây được đánh giá là cho ra chất lượng tiếng nói tổng hợp tốt.

Sơ đồ giải thuật cân bằng được mô tả trên hình vẽ sau:

Hình 3.9: Sơđồ giải thuật cân bằng năng lượng

Bắt đầu

Tính năng lượng của mỗi diphone tại điểm ghép nối

Kết thúc

Tính các hệ số tỷ lệ giữa năng lượng của các diphone

với mức năng lượng chuẩn

Nhân tín hiệu mỗi diphone với hệ số tỷ lệ tương ứng

Một số hình vẽ minh hoạ tín hiệu trước và sau khi cân bằng (xử dụng công cụ xây dựng trong đề tài này)

Hình 3.10: Tín hiệu diphone -cha khi chưa cân bằng năng lượng

Hình 3.11: Tín hiệu diphone -cha sau khi cân bằng năng lượng

Hình 3.12 là dạng thời gian của tín hiệu từ chao, ta có thể thấy điểm ghép nối là điểm có biên độ biến đổi đột ngột.

Hình 3.12: Tín hiệu từchao trước khi cân bằng năng lượng

Hình 3.13 là dạng tín hiệu từ chao sau khi đã cân bằng năng lượng giữa 2 diphone. Ta thấy tại điểm ghép nối không còn sự biết đổi đột ngột về biên độ.

CHƯƠNG 4: THIT K XÂY DNG NG DNG TNG HP TING VIT

Một phần của tài liệu XÂY DỰNG CÔNG CỤKHẢO SÁT ẢNH HƯỞNG CỦA CÁC THAM SỐCƠBẢN ĐẾN CHẤT LƯỢNG TIẾNG NÓI BỘ TỔNG HỢP TIẾNG VIỆT DÙNG TD-PSOLA (Trang 47 - 49)