Tổng hợp mức thấp

Một phần của tài liệu Luận văn: Tổng hợp tiếng Việt bằng giải thuật TD-PSOLA pot (Trang 31 - 32)

c. Ngôn điệu

2.2.2. Tổng hợp mức thấp

Tổng hợp mức thấp là quá trình kết hợp các đoạn tín hiệu (ví dụ như diphone). Các đoạn tín hiệu này đã được phân tích, xử lý qua mức cao (xử lý văn bản, ngữ điệu).

Đối với phương pháp tổng hợp bằng cách mô phỏng hệ thống phát âm của con người thì sự chọn lựa dữ liệu và thực thi các luật là rất phức tạp. Hầu như không thể mô phỏng dưới dạng mô hình khối, sự chuyển động của lưỡi... một cách hoàn hảo. Lúc này, sự có mặt của máy tính đã trợ giúp một phần đáng kể.

Với tổng hợp formant thì tập luật để điều khiển tần số cơ bản, biên độ và đặc trưng của tín hiệu nguồn lại rất lớn. Vì vậy làm mất đi tính tự nhiên vốn có. Đặc biệt, âm mũi được xem là một vấn đề lớn đối với tổng hợp formant.

Còn với tổng hợp ghép nối thì việc thu thập các mẫu tín hiệu và gán nhãn mất rất nhiều thời gian, và có thể làm cho cơ sở dữ liệu rất lớn. Tuy nhiên số lượng dữ liệu có thể giảm xuống đáng kể nếu sử dụng những phương pháp nén dữ liệu thích hợp. Bên cạnh đó sự không đồng bộ các điểm ghép nối cũng có thể làm tín hiệu tổng hợp bị méo. Đối với những đơn vị ghép nối dài như từ

Ngôn điệu Cảm giác - Tức giận - Hạnh phúc

Nghĩa của câu - Bình thường -Câu mệnh lệnh Đặc trưng người nói

- Giới tính - Độ tuổi

-Tần số cơ bản -Khoảng thời gian - Độ nhấn mạnh

hoặc âm vị thì hiệu quả kết hợp là một vấn đề, ngoài ra bộ nhớ và hệ thống cũng là một khó khăn cần giải quyết.

Một phần của tài liệu Luận văn: Tổng hợp tiếng Việt bằng giải thuật TD-PSOLA pot (Trang 31 - 32)

Tải bản đầy đủ (PDF)

(92 trang)