3. CHƢƠNG 3: CÁC HỆ THỐNG TỔNG HỢP TIẾNG NÓI
3.2.2 Tổng hợp Formant theo quy luật
+ Quá trình phân tích âm thanh tiếng nói để tìm ra các quy luật + Tổng hợp tiếng nói dựa vào bộ quy luật đã tìm đƣợc
3.2.2.1 Phân tích tìm quy luật
Quá trình phân tích đƣợc tiến hành trên CSDL tiếng nói tự nhiên, chủ yếu bao gồm các âm tiết có dạng C-V (phụ âm-nguyên âm) hay C-V-C (phụ âm-nguyên âm- phụ âm) của nhiều giọng nói. CSDL này tốt nhất phải đƣợc bao phủ đƣợc tất cả các hình thái ngữ âm của một ngôn ngữ.
Thuật toán tiên đoán tuyến tính LPC đƣợc sử dụng trong quá trình phân tích phổ để xác định mẫu của tần số formant, băng thông formant, tần số âm cơ bản F0
của tín hiệu tiếng nói. Tần số từ F1 đến F5 và băng thông W1 đến W5 ở phần ổn định của các âm tố đƣợc lƣu giữ dƣới dạng bảng. Đó là các giá trị đích để tạo ra một âm vị. Trong tiếng nói, phần mang thông tin đƣợc quan tâm nghiên cứu nhiều hơn là các phần chuyển tiếp giữa các âm vị từ nguyên âm sang phụ âm và ngƣợc lại (C- V và V-C). Tần số formant chuyển tiếp từ âm vị này sang âm vị kia đƣợc mô hình hóa và tạo thành các quy luật tổng hợp cho kỹ thuật tổng hợp formant và sự chuyển tiếp của các formant từ âm vị này sang âm vị khác. Hệ thống quy luật gồm có:
Tiếng nói tiếng nói Tham số
Phân tích Phân tích Hợp luật Tổng hợp tín hiệu Xử lí tín hiệu Luật tạo tiếng nói Ngữ âm
Âm vị và ngôn điệu
Tiếng nói
+ Luật để xác định vị trí đích của các formant của mỗi âm vị trong một ngữ lƣu cũng nhƣ thời gian tồn tại của các vị trí đó.
+ Luật để làm trơn các formant đích.
+ Luật để chuyển đổi các hàm thời gian thành dạng sóng âm thanh.
Hệ thống tổng hợp formant sẽ căn cứ vào các tham số điều khiển từ bảng tra cứu và cùng với các thuật toán đƣợc xây dựng cho sự chuyển tiếp là các tín hiệu điều khiển bộ tổng hợp để tạo ra các âm đoạn tính.
Tổng hợp formant đƣợc phân loại theo cấu hình mắc các bộ cộng hƣởng song song hay nối tiếp. Hàm truyền của bộ tổng hợp khi mắc nối tiếp bộ cộng hƣởng tƣơng tự nhƣ hàm truyền ống thanh. Vì vậy bộ tổng hợp với các bộ cộng hƣởng mắc song song sẽ tạo ra cho các âm tắc, âm xát và âm mũi một chất lƣợng âm thanh tốt hơn.
Một hệ thống tiêu biểu nhƣ vậy là phần mềm Klatt bao gồm việc nối song song và nối tiếp các bộ cộng hƣởng với nhau tạo ra một hệ thống tổng hợp formant khá hoàn chỉnh. Phƣơng pháp này sử dụng các giá trị đích của tham số điều khiển và thuật toán để tính toán sự chuyển tiếp. Các giá trị đích cho mỗi âm vị không chỉ nhận đƣợc từ bảng tra còn đƣợc tính theo luật về vị trí, cách cấu âm và ngữ cảnh của các âm vị đó, các hằng số thời gian cho sự chuyển tiếp đƣợc tính từ các luật về
Bộ tạo xung tuần hoàn Mô hình xung thanh quản G(z) A (v) Mô hình xung thanh quản G(z) A (n) Mô hình ống thanh V(z) Mô hình tán xạ V(z)
thông tin ngữ cảnh. Ba formant và băng thông của nguyên âm, bán nguyên âm và nguyên âm đôi đƣợc chuyển cho phần tổng hợp nối tiếp. Hệ thống còn xác định thêm sáu tham số phụ âm khác để điều khiển phần cộng hƣởng mắc song song khi tổng hợp âm tắc, âm xát, âm tắc xát. (xem thêm [2], trang 787-789)