Tổng hợp Formant theo quy luật

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Áp dụng phương pháp P-SOLA trong tổng hợp tiếng nói tiếng Việt Luận văn ThS. Công nghệ thông tin 1 01 10 (Trang 25 - 28)

3. CHƢƠNG 3: CÁC HỆ THỐNG TỔNG HỢP TIẾNG NĨI

3.2 Các phƣơng pháp tổng hợp tiếng nĩi

3.2.2 Tổng hợp Formant theo quy luật

+ Quá trình phân tích âm thanh tiếng nĩi để tìm ra các quy luật + Tổng hợp tiếng nĩi dựa vào bộ quy luật đã tìm đƣợc

3.2.2.1 Phân tích tìm quy luật

Quá trình phân tích đƣợc tiến hành trên CSDL tiếng nĩi tự nhiên, chủ yếu bao gồm các âm tiết cĩ dạng C-V (phụ âm-nguyên âm) hay C-V-C (phụ âm-nguyên âm- phụ âm) của nhiều giọng nĩi. CSDL này tốt nhất phải đƣợc bao phủ đƣợc tất cả các hình thái ngữ âm của một ngơn ngữ.

Thuật tốn tiên đốn tuyến tính LPC đƣợc sử dụng trong quá trình phân tích phổ để xác định mẫu của tần số formant, băng thơng formant, tần số âm cơ bản F0

của tín hiệu tiếng nĩi. Tần số từ F1 đến F5 và băng thơng W1 đến W5 ở phần ổn định của các âm tố đƣợc lƣu giữ dƣới dạng bảng. Đĩ là các giá trị đích để tạo ra một âm vị. Trong tiếng nĩi, phần mang thơng tin đƣợc quan tâm nghiên cứu nhiều hơn là các phần chuyển tiếp giữa các âm vị từ nguyên âm sang phụ âm và ngƣợc lại (C- V và V-C). Tần số formant chuyển tiếp từ âm vị này sang âm vị kia đƣợc mơ hình hĩa và tạo thành các quy luật tổng hợp cho kỹ thuật tổng hợp formant và sự chuyển tiếp của các formant từ âm vị này sang âm vị khác. Hệ thống quy luật gồm cĩ:

Tiếng nĩi tiếng nĩi Tham số

Phân tích Phân tích Hợp luật Tổng hợp tín hiệu Xử lí tín hiệu Luật tạo tiếng nĩi Ngữ âm

Âm vị và ngơn điệu

Tiếng nĩi

+ Luật để xác định vị trí đích của các formant của mỗi âm vị trong một ngữ lƣu cũng nhƣ thời gian tồn tại của các vị trí đĩ.

+ Luật để làm trơn các formant đích.

+ Luật để chuyển đổi các hàm thời gian thành dạng sĩng âm thanh.

Hệ thống tổng hợp formant sẽ căn cứ vào các tham số điều khiển từ bảng tra cứu và cùng với các thuật tốn đƣợc xây dựng cho sự chuyển tiếp là các tín hiệu điều khiển bộ tổng hợp để tạo ra các âm đoạn tính.

Tổng hợp formant đƣợc phân loại theo cấu hình mắc các bộ cộng hƣởng song song hay nối tiếp. Hàm truyền của bộ tổng hợp khi mắc nối tiếp bộ cộng hƣởng tƣơng tự nhƣ hàm truyền ống thanh. Vì vậy bộ tổng hợp với các bộ cộng hƣởng mắc song song sẽ tạo ra cho các âm tắc, âm xát và âm mũi một chất lƣợng âm thanh tốt hơn.

Một hệ thống tiêu biểu nhƣ vậy là phần mềm Klatt bao gồm việc nối song song và nối tiếp các bộ cộng hƣởng với nhau tạo ra một hệ thống tổng hợp formant khá hồn chỉnh. Phƣơng pháp này sử dụng các giá trị đích của tham số điều khiển và thuật tốn để tính tốn sự chuyển tiếp. Các giá trị đích cho mỗi âm vị khơng chỉ nhận đƣợc từ bảng tra cịn đƣợc tính theo luật về vị trí, cách cấu âm và ngữ cảnh của các âm vị đĩ, các hằng số thời gian cho sự chuyển tiếp đƣợc tính từ các luật về

Bộ tạo xung tuần hồn Mơ hình xung thanh quản G(z) A (v) Mơ hình xung thanh quản G(z) A (n) Mơ hình ống thanh V(z) Mơ hình tán xạ V(z)

thơng tin ngữ cảnh. Ba formant và băng thơng của nguyên âm, bán nguyên âm và nguyên âm đơi đƣợc chuyển cho phần tổng hợp nối tiếp. Hệ thống cịn xác định thêm sáu tham số phụ âm khác để điều khiển phần cộng hƣởng mắc song song khi tổng hợp âm tắc, âm xát, âm tắc xát. (xem thêm [2], trang 787-789)

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Áp dụng phương pháp P-SOLA trong tổng hợp tiếng nói tiếng Việt Luận văn ThS. Công nghệ thông tin 1 01 10 (Trang 25 - 28)

Tải bản đầy đủ (PDF)

(83 trang)