Biểu d in tín hi u ting nó

Một phần của tài liệu Tổng hợp tiếng nói sử dụng giải thuật TD PSOLA (Trang 26 - 27)

d. Tham số Formant

2.1.4Biểu d in tín hi u ting nó

Tín hiệu tiếng nói là tín hiệu tương tự. Do đó khi biểu diễn tín hiệu tiếng nói trong môi trường tính toán của tín hiệu số, việc biểu diễn và lưu trữ sao cho không bị mất thông tin là vấn đề hết sức quan trọng trong các hệ thống thông tin có sử dụng tín hiệu tiếng nói. Việc xem xét các vấn đề xử lý tín hiệu tiếng nói trong các hệ thống này dựa trên các vấn đề chính sau đây:

+ Biểu diễn tín hiệu tiếng nói dạng tham số, dạng sóng.

+ Cài đặt các thông số kỹ thuật xử lý, phân tích các lớp ứng dụng dựa trên kỹ thuật xử lý tín hiệu số.

Phần sau trình bày vấn đề biểu diễn tiếng nói dưới dạng số. Mô hình tổng quát các phương pháp biểu diễn tín hiệu tiếng nói được trình bày trên hình 2.3.

Trang 14

Biểu diễn tín hiệu tiếng nói theo dạng số chịu ảnh hưởng quan trọng của lý thuyết lấy mẫu, theo đó các trạng thái của tín hiệu có dải tần giới hạn có thể được biểu diễn dưới dạng các mẫu lấy tuần hoàn theo một chu kỳ cố định gọi là chu kỳ lấy mẫu. Việc lấy mẫu này sẽ cung cấp cho hệ thống những mẫu tín hiệu với tỷ lệ đủ lớn để xử lý. Tất cả các quá trình xử lý lấy mẫu được chỉ rõ trong các tài liệu về xử lý tín hiệu số.

Có nhiều phương pháp biểu diễn rời rạc tín hiệu tiếng nói, hình 2.3 chỉ ra những phương pháp biểu diễn này. Các khả năng biểu diễn như thế được phân thành hai nhóm chính: nhóm biểu diễn tín hiệu dạng sóng (waveform) và nhóm biểu diễn tín hiệu theo tham số (parametric).

+ Phương pháp biểu diễn tín hiệu theo dạng sóng, thông thường là giữ nguyên hình dạng sóng của tín hiệu tương tự sau khi đã qua các bước lấy mẫu và lượng tử hoá tín hiệu.

+ Phương pháp biểu diễn tín hiệu theo tham số thì xem xét đến đầu ra của hệ thống tạo tiếng nói. Để thu được các tham số biểu diễn, bước đầu tiên của phương pháp này lại thường là biểu diễn tín hiệu theo dạng sóng. Điều này có nghĩa là tín hiệu tiếng nói được lấy mẫu và lượng tử hoá giống như phương pháp biểu diễn tín hiệu tiếng nói dạng sóng, sau đó tiến hành xử lý để thu được các tham số của tín hiệu tiếng nói của mô hình tạo tiếng nói nêu trên.

Vì tiếng nói là tín hiệu liên tục nên để áp dụng các phương pháp xử lý tín hiệu số thì tiếng nói phải được biểu diễn dưới dạng rời rạc. Quá trình rời rạc hoá tín hiệu tiếng nói bao gồm các bước sau:

+ Lấy mẫu tín hiệu tiếng nói với tần số lấy mẫu f0. + Lượng tử hoá các mẫu với các bước lượng tử q. + Mã hoá, nén tín hiệu.

Một phần của tài liệu Tổng hợp tiếng nói sử dụng giải thuật TD PSOLA (Trang 26 - 27)