Ngồi ra mơ hình hố q trình kích thích của luồng khơng khí từ phổi đi qua thanh quản lên cơ quan phát âm cũng rất quan trọng. Tuỳ theo loại âm thanh mà có cách mơ hình hố thích hợp để tiếng nói sau khi tái tạo đạt được chất lượng theo u cầu.
1.3.2.2. Các tính chất cơ bản của tiếng nói
Trong kỹ thuật mã hố tiếng nói, dựa vào dao động của các dây thanh âm có thể chia tiếng nói ra thành hai loại âm chính sau đây:
Âm hữu thanh (voiced sound): âm hữu thanh được tạo ra khi các dây thanh âm
dao động đóng mở làm ngắt qng luồng khơng khí và sự ngắt quãng này được xem gần như là tuần hoàn tác động lên cơ quan phát âm. Trong thực tế chu kì tuần hồn này khoảng từ 2 -20ms. Do đó với âm hữu thanh, tín hiệu kích thích được mơ hình hố là các xung tuần hồn.
Âm vơ thanh (unvoiced sound): âm vô thanh được tạo ra khi luồng khơng khí đi
qua thanh mơn tác động lên cơ quan phát âm không theo một qui luật nào cả (không tuần hồn). Do đó với âm vơ thanh, tín hiệu kích thích được mơ hình hố tương tự như tín hiệu ngẫu nhiên (nhiễu).
Nhìn chung, các âm của tiếng nói là một trong hai loại âm trên hoặc là sự kết hợp của chúng. Theo thống kê, với tiếng nói của các ngơn ngữ trên thế giới thì phần lớn là các âm là hữu thanh. Một số ngơn ngữ trong đó có tiếng Việt, hầu như chỉ tồn âm
hữu thanh. Thí nghiệm với tiếng Việt cho thấy có thể chỉ dùng hồn tồn âm hữu thanh mà vẫn khơng làm ảnh hưởng đến ngữ nghĩa của lời nói.
Để mã hóa và tái tạo tiếng nói, có thể mơ hình hóa các tham số thể hiện sự kích khơng khí từ phổi và giao động qua thanh quản bằng các tham số sau:
Sự kích thích từ phổi tạo ra thay bằng nhiễu ngẫu nhiên.
Dao động của thanh quản (Khoang họng) được mơ hình bằng các bộ lọc tạo chu kỳ ‘Pitch’.
Khoang tạo âm (Khoang miệng – Khoang mũi) được mơ hình bằng bộ lọc LPC.
Hình 1.12 dưới đây mơ hình hóa này:
Speech
Hình 1.12. Mơ hình hóa q trình tạo tiếng nói của con người [9b]
1.3.3. Các phương pháp mã hố tiếng nói cơ bản
Mã hố tiếng nói được chia ra thành ba loại chính là mã hố dạng sóng, mã hố nguồn và mã hoá lai. Tốc độ bit và chất lượng tiếng nói sau khi tổng hợp lại của các bộ mã hố này được biểu diễn ở Hình 1.13.
Nhiễu trắng Pitchs
Voice
Gain LPC Filter