Trong phần trên chúng ta đã tìm hiểu về cơ chế hoạt động của bộ máy phát âm. Hoạt động này gồm hai quá trình: nguồn tạo dao động âm và cấu trúc phổ định hình hay còn gọi là bộ lọc. Cơ chế hoạt động có thể tóm lƣợc nhƣ minh họa hình 1.12.
Hình 1.12 Minh họa tóm lƣợc cơ chế phát âm
Để đơn giản trong quá trình phân tích, ngƣời ra thực hiện mô hình hóa quá trình làm việc của bộ máy phát âm nhƣ sơ đồ hình 1.13.
Hình 1.13 Mô hình nguồn-bộ lọc mô phỏng bộ máy phát âm
Trong mô hình này, nguồn tƣơng ứng với dao động dây thanh đƣợc mô tả tƣơng ứng với hai trƣờng hợp: (1) với các âm hữu thanh, dao động dây thanh có tần số cơ bản xác định, khi đó nó đƣợc mô tả bởi một dãy xung tuần hoàn; (2) với các âm vô thanh, dao động dây thanh không xác lập tần số, nó đƣợc mô tả tƣơng ứng nhƣ là nhiễu trắng.
Tín hiệu dao động dây thanh sẽ đƣcc lọc bởi bộ lọc tuyến âm để tạo ra tín hiệu tiếng nói mong muốn. Bản chất bộ lọc tuyến âm là một bộ lọc cơ học (bộ lọc âm), ta có thể mô tả bởi một bộ lọc có đáp ứng xung tƣơng ứng h(n).
Việc xác định hàm đáp ứng xung của bộ lọc tuyến âm tƣơng đối phức tạp. Mặc dù đã có rất nhiều nghiên cứu, cùng với đó là có khá nhiều phƣơng pháp để xấp xỉ bộ lọc này, nhƣng cho đến nay vẫn chƣa có một mô hình hoàn toàn đúng nào đƣợc đề ra. Bởi đặc tuyến của bộ lọc phụ thuộc không những sự co thắt của tuyến âm mà còn phụ thuộc rất lớn vào hiệu quả phát xạ âm tại môi hoặc/và mũi và những tƣơng tác giữa các bộ phận này.
Thông thƣờng, để có thể nhấn đƣợc các đỉnh cộng hƣởng của bộ lọc tuyến âm, ngƣời ta thƣờng xấp xỉ nó bằng bộ lọc toàn điểm cực (all-pole). Bằng cách tổng hợp mạch lọc IIR bậc hai, chúng ta có thể mô tả một cách đầy đủ một tần số formant.
Khi có kể đến khoang mũi, hoạt động của khoang miệng trở nên phức tạp cũng nhƣ sự tƣơng tác giữa khoang miệng và khoang mũi rất khó quan sát. Để đơn giản trong nghiên cứu, ngƣời ta coi khoang mũi là khoang tĩnh, và bỏ qua sự tƣơng tác. Khi đó, khoang mũi đƣợc xem nhƣ một bộ lọc mắc song song với khoang miệng. Quá trình thực nghiệm xác định hàm truyền đạt tổng hợp thƣờng đƣợc tiến hành bằng cách xấp xỉ hàm truyền đạt của từng bộ lọc.