Từ điển phát âm là công cụ lưu trữ cách phát âm của một từ. Nghĩa là gắn với một từ có một hoặc một số cách phát âm. Từ điển phát âm thường được sử dụng để nhận dạng các yếu tố dưới từ (subword). Thực chất từ điển phát âm cũng là một văn phạm với các ký hiệu hằng chính là các âm vị cơ bản và các ký hiệu biến chính là các từ.
trời -> tr ow_f i_f chà -> ch a_f chài -> ch a_f i_f chì -> ch i_f
Bảng 4-2a. Ví dụ về từđiển phát âm
Tiếng Việt là ngôn ngữ phiên âm, do vậy các từ có thể được chia thành các âm cơ bản một cách tự nhiên. Do vậy chúng ta có thể biên soạn từ điển phát âm cho tiếng Việt một cách không khó khăn. Tuy nhiên chúng ta cần chú ý rằng các phương ngữ khác nhau có cách đọc khác nhau, do vậy chúng ta cần các từ điển khác nhau để mô phỏng nếu nhận dạng đa phương ngữ.
trời -> tr ow_f i_f /*Nghệ An*/ | ch ow_f i_f /*Hà nội*/ vô -> v oo /*Hà nội*/ | dz oo /*Sài Gòn */
có -> c o_s /*Hà Nội */ | qu oa_S /*Vĩnh Bảo, o như oa, dấu sắc mạnh */
bảo -> b a_r o_r /*Hà Nội*/ | b au_R u_R /*Vĩnh Bảo, ao như au, dấu hỏi nặng */
Từ điển phát âm có vai trò to lớn trong các hệ nhận dạng. Vì số lượng các từ trong các ngôn ngữ thường rất lớn, trong khi số lượng các âm tiết thường rất nhỏ. Cho nên chúng ta nhận dạng âm tiết kết hợp với từ điển phát âm để nhận dạng từ sẽ cho tốc độ nhanh hơn nhận dạng từ trong nhiều trường hợp.