Việc giới hạn nhận dạng trên các từ đơn âm tiết sẽ làm quá trình nhận dạng dễ dàng và khả thi hơn, xem bài [13]. Ví dụ như câu các “the cat is bad”, “he goes to the shop”, hoặc “take it to the room”. Nhưng bản thân tiếng Việt đã là ngôn ngữ đơn âm tiết, nghĩa là với mỗi một tiếng chúng ta cho ra một từ. Ở đây chúng tôi sử dụng khái niệm tiếng để chỉ đoạn âm thanh có điểm đầu (onset), đoạn thân (nuclear) và phần kết (coda). Và chúng tôi sử dụng khái niệm từ để chỉ một dãy các ký tự có hoặc không có phụ âm đầu, các nguyên âm chính, và có thể có phụ âm cuối. Do đó luôn luôn có một sự tương ứng giữa một từ và một tiếng.
Nhìn vào hình vẽ tín hiệu, chúng ta thậm chí có thể đưa ngay ra thuật toán nhận dạng các từ rời rạc dùng cho tiếng Việt, ví dụ như thuật toán
1) Cắt các từ dựa vào biên độ
2) Tham số hoá từ vừa cắt thành bộ tham số tương ứng 3) Tìm kiếm bộ tham số khớp nhất trong từ điển
4) Nếu tìm thấy đưa ra từ tương ứng của bộ tham số 5) Lặp lại từ bước 1 nếu như còn tín hiệu
Thuật toán này tất nhiên không thể dùng với các ngôn ngữ đa âm tiết như tiếng Anh, tiếng Pháp, vì ranh giới mà chúng ta cắt một đoạn âm thanh (một âm tiết) không phải ranh giới của một từ. Nếu chúng ta cố gắng dùng thuật toán trên với tiếng Anh, thì câu nói “I wonder” với kết quả chính xác nhất cũng chỉ là “I won the”