Các lưới từ rất mềm dẻo. Chẳng hạn, lưới từ có thể được đánh giá lại điểm số bằng cách sử dụng lưới từ đó như mạng nhận dạng đầu vào và lưới từ có thể được mở rộng cho phép đánh giá lại điểm số theo mơ hình ngơn ngữ bậc cao hơn. Lưới từ cũng có thể được thu gọn thành cách biểu diễn rất hiệu quả gọi là mạng nhầm lẫn [44, 91]. Hình 4.7 minh họa mạng nhầm lẫn trong đó dấu "-" là nhãn của cung khơng có chuyển biến trạng thái nào. Trong mạng nhầm lẫn, các nút khơng cịn tương ứng với các điểm rời rạc theo thời gian nữa, mà đơn giản chỉ là ép ràng buộc dãy từ. Như vậy, các cung song song trong mạng nhầm lẫn không nhất thiết phải ứng cùng một đoạn âm học. Tuy nhiên, giả thiết khi phân tích đặc trưng, thời gian chồng lấn giữa các cửa sổ là đủ lớn để coi các cung song song là các giả thiết cạnh tranh với nhau. Mạng nhầm lẫn có thuộc tính là với mỗi đường đi qua lưới ban đầu sẽ có đường tương ứng đi qua mạng nhầm lẫn. Mỗi cung trong mạng nhầm lẫn mang xác suất hậu nghiệm của từ tương ứng 𝑤.
Xác suất này được tính bằng cách tìm kiếm xác suất liên kết của 𝑤 trong lưới theo thủ tục forward–backward, lấy tổng tất cả các xuất hiện của 𝑤 và chuẩn hóa sao cho tất cả các cung từ cạnh tranh trong mạng nhầm lẫn có tổng bằng một. Các mạng nhầm lẫn có thể dùng như là các bộ giải mã lỗi từ cực tiểu [6] nhằm cung cấp điểm số tin cậy và trộn các đầu ra của các bộ giải mã khác nhau [43, 52, 62, 67].
Phương pháp lưới từ hậu nghiệm đã được dùng để cải thiện hiệu năng của hệ thống nhận dạng tiếng Việt (công bố số 2 của luận án). Nghiên cứu trong (công bố số 2) đã nhận dạng tiếng Việt nói với bộ cơng cụ HTK. HTK là hệ thống nhận dạng tiếng nói cho phép tạo ra giả thiết về lưới từ kết quả (bằng công cụ HVITE). Cấu trúc của lưới từ được mơ tả trên Hình 4.8.
Thuật giải cơ bản để xử lý lưới từ là thuật giải quy hoạch động. Để cải thiện hiệu năng của hệ thống nhận dạng bằng cách tối ưu hóa lưới từ, luận án đề xuất phương pháp tích hợp mơ hình ngơn ngữ trigram vào q trình xử lý lưới từ. Mơ hình ngơn ngữ trigram có rất nhiều bigram (𝑃(𝑊2|𝑊1)) và trigram (𝑃(𝑊3|𝑊1𝑊2)). Vì vậy, cần có phương pháp để có thể truy nhập nhanh các N-gram này trong quá trình xử lý lưới từ. Các bước xử lý như sau: I HAVE MOVE - - VERY VEAL IT FINE OFTEN FAST
115 - Bước 1. Sắp xếp các N-gram.
- Bước 2. Đánh chỉ số các N-gram.
- Bước 3. Lưu trữ các N-gram và các chỉ số vào các file nhị phân.
- Bước 4. Xây dựng mơ đun tìm kiếm các N-gram từ các file nhị phân này.