Phương pháp tiếp cận của chúng tơi có nhiều điểm khác biệt so với các cách tiếp cận trước đây. Các cách tiếp cận trước đây thường dùng các trọng số để cắt đi các nhánh tìm kiếm kém chất lượng hoặc dùng các bảng băm cũng như các từ điển
bó cụm để gia tốc q trình tìm kiếm. Chúng tơi giới hạn và định hướng q trình tìm kiếm bằng cách tích luỹ (accumulate) thông tin nghe được. Phương pháp này dựa trên quá trình nghe tự nhiên ở tai người. Và phương pháp này cũng có lý thuyết chương trình dịch làm cơ sở vững chắc.
Cách tổ chức cơ sở tri thức nhận dạng của chúng tôi dựa trên mạng lưới. Cách tổ chức này không những hỗ trợ đắc lực phương pháp nhận dạng của chúng tơi mà cịn tiết kiệm không gian lưu trữ do mạng lưới có thể chia sẻ các phần giống nhau. Chúng tôi cũng tổ chức các mẫu thành các từ điển cục bộ trong các trạng thái nhằm giảm thời gian tải lên và ghi xuống của từ điển.
Trong suốt q trình nghiên cứu, chúng tơi coi đầu vào của quá trình nhận dạng là một tập tin liên tiếp, nghĩa là mẫu nọ nối tiếp mẫu kia, mà chúng tôi khơng xử lý tồn bộ tập tin một lúc. Quan niệm này dẫn đến nhiều triển khai tối ưu. Thứ nhất chúng tơi khơng cần tải tồn bộ tập tin âm thanh lên một lúc (trong trường hợp nhận dạng tập tin). Và chúng tơi có thể nhận dạng lần lượt các từ khi có tín hiệu từ thiết bị thu thanh (trong trường hợp nhận dạng trực tiếp từ micro).
Chúng tôi cũng phát triển ngữ cảnh của các câu trước với câu sau, cái mà mơ hình ngơn ngữ khơng bao giờ đạt được. Và chúng tôi ứng dụng phát triển này để nhận dạng và chuyển đổi các mệnh lệnh thành các khối tham số. Đây là một ứng dụng khác của nhận dạng tiếng nói, có thể sử dụng vào trong các hệ thơng dịch tự động hoặc các hệ hiểu tiếng nói, và hệ chun gia nói chung.
Chương 2
CƠ SỞ TỐN HỌC
Trong phần này, chúng tôi đưa ra các khái niệm cơ sở. Các khái niệm này xuất hiện ở nhiều nơi trong các phần tiếp theo. Do đó người đọc cần nắm vững các khái niệm trước khi đi vào các phần tiếp theo.
Trong phần này chúng tôi cũng đưa ra triển khai của các khái niệm toán học. Đáng lẽ chúng sẽ được đưa vào phần triển khai của tài liệu, nhưng để tiện cho độc giả theo dõi và đảm bảo tính liền mạch của vấn đề được trình bày, chúng tơi gắn một số phần triển khai vào phần cơ sở toán học. Việc này cịn có một lợi điểm nữa là chúng ta có thể hiểu rõ hơn các khái niệm, vì các khái niệm không những được mô tả bằng ngôn ngữ tự nhiên và ngơn ngữ hình thức trong tốn học mà cịn được mơ tả bằng ngơn ngữ lập trình hay ngơn ngữ định nghĩa dữ liệu vốn quen thuộc và dễ hiểu trong cộng đồng những người làm tin học.