Có rất nhiều phương pháp nhận dạng được đưa ra, xem [19], [23], và [21], nhưng về cơ bản chúng đều tìm cách tổ chức khơng gian mẫu và tìm kiếm trên khơng gian mẫu. Giả sử chúng ta có từ điển mẫu, nghĩa là một tập hợp các cặp mẫu và từ tương ứng với mẫu. Với mỗi tập tin âm thanh, chúng ta sẽ tiến hành nhận dạng nó bằng cách tìm mẫu tương ứng trong trong tập tin và đưa ra từ tương ứng nếu tìm thấy theo đúng thứ tự từ đầu đến cuối tập tin âm thanh. Nhược điểm lớn nhất của phương pháp này là cần phát hiện được đầu của từ và thao tác trên tất cả các mẫu trên từ điển. Thuật toán trong bảng 4-5 minh hoạ về cách hoạt động của phương pháp này. Tất nhiên đây chỉ là nguyên tắc cơ bản. Trên thực tế, không ai triển khai hệ thống như vậy
void recognize(speakingfile inf, writingfile outf, dictionary kbf) {
while( ! is_end_of(inf) ) {
for(i=0; i<card(kbf); i++) if( is_left_of(pattern(kbf, i), inf) ) break;
if(i<card(kbf)) { print(outf, word(p)); advance(inf, length(p)); } else advance(inf, 1); }
}
Bảng 4-5. Thuật toán nhận dạng dựa trên từ điển
Trong đó điều kiện dừng là duyệt hết tập tin đầu vào thông qua kiểm tra is_end_of và quan trọng nhất là phép so sánh một mẫu nằm bên trái của tập tin thông qua kiểm tra is_left_of để tìm thấy mẫu. Chúng ta có thể nhìn ví dụ bên dưới để thấy các bước chuyển trạng thái của thuật toán với đầu vào và đầu ra cụ thể. Để cho dễ nhìn, chúng tơi biến các véc tơ đặc trưng thành các ký tự và chúng tôi cắt phần đã được duyệt của tập tin đầu vào để độc giả chỉ ln nhìn thấy phần đầu đang được xét của tập tin.
Tập tin đầu vào Tập tin đầu ra
t o i - - - d d i i - - c c d - -
- - - d d i i - - c c d - - tôi
- d d i i - - c c d - - tôi
d d i i - - c c d - - tôi
- - c c d - - tôi đi
- c c d - - tôi đi
c c d - - tôi đi
- - tôi đi chơi
- tơi đi chơi
Bảng 4-6. Ví dụ về thuật toán nhận dạng dựa trên từ điển
Tất nhiên chúng ta hồn tồn có thể cài đặt thuật tốn đơn giản như vậy trực tiếp bằng ngơn ngữ lập trình. Nhưng thuật tốn như vậy khơng đảm bảo chính xác cũng như tốc độ khi số lượng mẫu tăng lên. Do đó chúng tơi đưa ra các cải tiến của thuật toán nhận dạng trên các cải tiến của các thuật toán huấn luyện tương ứng.
Để huấn luyện được từ điển tìm kiểm như vậy, chúng ta chỉ cần một cách để xác định sự tương ứng giữa một đoạn tín hiệu với một ký hiệu ra, sau đó ta thêm vào từ điển ký hiệu ra trước, và thêm vào đoạn tín hiệu (đã được tham số hố) tham chiếu tới ký hiệu ra đó.