4.2. Phát biểu bài toán nhận dạng
4.2.4. Hệ nhận dạng, bộ nhận dạng và bộ huấn luyện
Từ việc hình thức hố được đầu vào và đầu ra của quá trình nhận dạng như trên, chúng ta sẽ đi đến việc hình thức hố bài tốn nhận dạng. Tất nhiên theo cách mơ hình hố truyền thống, mọi chương trình sẽ được coi như chức năng (function), nhưng ở đây chúng ta có chức năng với đầu vào và đầu ra cụ thể hơn do đó chúng ta cũng có thể mơ hình hố hệ thống cụ thể hơn.
Bộ nhận dạng (recognizer) được coi là ánh xạ từ không gian các tập tin đầu vào tiếng nói vào khơng gian các tập tin đầu ra văn bản. Trong mơ hình tốn học, tri thức nhận dạng được bó gọn trong hàm do đó chúng ta khơng thấy sự xuất hiện của tri thức nhận dạng. Nhưng trong dạng triển khai, chúng ta cần đưa tri thức nhận dạng vào một cách tường minh để mô tả các ràng buộc
recognizer(speakingfile S) → (writingfile T)
recognizer(speakingfile S, knowledgefile K) → (writingfile T)
Bộ huấn luyện (trainer) được coi là ánh xạ từ khơng gian tích các tập tri thức và các tập dữ liệu huấn luyện vào không gian các tập tri thức. Vì thực chất bộ huấn luyện có tác dụng bổ xung hoặc làm mịn tri thức nhận dạng. Trong triển khai chúng ta cũng tách các phần dữ liệu nhận dạng thành tập tin ký hiệu vào và tập tin ký hiệu ra để dễ dàng mô tả các ràng buộc
trainer(knowledgefile K, trainingdata D) → (knowledgefile K')
trainer(knowledgefile K, writingfile T, speakingfile S) → (knowledgefile K') Trong suốt quá trình nghiên cứu, chúng tôi sử dụng khái niệm hệ nhận dạng (recognition system) để chỉ tập hợp các công cụ nhận dạng trong đó có bộ nhận dạng (recognizer) và bộ huấn luyện (trainer). Bộ nhận dạng có vai trị chuyển các tập tin âm thanh thành tập tin văn bản. Bộ huấn luyện có chức năng tạo ra tri thức nhận dạng. Tri thức nhận dạng được tạo ra bằng cách gắn các tập tin dạng nói với tập tin dạng viết tương ứng của nó sao cho hệ thống thơng minh dần lên. Tất nhiên tập tin dạng viết dùng cho huấn luyện thường có dạng đặc biệt và thường gọi là tập tin nhãn, nhưng không phải bao giờ ta cũng cần huấn luyện bằng tập tin được đánh nhãn (labelled file) mà chúng ta có thể chỉ cần tập tin nhãn là văn bản trơn hay không đánh nhãn (unlabelled file). Dưới đây là quan hệ của bộ nhận dạng và bộ huấn luyện.
knowledge file trainer writing file speaking file recognizer speaking file writing file Hình 4-3. Hệ nhận dạng
Trong quá trình đặc tả chức năng của hệ thống, chúng tôi đề cập tới tri thức nhận dạng như là đầu vào của bộ huấn luyện và bộ nhận dạng, nó cũng là một thành phần của hệ thống. Với việc xem xét tri thức nhận dạng một cách tường minh như vậy, chúng ta có thể đưa ra một số ràng buộc như sau:
1) Bộ huấn luyện là ánh xạ từ tập tri thức và dữ liệu nhận dạng sang tập tri thức. Q trình huấn luyện chính là quá trình bổ xung hay chỉnh sửa
trainer(knowledgefile K, writingfile T, speakingfile S) → (knowledgefile K')
2) Quá trình huấn luyện cần không được phép lặp lại, nghĩa là dữ liệu huấn luyện cũ sẽ không làm thay đổi tri thức nhận dạng đã được huấn luyện bởi chính dữ liệu cũ đó.
trainer(trainer(k, t, s), t, s) = trainer(k, t, s)
3) Quá trình huấn luyện là quá trình là quá trình tăng dần, nghĩa là với một tri thức rỗng∅ sau khi huấn luyện chúng ta phải được tri thức không rỗng
trainer(∅, t, d) ≠ ∅
4) Bộ nhận dạng là ánh xạ từ tập tri thức và dữ liệu nhận dạng thành dữ liệu kết quả nhận dạng.
recognizer(speakingfile S, knowledgefile K) → (writingfile T)
5) Bộ nhận dạng phải nhận ra được ít nhất dữ liệu huấn luyện tạo ra bởi chương trình huấn luyện tương ứng với nó