Chương 5 Nhận dạng chữ viết tay bằng mô hình Markov ẩn 5.1 Giới thiệu
5.2. Mô hình HMM với các kiểu viết khác nhau
Trong trường hợp đơn giản nhất chúng ta sử dụng một HMM cho một lớp kí tự. Nhưng vấn đề xảy ra khi ứng với một kí tự nhất định, không chỉ có một kiểu viết (writing lexemes). Các kiểu viết khác nhau sẽ khác nhau hoàn toàn về thứ tự các nét bút, các đặc trưng cơ bản của nét bút. Trong khi mô hình Markov ẩn lại được xây dựng trên giả thuyết là dữ liệu có phân bố Gauss. Nhưng các kiểu viết nhau khác nhau khi được sử dụng để huấn luyện cho một HMM duy nhất sẽ khiến giả thuyết về phân bố Gauss không thỏa mãn. Ví dụ, một số các cách viết kí tự "b" gây khó khăn cho quá trình trích chọn đặc trưng và huấn luyện mô hình Markov ẩn
Một cách được đề xuất ở [18] để giải quyết trường hợp này là chúng ta sẽ sử dụng nhiều mô hình Gauss cho một lớp kí tự, mỗi mô hình Gauss sẽ sử dụng các mẫu tương tự nhau để huấn luyện. Cụ thể hơn, với mỗi lớp kí tự C, gọi H là tập tất cả các mẫu được sử dụng trong huấn luyện. Bằng cách sử dụng thuật toán phân cụm K - trung bình (K - Mean Clustering, MacQueen, 1967) dựa trên các vector trích chọn đặc trưng theo biến đổi DCT, với mỗi cụm thu được, các mẫu thuộc cụm đấy sẽ được dùng để huấn luyện một mô hình Markov ẩn. Tuy nhiên, độ tốt của kết quả đạt được lại phụ thuộc khá nhiều vào quá trình phân cụm K - Mean Clustering.
5.3. Kết luận
Trên đây là phương pháp áp dụng mô hình Markov ẩn vào bài toán nhận dạng kí tự viết tay dựa trên rích chọn đặc trưng theo biến đổi DCT. Điểm yếu của phương pháp sử dụng mô hình Markov ẩn nằm ở giả thuyết dữ liệu có phân bố Gauss. Vì thế mô
hình Markov ẩn đòi hỏi phải có một số lượng lớn các mẫu dữ liệu huấn luyện để tìm được chính xác sự phân bố này, và đồng thời, nếu dữ liệu thật sự không tuân theo phân bố Gauss thì kết quả đạt được sẽ không cao. Kết quả thực nghiệm trong chương 6 sẽ chỉ ra rõ hạn chế này. Chương tiếp theo sẽ trình bày một phương pháp phân đoạn dựa trên Quy hoạch động để giải quyết bài toán nhận dạng từ viết tay trực tuyến.