Mô hình nhận dạng và huấn luyện

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Nhận diện chữ viết tay bằng mô hình markov ẩn (Trang 82)

Gọi N là số phân lớp trong hệ thống cần nhận dạng (ở đây chính là tập các chữ hoa in và chữ thƣờng đã đƣợc liệt kê bên trên, và N=84).

Ta xây dựng N mô hình Markov ẩn, mỗi mô hình đại diện cho một phân lớp. Gọi tên các mô hình lần lƣợc là: 1 , 2 ,..., N .

Gọi O là dãy các vector nhận đƣợc trong quá trình trích chọn đặc trƣng trên một chữ.

Quá trình huấn luyện sẽ đƣợc thực hiện bằng thuật toán Baum-Welch hay thuật toán Segmental K means, hay kết hợp cả hai bằng cách tạo một khởi tạo tốt bằng thuật toán Segmental K means và dùng thuật toán Baum-Welch để tối ƣu các tham số vừa khởi tạo. Quá trình nhận dạng: O sẽ thuộc lớp v * với, việc tính :

v*arg max[P(O |1 v Nv )] .

P(O |v ) sẽ dựa vào việc giải quyết bài toán 1 trong các bài toán cơ bản của mô hình Markov ẩn.

Khi xây dựng các mô hình Markov ẩn, các thông số cần quan tâm đó là: số

trạng thái, số thành phần hợp trong một trạng thái đối với mô hình Markov ẩn liên tục hay số thành phần hợp thành không gian quan sát đối với mô hình Markov ẩn bán liên tục hay số ký hiệu quan sát phân biệt đối với mô hình Markov ẩn rời

rạc.

Khi chọn lựa số trạng thái của mô hình trong nhận dạng tiếng nói, có nhiều ý kiến khác nhau. Một ý tƣởng hợp lý có thể chấp nhận trong ngữ cảnh nhận dạng chữ

viết tay chính là xây dựng mô hình Markov ẩn với các trạng thái tƣơng ứng với sự biến đổi trong cấu trúc đƣờng nét chữ cái.

CHƢƠNG V

CÀI ĐẶT CHƢƠNG TRÌNH VÀ ĐÁNH GIÁ KẾT QUẢ

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Nhận diện chữ viết tay bằng mô hình markov ẩn (Trang 82)