Các mô hình huấn luyện liên tục và bán liên tục

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Nhận diện chữ viết tay bằng mô hình markov ẩn (Trang 59)

Với một mô hình mật độ hỗn hợp liên tục, những quan sát là những vector thực tế thay vì những ký hiệu rời rạc, và xác suất phát ra là:

bj( ) = (23)

Trong đó F là một đoạn log-concave bất kỳ hoặc mật độ đối xứng dạng ellipse (Gausse) có vector trung bình và ma trận hợp biến covariance cho hỗn hợp

thứ m trong trạng thái Sj.

Rabiner bày một phƣơng pháp ƣớc lƣợng lại tham số theo các dòng giống nhau tƣơng tự nhƣ với mô hình rời rạc, ngoại trừ thay vì bj(k), các biến cjm, và phải đƣợc ƣớc lƣợng lại. Ƣớc lƣợng lại sự biến đổi trạng thái và các phân bố trạng thái ban đầu tƣơng tự với dạng rời rạc. Rõ ràng các biến tiến và lùi đƣợc tính toán sử dụng mật độ phát ra ở dạng liên tục của nó trong trƣờng hợp này. Để trình bày phƣơng trình ƣớc lƣợng lại cho các tham số phát ra, ta định nghĩa một biến tạm:

i(i,m) =[ | ] (24)

Đây là xác suất ở trạng thái Sj tại thời điểm t với thành phần hỗn hợp thứ m tính cho vector quan sát Oi. Tổng của biến này trên toàn bộ M hỗn hợp có dạng i(j) đƣợc cho trong phƣơng trình (14) cũng dùng cho trƣờng hợp một hỗn hợp

Bây giờ các phƣơng trình ƣớc lƣợng lại có thể đƣợc phát biểu theo giá trị i(j,m):

= (26)

= (28)

Những phƣơng trình này có thể đƣợc giải thích nhƣ sau: là tỷ lệ giữa số lần kỳ vọng mô hình trong trạng thái Sj sử dụng hỗn hợp thứ m và số lần kỳ vọng mô hình nằm trong trạng thái Sj. Phƣơng trình tính số lần kỳ vọng mô hình nằm trong trạng thái Sj sử dụng hỗn hợp thứ m trong vector quan sát, đƣa đến giá trị kỳ vọng của các vector quan sát đƣợc, tính bởi hỗn hợp thứ m. Một đối số tƣơng tự dẫn đến kết quả . Huang trình bày một phƣơng thức ƣớc lƣợng lại các tham số của mô hình và codebook chung cho trƣờng hợp HMM bán liên tục. Một lần nữa công thức ƣớc lƣợng lại và tƣơng tự trƣờng hợp rời rạc, với sự khác biệt là các biến tiến và lùi tính theo giá trị bj(k) đƣợc thay bởi giá trị bj( ) cho những quan sát liên tục .

Để ƣớc lƣợng lại các tham số của codebook và các tham số phát ra của mô hình, ngoài biến , định nghĩa trong phƣơng trình (14) cần thêm hai biến tạm khác:

(29)

là xác suất mô hình ở trong trạng thái Si tại thời điểm t với quan sát đƣợc lƣợng hóa thành mẫu tƣợng vk – nghĩa là xác suất mà codeword thứ k có thể sinh ra quan sát thứ t kết hợp với xác suất mà codeword thứ k có thể đƣợc quan sát trong trạng thái Si – cho trƣớc quan sát và mô hình.

Bây giờ, các phƣơng trình ƣớc lƣợng lại có thể đƣợc phát biểu cho tham số mô hình bi(k) và các vector trung bình của codebook cùng với các ma trận hợp biến :

= (30)

= (32)

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Nhận diện chữ viết tay bằng mô hình markov ẩn (Trang 59)