Giải thuật Level Building

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Nhận diện chữ viết tay bằng mô hình markov ẩn (Trang 62)

Giải thuật Level Building – LB hoạt động giống nhƣ VA nhƣng nó đối sánh một chuỗi quan sát sinh ra bởi một số mô hình.

Mục đích của giải thuật LB là đối sánh các mô hình với chuỗi quan sát mà không cần phải phân đoạn chuỗi quan sát này ra thành các chuỗi con. Trong lĩnh vực nhận dạng

tiếng nói, nó đƣợc sử dụng để nhận dạng các từ phát âm liên tục trong đó mỗi HMM đực sử dụng để biểu diễn một từ. Cách tiếp cận LB cho phép nhận dạng cụm từ mà không cần phân đoạn nó ra thành từng từ. Thực tế, giải thuật LB cực đại xác suất kết nối giữa phân đoạn và nhận dạng.

Tại mức l=0, mỗi mô hình đƣợc đối sánh với chuỗi quan sát tính từ thời điểm t=0. Các mô hình đƣợc giả thiết có cấu trúc trái-phải, bắt đầu ở trạng thái 0 và kết thúc ở trạng thái N-1. 1. Khởi tạo: = ( ) (38) = (39) 2. Đệ qui: = (Ot), , (40) 3. Kết thúc: P(l,t,w) = , (41) B(l,t,w) = -1 (42)

Sau khi mảng P(l,t,w) đã đƣợc tính toán đầy đủ tại mức này cho tất cả các mô hình, nó sẽ đƣợc giảm mức để chỉ ra mô hình phù hợp nhất tại mỗi thời điểm ở mức này:

(l,t) = (43)

(l,t) = B(l, t, arg ) (44)

(l,t) = arg (45)

Mảng chỉ ra xác suất của mô hình phù hợp nhất tại mức này, lƣu nhãn của mô hình và cuối cùng, là con trỏ tới mức trƣớc đó. Đối với mức cao hơn, việc tính toán sẽ khác với thủ tục khởi tạo, theo đó các mô hình ở mức thứ hai (mức cao hơn) sẽ nhận kết quả từ mức mô hình ở mức thấp nhất:

= (46)

= max[ t-1), ]. ( ) (47)

Một mảng con trỏ quay lui cũng đƣợc tạo để lƣu thời gian mà mức trƣớc đƣợc đối sánh bởi mô hình trƣớc đã kết thúc:

= {t-1 nếu t-1) > ), } (48) Trong quá trình đệ qui, mảng đƣợc cập nhật nhƣ sau:

= arg (49) Khi đến mức cuối cùng, mảng con trỏ quay lui B sẽ đƣợc cập nhật:

B(l,t,w) = , (50)

Tại mức cuối này, thao tác giảm mức đƣợc thực hiện và các tính toán có thể đƣợc xử lý cho mức tiếp theo. Tiến trình này tiếp tục lặp lại cho đến khi vƣợt số mức giới hạn trƣớc. Đối sánh tốt nhất của L mô hình với chuỗi quan sát có xác suất T-1) và có thể tìm thấy đƣợc bằng cách lần ngƣợc, sử dụng mảng B. Chuỗi đối sánh tốt nhất là cực đại của trên tất cả các mức.

Hình 3.10 Biểu đồ minh họa giải thuật Level Building

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Nhận diện chữ viết tay bằng mô hình markov ẩn (Trang 62)