Mô hình Markov ẩn gồm các trạng thái, và một ma trận trọng số chuyển trạng thái tạo thành một mạng chuyển đổi trạng thái. Trong phương pháp nhận dạng tiếng nói bằng mô hình Markov ẩn, mỗi từ mẫu sẽ được biểu diễn bằng một mô hình Markov ẩn. Tại một thời điểm bất kỳ, hệ thống sẽ ở vào trạng thái qt trong tập S = {Si} có N trạng thái. Qua các thời gian rời rạc, hệ thống sẽ chuyển qua các trạng thái
t
khác. Ký hiệu qt là trạng thái ở thời điểm t, ta có:
Công thức 3.1
P[qt = Sj|qt-1 = Si, qt-2 = Sk,…] = P[qt = Sj | qt-1 = Si]
Chúng ta chỉ xét các quá trình mà vế phải không phụ thuộc vào thời gian. Khi đó tập xác suất chuyển trạng thái aij có dạng:
Công thức 3.2
aij = P[qt = Sj | qt-1 = Si], với aij 0; a ij 1 .
Do đó, một mô hình Markov ẩn được đặc trưng bởi các tham số sau:
1. N: số trạng thái của mô hình
Tập trạng thái của mô hình: s = {s1,s2,...,sN }
Trạng thái ở thời điểm t, q s
2. M: số các ký hiệu quan sát được ứng với một trạng thái Tập các ký hiệu quan sát: v = {v1,v2,...,vM }
Ký hiệu quan sát ở thời điểm t, ot v
3. Tập xác suất chuyển trạng thái: A = {aij} aij = P(qt+1 = sj | qt = si ), 1 ≤ i,j ≤ N
4. Tập xác suất ký hiệu Vk quan sát được trong một trạng thái: B = {bj(k)}
Công thức 3.3
5. Tập xác suất trạng thái ban đầu là trạng thái i: π = {πi }
Công thức 3.4
i = P[qt = Si], i[1,N]
Ta ký hiệu một mô hình Markov ẩn như sau: = (A, B,
Hình 3.2: Mô hình Left – Right
Hình 3.3: Mô hình Bakis
Hình 3.4: Mô hình Tuyến tính