Trong phương pháp này, mỗi từ mẫu sẽ được biểu diễn bằng một mạng chuyển đổi các trạng thái. Tại một thời điểm bất kỳ, hệ thống sẽ ở vào trạng thái qt
trong tập S = {Si} có N trạng thái. Qua các thời gian rời rạc, hệ thống sẽ chuyển qua các trạng thái khác. Ký hiệu qtlà trạng thái ở thời điểm t, ta có:
P[qt= Sj|qt-1= Si, qt-2= Sk,…] = P[qt= Sj| qt-1= Si]
Chúng ta chỉ xét các quá trình mà vế phải không phụ thuộc vào thời gian. Khi đó tập xác suất chuyển trạng thái aijcó dạng:
aij= P[qt= Sj| qt-1= Si], với aij 0; aij 1.
Một mô hình Markovẩn được đặc trưng bởi các tham sốsau:
1. N : số trạng thái của mô hình
2. M: số các ký hiệu quan sát được ứng với một trạng thái 3. Tập xác suất chuyển trạng thái: A = {aij}
4. Tập xác suất ký hiệu Vkquan sát được trong một trạng thái: B = {b(k)}
5. Tập xác suất trạng thái ban đầu là trạng thái i:
i= P[qt= Si], i [1,N ]
Như vậy nếu cho các giá trị N, M, A, B, thì mô hình Markovẩn hoàn toàn xác định.
Ta ký hiệu một mô hình Markovẩn như sau: = (A, B, ).
Áp dụng mô hình Markov ẩn cho xử lý tiếng nói, ta phải giải quyết 3 bài toán cơ bản sau:
1. Cho chuỗi quan sát O và mô hình , ta phải tính xác suất có điều kiện P(O| ) của chuỗi quan sát.
2. Cho chuỗi quan sát O và mô hình , ta phải tìm chuỗi trạng thái Q sao cho xác suất có điều kiện P(O| ) là tốiưu.
3. Cho chuỗi quan sát O và mô hình , ta phải đánh giá lại các thông số
của mô hình sao cho xác suất có điều kiện P(O| ) của chuỗi quan sát là tối
ưu.