Khác với chuỗi Markov như trình bày ở trên, mô hình Markov ẩn có những đặc điểm sau:
-Từ 1 trạng thái có thể phát sinh hơn 1 sự kiện (hay còn được gọi là 1 quan sát).
-Chuỗi quan sát là hàm xác suất của trạng thái.
-Chúng ta có thể tính toán xác suất của các chuỗi trạng thái khác nhau từ một chuỗi quan sát.
Như vậy HMM vẫn phát sinh ra các quan sát. Số lượng trạng thái thông thường khác số lượng quan sát. Khi ở trạng thái Si, có xác suất p(o1) để phát sinh sự kiện 1, xác suất p(o2) để phát sinh sự kiện 2...
Các thành phần của mô hình Markov ẩn:
-N là số lượng trạng thái của mô hình. {1,2,...,N} là các trạng thái. Ký hiệu trạng thái ở thời điểm t là qt.
-M là số lượng quan sát phân biệt. Các ký hiệu quan sát tương ứng với tín hiệu vật lý mà hệ thống đang mô tả. Ta ký hiệu tập quan sát là V={v1, v2, ..., vM}. Đối với tín hiệu tiếng nói, M là kích thước codebook. vilà mã của từng vector.
-A = {aij} - là ma trận phân phối xác suất chuyển trạng thái, trong đó aij là xác suất chuyển từ trạng thái i ở thời điểm t sang trạng thái j ở thời điểm t+1
aij = P[qt = j |qt-1 = i] 1 ≤ i, j ≤ N
-B = {bj(k)} - ma trận phân phối xác suất các ký hiệu quan sát, trong đó
bj(k) là xác suất nhận được ký hiệu quan sát vk ở trạng thái j:
bj(k) = P[ot = vk|qt = j] 1 ≤ k ≤ M j=1, 2, … N
-π = {πi} - ma trận phân phối trạng thái ban đầu trong đó πi là xác suất của mô hình ở trạng thái i tại thời điểm ban đầu t=1:
πi = P[q1=i] 1 ≤ i ≤ N
Như vậy để đặc tả đầy đủ một HMM cần phải có số trạng thái N của mô hình, tập V gồm M ký hiệu quan sát, ma trận xác suất chuyển trạng thái A, ma trận xác suất các ký hiệu quan sát được B và ma trận xác suất trạng thái ban đầu π.
Cho mô hình Markov như hình sau:
Mô hình này có: Số trạng thái N=3 (gồm High, Medium, Low) Số ký hiệu quan sát M=3 (gồm Rain, Cloud, Sun)
Các giá trị các phần tử của ma trận A, B, 𝜋 như trên hình trên.
Nếu cho chuỗi quan sát O = {sun, sun, cloud, rain, cloud, sun} và mô hình Markov ẩn như hình vẽ trên, thì xác suất để có chuỗi trạng thái {H, M, M, L, L, M} là bao nhiêu?
Xác suất cần tìm =
bH(sun)*bM(sun)*bM(cloud)*bL(rain)*bL(cloud)*bM(sun) = 0.8* 0.3*0.4*0.6*0.3*0.3
= 5.2*10-3
Cho mô hình Markov như hình vẽ trên. Tính xác suất để có được chuỗi quan sát O = {sun, sun, cloud, rain, cloud, sun} và chuỗi trạng thái là {H, M, M, L, L, M}.
Xác suất cần tìm =
𝜋H*bH(s)*aHM*bM(s)*aMM*bM(c)*aML*bL(r)*aLL*bL(c)*aLM*bM(s) = 0.4*0.8*0.3*0.3*0.2*0.4*0.5*0.6*0.4*0.3*0.7*0.3 = 1.74*10-5
Cho mô hình Markov như hình vẽ trên. Tính xác suất để có được chuỗi quan sát O={sun, sun, cloud, rain, cloud, sun}và chuỗi trạng thái là {H, H, M, L, M, H}.
Xác suất cần tìm =
𝜋H*bH(s)*aHH*bH(s)*aHM*bM(c)*aML*bL(r)*aLM*bM(c)*aMH*bH(s) = 0.4*0.8*0.6*0.8*0.3*0.4*0.5*0.6*0.7*0.4*0.4*0.6
= 3.71*10-4
Với định nghĩa HMM ở trên, ta có ba vấn đề cơ bản cần quan tâm trước khi được áp dụng trong các ứng dụng thực tế.
i. Vấn đề sự ước lượng - cho trước một mô hình 𝚽 và một dãy của các quan sát X=(X1, X2, …, XT), có xác suất là P(X| 𝚽); xác suất của mô hình tạo ra cho các quan sát là gì?
ii. Vấn đề giải mã - cho trước một mô hình 𝚽 và một dãy của các quan sát X=(X1, X2, …, XT), dãy trạng thái phù hợp nhất S = (s0, s1, s2, …, sT) trong mô hình tạo ra các quan sát là gì?
iii. Vấn đề học - cho trước một mô hình 𝚽 và một tập các quan sát, làm thế nào chúng ta có thể điều chỉnh mô hình tham biến 𝚽̂ để cực đại xác suất liên kết (có thể xảy ra) ∏ 𝑃(𝐗|𝑋 𝚽)?
Nếu chúng ta có thể giải quyết vấn đề sự ước lượng, chúng ta sẽ có một cách ước lượng làm sao với một HMM cho trước ăn khớp một dãy quan sát. Do đó, chúng ta có thể sử dụng HMM để nhận dạng mẫu, khi đó xác suất P(𝐗|𝚽) có thể được sử dụng để tính toán xác suất hậu nghiệm P(𝚽|𝐗), và HMM với xác suất hậu nghiệm cao nhất có thể được xác định như mẫu mong đợi cho dãy quan sát. Nếu chúng ta có thể giải quyết vấn đề giải mã, chúng ta có thể tìm được dãy trạng thái khớp nhất với một dãy quan sát cho trước, hay trong các từ khác, chúng ta có thể khám phá dãy trạng thái ẩn làm cơ sở cho quá trình giải mã trong nhận dạng tiếng nói liên tục. Sau cùng nếu chúng ta có thể giải quyết vấn đề học, chúng ta sẽ có thể ước lượng tự động mô hình tham biến Φ từ một bộ dữ liệu huấn luyện. Ba vấn đề này được liên kết dưới nền tảng xác suất tương tự. Sự bổ sung hiệu quả của các thuật toán chia sẻ các nguyên tắc của lập trình động sau.