Giới thiệu về nhậndạng thống kê và HMM

Một phần của tài liệu Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động (Trang 32 - 33)

Quá trình thống kê là quá trình xác định xác suất của 1 số sự kiện vàxác suất mối quan hệ giữa các sự kiện trong 1 tiến trình tại các thời điểm khác nhau.

™ Biến c ngu nhiên và hàm mt độ xác sut:

Gọi X là tập các biến ngẫu nhiên X={X1, X2, …, Xn} mà tồn tại ít nhất một sự kiện của tập X này xuất hiện. Gọi xác suất của sự kiện Xi la P(Xi). Khi đó ta có xác suất của X là P(X)=1. Nếu gọi P(Xi ) là xác suất của biến cố Xi thì ta có:

P(X)= Σ P(Xi)=1 ™ Xác sut có điu kin:

Gọi A và B là các biến ngẫu nhiên. Xác suất có điều kiện được mô tả như sau: Giả sử sụ kiện A đã xảy ra với xác suất P(A). Xác suất của sự kiện A với

điều kiện sự kiện B đã xảy kí hiệu là P(A|B) được tính như sau:

) ( ) ( ) | ( B P AB P B A P =− với P(B) ≠0

Trong nhận dạng thống kê, hai hàm xác suất có điều kiện sau thường được dùng:

1. P(x|Ci): hàm mật độ xác suất của độđo vector x thuộc về lớp Ci, với giả thiết là xác suất P(Ci) được biết trước hay có thểước lượng được. 2. P(Ci|x): với điều kiện x xảy ra, xác định xác suất xuất hiện của lớp rời

rạc Ci (chưa biết), thông qua P(Ci): xác suất của lớp Ci và P(x|Ci). Một tiến trình được gọi là tiến trình Markov (Markov process) nếu xác suất của 1 sự kiện tại 1 thới điểm bị ràng buộc bởi các sự kiện trong quá khứ xác định. Như vậy, mô hình Markov là một mô hình thống kê thuần túy. Trạng thái là 1 định nghĩa giúp chúng ta hiểu được sự biến đổi của sự kiện theo thời gian. Biến cố chính trong tiến trình Markov là “đạt trạng thái i tại thời điểm t”. Một tiến trình Markov

KHOA CNTT –

ĐH KHTN

được sử dụng trong các hệ thống nhận dạng tiếng nói tựđộng (ASR) tuân theo các

điều kiện sau:

1. Chỉ tồn tại 1 thời điểm phân biệt trong chuỗi thời gian t=1, 2, …, T; 2. Chỉ có 1 số lượng trạng thái xác định {st }= {i}, i=1, 2, …, n; 3. Trạng thái hiện tại và quá khứ chỉ là cách nhau 1 bước:

P(st | st-1,st-1, …, st-k )=P(st | st-1)

Nhiệm vụ chính của tiến trình Markov là tạo ra chuỗi trạng thái S=s1, s2, …, sT. Mô hình Markov ẩn HMM được phát triển dựa trên mô hình Markov. Các khía cạnh chính yếu về sử dụng mô hình HMM trong nhận dạng tiếng nói sẽ được trình bày dưới đây.

2.2.1.2.Các thành phn chính ca HMM Thành phần chính của HMM gồm tập trạng thái và các tập hợp tham số chính.

Một phần của tài liệu Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động (Trang 32 - 33)

Tải bản đầy đủ (PDF)

(91 trang)