Mô hình Markov n:

Một phần của tài liệu Ứng dụng FPGA cho nhận dạng tiếng nói tiếng việt (Trang 46)

M CL C

4.2. Mô hình Markov n:

Mô hình Markov n ậ HMMă đ c m r ng từ khái ni m mô hình Markov bằng cách m i tr ngătháiăđ c g n v i m t hàm phát x quan sát. Ngoài quá trình ng u nhiên chuy n tr ng thái, t i m i tr ng thái còn có m t quá trình ng u nhiên sinh ra m tăquanăsát.ăNh ăv y, mô hình Markov n có m t quá trình ng u nhiên kép,ătrongăđóăcóăm t quá trình ng u nhiênăkhôngăquanăsátăđ c.

T p các quan sát O đ c sinh ra b i dãy các tr ng thái S1, S2,…, SN c a mô hình không thấyăđ c, vì v yămôăhìnhănƠyăđ c g i là mô hình Markov n.

M t mô hình Markov năđ căđ cătr ngăb i các thành ph năc ăb n sau:

N: S tr ng thái (state) c a mô hình Markov. Các tr ngătháiăth ngăđ c ký hi u bằng S = {1, 2,…,N} và tr ng thái c a mô hình t i th iăđi m t đ c ký hi u là qt.

M: S ký hi u quan sátđ c ng v i m t tr ng thái,ăđơyăchínhălƠăkíchăth c c a b ng từ v ng c a mô hình. Các ký hi uăquanăsátăđ c bi u di n bằng V = {v1, v2, …,vM).

 Xác suất chuy n tr ng thái A = {aij}, trongăđóăaij là xác suấtăđ tr ng thái j xuất hi n t i th iăđi m t + 1 khi tr ng thái iđƣăxuất hi n t i th iăđi m t.

1

( | )

ij t t

B = {bj(k)}: phân ph i xác suất các ký hi u quan sát, v i bj(k) là xác suất quan sát vk tr ng tháij t i th iăđi m t.

bj(k) = P(ot=vk |qt = j)v i 0; 1 ; 1, 2,..., j b k k M j N          (4.6)

 Xác suất tr ng thái kh iăđ u π = {π1, π2,…,πN}, trongăđóăπi là xác suấtăđ tr ng thái i đ c ch n là th iăđi m kh iăđ u t = 1:

1

( )

i P q i

   v i  i 0 ; 1 i N (4.7) V i các giá tr thích h p A, B, π, M, N m t mô hình Markov năđ cădùngăđ sinh ra m t dãy các quan sát O = {o1, o2, o3,….}.

Ho tăđ ng c aămôăhìnhăHMMăđ c mô t nh ăsau:

 B c 1: Ch n tr ng thái kh i đ u q1= it ngă ng v i xác suất tr ng thái kh iăđ u π.

 B c 2: Gán t = 1

 B c 3: Ch n ot = vkt ngă ng v i xác suất quan sát t i tr ng thái i.

 B c 4: Chuy n sang tr ng thái m i qt+1 = j t ngă ng v i xác suất chuy n tr ng thái aij.

 B c 5: Gán t = t + 1 và quay l iăb c 3 n u t <T, n u không k t thúc. Ng iătaăth ng dùng b ba  = (A, B, π) đ bi u di n m t mô hình Markov n. A, Bπđ c g i là các tham s c a mô hình .

Hình (4.2) cho ta thấy m t ví d v m t mô hình Markov n g m có sáu tr ng thái,ătrongăđóăcóăm t tr ng thái kh iăđ u và m t tr ng thái k t thúc. Sáu quan sát

{o1, o2,…,o6} đ c sinh ra từ b n tr ng thái từ2ăđ n 5. M i tr ng thái có th chuy n sang tr ng thái bên ph i nó, ho c chuy n sang chính nó. Riêng tr ng thái kh iăđ u ch có m t kh nĕngăduyănhất là chuy n sang tr ng thái th 2, t c là a12 = 1

Đ áp d ng mô hình Markov n cho vi c x lý nh n d ng ti ng nói, ta ph iăđiă gi i quy tăbaăbƠiătoánăc ăb nănh ăsau:

 Bài toán 1: v i dãy quan sát O = {o1, o2,…,oT} và mô hình Markov n

=(A, B, π) đƣăđ c huấn luy n, chúng ta c năxácăđ nh xác suất P(O|).

ĐơyălƠăbƠiătoánănh n d ng khi có m tădƣyăcácăquanăsátăchoătr c và m t t p các mô hình Markov n, vi c tính toán các P(O|) s cho chúng ta tìm

raăđ c mô hình Markov n có xác suất P(O|) t ngă ng l n nhất. Trong h th ng nh n d ng ti ng nói otlƠăvectorăđ cătr ngăti ng nói ngõ vào t i th iăđi m t.

 Bài toán 2: v i dãy quan sát O = {o1, o2,…,oT} và mô hình Markov n

=(A, B, π) làm th nào chúng ta có th tìmăđ c dãy tr ng tháiăt ngă ng

q = {q1, q2, q3,….} t iă uănhất theo m t tiêu chu nănƠoăđó.ĐơyălƠăbƠiătoánă tìm ph n n c a mô hình Markov, t c là dãy tr ng thái q. Bài toán này

th ngă đ c s d ng trong quá trình gán nh n c ng b c d li u huấn luy n.

 Bài toán 3: làm th nào chúng ta có th đi u ch nh các tham s A, B, π đ cóăđ c xác suất P(O|) l n nhất. ĐơyălƠăbƠiătoánămƠăchúngătaăph iăđi u ch nh các tham s c a mô hình Markov năđ nó có th mô t m t cách chínhăxácăcácăquanăsátăđƣăđ c bi tătr căđó.ăDƣyăcácăquanăsátădùngăđ đi u ch nh các tham s đ c g i là t p d li u huấn luy n.ăĐơyălƠăkhơuăc ă b n trong m t bài toán nh n d ng,ănóăchoăphépăđi u ch nh các tham s đ mô hình h c các d li u từ các hi năt ng th cănh ăti ng nói.

Đ thi t k h th ng nh n d ng ti ng nói g m các từ r i r c,ătr c tiên chúng ta ph i thi t k HMM g m N tr ng thái riêng bi t cho m i từ c a b từ v ng V.

Vchính là s từ trong b từ v ng. Nhi m v nƠyăđ c gi i quy t bằng cách tìm l i gi i cho bài toán th 3.ăSauăđóăs d ng l i gi i cho bài toán th 2 chúng ta có th phân chia m i từ trong các chu i huấn luy n thành các tr ngătháiăđ đ m b o s chính xác c a mô hình nh n d ng, từđóăc i thi n kh nĕngămôăhìnhăhóaăcácăchu i từ đ c nói c a mô hình. Cu i cùng từ ch aăbi t c n nh n d ngă đ c th c hi n bằng cách s d ng l i gi i cho bài toán th nhấtăđ xácăđ nhăđi m s cho m i mô hình từ d a trênchu iăquanăsátăđ c th nghi m, từ đóăch n ra từ cóăđi m s mô hình cao nhất.

Vi c l a ch n lo iămôăhình,ăkíchăth c và các ký t quanăsátăđ th c thi mô hình HMM rất ph c t p, chúng ph thu c vào tín hi uăđ c mô hình. Khó khĕnch y u trong quá trình huấn luy n HMM là t p d li uăkhôngăđ yăđ . Khi tính bi(k),

n u t p huấn luy n quá nh thìăsauăkhiă căl ng ta s có bi(k) = 0, nghƿaălƠ mô hình s t o ra xác suất bằng 0 cho bất kỳ chu i quan sát nào. Vì v y, m t mô hình quanăsátăcóăđángătinăc y hay không là tùy thu c và chu i huấn luy n. M t gi i pháp kh thi là gi m b tăkíchăth c mô hình, hay nói cách khác chính là gi m b t s l ng các tr ng thái, s l ng ký t trên m t tr ngăthái,ầ

Một phần của tài liệu Ứng dụng FPGA cho nhận dạng tiếng nói tiếng việt (Trang 46)

Tải bản đầy đủ (PDF)

(107 trang)