Mô hình 3:

Một phần của tài liệu Ứng dụng FPGA cho nhận dạng tiếng nói tiếng việt (Trang 75)

M CL C

6.3. Mô hình 3:

Mô hình 3ăđ c xây d ng trên c s lý thuy tăđƣăđ c trình bày ch ngă3. L uăđ lấy m u và tách kho ng l ng:ăđ c th c hi n gi ng v i l uăđ lấy m u và tách kho ng l ng mô hình 1.

L uăđ gi i thu tăl ng t vectorăVQ:ăđ c th c hi n gi ng v i mô hình 1 v i hai kíchăth c codebook là codebook 32 và codebook 128.

6.3.1. Trích đ cătr ngăMFCC:

Trong mô hình 3, kh iăMFCCăđ c th c hi n gi ng v i lý thuy tăđƣătrìnhăbƠyă ch ngă3. Tín hi u ti ngănóiăđ c chia thành các frame 160 m u, ch ng lấp 80 m u gi a 2 frame k c n nhau.

Do vi c chia các frame ti ng nói thành 160 m uă nênă cácă đ dài c a s Hammingăcũngăđ c th c hi n cho 160 m u, kh i FFT s s d ng FFT 256ăđi m, kh i Mel_filter_bank s d ng 128 h s mel.L uă đ gi i thu t tríchă đ că tr ngă MFCCătheoămôăhìnhă3ăđ c th hi n trong hình (6.9).

Pre - emphasis

B tăđ u

frame_blocking 160 m uăch ngă

lấpă80 m u

Windowing 160

|FFT 256|

Mel ậ frequency filter bank

128 h ăs Cepstrum delta K tăthúc M F C C energy frame_blocking 160 m uă ch ngălấpă80 m u Logarith

6.3.2. Hu n luy n mô hình HMM:

L uăđ c a quá trình huấn luy n HMM c a mô hình 3 đ c th hi n trong hình (6.10).

Ghiăơmăcácătừăc năhuấnăluy n, m iătừănóiă nhi uăl n

B tăđ u

Tríchăđ cătr ngăMFCCă256 c aătừngătừ K tăh pătấtăc ăcácăđ cătr ngăc aătừngătừăt oă

thƠnhăt păd ăli uăhuấnăluy n

L ngăt ăvectorăt păd ăli uăhuấnăluy năđ ăt oă codebook

Gánănhƣnăchoătừngătừ

K tăthúc

Kh iăt oăHMMăchoătừngătừ Huấnăluy năHMMăchoătừngătừ

Hình 6. 10: L uăđ huấn luy n HMM theo mô hình 3

L uăđ gi i thu t huấn luy năHMMătheoămôăhìnhă3ăcũngăđ c th c hi n gi ng nh ăl uăđ gi i thu t huấn luy nătrongămôăhìnhă1ăđ tìm ra mô hình nh n d ng t i

Một phần của tài liệu Ứng dụng FPGA cho nhận dạng tiếng nói tiếng việt (Trang 75)

Tải bản đầy đủ (PDF)

(107 trang)