Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 30 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
30
Dung lượng
1,32 MB
Nội dung
1 1 1 Tr Tr ị ị nh Văn Loan nh Văn Loan B B ộ ộ môn K môn K ỹ ỹ thu thu ậ ậ t M t M á á y t y t í í nh nh Khoa CNTT, Khoa CNTT, ĐHBK H ĐHBK H à à N N ộ ộ i i X X Ử Ử LÝ TI LÝ TI Ế Ế NG N NG N Ó Ó I I 2 2 T T à à i li i li ệ ệ u tham kh u tham kh ả ả o o La parole et son traitement automatique La parole et son traitement automatique Calliope, Masson, 1989 Calliope, Masson, 1989 Traitement de la parole Traitement de la parole Rene Boite et Murat Kunt, Presse Polytechnique Romandes, 1987 Rene Boite et Murat Kunt, Presse Polytechnique Romandes, 1987 Fundamentals of Speech Signal Processing Fundamentals of Speech Signal Processing Saito S., Nakata K. , Academic Press, 1985 Saito S., Nakata K. , Academic Press, 1985 Digital Processing of Speech Signals Digital Processing of Speech Signals Lawrence R. Rabiner, Ronald W. Schafer, Prentice Lawrence R. Rabiner, Ronald W. Schafer, Prentice - - Hall .1978 Hall .1978 Discrete Discrete - - Time Processing of Speech Signals Time Processing of Speech Signals John R. Deller, John G. Proakis, Hansen John H. L. 1999 John R. Deller, John G. Proakis, Hansen John H. L. 1999 Ti Ti ế ế ng Vi ng Vi ệ ệ t hi t hi ệ ệ n đ n đ ạ ạ i (Ng i (Ng ữ ữ âm, ng âm, ng ữ ữ ph ph á á p, phong c p, phong c á á ch) ch) Nguy Nguy ễ ễ n H n H ữ ữ u Qu u Qu ỳ ỳ nh, H nh, H à à N N ộ ộ i, 1994 i, 1994 D D ẫ ẫ n lu n lu ậ ậ n Ngôn ng n Ngôn ng ữ ữ h h ọ ọ c c Nguy Nguy ễ ễ n Thi n Thi ệ ệ n Gi n Gi á á p, p, Đo Đo à à n Thi n Thi ệ ệ n Thu n Thu ậ ậ t , Nguy t , Nguy ễ ễ n Minh Thuy n Minh Thuy ế ế t, H t, H à à N N ộ ộ i, 1994 i, 1994 http://dce.hut.edu.vn http://dce.hut.edu.vn 3 3 N N ộ ộ i dung i dung 1. M 1. M ộ ộ t s t s ố ố kh kh á á i ni i ni ệ ệ m cơ b m cơ b ả ả n n 2. X 2. X ử ử lý t lý t í í n hi n hi ệ ệ u ti u ti ế ế ng n ng n ó ó i i 3. Mã ho 3. Mã ho á á ti ti ế ế ng n ng n ó ó i i 4. T 4. T ổ ổ ng h ng h ợ ợ p ti p ti ế ế ng n ng n ó ó i i 5. Nh 5. Nh ậ ậ n d n d ạ ạ ng ti ng ti ế ế ng n ng n ó ó i i 4 4 X X ử ử lý thông tin ch lý thông tin ch ứ ứ a trong t a trong t í í n hi n hi ệ ệ u ti u ti ế ế ng n ng n ó ó i i nh nh ằ ằ m truy m truy ề ề n, n, lưu tr lưu tr ữ ữ t t í í n hi n hi ệ ệ u n u n à à y ho y ho ặ ặ c t c t ổ ổ ng ng h h ợ ợ p, nh p, nh ậ ậ n d n d ạ ạ ng ti ng ti ế ế ng n ng n ó ó i. i. C C á á c nghiên c c nghiên c ứ ứ u đư u đư ợ ợ c ti c ti ế ế n h n h à à nh đ nh đ ể ể x x ử ử lý lý ti ti ế ế ng n ng n ó ó i yêu c i yêu c ầ ầ u nh u nh ữ ữ ng hi ng hi ể ể u bi u bi ế ế t trên nhi t trên nhi ề ề u u l l ĩ ĩ nh v nh v ự ự c ng c ng à à y c y c à à ng đa d ng đa d ạ ạ ng: t ng: t ừ ừ ng ng ữ ữ âm v âm v à à ngôn ng ngôn ng ữ ữ h h ọ ọ c cho đ c cho đ ế ế n x n x ử ử lý t lý t í í n hi n hi ệ ệ u u 1. M 1. M ộ ộ t s t s ố ố kh kh á á i ni i ni ệ ệ m cơ b m cơ b ả ả n n 2 5 5 M M ụ ụ c đ c đ í í ch ch Mã ho Mã ho á á m m ộ ộ t c t c á á ch c ch c ó ó hi hi ệ ệ u qu u qu ả ả t t í í n hi n hi ệ ệ u u ti ti ế ế ng n ng n ó ó i đ i đ ể ể truy truy ề ề n v n v à à lưu tr lưu tr ữ ữ ti ti ế ế ng n ng n ó ó i. i. T T ổ ổ ng h ng h ợ ợ p p v v à à nh nh ậ ậ n d n d ạ ạ ng ng ti ti ế ế ng n ng n ó ó i ti i ti ế ế n n t t ớ ớ i giao ti i giao ti ế ế p ngư p ngư ờ ờ i i - - m m á á y b y b ằ ằ ng ti ng ti ế ế ng n ng n ó ó i. i. T T ấ ấ t c t c ả ả c c á á c c ứ ứ ng d ng d ụ ụ ng c ng c ủ ủ a x a x ử ử lý ti lý ti ế ế ng ng n n ó ó i đ i đ ề ề u c u c ầ ầ n ph n ph ả ả i d i d ự ự a trên c a trên c á á c k c k ế ế t qu t qu ả ả c c ủ ủ a a phân t phân t í í ch ch ti ti ế ế ng n ng n ó ó i i 6 6 M M ộ ộ t s t s ố ố kh kh á á i ni i ni ệ ệ m cơ b m cơ b ả ả n n Phân bi Phân bi ệ ệ t ti t ti ế ế ng n ng n ó ó i v i v à à âm thanh âm thanh Ti Ti ế ế ng n ng n ó ó i đư i đư ợ ợ c phân bi c phân bi ệ ệ t v t v ớ ớ i c i c á á c âm c âm thanh kh thanh kh á á c b c b ở ở i c i c á á c đ c đ ặ ặ c t c t í í nh âm h nh âm h ọ ọ c c c c ó ó ngu ngu ồ ồ n g n g ố ố c t c t ừ ừ cơ ch cơ ch ế ế t t ạ ạ o ti o ti ế ế ng n ng n ó ó i. i. C C ó ó 2 lo 2 lo ạ ạ i ngu i ngu ồ ồ n âm n âm – – tu tu ầ ầ n ho n ho à à n (dây thanh rung) n (dây thanh rung) – – t t ạ ạ p âm (dây thanh không rung) p âm (dây thanh không rung) 7 7 B B ộ ộ m m á á y ph y ph á á t âm t âm 8 8 B B ộ ộ m m á á y ph y ph á á t âm t âm 3 9 9 B B ộ ộ m m á á y ph y ph á á t âm t âm NASAL CAVITY: Khoang mũi SOFT PALATE: Vòm miệng mềm EPIGLOTTIS: Nắp thanh quản VOCAL FOLDS (CORDS): Dây thanh OESOPHAGUS: Thực quản TRACHEA: Khí quản PHARYNX: Họng 10 10 Sơ đ Sơ đ ồ ồ kh kh ố ố i b i b ộ ộ m m á á y ph y ph á á t âm t âm 11 11 Thanh môn Dây thanh Thanh môn Thanh môn 12 12 1. 1. M M é é t s t s è è kh kh ¸ ¸ i ni i ni Ö Ö m c m c ¬ ¬ b b ¶ ¶ n n A. Glotte pendant la respiration B. Glotte pour la phonation 1. Glotte 2. Cordes vocales 3. Epiglotte 5. Cartilages aryténoïdes Thanh môn Thanh môn Ở Ở c c á á c v c v ị ị tr tr í í h h í í t, th t, th ở ở ,ph ,ph á á t âm, n t âm, n ó ó i th i th ì ì th th à à o o 4 13 13 Dây thanh trong m Dây thanh trong m ộ ộ t chu k t chu k ỳ ỳ dao đ dao đ ộ ộ ng ng 14 14 Bi Bi ể ể u di u di ễ ễ n t n t í í n hi n hi ệ ệ u ti u ti ế ế ng n ng n ó ó i i D D ạ ạ ng s ng s ó ó ng theo th ng theo th ờ ờ i gian i gian 15 15 T T ầ ầ n s n s ố ố l l ấ ấ y m y m ẫ ẫ u: 8kHz, F1= 11025 Hz, u: 8kHz, F1= 11025 Hz, 2F1, 4F1 (16kHz, 10kHz) 2F1, 4F1 (16kHz, 10kHz) S S ố ố bit/m bit/m ẫ ẫ u: 8,16 u: 8,16 Mono, Stereo Mono, Stereo File WAV File WAV 16 16 Bi Bi ể ể u di u di ễ ễ n t n t í í n hi n hi ệ ệ u ti u ti ế ế ng n ng n ó ó i i Ph Ph ổ ổ t t í í n hi n hi ệ ệ u ti u ti ế ế ng n ng n ó ó i i 5 17 17 Bi Bi ể ể u di u di ễ ễ n t n t í í n hi n hi ệ ệ u ti u ti ế ế ng n ng n ó ó i i Spectrogram (Sonagram) Spectrogram (Sonagram) 18 18 Bi Bi ể ể u di u di ễ ễ n t n t í í n hi n hi ệ ệ u ti u ti ế ế ng n ng n ó ó i i 19 19 Bi Bi ể ể u di u di ễ ễ n t n t í í n hi n hi ệ ệ u ti u ti ế ế ng n ng n ó ó i i 20 20 Bi Bi ể ể u di u di ễ ễ n t n t í í n hi n hi ệ ệ u ti u ti ế ế ng n ng n ó ó i i Thu b Thu b ằ ằ ng micro kh ng micro kh á á c lo c lo ạ ạ i i 6 21 21 Bi Bi ể ể u di u di ễ ễ n t n t í í n hi n hi ệ ệ u ti u ti ế ế ng n ng n ó ó i i Hai gi Hai gi ọ ọ ng kh ng kh á á c nhau cho c c nhau cho c ù ù ng m ng m ộ ộ t âm t âm 22 22 Bi Bi ể ể u di u di ễ ễ n t n t í í n hi n hi ệ ệ u ti u ti ế ế ng n ng n ó ó i i C C ù ù ng ngư ng ngư ờ ờ i n i n ó ó i, c i, c ù ù ng m ng m ộ ộ t âm t âm 23 23 Năng lư Năng lư ợ ợ ng, t ng, t ỷ ỷ l l ệ ệ bi bi ế ế n thiên qua gi n thiên qua gi á á tr tr ị ị không không 0 0.5 1 1.5 2 2.5 3 3.5 -0.6 -0.4 -0.2 0 0.2 0.4 amplitude file:C:\wav\1-6-5-8-10-0.wav, ss,es:1, 43029, window length, shift (samples):160, 40, wtype:1 Signal 0.5 1 1.5 2 2.5 3 3.5 1 2 3 4 short-time energy En 0.5 1 1.5 2 2.5 3 3.5 5 10 15 short-time magnitude Mn 0.5 1 1.5 2 2.5 3 3.5 0 20 40 60 80 time in seconds zero crossing rate ZC 24 24 T T ạ ạ o âm h o âm h ữ ữ u thanh u thanh Formant v Formant v à à antiformant antiformant 7 25 25 T T ạ ạ o âm vô thanh o âm vô thanh 26 26 M M ộ ộ t s t s ố ố đ đ ặ ặ c đi c đi ể ể m ng m ng ữ ữ âm âm ti ti ế ế ng Vi ng Vi ệ ệ t t Đơn âm ti Đơn âm ti ế ế t t C C ó ó thanh đi thanh đi ệ ệ u (6), bi u (6), bi ế ế n đ n đ ổ ổ i thanh đi i thanh đi ệ ệ u u k k è è m theo bi m theo bi ế ế n đ n đ ổ ổ i ngh i ngh ĩ ĩ a a Không bi Không bi ế ế n đ n đ ổ ổ i h i h ì ì nh th nh th á á i i 27 27 1 1 i,y i,y ý ch ý ch í í 2 2 ê ê ê ch ê ch ề ề 3 3 e e e d e d è è 4 4 a a a ha a ha 5 5 ă ă m m ắ ắ t t 6 6 ơ ơ bơ ph bơ ph ờ ờ 7 7 â â ân c ân c ầ ầ n n 8 8 ư ư t t ừ ừ t t ừ ừ 9 9 ô ô ôtô ôtô 10 10 o o co ro co ro 11 11 u u l l ù ù m m ù ù 1 1 ia,yê,ya,iê ia,yê,ya,iê ( ( đ đ ọ ọ c ia, yê) c ia, yê) kia k kia k ì ì a, yêu a, yêu ki ki ề ề u, khuya, tiên u, khuya, tiên ti ti ế ế n n 2 2 ua,uô ua,uô ( ( đ đ ọ ọ c ua) c ua) tua rua, luôn tua rua, luôn 3 3 ưa ưa , , ươ ươ ( ( đ đ ọ ọ c ưa c ưa ) ) lưa thưa lưa thưa , , lư lư ợ ợ t t M M ộ ộ t s t s ố ố đ đ ặ ặ c đi c đi ể ể m ng m ng ữ ữ âm âm ti ti ế ế ng Vi ng Vi ệ ệ t t H H ệ ệ th th ố ố ng âm v ng âm v ị ị : 14 nguyên âm : 14 nguyên âm (11 (11 nguyên âm đơn nguyên âm đơn , 3 , 3 nguyên âm đôi nguyên âm đôi , 22 ph , 22 ph ụ ụ âm) âm) 28 28 1 1 b b b b ồ ồ ng b ng b ề ề nh nh 2 2 p p ố ố p p é é p p 3 3 v v v v ẩ ẩ n vơ n vơ 4 4 ph ph phôi pha phôi pha 5 5 m m mơ m mơ m à à ng ng 6 6 đ đ đ đ ấ ấ t đai t đai 7 7 t t tin tư tin tư ở ở ng ng 8 8 th th thơ th thơ th ẩ ẩ n n 9 9 d,gi d,gi duyên, gi duyên, gi ữ ữ 10 10 n n n n ó ó ng ng 11 11 l l long lanh long lanh 12 12 tr tr tr tr ồ ồ ng ng 13 13 s s sinh viên sinh viên 14 14 r r r r ừ ừ ng ng 15 15 ch ch chông chông 16 16 nh nh nh nh ọ ọ c c 17 17 ng,ngh ng,ngh ngô nghê ngô nghê 18 18 c,k,q c,k,q con,k con,k ẹ ẹ t,qua t,qua 19 19 kh kh kh kh ú ú c c 20 20 g,gh g,gh g g ồ ồ gh gh ề ề 21 21 h h h h ả ả hê hê 22 22 x x xa xôi xa xôi M M ộ ộ t s t s ố ố đ đ ặ ặ c đi c đi ể ể m ng m ng ữ ữ âm âm ti ti ế ế ng Vi ng Vi ệ ệ t t H H ệ ệ th th ố ố ng âm v ng âm v ị ị : 22 ph : 22 ph ụ ụ âm âm 8 29 29 Đ Đ ộ ộ nâng nâng H H à à ng ng cao cao trung b trung b ì ì nh nh th th ấ ấ p p trư trư ớ ớ c c i e i e e e ơ â ơ â o o gi gi ữ ữ a a ư ư a ă a ă sau sau u ô u ô M M ộ ộ t s t s ố ố đ đ ặ ặ c đi c đi ể ể m ng m ng ữ ữ âm âm ti ti ế ế ng Vi ng Vi ệ ệ t t Phân lo Phân lo ạ ạ i nguyên âm theo đ i nguyên âm theo đ ộ ộ nâng nâng c c ủ ủ a lư a lư ỡ ỡ i v i v à à chuy chuy ể ể n đ n đ ộ ộ ng c ng c ủ ủ a lư a lư ỡ ỡ i i 30 30 H H à à ng ng Đ Đ ộ ộ m m ở ở h h à à ng trư ng trư ớ ớ c c h h à à ng sau không ng sau không tròn môi tròn môi h h à à ng sau ng sau tròn môi tròn môi h h ẹ ẹ p p i i ia,yê,ya,iê ia,yê,ya,iê ư ưa ư ưa ơ â ơ â r r ộ ộ ng ng a ă a ă u ua u ua hơi h hơi h ẹ ẹ p p ê ê ô ô hơi r hơi r ộ ộ ng ng e e o o M M ộ ộ t s t s ố ố đ đ ặ ặ c đi c đi ể ể m ng m ng ữ ữ âm âm ti ti ế ế ng Vi ng Vi ệ ệ t t Phân lo Phân lo ạ ạ i nguyên âm theo đ i nguyên âm theo đ ộ ộ m m ở ở c c ủ ủ a a mi mi ệ ệ ng v ng v à à chuy chuy ể ể n đ n đ ộ ộ ng c ng c ủ ủ a lư a lư ỡ ỡ i i 31 31 th Vô thanh p t tr ch c,k,qu Hữu thanh b đ m n nh ng,ngh ph x s kh h vd,gi r g l Xát Bật hơi Vang mũi Vô thanh Hữu thanh Vang bên Ồn Không bật hơi Ồn Cuối lưỡiHọng Phương thức cấu âm Vị trí cấu âm Đầu lưỡi Môi Răng Vòm miệng Tắc Mặt lưỡi M M ộ ộ t s t s ố ố đ đ ặ ặ c đi c đi ể ể m ng m ng ữ ữ âm âm ti ti ế ế ng Vi ng Vi ệ ệ t t Phân lo Phân lo ạ ạ i ph i ph ụ ụ âm theo t âm theo t ắ ắ c hay x c hay x á á t, t, h h ữ ữ u thanh hay vô thanh, m u thanh hay vô thanh, m ũ ũ i h i h ó ó a a 32 32 M M ộ ộ t s t s ố ố đ đ ặ ặ c đi c đi ể ể m ng m ng ữ ữ âm âm ti ti ế ế ng Vi ng Vi ệ ệ t t Âm t Âm t ắ ắ c: ti c: ti ế ế ng n ng n ổ ổ , ph , ph á á t sinh do lu t sinh do lu ồ ồ ng kh ng kh í í t t ừ ừ ph ph ổ ổ i đi ra b i đi ra b ị ị c c ả ả n tr n tr ở ở ho ho à à n n to to à à n, ph n, ph ả ả i ph i ph á á v v ỡ ỡ s s ự ự c c ả ả n tr n tr ở ở đ đ ó ó đ đ ể ể tho tho á á t ra. t ra. Âm x Âm x á á t: ti t: ti ế ế ng c ng c ọ ọ x x á á t, ph t, ph á á t sinh do lu t sinh do lu ồ ồ ng không kh ng không kh í í đi ra b đi ra b ị ị c c ả ả n tr n tr ở ở không ho không ho à à n to n to à à n (ch n (ch ỉ ỉ b b ị ị kh kh ó ó khăn khăn ), ph ), ph ả ả i l i l á á ch qua m ch qua m ộ ộ t khe h t khe h ở ở nh nh ỏ ỏ v v à à trong khi tho trong khi tho á á t ra như v t ra như v ậ ậ y ph y ph ả ả i c i c ọ ọ x x á á t v t v à à o th o th à à nh c nh c ủ ủ a b a b ộ ộ m m á á y ph y ph á á t t âm. âm. Ph Ph ụ ụ âm bên âm bên : : đ đ ầ ầ u lư u lư ỡ ỡ i ti i ti ế ế p x p x ú ú c v c v ớ ớ i l i l ợ ợ i ch i ch ặ ặ n l n l ố ố i tho i tho á á t c t c ủ ủ a không kh a không kh í í , , bu bu ộ ộ c n c n ó ó ph ph ả ả i l i l á á ch qua khe h ch qua khe h ở ở ở ở hai bên c hai bên c ạ ạ nh lư nh lư ỡ ỡ i ti i ti ế ế p gi p gi á á p v p v ớ ớ i m i m á á m m à à ra ngo ra ngo à à i t i t ạ ạ o nên ti o nên ti ế ế ng x ng x á á t nh t nh ẹ ẹ (l). (l). Lu Lu ồ ồ ng không kh ng không kh í í tho tho á á t ra ngo t ra ngo à à i b i b ị ị c c ả ả n tr n tr ở ở , t , t ạ ạ o nên ti o nên ti ế ế ng x ng x á á t hay ti t hay ti ế ế ng ng n n ổ ổ , d , d ạ ạ ng t ng t í í n hi n hi ệ ệ u không tu u không tu ầ ầ n ho n ho à à n g n g ọ ọ i l i l à à ti ti ế ế ng đ ng đ ộ ộ ng ( ng ( ồ ồ n). n). Trong khi ph Trong khi ph á á t âm m t âm m ộ ộ t s t s ố ố ph ph ụ ụ âm, dây thanh c âm, dây thanh c ũ ũ ng ho ng ho ạ ạ t đ t đ ộ ộ ng đ ng đ ồ ồ ng ng th th ờ ờ i t i t ạ ạ o nên ti o nên ti ế ế ng thanh. ng thanh. Ph Ph ụ ụ âm c âm c ó ó t t ỉ ỉ l l ệ ệ ti ti ế ế ng đ ng đ ộ ộ ng l ng l ớ ớ n hơn g n hơn g ọ ọ i l i l à à ph ph ụ ụ âm âm ồ ồ n. n. Ph Ph ụ ụ âm c âm c ó ó t t ỉ ỉ l l ệ ệ ti ti ế ế ng thanh l ng thanh l ớ ớ n hơn g n hơn g ọ ọ i l i l à à ph ph ụ ụ âm vang. âm vang. 9 33 33 phê bé vẽ chè D D ạ ạ ng s ng s ó ó ng m ng m ộ ộ t s t s ố ố t t ừ ừ ti ti ế ế ng Vi ng Vi ệ ệ t t 34 34 trị tìm tám đánh D D ạ ạ ng s ng s ó ó ng m ng m ộ ộ t s t s ố ố t t ừ ừ ti ti ế ế ng Vi ng Vi ệ ệ t t 35 35 kệ lạ khả D D ạ ạ ng s ng s ó ó ng m ng m ộ ộ t s t s ố ố t t ừ ừ ti ti ế ế ng Vi ng Vi ệ ệ t t 36 36 0 50 100 150 200 250 300 350 400 450 500 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 CHUR.WAV, Fs = 11025Hz, 5669 samples, Time = 514ms Amplit ude Time in ms D D ạ ạ ng s ng s ó ó ng m ng m ộ ộ t s t s ố ố t t ừ ừ ti ti ế ế ng Vi ng Vi ệ ệ t t 10 37 37 0 50 100 150 200 250 300 350 400 450 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 DDEER.WAV, Fs = 11025Hz, 5278 samples, Time = 479ms Amplitude Time in ms D D ạ ạ ng s ng s ó ó ng m ng m ộ ộ t s t s ố ố t t ừ ừ ti ti ế ế ng Vi ng Vi ệ ệ t t 38 38 0 100 200 300 400 500 600 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 KHAR.WAV, Fs = 11025Hz, 7718 samples, Time = 700ms Amplitude Time in ms D D ạ ạ ng s ng s ó ó ng m ng m ộ ộ t s t s ố ố t t ừ ừ ti ti ế ế ng Vi ng Vi ệ ệ t t 39 39 0 100 200 300 400 500 600 -0 .3 -0 .2 -0 .1 0 0.1 0.2 0.3 NG HIR.W A V , Fs = 11025H z, 6707 sam ples, Tim e = 608m s Amplitude Time in ms D D ạ ạ ng s ng s ó ó ng m ng m ộ ộ t s t s ố ố t t ừ ừ ti ti ế ế ng Vi ng Vi ệ ệ t t 40 40 0 100 200 300 400 500 600 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 XOA.WAV, Fs = 11025Hz, 7690 samples, Time = 697ms Amplitude Time in ms D D ạ ạ ng s ng s ó ó ng m ng m ộ ộ t s t s ố ố t t ừ ừ ti ti ế ế ng Vi ng Vi ệ ệ t t [...]... (1/2)[x(i-1)+x(i)] (1/2)[x(iLut lng t u v i xng c trng bi: Lu l t v x b cỏc mc bóo ho xs m ho mc lng t L hoc (L+1) = 2b l t ho Bc lng t = 2xs/L B l t L=9 81 Lng t u 1 82 Lng t u L = 16 1 1 0.8 0.8 0.6 0.6 0.6 0.6 0.4 0.4 0.4 0.4 0.2 0.2 0 1 0.8 0.8 0.2 0.2 0 0 -0 .2 -0 .2 -0 .4 -0 .4 -0 .4 -0 .4 -0 .6 -0 .6 -0 .6 -0 .6 -0 .8 -0 .8 -1 -1 0 0 -0 .2 -0 .2 -0 .8 -0 .8 0 2 2 4 4 6 6 8 8 10 10 12 12 14 14 -1 -1 0 83... Amplitude -0 2 0 -0 .05 -0 .1 -0 4 -0 .15 -0 6 0 100 200 300 T im e in m s 400 500 600 -0 .2 41 Dng súng mt s t ting Vit 0 50 100 150 200 250 Time in ms 300 350 42 400 Dng súng mt s t ting Vit TAMS.WAV, Fs = 11025Hz, 4989 samples, Time = 452ms BUF.WAV, Fs = 11025Hz, 6779 samples, Time = 615ms 0.6 0.4 0.3 0.4 0.2 0.1 0.2 Amplitude 0 Amplitude Amplitude 0.05 0 0 -0 .1 -0 .2 -0 .3 -0 .2 -0 .4 -0 .5 -0 .4 -0 .6 43 -0 .6... Amplitude Amplitude 0 0 -0 .2 -0 .1 -0 .4 -0 .2 -0 .3 -0 .6 0 50 100 150 200 250 Time in ms 300 350 400 0 49 450 Dng súng mt s t ting Vit 50 100 150 200 Time in ms 250 300 350 50 Dng súng mt s t ting Vit TIMF.WAV, Fs = 11025Hz, 5589 samples, Time = 507ms SOOS.WAV, Fs = 11025Hz, 8888 samples, Time = 806ms 0.6 0.4 0.3 0.4 0.2 0.2 Amplitude Amplitude 0.1 0 -0 .1 0 -0 .2 -0 .2 -0 .3 -0 .4 -0 .4 -0 .5 51 0 100 200 300... 0.1 Amplitude Amplitude 0 -0 .1 0 -0 .2 -0 .1 -0 .3 -0 .2 -0 .4 -0 .5 45 0 100 200 300 400 Time in ms 500 600 -0 .3 0 700 Dng súng mt s t ting Vit 100 200 300 400 500 Time in ms 600 700 46 800 Dng súng mt s t ting Vit KHOONG.WAV, Fs = 11025Hz, 6743 samples, Time = 612ms NHAAN.WAV, Fs = 11025Hz, 5713 samples, Time = 518ms 0.4 0.6 0.2 0.4 0 Amplitude Amplitude 0.2 -0 .2 0 -0 .4 -0 .2 -0 .6 -0 .4 47 0 100 200 300 Time... 1 x(n) x(n) N 1 2 D(iP) = 0, i = 0,1, N u (n) N u (n) n=0 n=0 0.3 0.3 0.2 0.2 0.1 0.1 0 0 -0 .1 -0 .1 -0 .2 -0 .2 700 700 1/2 1 N-1 D(k ) = [ x(n + m) x(n + m k )]2 N m=0 1/ 2 1 k = 0,1, , K = [2r (0) 2r (k )] N với < 1 67 0.015 0.015 0.01 0.01 0.005 0.005 0 0 -0 .005 -0 .005 -0 .01 0 -0 .01 750 750 800 800 850 850 900 900 950 n 950 n 1000 1000 1050 1050 1100 1100 1150 1150 r(k) r(k)... 4 4 6 6 8 phõn b u gia - /2 v + /2 b gi v pe ( ) = 1/ , / 2 = 0, > / 2 0 -1 -1 0 0 0.2 0.2 0 2 0 -1 -1 0 0 1 1 0 Mt xỏc sut sai s lng t su s l t l pe ( ) = p x (i + ), l = ( L 1) / 2 1 -1 -1 0 0 1 1 0 Cỏc tớnh cht lng t u 2 2 4 4 6 Quantific ation E rror 6 Quantific ation E rror 8 Trung bỡnh tp õm /lng t = 0 bỡ t l t 2 2 Phng sai e = 2 / d = 2 /12 0 -0 .2 -0 .2 0 0 2 2 4 4 6 6 8... s(n)=h(n)*e(n) S() = H().E() S( H( ).E( log[S()]= log[H()]+ log[E()] log[S( log[H( log[E( -1 {log[S()]} = F-1{log[H()]} + F-1{log[E()]} F {log[S( {log[H( {log[E( -1 {log[S()]} = $ F {log[S( s(n) -1 {log[H()]} = $ F {log[H( h(n) $ F-1{log[H()]} = e(n) {log[H( $ $ $ s(n) = h(n) + e(n) B lc hiu chnh Ca s Hamming FFT Log |.| FFT-1 $ s(n) 59 60 15 Tiờn oỏn tuyn tớnh (Linear Prediction Coding) Vớ d Mụ hỡnh AR hỡ... (Simplified Inverse X lý ng hỡnh Filter Tracking) 10kHz Thụng thp th Thụng thp 4700Hz 900Hz 1-z-1 A(z) W(n) W(n) LPC(p=4) LPC(p=4) Hm t tng quan HT/VT ỏnh giỏ kt qu Ni suy Tỡm cc i Fo 69 Xỏc nh formant 70 X lý ng hỡnh Tham s cn xỏc nh s xỏ Tớn hiu ting núi Formant Fk Di thụng Bk B lc hiu chnh Ca s FFT Phng phỏp phỏ X lý ng hỡnh hỡ LPC Log10|.| FFT-1 FFT Wc(n) 71 72 18 X lý ng hỡnh Phng phỏp LPC... ) = A1 ( z ) A 2 ( z ) A( z ) q C( z ) = c i z -i i=0 1 1/ 2 c0 = 1 Di thụng Bk p q i =1 i =0 x( n ) + a i x( n i ) = c i u ( n i ) Fk 55 Tn s 56 14 2 X lý tớn hiu ting núi x(n) Phõn tớch ph tớ ph B lc hiu chnh Ca s Hamming FFT Log |.| N B lc hiu chnh H(z) = 1 az-1, a = 0,95 0,98 hi ch 57 X lý ng hỡnh (homomorphic) frame 58 0 S khi x lý ng hỡnh s(n)=h(n)*e(n) S() = H().E() S( H( ).E(... Hz 108 27 Mụ hỡnh phn x khụng tn hao (Kelly-Lochbaum) + + u k + 1 (t) u k + 1 (t - k + 1 ) + u k (t) Tớnh liờn tc ca ỏp sut v thụng lng t c su v l + u k (t - k ) u k (t) u k (t + k ) p k (l, t) = p k +1 (0, t) u k (l, t) = u k +1 (0, t) 2 A k+1 A Ak + u k+1 (t) = u + (t - ) + k+1 u k +1 (t) k A k+1 + A k A k+1 + A k A Ak + 2 Ak u (t+ ) = k+1 u k (t - ) + u +1 (t) k k A k+1 + A k A k+1 + A k . log[E( ω ω )] )] F F - - 1 1 {log[S( {log[S( ω ω )]} = F )]} = F - - 1 1 {log[H( {log[H( ω ω )]} + F )]} + F - - 1 1 {log[E( {log[E( ω ω )]} )]} F F - - 1 1 {log[S( {log[S( ω ω )]} = )]} = F F - - 1 1 {log[H( {log[H( ω ω )]}. 2.5 3 3.5 -0 .6 -0 .4 -0 .2 0 0.2 0.4 amplitude file:C:wav 1-6 - 5-8 -1 0-0 .wav, ss,es:1, 43029, window length, shift (samples):160, 40, wtype:1 Signal 0.5 1 1.5 2 2.5 3 3.5 1 2 3 4 short-time energy En 0.5. ph á á p p – – X X ử ử lý đ lý đ ồ ồ ng h ng h ì ì nh nh – – LPC LPC 72 72 Bộ lọc hiệu chỉnh Cửa sổ FFT Log 10 |.| FFT -1 FFT Wc(n) X X ử ử lý đ lý đ ồ ồ ng h ng h ì ì nh nh Tín hiệu tiếng nói 19 73 73 X X ử ử