1. Trang chủ
  2. » Luận Văn - Báo Cáo

NGUYÊN tắc của hệ THỐNG NHẬN DẠNG TIẾNG nói

65 258 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 65
Dung lượng 1,08 MB

Nội dung

   !""#$%&'()*$'+*,- .,,/(0123456 7(841$090:&!$;&) <=3>0?"("/)' *,-.,/(01 2=@A+!=0!$=B30>C DE),-06FG0<4;( :H!B "(DI!I"I%1H$!6! 867/:(>H!BJ86$/ )61 DK!,-06F,/*$:L )/1M(LN!K!,-0>((:5!= *$:L)/1 D@1&/LN! (&A/N! "I!"%"$( !!"%4( 9:&A.:&O1  2)P6,-!!(: !C)P7H)P7=1E()P =,H!0))P:,7 6Q)P:,760(8RS!0I TUUVW1XT1T(!)P:!1 Nghiên cứu một số phương pháp trong nhận dạng tiếng nói T Hình 1.1: Các hệ thống nhận dạng tiếng nói Y*$7Z[\ T \ ] ^\  )K!)P !,-*$7ŴG"9!(9*$I(8;Y (,1 EI(G"9_!$I"!C ` % !G! YWP= % % % !G! YP WYPWP = M(G"9Y a%Z(!9$6,-*$7G"9 !(9`>*$7"!((!G"9Y Z%Y abZ%!(91c"9 Y Z%)G"9$G40<&&/ !!I(I%1c"9Y abZ%,-G40<&. !(" (I%1XT1](9$P!)/!G"9$1E( *$7d.e&&/"f(!G"9Y Z%1_?76 =!0;5*$4,3@1M*$4$(! G$+&g!:(h0?Pi&g!:(hK! 4,3@1Y,-.86,!(&g!:( h$"f(!G"9Y abZ%1 Nghiên cứu một số phương pháp trong nhận dạng tiếng nói ] X)P X)P 7= X)P 7H X)P: ,076Q X)P: ,076 0 Hình 1.2: Khái quát về hệ thống nhận dạng XT1V"!$(!9$0,30>K!)P j0!!(C8GkL&/1 M*$8 ; M*$7 X(84 E)  E7,-  g&. !("(I% g&&/ !!I(I% Hình 1.3: Các quá trình nhận dạng  !"#$%&!&'&()&$%#!$*+#,#-* Nghiên cứu một số phương pháp trong nhận dạng tiếng nói V Y8  #I!I !!$""% Y !I !""#!(% ckL& / !!I (I""% 27 4 27 Y8!&'( 7)1  !"#./0123 _,@!()P( )P"f*$I(8*$P,3430> 7 (84%120P,3!$,-CP" I!I !I%ID0!"II(&g!:(h1 456!7#!#,6##,8 gK!&&/!G"9K!7w k (I( "!7W 1 k-1 = w 1 , w 2 , … w k-1 1g,33>!$,- JD!>?7\ : l(DT7@,@ P(w k |W 1 k-1 )=P(w k |W T T − +− k nk ) mA8$=BG"9K!&&/6,-( +7"P'G9)K!7(3"</)C % % % n T] T] ]T −− −− −− = kk kkk kk wwb wwwt wwP E(t(a,b,c)"P'G9)K!00!7a,b,c !%1b(a,b) "P'G9)K!0& 0!%a,b1 49:; 4!<#=>#,$*+#,#-*?@?*A#$!6#, 4B$!C#,(D&&!%#!$EFG#,,*D#,#-* 44!<#=>#,$*+#,#-*$HI#,&'&JE#0!K1$*L3=M#, N:O Nghiên cứu một số phương pháp trong nhận dạng tiếng nói o p!$86K!)P=! GC Dp+(,Hqr,K!076qEP),-j qp+0;(HqsA:)&,Hq2+= =q2A&/1 N'&#,!*L#&P3?Q#!<#=>#,$*+#,#-*#,6##,8#R/&#,I@* g"P'A*8=4,HCt_g u!(p$"I"vwX1mA@(F&!I pIIZ(:"12=@!=@A x,_Iv!0"t_gSI"I!2IIg("(#SI"I!2pvy^ ]z ]zz ]zzz ]zzzz Hình 1.4: Các bài toán nhận dạng khác nhau theo kích thước bộ từ điển và kiểu nói _>T1T"("{)|K!)P }"(:>~K!(,HI( K!R_!0!!]zzTW1 X)P r,7+ g$ 2(,H v= Tz z•]€ zzzU€ 2/ ]• ‚€ T€ u.+= ]zzz V••€ Vƒ€ u.9,-PK!Zp„ ‚zzz o‚€ zU€ u.AFZp„ ]zzzz ƒ•€ TT€ Bảng 1.1: So sánh tỷ lệ lỗi nhận dạng của máy tính và con người với một số hệ thống nhận dạng Nghiên cứu một số phương pháp trong nhận dạng tiếng nói u.+ = u.=  u.( ,H. E=  27H ‚ sP(+ = E7 ui X)PP ( …!$"P0? . s.> (~† sA06 0?. S!)0? . E!@ !0 (&/2‡=@AP &/3!)Pm),E…P 0!(j _Br…>s&%Ev!ˆ*,-=@1 Y,3 r,076 sG Xgg‰(#!((#!"!#!" ‚zzz"$!0I" UV€ 2MXgg 2(II(!0!$ U]‚€ MMXgg T]‚o"$!0I" UzT€ EIMI!$II!I\(: 2(II(!0!$ ƒ‚€ XI!!I!I\(: 2(II(!0!$ UzTo€ Bảng 1.2: Các hệ thống nhận dạng tiếng Hán m&/Ev!'=@(7 HRp(I!!W1m=@)P=)P ,H/"PE=GU•ƒU€3"</) (RE0(]zzz!W1 N'&#,!*L#&P3?Q#!<#=>#,$*+#,#-*$*+#,*B$ XT1‚,$=>)P&/!)( m)C Hình 1.5: Hệ thống nhận dạng ngôn ngữ có thanh điệu 9S95TU5 VT W)&(*X1"1$*+$$*+#,*B$ 2.1.1.1 Tính độc lập cao 2.1.1.2 Có khả năng biểu hiện ý nghĩa 2.1.1.3 Có cấu trúc chặt chẽ g|m)<'$K‚',X]1TC Nghiên cứu một số phương pháp trong nhận dạng tiếng nói • 7 :&9 !) E!) ‡' m' ‡) ‡ ‡P Hình 2.1: Cấu trúc âm tiết của tiếng Việt ‡m)95j!0C Hình 2.2: Cấu trúc bậc hai của tiếng Việt U1?Y$*+#,*B$ ‡434(Q9@~0)N!1mA8G* K!/("P4(HK!&/!6-"P ,-/34!/iA9(!A@ ~(&/.41 2.1.2.1 Thanh điệu Hình 2.3: Các thanh điệu tiếng Việt 1. Không dấu, 2. Huyền, 3. Ngã, 4. Hỏi, 5. Sắc, 6. Nặng Em)"!)1!!K!.0,H ‚0!!)m),-=>,(X]1V1 2.1.2.2 Âm đầu Nghiên cứu một số phương pháp trong nhận dạng tiếng nói • ‡ E! ‡' Y'' ‡) ‡ ‡P _T _] ‚ o V ] T T% ‚% V% •% o% ]% Em)]T'•!)])T•ƒP1 2.1.2.3 Âm đệm ‡)@~l"BK!5:<''! :0)$:11 2.1.2.4 Âm chính ‡$=8(.4"BK! 1‡m)9>TojTT$=3V$=&1 ‡6!oC 2.1.2.5 Âm cuối 2Pm)86P!:&0& 09 49j/$=4@:&A4ˆ%1M("+ :0)/!RW(!7d!ed!e1E(:7d!e P(K!:&:,-:!&"!:04><0?<!( 8J1E(:7d!e09<$=4 9:&::&,-(!(1RE(TUU•W1 4Z[0!"#FC&\]&'&"1?Y$*+#,*B$ 2m)958f4(m):- !I(/$1p!$_>]1TE;:"+0P/!$= )0$=PRE(TUU•W1 U1 &!%#! U10!^ _'##,3`L#"1&3C* a3 b a %=^ a3 b a a* b a %=^  ‰ $ ‰ D  I ‰ = ‰ D = Š ‰ (I ‰ D I( hI ‰ $= ‰ D $=  D  D ‰  ( D & D ‰ & ‹ D ( D ‰ ( Nghiên cứu một số phương pháp trong nhận dạng tiếng nói ƒ h( D & D ‰ & Œ D D ‰ ‰ ,, • ‰ 3 ‰ D3 • Ž ‰  ‰ ‰ !$ ! ‰ (! ‰ ‰ !(! ~ ‰ ~ ‰ ‰ !!$ Œh• D D ‰ ‰ ,,3 Bảng 2.1: Phân bố giữa nguyên âm âm chính và các âm đệm và bản nguyên âm cuối. _cSde U5 g|3"</)"k,3@6=>=< @41s6=>m),-0?P/ &,H1E$=(m)A9:L+80):&> *}p2tth)I(0*m))!"k,E2mV mt^"f(!)~0>*80):J(&,H $1 m=44ˆ,-P,,3@O EIIG1"+:!/!>K!45"f,- 4I(P9124=tY},-06F, /!}p2tt1_>:L)4m),-0$( '1 49f_g 4*/*$!*B3 >l7<)K!I( ,3@(:&0!(j*H!*†Q 9AH!312,-,*$4 |4,-B*H!064H!0B':5K! 41 Nghiên cứu một số phương pháp trong nhận dạng tiếng nói U u*4!†!.(G$+3"</ )1m"!$K!)=<@4K! (3"</)EtgtE1 z]]‚z• ]]‚z]‚oz ]‚ozoU]z(\ oU]z‚V]zG ‚V]z•UTz!I •UTzUT•z" UT•zTzV]z: E(|)=|†4!*H! 0?34Tzz"12*H!$6,-(0?*0?!$ (8*,•0@1E(*0?!$,H* !0II !$!"0I%G4!/!40?.06j"06 j;K!,3@1u*+,-+)0<)P 0?*,•0@1 4'&#,3`L#$h&&!3#,?Q,'##!i#FG#,$]` E&A.=06j",-J6G438! 1sP'"P!(0=9).&=06j" ,3P::~:06j;"f,-"k1p+0;=06j" $3"+0;(06j;80)( ,H-"+$6470=9"!0=!(1 44'&"1$h& rB3!"f:ij:&:7 ;!"f04><((1‡B,-:j3•"+> <0!; ($Bˆ,-.;("I%1 4NU1(-#, Nghiên cứu một số phương pháp trong nhận dạng tiếng nói Tz [...]... thống nhận dạng dùng các nhãn thời gian khác nhau Hệ thống nhận dạng Hệ thống nhận dạng dùng Độ chính xác mức từ Độ chính xác mức câu 96.34 80.34 95.97 80.04 các nhãn tạo bằng tay Hệ thống nhận dạng dùng các nhãn tạo tự động Kết quả nhận dạng cho thấy hệ thống nhận dạng dùng các nhãn thời gian tạo bằng tay có độ chính xác cao hơn so với hệ thống nhận dạng dùng các nhãn thời gian tạo bằng máy Tuy nhiên... hệ thống nhận dạng đã được xây dựng để đánh giá ảnh hưởng của các nhãn thời gian tạo bằng tay và nhãn thời gian tạo bằng máy tới độ chính xác nhận dạng của hệ thống nhận dạng Hai tín hiệu được huấn luyện bằng tập dữ liệu huấn luyện gồm 318 câu và được kiểm tra trên tập dữ liệu gồm 124 câu Kết quả nhận dạng của hai hệ thống là như sau: Bảng 2.6 Kết quả nhận dạng của hai hệ thống nhận dạng dùng các nhãn... trong nhận dạng tiếng nói 17 Hệ thống nhận dạng dùng để gán nhãn cưỡng bức ở trên mới chỉ sử dụng một hàm mật độ xác suất Gaussian duy nhất Trong khi đó cơ sở dữ liệu được gán nhãn có độ đa dạng cao, do nhiều người nói, trong môi trường khác nhau Một hàm Gaussian không đủ khả năng để mô hình hóa sự đa dạng của giọng nói trong cơ sở dữ liệu Để nâng cao hiệu quả của gán nhãn tự động hệ thống nhận dạng. .. biểu đồ phổ các âm Nghiên cứu một số phương pháp trong nhận dạng tiếng nói 12 mũi thường mang các formant cùng với các formant của các âm đứng xung quanh nhưng với màu nhạt về màu sắc và cường độ trong biểu đồ phổ 2.3.7 Nguyên âm đơn, nguyên âm đôi và bán nguyên âm Tiếng Việt có mười ba nguyên âm đơn, ba nguyên âm đôi và hai bán nguyên âm cuối Nguyên âm có đặc điểm chung là có các formant nằm ngang... phổ của hai từ “toán tán” Âm đệm không xuất hiện trước các nguyên âm tròn môi, nó cũng chỉ xuất hiện trước các nguyên âm hàng trước Độ mở của âm đệm phụ thuộc vào độ mở của các nguyên âm đi sau Trên biểu đồ phổ, âm đệm thường có hình ảnh là các formant gắn liền với các formant của nguyên âm đứng sau nhưng không bằng phẳng Hình 2.7 cho ta thấy hình Nghiên cứu một số phương pháp trong nhận dạng tiếng nói. .. trích ra từ hai cơ sở dữ liệu tiếng nói điện thoại “22 Language v1.2”, và “Multi-Language Telephone Speech v1.2” của trung tâm CSLU (Center for Speech Language Understanding), Viện Sau Đại Học Oregon, Hoa Kỳ Các câu trong cơ sở dữ Nghiên cứu một số phương pháp trong nhận dạng tiếng nói 16 liệu tiếng nói được thu âm theo hình thức phỏng vấn qua điện thoại từ 213 người nói (135 nam, 78 nữ) Bảng 2.2 dưới... trong nhận dạng tiếng nói . ƒ•€ TT€ Bảng 1.1: So sánh tỷ lệ lỗi nhận dạng của máy tính và con người với một số hệ thống nhận dạng Nghiên cứu một số phương pháp trong nhận dạng tiếng nói u.+ = u.=  u.( ,H. E=  27H ‚ sP(+ = E7 ui X)PP ( …!$"P0? . s.> (~† sA06 0?. S!)0? . E!@ !0 (&/2‡=@AP &/3!)Pm),E…P. !!"%4( 9:&A.:&O1  2)P6,-!!(: !C)P7H)P7=1E()P =,H!0))P:,7 6Q)P:,760(8RS!0I TUUVW1XT1T(!)P:!1 Nghiên cứu một số phương pháp trong nhận dạng tiếng nói T Hình 1.1: Các hệ thống nhận dạng tiếng nói Y*$7Z[ T  ] ^  )K!)P !,-*$7ŴG"9!(9*$I(8;Y (,1 EI(G"9_!$I"!C ` %. nói T• X!_>]1o_>]1‚(!9$>):6GK! *+1p+:!/!*H!(0?!$(+ G9Gl"("+:!/!/,H*:!1E{)"!:$ 9,-1 NjS+$.3<# s6:x4:>,-K!*+!)P *,-G$+6>,<K!*H!(0?!$* H!(0?$GK!)P1 X!),-9$)0?/)9$)jVTƒ,- :6!=/)jT]o1r>K!!)P,"!C Bảng 2.6. Kết quả nhận dạng của hai hệ thống nhận dạng dùng các nhãn thời gian khác nhau B$!C#,#!<#=>#, Wv&!%#!k'&1P&$|

Ngày đăng: 18/08/2015, 19:50

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w