0
Tải bản đầy đủ (.pdf) (37 trang)

SO sANH MO HI1\TfID!CH BTL val cAc MO IDNH KHAc

Một phần của tài liệu DỊCH TỰ ĐỘNG ANH-VIỆT DỰA TRÊN VIỆC HỌC LUẬT CHUYỂN ĐỔI TỪ NGỮ LIỆU SONG NGỮ 4 (Trang 35 -37 )

So voi cae ma hlnh dieh khae, ma hlnh BTL trlnh bay 0 tren rung c6 mQt s6 di€m tuong d6ng va di bit%t.Duoi day, chung tai se trlnh cae di€m tuong d6ng va di bit%ta'y, cling nhu u'ukhuye't di€m eua BTL so voi cae ma hlnh khae.

3.4.1 SO SANH YOI MO HTh1JID~CH DTjA TREN LUAT (RBMT) Thl,I'eeha't, ma hlnh BTL eu6i rung rung dua v~ d<;tnglu~t gi6ng nhuma hlnh RBMT, nhung di€m khae bit%tIOn nha't ehinh la BTL xay dl,I'ngcae lu?t d6 mQt each tl,I'dQng b~ng each hQe tu kho ngil' lit%usong ngil', eon trang ma hlnh RBMT, cae lu[tt d6 phai duQcxay dl,I'ngthu rang boi cac chuyen gia.

3.4.2 so SANE YOl MO HINH D~CHDTjA TREN THONG KE (Sl\1T)

v~ phuong phap lu~n, BTL rat giong SMT: ca hai rung duQchuan luy~n tu khongil'lit%usong ngil',ca hai rung thl,I'chit%nho~mroan WdQngtu khau d~u rho den khau cu6i. Nhung di~m khac bit%tIOn nha't (5day chinh 1a: BTL dlfa tren co S0 1)' thuye't ngan ngil' hQc so sanh, can SMT l<;tidlfa tren eo so 19 thuye't xac sua't th6ng ke. Ke't qua hua'n 1uy~n cua BTL la t~p cac lu~t chuy~n d6i (chuy~n ngil') mang tinh trlfc quail va tinh bi€u trung cua ngan ngil', can SMT l<;tila mQt bang cac xac sua't kh6ng 16, ra't kh6 long ma chung ta hi~u du9C. Chung ta c6 th~ rhea diSiva can thi~p vao BTL nhung khang lam duQc d6i voi SMT. SMT dl,I'atren

vi~c h9C khong giam sat, can BTL 1;;1id1!atren vi~c hQc c6 giam sat. SMT kh6ng

giai quyft du'c;fCcac hi~n tu'c;fngngon ngil iJ khoilng each xa (ngoM khung czIa s6

ngucanh n-gram), can BTL c6 th€ giai quye't dU9C. Cd so 19 thuyft cua SMT 1ft

cdso toaDhQCnen vil'ng char bon, tuy ket qua thlfC te' hit%nnay cua SMT can ra't

-3.4.3 SO SANH Val MO HINH DJCH DTjATREN NGU LI~U (CBMT) ThlfC cha't BTL chinh la mo hlnh dich dlfa tren ngii' li~u (CBMT). Tuy nhien, giil'a 2 mo hlnh c6 di€m khac bi~t 18.:hgu he't cae h~ dich dlfa tIeD CBMT hi~n nay d~u hQc tU cac ngii' li~u don ngii' d~ rut ra cae lu~t xii' 1)\ con BTL l~i

dlfa tren ngil' li~u song ngii'. BTL t~n d\lDg t6i da m6i lien ke't tU trong song ngii'

d€ tlf khii' nh~p nh~ng Iftn nhau, nh~m Dang caD hi~u sua't gall nhan trong ngii' li~u hua'n luy~n. Vi v~y trong BTL, chung ta c6 th~ xay dvng Den kho ngil' li~u SOl1gngil' hua'n luy~n c6 kich thuoc Ion va du<;1Cgall nhan ngon ngii' dgy dil mQt cach tV dQng. Con trong CBMT, till kho ngil' li~u nay phai du<;1cxay dvng b~ng lay ban dgu rho CBMT hQc rhea ki€u giam sat (CBMT h9c~theo ki~u khong giam sat thl c6 cha't lU<;1ngkern bon). Vi~c thu th~p mQt s61On ngil' li~u don ngii'

thl d~ thlfC hi~n .hon so voi ngti' li~u song ngii'. Tuy nhien thong tin khai thac du<;1c tu ngii' li~u song ngii' thl khong phai nhi~u ga'p hai 19n thong tin tu ngii' li~u don

ngii'ma con nhi~u hon the'mIa.

3.4.4 SO Val MO HlNH DJCH DTjATREN co sa TRI THUC (KBMT)

BTL va KBMT d~u dva tIeD co sd tri thUGv~ ngon ngii'va the' gioi thlfC,tuy

nhien c6 di~m khac bi~t v~ mUGdQ va mvc lieu sii' dl}.ng.KBMT dva nhii'ng co sd tri thuGkh6ng 16v~ ngon ngii'va the' gioi thvc va luon phan giai vo rung chi tie'tmQikhai ni~m, mQihanh vi ngon ngil' trong van ban. Con BTL chi dung mQt 1U<;1ngnha vila dil cac tri thuG d6 d€ phvc vv rho vi~c khii' nh~p nh~ng khi cgn thie't ma thai. TrQng tam cila KBMT 18.hi~u ngon ngii', con BTL chi 18.chuy€n

ngil'. ~_B}1T thiGh h<;1prho dich da ngon ngil', con BTL chi thich h<;1prho dich mQt

c~p ngon ngii'. KBMT chi moi thii' nghi~m dich trong mi~n hyp va vi~c md rQng dang g~p ra't nhi~u kh6 khan trong vi~c bi~u di~n kh6i tri thuG kh6ng 16 bell trang.

3.4.5 SO SANH VOl MO HlNH D~CHDT)ATREN vi DV (EBMT)

Ca BTL va EBMT d~u dung ngu li~u song ngu d~ hua'n luy~n, d~u rut ra kinh nghi~m dich tu ngu li~u song ngu nay. Tuy nhien, EBMT don gian chi thvc hi~n vi~c so khap mfiu (patterns) call dn dich vai ta't ca cac call ngu6n c6 trong song ngu, r6i dua ra Call dich chinh la Call dieh cila Call ngu6n gftn ma gi5ng vai Call dn dich nha't. EBMT thong dVa lien co sa ngan ngu hQc, chi dva LIenphep do e1QLuongd6ng giua Call moi vai cac call diet da bier r6i ma thai. EBMT phl,l thuQc ra't nhi~u VaGngu li~u song ngu huan luy~n. Neu cae call dn dich Luong tl,l'nhu nhung ca u ngu6n c6 san trong ngu li~u d6, thl ket qua dich se cao ba't ngo (nhu nguoi !). Ta't nhien la chi phi 1u'Utru va tlm kiem eila EBMT se ra't IOn. 3.4.6 SO SANHVOl CAC 1\10HINH DICH LAI

. .

ThVe ra, xu huang chung LIen the gioi hi~n nay cila cac h~ dich may la dung cae ma hinh duc;!clai t<;10tiTnhi~u cach tier c~n khac nhau. Vi~c lai t~o nh~m t?n dl,lng cac u'Udi~m cila m6i ma hlnh va bu trti khuyet di~m cho nhau. Den nay, da c6 rat nhi~u cae ma hinh lai, nhu: lai giUa KBMT Val EB1\1T,

CBMT +SMT,...

- .

Thve chat, ta c6 th~ n6i lEiBTL lEtket qua lai t?o giITacae each tiep C?ll CBMT, RBMT, KBMT va SMT. Th~t v~y, dftu lien BTL dva tren ngu li~u song ngu (day chinh 1ftCBMT) d~ rut ra cae qui lu~t chuy~n ngu, cac lu?t nay gi5ng h~t nhu la cac lu?t trong RBMT va th~m chi chung ta co th~ hi~u chinh, themfbat b~ng lay cac lu?t trl,l'cquail nay. Trong cae lu~t nay, BTL da rich hc;!p cae eel sa tri thue dn thiet v~ the gioi thvc (nhu WeIdNer) VaGtrang d6 (day ehinh la KBMT). Ngoai ra, trong ph~n gall nh1:lneel sa (baseline), BTL d1:lt~n dl,lngt5i da ket qua eila cae ma hinh dung th5ng ke (SMT) d~ gall ket qua ban d~ u t5t nha't c6 th~ duc;!e.

Một phần của tài liệu DỊCH TỰ ĐỘNG ANH-VIỆT DỰA TRÊN VIỆC HỌC LUẬT CHUYỂN ĐỔI TỪ NGỮ LIỆU SONG NGỮ 4 (Trang 35 -37 )

×