Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 116 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
116
Dung lượng
2,76 MB
Nội dung
TR NG I H C KHOA H C T NHIÊN KHOA CÔNG NGH THÔNG TIN MÔN CÔNG NGH TRI TH C Châu H i Duy - 0112005 CÁCH TI P C N D A TRÊN NG LI U CHO KI M L I CHÍNH T TI NG VI T KHÓA LU N C NHÂN TIN H C GIÁO VIÊN H TS inh NG D N n NIÊN KHÓA 2001 – 2005 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 ic m n Ñ&Ò u tiên em xin t lòng bi t n sâu s c tình giúp , tr c ti p h ng d n truy n có th th c hi n hoàn thành n th y inh n, ng i ãt n t nhi u kinh nghi m quý báu em tài Em xin chân thành c m n th y cô thu c khoa Công ngh Thông tin, tr ng i h c Khoa h c T nhiên Các th y cô ã t n tình d y d , truy n em nhi u ki n th c quý báu su t nh ng n m ih c t cho em có c ngày n ông bà, cha m , nh ng ng i ã sinh n b n nhóm VCL, c bi t hôm Con xin g i l i c m n sâu s c thành nuôi d ng thành ng i Sau xin g i l i c m n n V Th y – ng trình có th ho t i ã t ng h p cung c p ng li u hu n luy n ch ng ng TP H Chí Minh, tháng n m 2005 Châu H i Duy – 0112005 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Nh n xét c a Giáo viên ph n bi n Ch ký c a GVPB Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 cl c u Ch ng 1.1 ng quan Ki m l i t c a ti ng n 1.1.1 Ki m l i t cho ngôn ng châu Âu 1.1.1.1 Ph ng pháp T ng c nh 1.1.1.2 Ph ng pháp 1.1.1.3 Ph ng pháp Danh sách quy t 1.1.2 c tr ng lân c n nh Ki m l i t cho ngôn ng châu Á 1.1.2.1 Mô hình CInsunSpell cho ti ng Hoa 1.1.2.2 Ph 1.1.3 1.2 c ng pháp c a Nagata cho ti ng Nh t ánh giá chung v mô hình Ki m l i t ti ng Vi t 10 1.2.1 Ch 1.2.2 Ki m l i t d a vào phân tích cú pháp 11 1.2.3 Ki m l i t b ng mô hình l 1.2.4 Word 2003 phiên b n ti ng Vi t 13 Ch ng ng trình VietSpell 10 i t 12 s lý thuy t 14 2.1 Chu n t .15 2.2 t s ki n th c c b n v t ti ng Vi t 15 2.2.1 Các y u t c a ti ng ch vi t: 15 2.2.1.1 Âm 16 2.2.1.2 Ch 17 2.2.1.3 Thanh d u 17 2.2.1.4 Ti ng hay âm ti t 17 2.2.1.5 Hình v 17 2.2.1.6 18 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 2.2.2 Quy cách ghi d u ch vi t 19 2.2.3 t qu u tra l i t 19 2.2.3.1 2.2.3.2 âm 2.2.3.3 âm 20 2.2.3.4 âm cu i 20 2.2.4 u 19 u 20 Nguyên nhân 20 2.2.4.1 2.2.4.2 âm 2.2.4.3 âm 21 2.2.4.4 âm cu i 21 2.3 c u 20 u 21 m chung c a m t h ki m l i t .22 2.3.1 Các ch c n ng 22 2.3.2 Các lo i l i t 22 2.3.3 Nguyên nhân gây l i t 23 2.3.4 Các sai l m c a trình ki m l i 24 2.4 s tin h c 25 2.4.1 Lu t Bayes 25 2.4.2 Mô hình N-Gram t ng quát 26 2.4.2.1 ng b ng N-Gram 26 2.4.2.2 Hu n luy n N-Gram 28 2.4.2.3 Làm m n 29 2.4.3 Ch cl Tách t 30 2.4.3.1 Kh p t i a 31 2.4.3.2 WFST 32 ng Mô hình 33 3.1 Mô hình t ng quát 34 3.2 Ti n x lý 37 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 3.2.1 Tách c m ti ng 37 3.2.2 Tách ti ng 37 3.2.3 c “nhi u” 38 3.3 3.2.3.1 Nh n di n ti ng Anh 38 3.2.3.2 Nh n di n t vi t t t 38 3.2.3.3 Nh n di n phiên âm 38 Ki m l i non-word 39 3.3.1 Phát hi n l i 39 3.3.2 a l i 39 3.4 3.3.2.1 a l i phát âm 39 3.3.2.2 a l i nh p li u 40 3.3.2.3 Các l i khác 43 Ki m l i real-word 43 3.4.1 Phát hi n l i b ng bigram 44 3.4.1.1 Ýt ng 44 3.4.1.2 t h p v i trigram 45 3.4.1.3 Làm m n 47 3.4.1.4 Heuristic h n ch l i tích c c 47 3.4.2 Phát hi n l i b ng FMM n-gram 48 3.5 p danh sách ng viên s a l i 50 3.6 c trình ki m l i 51 Ch ng 4.1 Cài Cài 4.1.1 t th c nghi m 52 t 53 Chu n hoá ti ng 53 4.1.1.1 Mã hoá ch 53 4.1.1.2 Mã hoá ti ng 53 4.1.1.3 u trúc l p Tieng 55 4.1.2 Mã hoá t n-gram 57 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 4.1.2.1 Mã hoá t 57 4.1.2.2 Mã hoá n-gram 58 4.1.2.3 u trúc l p Tu 59 4.1.3 4.1.4 u trúc d li u cho t n b n-gram 59 Phát sinh ng viên 60 4.1.4.1 Phát sinh ti ng g n gi ng 60 4.1.4.2 Phát sinh t g n gi ng 61 4.1.5 Ki m l i t 64 4.1.5.1 Dò tìm l i 64 4.1.5.2 p x p ng viên s a l i 66 4.1.5.3 c trình ki m l i 66 4.1.6 Hu n luy n 66 4.1.7 Tích h p vào Word 69 4.1.8 Các x lý khác 70 4.1.8.1 ng mã ti ng Vi t 70 4.1.8.2 Linh tinh 70 4.1.9 4.2 Vài hình nh v Ch ng trình 71 Th nghi m ánh giá .73 4.2.1 Các tham s th nghi m 73 4.2.2 t qu 74 4.2.3 Nh n xét 79 4.2.4 So sánh v i VietSpell 80 4.2.4.1 Kh n ng phát hi n l i 80 4.2.4.2 Kh n ng ngh s a l i 80 4.3 ánh giá K t lu n .88 4.4 ng phát tri n 89 Tài li u tham kh o 90 Ph l c 92 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Danh sách hình Hình 1: Dò tìm l i b ng ma tr n ti ng nh m l n Hình 2: Mô hình t ng quát 36 Hình 3: Bigram c m r ng v phía sau 47 Hình 4: Mã ti ng 54 Hình 5: Mã t 57 Hình 6: Mã n-gram 58 Hình 7: S ki m l i b ng FMM n-gram 65 Hình 8: Quá trình ki m l i 71 Hình 9: Quá trình ki m l i hoàn t t 72 Hình 10: K t qu th nghi m v i P_bi' = 5.33 75 Hình 11: K t qu th nghi m v i P_bi' = 4.95 76 Hình 12: K t qu th nghi m v i P_bi' = 4.73 77 Hình 13: K t qu th nghi m v i P_bi' = 4.59 78 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Danh sách b ng ng 1: Các thành ph n d nh m l n phát âm 39 ng 2: Phím g c phím lân c n 42 ng 3: K t qu th nghi m 74 Danh sách thu t toán Thu t toán 1: Phát sinh ti ng ng viên d a vào l i phát âm 40 Thu t toán 2: Phát hi n l i b ng bigram 45 Thu t toán 3: K t h p bigram trigram phát hi n l i 46 Thu t toán 4: Phát hi n l i b ng FMM n-gram 49 Thu t toán 5: Phát sinh t ng viên 62 Thu t toán 6: Binary Search c i ti n 63 Thu t toán 7: Quá trình hu n luy n 67 Thu t toán 8: Các b c t o n-gram giai n hu n luy n 68 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t u tv n Là m t ch vi t ghi âm, ch vi t ti ng Vi t c ng có r t nhi u quy cách k t h p t ng ký t c a b ng ch v i nh v t o thành nh ng t có ngh a, i t Vi c dùng úng t r t quan tr ng, nh t v n b n hành M t v n b n sai t có th gây khó ch u cho ng ng i c không tin t ng vào trình c a ng Tr c, làm i ã t o v n b n ó Nh ng quan tr ng h n h t, vi c sai t có th làm ng i dung c n truy n i i ti p nh n hi u sai t c ây, vi c ki m l i t ph i hoàn toàn d a vào s c ng nhiên, xã h i phát tri n, l ng thông tin c n truy n i Tuy t ngày nhi u, vi c ki m l i t “th công” r t m t th i gian công s c n ây, v i s phát tri n nhanh chóng c a công ngh thông tin, ng l c i hành chánh t ra: n t ngày c m r ng m t nhu c u m i ang máy tính có th thay th (m t ph n hay toàn b ) cho ng i vi c ki m l i t , hay nói cách khác ch ng trình b t l i t t xây d ng m t ng Ngoài ra, hi n nhi u v n b n khoa h c c a ti ng Vi t th dùng thêm ti ng Anh ng có thích cho thu t ng ho c cho t không th ch sát ngh a Do ó, m t ch ng trình ki m l i t t ng cho v n b n có c ti ng Vi t ti ng Anh r t c n thi t Thêm vào ó, vi c ki m l i t có th c dùng giai n ti n x lý c a r t nhi u toán khác v x lý ngôn ng t nhiên, ví d nh : phân lo i v n b n, tóm t t v n b n, d ch t ng, nh n d ng ch vi t, nh n d ng gi ng nói, … Tuy nhiên, toán ki m l i t cho ngôn ng châu Âu ã c gi i quy t m t cách tr n v n, vi c ki m l i t cho ti ng Vi t l i -1- Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • • nh (anh y), ng, c (bà y), d , tr ng (trong + y), tr n, (b a) h m … ng, ngo i… • Ch (ch + y), c u, m , d • Ch a (ch a + có), kh ng (/h ng, h ng)… • Ph ng (ph i +không) ng… Phân bi t t / c cu i: Các t có ý ngh a “c t t” t m b ng t ( t…b t, d t, t, r t, s t… 30 t ): C t, ng t, l t, x t, ch t, Phân bi t S / X m / âm: Trong m t s t ti ng, ti ng ng tr c Xà (20 ti ng), ch không ph i Sà: • Xà beng, xà phòng, xà lim, xà rông, xà l n, xà c , xà mâu, xà lách, ( i) xà lui… • Tr sà lan, sà lúp Trong m t s t ti ng, ti ng • ng tr c T m ( 13 ti ng) ch không ph i T m: m b y, t m phào, t m g i, t m vông, t m ph ng, t m phèo, t m ph , t m du t (chùm ru t)… Phân bi t S / X Trong t láy p v n, L ch láy v i X (34 t ): • L + X (28 t ): l ng x ng, lao xao, l n x n, l c x c, l ng x ng, lì xì, lo ng xo ng, loà xoà, li ng xi ng, lon xon… • Tr : l t s t, lo t so t • X + L ( t ): x p lép, l n x n, xi ng li ng, x i l i, x m l m, x c l c • Tr : sáng láng Phân bi t op / ôp / p: t s t v n op có ngh a “thu nh l i” (17 t ): • Bóp, cóp, móp, tóp, hóp, thoi thóp… t s t v n ôp t t • ng (16 t ): p b p, l p c p, l p m c p… p, l p b p, l p c p, l p b p, p p, b p b p, d m p, t s t v n p có ngh a “x u” (23 t ): • p (/b p tai), b p ch p, b p x p, ch p ( n c p), l p x p, nh p, t p, t p, m c p… Phân bi t V / Gi / D W / Hw / Ngw / Qu: t ng ch mang âm u V (15 t ), W (15 t ) không mang âm kia: - 93 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • Ve ve, vo vo, vò vò, vo ve, vi vu, vi vút, vun vút, vùn v t, véo von … • Oa oa, oác oác, oành o ch, oe oe, oang oang, o ng o ng, oai oái, o oe… Phân bi t h i / ngã Các t kh i • • u b ng nguyên âm u mang d u h i (80 t ): o nh, , y ban, uy n chuy n, ng h ng, n s , Tr : m con, mình, nh b ng, nh ng, r … n ng c u ý: Không k t láy theo lu t b ng tr m: m , õng o, o t, o t, m Phân bi t Ch /Tr Ch có kh n ng láy v i v i nguyên âm nhi u ph âm khác (80 t ), Tr ch láy i L (L sau Tr): Ch: • Ch + nguyên âm: Ch • Ch +v: ch i v i, chênh vênh, ch t v t, ch y v y, choáng váng, ch i v i, ch n n… • Ch + l: Cheo leo, chà là, chói lói, chói l i, chàng làng… • L + ch: L ch , láng cháng, lanh chanh, l m ch m, l ch … • Ch + r: chàng ràng, ch n r n, ch o r o… • Ch + m: chào mào, ch ch m ch, chòi mòi… • Tr + l (10 t ): tr t l t, tr t lét, tr c lúc, tr t lít, tr i l i, tr t l t, tr ng l ng… • Tr : tr v , chì ì, chình ình… Tr: • u ý: D u c a ti ng Tr + l khác Phân bi t Ch / Tr, S / X: t s t kh i u b ng Ch tên dùng nhà (25 t ) tên thú (25 t ): • Ch n, chi u, ch o, ch i, chai, chày, chén, chung, ch n, chõ, chum, chình, ch nh, chuông, chiêng, choé, chàng ( c)… • Tr : tranh, tráp • Ch n, cheo, chí (ch y), chu t, chiên, chó, chu n chu n, châu ch u, chào mào, chi n chi n, chích choè, chàng hiu, ch u chàng, chàng làng, chèo b o, ch ng tinh, chìa vôi… • Tr : trai, tr n, trâu, tr , trích, trùn t s t kh i • u b ng S tên (33 t ) tên thú (23 t ): , sanh, si, s i, sác, s , sung, s n, sim, sao, s n, s n, su su, s u âu, sa nhân, n trà, sài h , s t, s y, s u, s n, s ng á, s u riêng, so a, su hào… - 94 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • Tr xoài, xoan, x • Sam, sán, sáo, sâu, s u, sò, sóc, sói, s a, sùng, s u, séo, sen, sít, sa s , sáo s u, n s t, s t , s n ca, s n d ng, san hô, s t sành ng r ng, x ng b Phân bi t ên / ênh êt / êch: t s t v n ênh ch tr ng thái “b p bênh, không v ng ch c” (20 ti ng): • Gh nh thác, g p gh nh, kh p kh nh, chông chênh, lênh ênh, b p b nh, ch nh choáng, ch nh cho ng, ngh nh ngãng, lênh chênh, lênh khênh, b p bênh, công kênh… t s t v n êt t ng tác c a s v t “dính sát vào nhau” (15 t ) ho c “k t thúc” (6 ): • • (Ng i) b t, ph t, l t, l t b t, qu t, l t x t… t (quá), ch t, h t, k t (cu c), m t (m i), (t ng) tr t… t s t v n êch ch tr ng thái “nghiêng, ch ch” (9 t ): • Ch ch, l ch, (vi t) tr ch (dòng), chênh ch ch, (m i) h ch, ngh ch (m t), nh ch (môi), x c x ch, x c x ch… Phân bi t âp / p, n / ng / nh cu i: Có 254 t láy • p âm u có ti ng ng tr c mang v n âp, ch không ph i p: p bênh, kh p kh nh, p úng, nh p nháy, nh p nhô, ch p ch i, b p bùng, r p n, ph p ph ng, th p thò, g p gh nh, ch p ch ng, ng p ng ng… Trong 254 t có 75 ti ng ng sau mang âm ng ho c nh cu i, ch không ph i n: • p gh nh, kh p kh nh, b p b nh… • Th p thoáng, r p ràng, ch p cho ng… • Ng p ng ng, l p l ng, ch p ch ng… • p úng, b p bùng, tr p trùng… • Kh p ng, kh p ng… • Tr : ch p ch n, r p r n, d p d n Phân bi t t / c / ch n / ng / nh cu i t s t láy p âm u có v n t n b ng n / t, nh / ch, ng / c (95 t ): • n / t (47 t ): in ít, san sát, tho n tho t, vùn v t, b n b t, s n s t, bi n bi t, s n t, xoèn xo t… • nh / ch (11 t ): ình ch, bình b ch, thình th ch, trình tr ch, hu nh hu ch, chênh ch ch, x nh x ch… • ng / c (37 t ): r ng r c, ph ng ph c, d ng d c, n ng n c, v ng v c, eng éc, biêng bi c, lông l c, h ng h c, ph ng ph c, h ng h c… • Tr : bàn b c, tan tác, man mác - 95 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t Phân bi t h i / ngã Trong t láy p âm u, (hay d u) c a y u t ph i (ngang-s c-h i) h oc tr m (huy n-ngã-n ng) ( 700 t ) m t h b ng nh nhóm này, ta ph i thu c câu: o Em huy n mang n ng, ngã au o Anh ngang s c thu c, h i au ch ng: • Ngang + h i: nho nh , l loi, vui v , tr o… • c + h i: nh c nh , tr ng tr o, s c s o, v ng v … • i + h i: l ng l o, th th , h n h n, r r … Tr m: • Huy n + ngã: s n sàng, l ng l , v n vã, v v i… • ng + ngã: Nh nhõm, p , m nh m , l nh l o… • Ngã + ngã: l lã, d dãi, ngh nh ngãng, nh ng nh o… • Tr : ngoan ngoãn, khe kh (se s ), ve vãng, nông n i, ph nh ph , b n b , ni m , h h i, h n hòi, hoài hu , nài n , xài x , m y, l ng l ng, v n v n (15 ) Phân bi t t / c / ch cu i: Trong m t s t láy ho c ch cu i (50 t ): p âm u, t cu i ch i v i t cu i ( 20 t ), c cu i ch iv ic t + t: • út + ít: cút kít, thút thít, chút chít, s t s t, t t, l t l t • ôt + êt: t t, s t s t • ot + et: cót két, chót chét, ngót nghét, c t k t • • t, ât + at: v t vát, l t l t, nh t nh t, m t mát… ut + at: nhút nhát, h t h t c + c, ch: • uc + ac: núc nác, l c l c, t c tác… • uc + c: lúc l c,trúc tr c, vúc v c, xúc x c, tr c tr c, h c h c, gi c gi c… • êch + ac: nh ch nhác, ngu ch ngoác, hu ch hoác, ch ch cho c, ngo ch ngo c, ch l c… • uc + ich: khúc khích, núc ních, nhúc nhích, rúc rích, xúc xích, c c k ch, ph c ph ch, r c r ch, ch ch, x c x ch… • ôc + êch: ng c ngh ch, x c x ch, x c x ch - 96 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • oc + ach: óc ách, ngóc ngách, róc rách, c ch, c c c ch… Phân bi t n / ng / nh cu i n + n: • un + in: n n • ôn + ên: h n h n, th n th n • on + en: mon men, rón rén, n n, ng n ngo n, v n v n • • n + ên: v n v n, nh n nh n, r n r n un + n: v n v n, nh n nh n, ng n ngo n ng + ng, nh: • ung + ng: h ng, tung t ng, vung v ng, dùng d ng, vùng v ng, nhùng nh ng, húng h ng, ng ng, th ng th ng… • Tr : úng • ung + inh: lung linh, rung rinh, ùng ình, thùng thình, núng nính, phúng phính, ng nh, th ng th nh, r ng r nh… • ông + ênh: chông chênh, ngông nghênh, công kênh, b ng b nh / b nh b ng, mông mênh / mênh mông, c ng k nh… • ong + anh: long lanh, mong manh, phong phanh, tròng trành, óng ánh, lóng lánh, sóng sánh, ng nh… • ênh + ang: mênh mang, thênh thang, xênh xang, nghêng ngang, vênh vang, nh càng, gi nh giàng, ch nh choáng, lênh láng, kh nh kh ng… • inh + ang: n nh ang, rình rang, tình tang, th nh tho ng, kình càng… Phân bi t ao / au / âu: Trong m t s t láy n au, âu: p âm u, ti ng ng sau ch mang v n ao (70 t ), không mang • Nghêu ngao, rêu rao, m u máo, b u b o, th u thào, l u láo… • Nôn nao, xôn xao, n ào, nh n nháo, l n l o… • láo, ng ngáo, tr tráo, kh kh o… • t dào, ng t ngào, khát khao, sát sao… • ông o, xông xáo, h ng hào, thông th o… • Tanh tao, xanh xao, thao, b nh bao… • Rì rào, thào, xì xào… • • u ý: n ng náu t ghép Phân bi t an / ang, at / ac: - 97 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t Trong t láy p âm ), mang v n an, at: u, ph n l n ti ng ng sau mang v n ang (60 t ) ac (35 • Nghênh ngang, thênh thang, k nh càng, lênh láng… • Th p thoáng, l p loáng, r p ràng, ch nh cho ng… • • màng, m mang, ng ngàng, l làng… bàng, kh khàng, khoe khoang, l làng, nh nhàng, v vang… • Tr : ve vãn • Ng n ngang, x n xang, b n bàng, r n ràng, r n r ng… • Rõ ràng, võ vàng, h hàng Ch có 12 ti ng • • ng sau mang v n an: Ch a chan, h i han, khô khan, mê man, miên man, hân hoan, n ng nàn, t i tàn, vô vàn, hãn, ve vãn, dày d n ( a a v n t ghép) ch l c, h ch h c, ngu ch ngo c, nh ch nhác… • Ng ngác, x xác, ph ph c, x x c, g g c, v v c… • Xao xác, xào x c, nháo nhác,xáo xác… • n dác, nh n nhác, s n sác • c gác, h c hác, m c m c • Man mác, tan tác, bàn b c • c l c, núc nác, t c tác • Bôi bác, b i b c • Xài x c, r i rác Ch có ti ng úng sau mang v n at: • Ào t, d t, ngào ng t, t, xô xát, to tát, c ng cát, rân rát, sây sát Phân bi t iêt / iêc Ch có 13 t mang v n iêc, t t c t l i • u mang v n iêt: c bi c, n chi c, ti c r , ch t thi c, b a ti c, công vi c, ghi c, cá gi c, li c m t, m ng nhi c, di c, làng xi c (xi c) u ý: ch a k lo i t láy p âm c tai, g m u mang nét ngh a “x u”: sách si c, b n bi c… Phân bi t m / âm: t s t mang v n m ch “m c • cao” (30 t ): p l m, h c ch m, rét c m c m, say m, nhìn ch m ch m… th m, cu i g m, ch kh m, m t h m h m, t s t mang v n âm có ý ngh a liên quan n “ph n bên trong” c a s v t (35 t ): - 98 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • Ngâm, ng m, ng m, ng m, ng m, tính nh m, ôm ch m, th m vào, nói th m, m bàn, h m, m m, l m b m… Phân bi t / ay / ây: t s t mang v n có ý ngh a “dài” h oc “kéo dài” (30 t ): • Dai, eo ai, dài, hoài hoài, sóng soài, mi t mài, d i l a, mê m i, tr n i, b i, v ng chãi, mãi, nh n n i… t s t mang v n ay có ngh a “chuy n • ng theo c ng tròn” (10 t ): Xoay, loay hoay, xoáy (khoáy) tóc, ngoáy tai, quay, quày, xay lúa, day tr , ngoay ngo y, ng ngo y… t s t mang v n ây t “ch (26 t ): nh” (11 t ) ho c ch s v t, ng tác “t d i lên” • y, y, ây, bên nây, n y, (ai) n y, v y v y, (làm) v y, bây nhiêu, b y nhiêu, bây gi , b y gi • Cây, dây leo, y r y, c y, khu y, d y lên, y, b y, hây h y, n y lên, rún r y, gi y c , n c nh y, d y, qu y, c a c y… Phân bi t h i / ngã: t ti ng có h B ng (ngang, s c, h i) bi n âm c a c ng có h ng (180 ti ng); m t ti ng có h Tr m (huy n, ngã, n ng) bi n âm c a ng có h Tr m (80 ti ng): • ng: – l n, há – h , ng i – h i, (ch u) c nh – ki ng, (phí) t n – t n, k (m u) – (m ) gh , g i – g i, b o (b i) – b u, m nh – mi ng, ng ng – ng ng, (khinh) r - (khi d ), t - , s (ru ng) – th a, (trí th c) r m – (hàng) d m, qu ng – qu ng… • Tr m: c ng – cùng, – ã, xoà – (tóc) xoã, ( t) m – m, d u – d u, y – y, nh y, l i – lãi, m m – mõm, thòng – thõng, qu y – qu , t - ch , lãnh m) – l nh, (thi) u – , t ( n) – giã, a – d a… • Tr : s a – ch a, mi u – mi u, t - rõ, r i – vãi, gõ – kh , kho ng – quãng Phân bi t ut / uc, un / ung: Các t mang v n un / ut có ý ngh a “gi m b t” (27 t + 20 t ), t mang v n ung / uc ý ngh a này: • Chun (l i), hun, thun, run, vun, ùn, cùn, chùn, dùn, ùn, lùn, dún, lún, sún, (ng n) c n, (cái) c n “váy”, lùn x n, c n c n… • Con út, m t chút, rút b t, lút u, gi m sút, c t ng n, hao h t, dao l t, nh t chí, t c , s t cân, t t xu ng, tr t xu ng… Phân bi t n / ng / nh cu i: uh tt t ng t n b ng ng (42 t ) ho c nh (30 t ): - 99 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • • Oang oang, ùng ùng, lo ng xo ng, oàng oàng, sang s ng, r n r ng, ùng oàng, quang quác… ng ng, ng c, o ng o ng, r ng r c, s ng s c, p ng p ng • Eng éc, beng beng, bi beng, rùm beng, ch p cheng, leng keng, reng reng, phèng phèng, phèng la, l ng k ng, r ng r ng, l ng x ng… • Ùng ùng, ùng ùng, thùng thùng, rùng rùng, p úng, b p bung, b p bùng, thùng, ùng oàng, r ng r nh, lùng túng xèng… • Tr : râm ran, r n r n • u ý: không k lo i t láy âm vút vút) • Bình b ch, thình th ch, hu nh hu ch, ình ch, thình thình, r ng r nh, r p rình, p xình… u ki u chan chát (do chát chát), vun vút (do Phân bi t in / inh: Nhi u t láy • êp âm Rung rinh, u có ti ng ng ng sau mang v n inh (50 t ), ch không ph i in: nh, thùng thình, bùng bình… • p ghình, d p dính, x p xình… • Kháu kh nh, láu l nh, cáu k nh… • Ng ngh nh, v v nh, xoàng x nh, b u b nh, tròn tr nh, lém l nh, b m h nh… • Tr : n n ng b nh, a s t phiên âm mang v n in, mang v n inh: • Lê-nin, c-uyn, ca-bin, at-xpi-rin, c ng-tin, trái mìn, èn pin, v i phin, qu n gin (jean), m ng- ô-lin, pê-nê-xi-lin Phân bi t en / eng: phiên âm ch mang v n en: • En Xan-va- o, áo len, ô-ten, phông-ten, ng-ten, gien (gène), ben-den, a-xê-tilen, chích ven (veine)… t ng ch mang v n eng (x M o lu t 30) Phân bi t an / ang: a s t phiên âm mang v n an, mang v n ang: • An-ba-ni, Pa-xcan, an-bum, lô-can, xi-nhan,can-xi, x ng- an, van (xe an, bom na-pan… • Tr : kinh xáng (chaland), r u vang (vin), tang, cô-tang Phân bi t n / ng, t / c: u h t t phiên âm mang v n ng / c, không mang v n n / t: - 100 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 p), pê- Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • Li-b ng, ng-ghen, xe t ng, nhà b ng, c ng-tin, xi-m ng, ng-ten, èn m ngsông, t ng-gô, d u x ng, ng-xinh, b ng- -rôn, i-v ng, m ng- a, l ng-xê, ga-l ng… • Tr : Viêng-ch n, o n • c L c, công-t c, c quy, tích t c, x c, t c-xi, l p l c (la plaque), ph ctuya… Phân bi t t / c / ch cu i t s ti ng ng sau ng t , tính t y, có v n t n b ng t (60 ti ng): bi u th “m c cao” c a • Tr ng toát, nh n ho t, v t, l nh ng t, chua lét, l ng x t, d to t, t g t, say kh t, dài th t, xanh m t… • Tr : xa l c, thúi ho c, c ng ng c (nh c) ng t , tính t t, non cho t, Phân bi t h i / ngã: t s ti ng ng sau ng t , tính t y, mang d u h i (20 ti ng): bi u th “m c cao” c a ng t , tính t • Nh h u, nh n l u, c t ng n, tr ng nh n, en th i, nóng h i, m t l (l ), x n, chút b o, h n, s c l m, en nh m, d c y, tròn m, ch c m m, sâu h m… • Tr : nh b ng, tr ng nõn, n ng tr u Phân bi t ong / ông: Các t v n ong ch s v t, tr ng thái “cong, vòng tròn” (13 t ) ho c “ph n bên trong” a s v t (8 t ): • Cong, cõng, vòng, còng, g ng, võng, tròng, chong chóng, thòng l ng… • Dòng (sông), lòng, nòng (súng), b ng, h ng, ( ) trong, (cái) phòng, t ng (vào)… Các t v n ông có ngh a “r ng, r ng, cao” (42 t ) ho c “ ng tác m nh”: • Cái ng, c ng, tr ng, l ng, b ng, n ng, gò ng, ng ng, l ng, tr ng l ng, r ng, r ng, ph ng, v ng lên, ph ng m i, ch ng lên… • Tông, t ng, xông, công kích, r ng, n ng, d ng… Phân bi t h i / ngã Các ti ng Hán Vi t kh i u b ng ph âm M, N, Nh, L, V, D, Ng (“Mình Nên Nh Là Vi t D u Ngã”) ch mang d u ngã (180 ti ng), không mang d u h i: • M: mã l c, mãnh thú, m u giáo, mi n d ch… • N: n l c, ph n , noãn sào, trí não… • Nh: nhã, th ch nh , nh ng nhi u, nhi m • L: l th , lãnh t , thành lu , k t li u… c… - 101 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • V: v nh vi n, v l c, v n, vãng lai… • D: h • Ng: Ngôn ng , hàng ng , ý ngh a, ng • Tr : Cây ng i ng d n, d vãng, d ng c m , di m l … ng m … Phân bi t t / c / ch cu i Môt t t n b ng t, bi n âm c a c ng t n b ng t: • t – v t, nh t – nh t, th t – thi t, m t – th t, (r ) sét – rét, quát – n t, nh t – t, r n m t – m t, thét – hét, tái mét – lét, v t – v t, (ng i) b t – ph t, x t, bít – t, keo ki t – keo ki t, hút – nút, vút vút – v t v t, tu t (lúa) – su t, d t – t, xanh m t – m t, l t th t – l t th t… Môt t t n b ng c, bi n âm c a c ng t n b ng c: • ài) – gác, toác – hoác, ngoác (m m), o t c – gi c, ngo c – ngo c (vào), trúc tr c – tr c tr c, (c ng) ng c – nh c, l c c c – l c x c, b c – b c, (thôi) thúc – gi c, l c l o – s c s o, lúc l c – vúc v c, ( i) chác – chu c, lem lu c – nhem nhu c, náo n c – háo h c, tr c – ch c, s c – l c… Môt t t n b ng ch, bi n âm c a c ng t n b ng ch: • Ch ch – x ch, h ch – ngh ch, (tr ng) b ch – (b c) ph ch, th ch, lích kích – l ch ch, l ch ch – l ch b ch, rút – khúc khích… Phân bi t n / ng / nh cu i t t t n b ng n, bi n âm c a c ng t n b ng n: • Chán – ngán, n n, (ta) thán – than, v n – (vô) vàn, (tai) n n – nàn, can – gan, gian – c n, ng n – v n, x n – x n (tay), o n o i – qu n qu i, càn (khôn) – ki n, an – yên, cân – gân, h n – gi n, (s ) ph n – ph n, – l n, y – tr n, liên – sen, nguyên (nhân) – ngu n… t t t n b ng ng, bi n âm c a c ng t n b ng ng: • Hoàng – vàng, ho ng h t – s ng s t, ãng (trí) – lãng (trí), (nhà) hàng – hãng (buôn), (hình) dáng – d ng, c ng – gi ng, hàng (ngày) – h ng, kh ng khít – kh ng khít, (n c) mi ng – mi ng, sàng – gi ng, (l p) ph ng – vuông, (ông) lang – l ng (y), trang – tr ng (v ), nàng – n ng… t t t n b ng nh, bi n âm c a t n b ng nh ho c ng: • Sinh – sanh, th nh – th nh, l nh – lãnh, gh nh – gành, b nh – b nh, l nh – l nh, (bu n) – tanh, v nh (tai) – v nh, kình – k nh càng, binh (v c) – bênh… • (Ch u) c nh – ki ng, kính – ki ng, g ng, linh – thiêng, anh (hùng) – yêng, Trà Vinh – Trà Vang, thinh – ti ng, kh p kh nh – kh p ng, (l ) nh – ãng, thành – thi ng, cánh (hoa) – ki ng… Phân bi t Ch / Tr - 102 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t Ch th ng chuy n i v i Th, T, Ch (m o “Thu t tác chi n”): • Th – Ch: thìa (khoá) – chìa, th c (vào) – ch c, (dây) thun – chun, th (t ) – ch , thi n (môn) – (chùa) chi n, th - ch , th c – chu c, (th i) th ng – chu ng… • T – Ch: t - ch , t - chùa, (v n) t i – ch , t ( ch p, ten (ho n) – chen, t ng (h ng) – ch ng… • Ch – Ch: Ch (nh t) – chúa, (kim) chung – chuông (vàng), (thích) – chua, chuy n – chuy n, chi – chia, ch a – ch a, ch ng – ch ng, chình – ch nh, ch y) – ch … Còn Tr th ng chuy n i v i L, S, , Tr (m o “L ch s ) – che (ch ), ti p (thêm) – i Tr n”): • L – Tr: lên – trên, leo – trèo, lánh – tránh, lêu – trêu, l i – tr i, l n – tr n, n – (tr ) tr n, l n l o – tr n tr o… • S – Tr: (gà) s ng – tr ng, s c (nh ) – tr c, s - tr (xu ng), (chim) sa s - tra tr … • • – Tr: (giúp) - tr (l c), c – (ô) tr c, ìa – trì, úng – trúng… Tr – Tr: ( u) tr – tr , tr - tr , – trung (tâm), trú – tr , (n ng) tr u – tr u, tri u ( ình) – trào, Tràng Ti n – Tr ng Ti n… Phân bi t S / X: S th ng chuy n i v i S, Kh, Gi, R, H, L (“Sau khai gi ng ráng h c lên”): • S – S: s ng – s ng, sài (lang) – sói, s a – s a, sinh – sanh, sênh – sinh, (s ) su t – sót, si – say (mê), san – s n, (ki m) sát – soát, om sòm – um sùm… • Kh – S: Khe kh - se s , (v a) khít – sít, khò khè – sò sè, kh n – s n, kh ng – ng… • Tr : khéo – (tinh) x o, khoáy – xoáy (tóc) • Gi – S: gi (qu ) – s , gi i – (sành) s i, gióng (hàng) – sóng, (cái) giáo – sáo, gi t – sát, gi ng – sàng, giang – sông, (nói) gièm – sàm (t u)… • Tr : giáp (lá cà) – xáp • R – S: r u – s u, r p – s p, ri t – si t, r i – soi, rành – sành, r ng – sáng, rám – m… • H – S: h u – sau, hói (trán) – sói, hãi – s , ho ng h t – s ng s t … • Tr : h ng hái – x ng xái • L – S: liên – sen, l c – s c, (b ch) l p – sáp, li t (kê) – s p (ra), (thanh) l ch – ch, l c l o – s c s o, (thanh) lãng – sóng… Còn X th • ng chuy n i v i X, Ch (“Xu t chúng”): X – X: xa – xe, x m (l c) – x m (t i), xú (u ) – x u, xung (phong) – xông (lên), x n – x n, xoà (tóc) – xoã, xo n – xo n… - 103 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • Ch – X: chen – xen, chung (quanh) – xung, chiêm (tinh) – xem (sao), châm (mình) – xâm, ch - x , ch c (ch n) – xác (th c)… Phân bi t D / Gi / V: D th ng chuy n i v i L, Nh, , D (“Làm nhà o di n”): • L – D: l n l n – d n d n, lay ( ng) – day, l p – d p, l y – d ( dát (m ng), l (r i) – d (l )… • Tr : l t – gi t • Nh – D: nh – d , nhô (ra) – dô, nh p (c u) – d p (c u), nh ng – d ng, nh (nào) – d ng, nh n – d n, nhát – dát, nh n nhác – d n dác… • – D: a – d a, (cây) a – da, (màu) – dà, ao – dao, ( – d ng, ã (qua) – d (vãng)… • D – D: (hình) d ng – dáng, d (h i) – dò, (n i) d y – d y (lên), dù – d u, d u, (gi n) d - d , (s ) d ng – dùng, d - d , di (chuy n) – d i… • Còn Gi th ng chuy n th i gian”): • C – Gi: c n (nhà) – gian, c i (trói) – gi i (phóng), (m c) c - (tr ) giá, kén (ch n) – (tinh) gi n, (tam) c ng – (ba) gi ng, c ng – gi ng, (áo) kép – giáp, keo – (a) giao, kèo – giao (kèo)… • Ch – Gi: chi – gì, ch - gi , ch ng – gi ng (dây), ch m – gi m (l i), chõ – giõ, ch ng – gi ng, (nguy t) – (tháng) giêng, ch p ch n – gi p gi n, chúi – giúi, ch - gi y… • S – Gi: (x M o lu t 42) • Tr – Gi: trùn – giun, tranh – giành, trao – giao, (b o) trì – gi , tr u – gi u, tr i – gi i… • T – Gi: t ( n, t ) – giã, t c – gi c, t t – g t, (tu i) tác – (vóc) gi c, (ng c) t nh – gi ng (ng c), tài – gi i… • Tr : t a – d a, tông (môn) – dòng • Th – Gi: – gi , (thôi) thúc – gi c, thêm – gi m, thìn (n t) – gìn (gi )… • Gi – Gi: gi t – gi t, (cái) gi n – gi n, gi gi m, giá (mà) – gi (s )… Còn V th ph c v ”): ng chuy n t) c tr c), lát – ng m – d m, ình i v i C, Ch, S, Tr, Th, T, Gi (“Các chi n s tr ti c ng – gi ng, gi u – giú, gi m (chân) – i v i Qu, H, Hw, B, M, Ph, V (“ Qu y hàng hoá b n mùa • Qu – V: qu n – v n, qu ng (tr ng) – v ng, qu o – v o, qu n – v n, quây (qu n) – vây (quanh), vun quén – vun vén, qui – v , qu (l y) – v , quét – (v ) vét … • H – V: hai – vài, và, h n – v n, h t – v t, hòng – (hi) v ng, (âm) h (ti ng) vang … - 104 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 ng – Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • Hw – V: (h i) ho - v , (tai) ho - v , hoang – v ng, hoàng – vàng, ho ch ( nh) – v ch, hoàn (toàn) – v n, (nh n) ho t – v t… • B – V: (t ) b n – v n, biên – ven, bái – vái, bú – vú, b y b - v y vá, b m – m, b n (áo) v n, biên – vi n, b a b a – v a v a… • M – V: mùa – v , múa – v , mùi – v , m a – v , m i – v i, mí – v i, m ng – (c u) v ng, (c ) man – v n, vàn, m a – vô… • Ph – V: phe ph y – ve v y, (l p) ph ng – vuông, ph ng (m nh) – vâng, v ng, phi u – vé, (b ) ph n – ván, ph t – v t, ph t – v t … • V – V: v (k ) – (mình), vi (cá) – vây, v n (th ) – v n, vinh (h nh) – vênh (vang), vi t (dã) – v t ( ng), viên – v n, viên – v n, – vài … Phân bi t W / Hw / Ngw / Qu Khi bi n âm, m t s ti ng v n gi c âm u: • W – W: oai – uy, oan • Hw – Hw: hoa – huê, hoà – hu , (Thu n) Hóa – Hu , (h ) Hoàng – Huynh, hoàng (long) – hu nh, hoãn (l i) – h n, hoàn (thu c) – h n, ho t – hu t… • Ngw – Ngw: ngo i – ngoài, (mèo) ngoao – ngoeo, ngo c (vào) – ngo c, ngo t – ngo t, nguy n - nguy n, ngoay ngo y – ngu y ngu y… • Qu – Qu: (giang) – qua (sông), quay – quày, qu m – qu m, qu n – qu n, qu ng – qu ng, (t p) quán – (thói) quen, qu t – qu t, (th ) qu – qu y, quy n (r ) – (rù) qu n, quí – qu i ( nhân), (cây) qu t – quít, (bát) quái – qu … ng – uyên ng, oa oa – oe oe… - 105 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t k t h p thành phân ti ng k t h p cu ph âm Ph âm u v i âm i ê e ia,ya, iê,yê X X X X Nguyên âm a a, u ô o ua, uô b p m v ph t th x s d gi* r l n tr ch nh kh c k g gh ng ngh h X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X * gi ghép v i i, ia ch vi t m t ch i (Nh ng ô g ch chéo t ti ng Vi t) - 106 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t k t h p cu âm v i âm cu i Nguyên âm i/y X X X X i ê e iê i i â a u/o p nh ch X X X X X X X X X X X X X X X X X X X X X X u u o u u X y u X u ô o uô m Âm cu i n t X i i i i i u X X X X ng X X c X X (Nh ng ô g ch chéo t ti ng Vi t) k t h p cu uv iv n n a am an anh ang ap at ach ac c X X X X X X X X Thanh huy n X X X X u h i X X X X (Nh ng ô g ch chéo t ti ng Vi t ) - 107 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 ngã n ng [...]... th c t cho các ngôn ng c ngoài Ph n cu i ch ng s m qua các công trình ã ki m l i ti ng Vi t, cùng v i m t s nh n xét v chúng -3- Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 c công b cho Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t 1.1 Ki m l i chính t c a ti ng n c ngoài 1.1.1 Ki m l i chính t cho các ngôn ng châu Âu Nh ã nói trên, bài toán ki m l i chính t cho các... sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t 2.2.2 Quy cách ghi d u thanh trên ch vi t Khi b d u thanh theo khoa h c, ta ph i tuân theo 4 quy cách sau ây u ch ghi trên ho c d i nguyên âm, không ghi trên ho c d i ph âm Ví d : láng, b nh, mình ( úng) u ch ghi trên ho c d i âm i nguyên âm (âm chính) , không ghi trên ho c m Ví d : hoà, thu , qu , thu... u ng h p câu sai chính t nh ng v n phân tích cú pháp chính c a ph c ây là h n ch ng pháp này ng v i cách ti p c n trên, [TPLT98] ã xây d ng ch chính t VPCTTV Ch 140 t lo i, 2000 lu n và ng trình ki m l i ng trình này có ph n hoàn ch nh h n [HN99] do có t chính xác 95% - 11 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 n Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t... 0972.162.399 Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t 2.3 c m chung c a m t h ki m l i chính t 2.3.1 Các ch c n ng chính Nhìn chung, dù có th khác nhau v mô hình và ph ng pháp th c hi n, b t h th ng ki m l i chính t nào c ng bao g m hai kh i ch c n ng chính: • Kh i ki m l i: phát hi n nh ng vùng nghi ng có s hi n di n c a l i chính t • Kh i s a l i: tìm các ng viên thay th cho t b... ng l i sai v cách dùng t , t c là t v n không b sai chính t , nh ng trong hoàn c nh c a câu v n thì vi c dùng nó là không h p lý Tuy nhiên, i cùng v i hi u qu cao là s khó kh n trong cách ti p c n a vào lo i hình ngôn ng (bi n cách hay ki m l i chính t có th c chia thành hai “tr n l p), các ph ng pháp ng phái” chính: ki m l i cho các ngôn ng châu Âu và ki m l i cho các ngôn ng châu Á Ph n chính t ã u... 0972.162.399 Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t Ch ng 1 ng quan nh ng n m 60 c a th k XX, bài toán ki m l i chính t máy tính ã nh n c s quan tâm c a các nhà khoa h c Cho thu t toán, mô hình chúng gi i quy t bài toán này ã ng b ng n nay, r t nhi u c công b , tuy nhiên h u h t u t p trung vào các ngôn ng bi n cách c a châu Âu nh ti ng Anh, ti ng Pháp,… còn ki m l i chính t cho các... báng Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t t h p ó, sau cùng tìm ra cách k t h p có xác su t l n nh t làm l i gi i cho bài toán tách t Theo ánh giá c a tác gi , ph ng pháp này giúp c i thi n chính xác c a OCR t 90% lên 96%, hi u su t tách t là 93% 1.1.3 ánh giá chung v các mô hình trên Các ph ng pháp T ng c nh, c tr ng lân c n và Danh sách quy t ã nh c ng d ng r t thành công cho. . .Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t p nhi u khó kh n Vì v y, cho n nay, m c dù ã có vài công trình v này nh ng h u nh ch a có công trình nào c tiêu c a Nh c áp d ng vào th c t tài ã nói trên, m t ch ng trình ki m l i chính t t trong hoàn c nh hi n nay Tuy ã có m t s công trình v ch a áp d ng tài c vào th c t T nh ng ng là r t c n thi t tài này nh ng h u h t u ki n trên, ... ng cách duy t qua danh sách và so kh p t ng 4 c rút ra các nguyên t c ph thu c vào tr t t Ph 3 c phát này 1.1.1.3 Ph t n d ng u t4 c tr ng v i ang xét Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t Vì Danh sách quy t nh a ra l i gi i ch d a vào m t c tr ng m nh nh t, hi u su t c a nó ph n l n tùy thu c vào cách xác nh kh n ng quy t cho nh ng ng pháp này, b i vì vi c c tr ng ây chính. .. t cách không h p lý, … 1.2.2 Ki m l i chính t d a vào phân tích cú pháp m 1999, trong lu n v n t t nghi p i h c, Nguy n c H i và Nguy n Ph m H nh Nhi [HN99] ã phân tích cú pháp ây xu t mô hình ki m l i chính t ti ng Vi t b ng cách c xem là cách ti p c n d a trên lu t Theo mô hình này, câu u vào s c h th ng ti n hành phân tích cú pháp b ng thu t toán Earley Nh ng ch không phân tích c s b xem là l i chính