1. Trang chủ
  2. » Luận Văn - Báo Cáo

ThS37 023 cách tiếp cận dựa trên ngữ liệu cho kiểm lỗi chính tả tiếng việt

116 262 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 116
Dung lượng 2,76 MB

Nội dung

TR NG I H C KHOA H C T NHIÊN KHOA CÔNG NGH THÔNG TIN MÔN CÔNG NGH TRI TH C Châu H i Duy - 0112005 CÁCH TI P C N D A TRÊN NG LI U CHO KI M L I CHÍNH T TI NG VI T KHÓA LU N C NHÂN TIN H C GIÁO VIÊN H TS inh NG D N n NIÊN KHÓA 2001 – 2005 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 ic m n Ñ&Ò u tiên em xin t lòng bi t n sâu s c tình giúp , tr c ti p h ng d n truy n có th th c hi n hoàn thành n th y inh n, ng i ãt n t nhi u kinh nghi m quý báu em tài Em xin chân thành c m n th y cô thu c khoa Công ngh Thông tin, tr ng i h c Khoa h c T nhiên Các th y cô ã t n tình d y d , truy n em nhi u ki n th c quý báu su t nh ng n m ih c t cho em có c ngày n ông bà, cha m , nh ng ng i ã sinh n b n nhóm VCL, c bi t hôm Con xin g i l i c m n sâu s c thành nuôi d ng thành ng i Sau xin g i l i c m n n V Th y – ng trình có th ho t i ã t ng h p cung c p ng li u hu n luy n ch ng ng TP H Chí Minh, tháng n m 2005 Châu H i Duy – 0112005 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Nh n xét c a Giáo viên ph n bi n Ch ký c a GVPB Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 cl c u Ch ng 1.1 ng quan Ki m l i t c a ti ng n 1.1.1 Ki m l i t cho ngôn ng châu Âu 1.1.1.1 Ph ng pháp T ng c nh 1.1.1.2 Ph ng pháp 1.1.1.3 Ph ng pháp Danh sách quy t 1.1.2 c tr ng lân c n nh Ki m l i t cho ngôn ng châu Á 1.1.2.1 Mô hình CInsunSpell cho ti ng Hoa 1.1.2.2 Ph 1.1.3 1.2 c ng pháp c a Nagata cho ti ng Nh t ánh giá chung v mô hình Ki m l i t ti ng Vi t 10 1.2.1 Ch 1.2.2 Ki m l i t d a vào phân tích cú pháp 11 1.2.3 Ki m l i t b ng mô hình l 1.2.4 Word 2003 phiên b n ti ng Vi t 13 Ch ng ng trình VietSpell 10 i t 12 s lý thuy t 14 2.1 Chu n t .15 2.2 t s ki n th c c b n v t ti ng Vi t 15 2.2.1 Các y u t c a ti ng ch vi t: 15 2.2.1.1 Âm 16 2.2.1.2 Ch 17 2.2.1.3 Thanh d u 17 2.2.1.4 Ti ng hay âm ti t 17 2.2.1.5 Hình v 17 2.2.1.6 18 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 2.2.2 Quy cách ghi d u ch vi t 19 2.2.3 t qu u tra l i t 19 2.2.3.1 2.2.3.2 âm 2.2.3.3 âm 20 2.2.3.4 âm cu i 20 2.2.4 u 19 u 20 Nguyên nhân 20 2.2.4.1 2.2.4.2 âm 2.2.4.3 âm 21 2.2.4.4 âm cu i 21 2.3 c u 20 u 21 m chung c a m t h ki m l i t .22 2.3.1 Các ch c n ng 22 2.3.2 Các lo i l i t 22 2.3.3 Nguyên nhân gây l i t 23 2.3.4 Các sai l m c a trình ki m l i 24 2.4 s tin h c 25 2.4.1 Lu t Bayes 25 2.4.2 Mô hình N-Gram t ng quát 26 2.4.2.1 ng b ng N-Gram 26 2.4.2.2 Hu n luy n N-Gram 28 2.4.2.3 Làm m n 29 2.4.3 Ch cl Tách t 30 2.4.3.1 Kh p t i a 31 2.4.3.2 WFST 32 ng Mô hình 33 3.1 Mô hình t ng quát 34 3.2 Ti n x lý 37 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 3.2.1 Tách c m ti ng 37 3.2.2 Tách ti ng 37 3.2.3 c “nhi u” 38 3.3 3.2.3.1 Nh n di n ti ng Anh 38 3.2.3.2 Nh n di n t vi t t t 38 3.2.3.3 Nh n di n phiên âm 38 Ki m l i non-word 39 3.3.1 Phát hi n l i 39 3.3.2 a l i 39 3.4 3.3.2.1 a l i phát âm 39 3.3.2.2 a l i nh p li u 40 3.3.2.3 Các l i khác 43 Ki m l i real-word 43 3.4.1 Phát hi n l i b ng bigram 44 3.4.1.1 Ýt ng 44 3.4.1.2 t h p v i trigram 45 3.4.1.3 Làm m n 47 3.4.1.4 Heuristic h n ch l i tích c c 47 3.4.2 Phát hi n l i b ng FMM n-gram 48 3.5 p danh sách ng viên s a l i 50 3.6 c trình ki m l i 51 Ch ng 4.1 Cài Cài 4.1.1 t th c nghi m 52 t 53 Chu n hoá ti ng 53 4.1.1.1 Mã hoá ch 53 4.1.1.2 Mã hoá ti ng 53 4.1.1.3 u trúc l p Tieng 55 4.1.2 Mã hoá t n-gram 57 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 4.1.2.1 Mã hoá t 57 4.1.2.2 Mã hoá n-gram 58 4.1.2.3 u trúc l p Tu 59 4.1.3 4.1.4 u trúc d li u cho t n b n-gram 59 Phát sinh ng viên 60 4.1.4.1 Phát sinh ti ng g n gi ng 60 4.1.4.2 Phát sinh t g n gi ng 61 4.1.5 Ki m l i t 64 4.1.5.1 Dò tìm l i 64 4.1.5.2 p x p ng viên s a l i 66 4.1.5.3 c trình ki m l i 66 4.1.6 Hu n luy n 66 4.1.7 Tích h p vào Word 69 4.1.8 Các x lý khác 70 4.1.8.1 ng mã ti ng Vi t 70 4.1.8.2 Linh tinh 70 4.1.9 4.2 Vài hình nh v Ch ng trình 71 Th nghi m ánh giá .73 4.2.1 Các tham s th nghi m 73 4.2.2 t qu 74 4.2.3 Nh n xét 79 4.2.4 So sánh v i VietSpell 80 4.2.4.1 Kh n ng phát hi n l i 80 4.2.4.2 Kh n ng ngh s a l i 80 4.3 ánh giá K t lu n .88 4.4 ng phát tri n 89 Tài li u tham kh o 90 Ph l c 92 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Danh sách hình Hình 1: Dò tìm l i b ng ma tr n ti ng nh m l n Hình 2: Mô hình t ng quát 36 Hình 3: Bigram c m r ng v phía sau 47 Hình 4: Mã ti ng 54 Hình 5: Mã t 57 Hình 6: Mã n-gram 58 Hình 7: S ki m l i b ng FMM n-gram 65 Hình 8: Quá trình ki m l i 71 Hình 9: Quá trình ki m l i hoàn t t 72 Hình 10: K t qu th nghi m v i P_bi' = 5.33 75 Hình 11: K t qu th nghi m v i P_bi' = 4.95 76 Hình 12: K t qu th nghi m v i P_bi' = 4.73 77 Hình 13: K t qu th nghi m v i P_bi' = 4.59 78 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Danh sách b ng ng 1: Các thành ph n d nh m l n phát âm 39 ng 2: Phím g c phím lân c n 42 ng 3: K t qu th nghi m 74 Danh sách thu t toán Thu t toán 1: Phát sinh ti ng ng viên d a vào l i phát âm 40 Thu t toán 2: Phát hi n l i b ng bigram 45 Thu t toán 3: K t h p bigram trigram phát hi n l i 46 Thu t toán 4: Phát hi n l i b ng FMM n-gram 49 Thu t toán 5: Phát sinh t ng viên 62 Thu t toán 6: Binary Search c i ti n 63 Thu t toán 7: Quá trình hu n luy n 67 Thu t toán 8: Các b c t o n-gram giai n hu n luy n 68 Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t u tv n Là m t ch vi t ghi âm, ch vi t ti ng Vi t c ng có r t nhi u quy cách k t h p t ng ký t c a b ng ch v i nh v t o thành nh ng t có ngh a, i t Vi c dùng úng t r t quan tr ng, nh t v n b n hành M t v n b n sai t có th gây khó ch u cho ng ng i c không tin t ng vào trình c a ng Tr c, làm i ã t o v n b n ó Nh ng quan tr ng h n h t, vi c sai t có th làm ng i dung c n truy n i i ti p nh n hi u sai t c ây, vi c ki m l i t ph i hoàn toàn d a vào s c ng nhiên, xã h i phát tri n, l ng thông tin c n truy n i Tuy t ngày nhi u, vi c ki m l i t “th công” r t m t th i gian công s c n ây, v i s phát tri n nhanh chóng c a công ngh thông tin, ng l c i hành chánh t ra: n t ngày c m r ng m t nhu c u m i ang máy tính có th thay th (m t ph n hay toàn b ) cho ng i vi c ki m l i t , hay nói cách khác ch ng trình b t l i t t xây d ng m t ng Ngoài ra, hi n nhi u v n b n khoa h c c a ti ng Vi t th dùng thêm ti ng Anh ng có thích cho thu t ng ho c cho t không th ch sát ngh a Do ó, m t ch ng trình ki m l i t t ng cho v n b n có c ti ng Vi t ti ng Anh r t c n thi t Thêm vào ó, vi c ki m l i t có th c dùng giai n ti n x lý c a r t nhi u toán khác v x lý ngôn ng t nhiên, ví d nh : phân lo i v n b n, tóm t t v n b n, d ch t ng, nh n d ng ch vi t, nh n d ng gi ng nói, … Tuy nhiên, toán ki m l i t cho ngôn ng châu Âu ã c gi i quy t m t cách tr n v n, vi c ki m l i t cho ti ng Vi t l i -1- Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • • nh (anh y), ng, c (bà y), d , tr ng (trong + y), tr n, (b a) h m … ng, ngo i… • Ch (ch + y), c u, m , d • Ch a (ch a + có), kh ng (/h ng, h ng)… • Ph ng (ph i +không) ng… Phân bi t t / c cu i: Các t có ý ngh a “c t t” t m b ng t ( t…b t, d t, t, r t, s t… 30 t ): C t, ng t, l t, x t, ch t, Phân bi t S / X m / âm: Trong m t s t ti ng, ti ng ng tr c Xà (20 ti ng), ch không ph i Sà: • Xà beng, xà phòng, xà lim, xà rông, xà l n, xà c , xà mâu, xà lách, ( i) xà lui… • Tr sà lan, sà lúp Trong m t s t ti ng, ti ng • ng tr c T m ( 13 ti ng) ch không ph i T m: m b y, t m phào, t m g i, t m vông, t m ph ng, t m phèo, t m ph , t m du t (chùm ru t)… Phân bi t S / X Trong t láy p v n, L ch láy v i X (34 t ): • L + X (28 t ): l ng x ng, lao xao, l n x n, l c x c, l ng x ng, lì xì, lo ng xo ng, loà xoà, li ng xi ng, lon xon… • Tr : l t s t, lo t so t • X + L ( t ): x p lép, l n x n, xi ng li ng, x i l i, x m l m, x c l c • Tr : sáng láng Phân bi t op / ôp / p: t s t v n op có ngh a “thu nh l i” (17 t ): • Bóp, cóp, móp, tóp, hóp, thoi thóp… t s t v n ôp t t • ng (16 t ): p b p, l p c p, l p m c p… p, l p b p, l p c p, l p b p, p p, b p b p, d m p, t s t v n p có ngh a “x u” (23 t ): • p (/b p tai), b p ch p, b p x p, ch p ( n c p), l p x p, nh p, t p, t p, m c p… Phân bi t V / Gi / D W / Hw / Ngw / Qu: t ng ch mang âm u V (15 t ), W (15 t ) không mang âm kia: - 93 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • Ve ve, vo vo, vò vò, vo ve, vi vu, vi vút, vun vút, vùn v t, véo von … • Oa oa, oác oác, oành o ch, oe oe, oang oang, o ng o ng, oai oái, o oe… Phân bi t h i / ngã Các t kh i • • u b ng nguyên âm u mang d u h i (80 t ): o nh, , y ban, uy n chuy n, ng h ng, n s , Tr : m con, mình, nh b ng, nh ng, r … n ng c u ý: Không k t láy theo lu t b ng tr m: m , õng o, o t, o t, m Phân bi t Ch /Tr Ch có kh n ng láy v i v i nguyên âm nhi u ph âm khác (80 t ), Tr ch láy i L (L sau Tr): Ch: • Ch + nguyên âm: Ch • Ch +v: ch i v i, chênh vênh, ch t v t, ch y v y, choáng váng, ch i v i, ch n n… • Ch + l: Cheo leo, chà là, chói lói, chói l i, chàng làng… • L + ch: L ch , láng cháng, lanh chanh, l m ch m, l ch … • Ch + r: chàng ràng, ch n r n, ch o r o… • Ch + m: chào mào, ch ch m ch, chòi mòi… • Tr + l (10 t ): tr t l t, tr t lét, tr c lúc, tr t lít, tr i l i, tr t l t, tr ng l ng… • Tr : tr v , chì ì, chình ình… Tr: • u ý: D u c a ti ng Tr + l khác Phân bi t Ch / Tr, S / X: t s t kh i u b ng Ch tên dùng nhà (25 t ) tên thú (25 t ): • Ch n, chi u, ch o, ch i, chai, chày, chén, chung, ch n, chõ, chum, chình, ch nh, chuông, chiêng, choé, chàng ( c)… • Tr : tranh, tráp • Ch n, cheo, chí (ch y), chu t, chiên, chó, chu n chu n, châu ch u, chào mào, chi n chi n, chích choè, chàng hiu, ch u chàng, chàng làng, chèo b o, ch ng tinh, chìa vôi… • Tr : trai, tr n, trâu, tr , trích, trùn t s t kh i • u b ng S tên (33 t ) tên thú (23 t ): , sanh, si, s i, sác, s , sung, s n, sim, sao, s n, s n, su su, s u âu, sa nhân, n trà, sài h , s t, s y, s u, s n, s ng á, s u riêng, so a, su hào… - 94 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • Tr xoài, xoan, x • Sam, sán, sáo, sâu, s u, sò, sóc, sói, s a, sùng, s u, séo, sen, sít, sa s , sáo s u, n s t, s t , s n ca, s n d ng, san hô, s t sành ng r ng, x ng b Phân bi t ên / ênh êt / êch: t s t v n ênh ch tr ng thái “b p bênh, không v ng ch c” (20 ti ng): • Gh nh thác, g p gh nh, kh p kh nh, chông chênh, lênh ênh, b p b nh, ch nh choáng, ch nh cho ng, ngh nh ngãng, lênh chênh, lênh khênh, b p bênh, công kênh… t s t v n êt t ng tác c a s v t “dính sát vào nhau” (15 t ) ho c “k t thúc” (6 ): • • (Ng i) b t, ph t, l t, l t b t, qu t, l t x t… t (quá), ch t, h t, k t (cu c), m t (m i), (t ng) tr t… t s t v n êch ch tr ng thái “nghiêng, ch ch” (9 t ): • Ch ch, l ch, (vi t) tr ch (dòng), chênh ch ch, (m i) h ch, ngh ch (m t), nh ch (môi), x c x ch, x c x ch… Phân bi t âp / p, n / ng / nh cu i: Có 254 t láy • p âm u có ti ng ng tr c mang v n âp, ch không ph i p: p bênh, kh p kh nh, p úng, nh p nháy, nh p nhô, ch p ch i, b p bùng, r p n, ph p ph ng, th p thò, g p gh nh, ch p ch ng, ng p ng ng… Trong 254 t có 75 ti ng ng sau mang âm ng ho c nh cu i, ch không ph i n: • p gh nh, kh p kh nh, b p b nh… • Th p thoáng, r p ràng, ch p cho ng… • Ng p ng ng, l p l ng, ch p ch ng… • p úng, b p bùng, tr p trùng… • Kh p ng, kh p ng… • Tr : ch p ch n, r p r n, d p d n Phân bi t t / c / ch n / ng / nh cu i t s t láy p âm u có v n t n b ng n / t, nh / ch, ng / c (95 t ): • n / t (47 t ): in ít, san sát, tho n tho t, vùn v t, b n b t, s n s t, bi n bi t, s n t, xoèn xo t… • nh / ch (11 t ): ình ch, bình b ch, thình th ch, trình tr ch, hu nh hu ch, chênh ch ch, x nh x ch… • ng / c (37 t ): r ng r c, ph ng ph c, d ng d c, n ng n c, v ng v c, eng éc, biêng bi c, lông l c, h ng h c, ph ng ph c, h ng h c… • Tr : bàn b c, tan tác, man mác - 95 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t Phân bi t h i / ngã Trong t láy p âm u, (hay d u) c a y u t ph i (ngang-s c-h i) h oc tr m (huy n-ngã-n ng) ( 700 t ) m t h b ng nh nhóm này, ta ph i thu c câu: o Em huy n mang n ng, ngã au o Anh ngang s c thu c, h i au ch ng: • Ngang + h i: nho nh , l loi, vui v , tr o… • c + h i: nh c nh , tr ng tr o, s c s o, v ng v … • i + h i: l ng l o, th th , h n h n, r r … Tr m: • Huy n + ngã: s n sàng, l ng l , v n vã, v v i… • ng + ngã: Nh nhõm, p , m nh m , l nh l o… • Ngã + ngã: l lã, d dãi, ngh nh ngãng, nh ng nh o… • Tr : ngoan ngoãn, khe kh (se s ), ve vãng, nông n i, ph nh ph , b n b , ni m , h h i, h n hòi, hoài hu , nài n , xài x , m y, l ng l ng, v n v n (15 ) Phân bi t t / c / ch cu i: Trong m t s t láy ho c ch cu i (50 t ): p âm u, t cu i ch i v i t cu i ( 20 t ), c cu i ch iv ic t + t: • út + ít: cút kít, thút thít, chút chít, s t s t, t t, l t l t • ôt + êt: t t, s t s t • ot + et: cót két, chót chét, ngót nghét, c t k t • • t, ât + at: v t vát, l t l t, nh t nh t, m t mát… ut + at: nhút nhát, h t h t c + c, ch: • uc + ac: núc nác, l c l c, t c tác… • uc + c: lúc l c,trúc tr c, vúc v c, xúc x c, tr c tr c, h c h c, gi c gi c… • êch + ac: nh ch nhác, ngu ch ngoác, hu ch hoác, ch ch cho c, ngo ch ngo c, ch l c… • uc + ich: khúc khích, núc ních, nhúc nhích, rúc rích, xúc xích, c c k ch, ph c ph ch, r c r ch, ch ch, x c x ch… • ôc + êch: ng c ngh ch, x c x ch, x c x ch - 96 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • oc + ach: óc ách, ngóc ngách, róc rách, c ch, c c c ch… Phân bi t n / ng / nh cu i n + n: • un + in: n n • ôn + ên: h n h n, th n th n • on + en: mon men, rón rén, n n, ng n ngo n, v n v n • • n + ên: v n v n, nh n nh n, r n r n un + n: v n v n, nh n nh n, ng n ngo n ng + ng, nh: • ung + ng: h ng, tung t ng, vung v ng, dùng d ng, vùng v ng, nhùng nh ng, húng h ng, ng ng, th ng th ng… • Tr : úng • ung + inh: lung linh, rung rinh, ùng ình, thùng thình, núng nính, phúng phính, ng nh, th ng th nh, r ng r nh… • ông + ênh: chông chênh, ngông nghênh, công kênh, b ng b nh / b nh b ng, mông mênh / mênh mông, c ng k nh… • ong + anh: long lanh, mong manh, phong phanh, tròng trành, óng ánh, lóng lánh, sóng sánh, ng nh… • ênh + ang: mênh mang, thênh thang, xênh xang, nghêng ngang, vênh vang, nh càng, gi nh giàng, ch nh choáng, lênh láng, kh nh kh ng… • inh + ang: n nh ang, rình rang, tình tang, th nh tho ng, kình càng… Phân bi t ao / au / âu: Trong m t s t láy n au, âu: p âm u, ti ng ng sau ch mang v n ao (70 t ), không mang • Nghêu ngao, rêu rao, m u máo, b u b o, th u thào, l u láo… • Nôn nao, xôn xao, n ào, nh n nháo, l n l o… • láo, ng ngáo, tr tráo, kh kh o… • t dào, ng t ngào, khát khao, sát sao… • ông o, xông xáo, h ng hào, thông th o… • Tanh tao, xanh xao, thao, b nh bao… • Rì rào, thào, xì xào… • • u ý: n ng náu t ghép Phân bi t an / ang, at / ac: - 97 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t Trong t láy p âm ), mang v n an, at: u, ph n l n ti ng ng sau mang v n ang (60 t ) ac (35 • Nghênh ngang, thênh thang, k nh càng, lênh láng… • Th p thoáng, l p loáng, r p ràng, ch nh cho ng… • • màng, m mang, ng ngàng, l làng… bàng, kh khàng, khoe khoang, l làng, nh nhàng, v vang… • Tr : ve vãn • Ng n ngang, x n xang, b n bàng, r n ràng, r n r ng… • Rõ ràng, võ vàng, h hàng Ch có 12 ti ng • • ng sau mang v n an: Ch a chan, h i han, khô khan, mê man, miên man, hân hoan, n ng nàn, t i tàn, vô vàn, hãn, ve vãn, dày d n ( a a v n t ghép) ch l c, h ch h c, ngu ch ngo c, nh ch nhác… • Ng ngác, x xác, ph ph c, x x c, g g c, v v c… • Xao xác, xào x c, nháo nhác,xáo xác… • n dác, nh n nhác, s n sác • c gác, h c hác, m c m c • Man mác, tan tác, bàn b c • c l c, núc nác, t c tác • Bôi bác, b i b c • Xài x c, r i rác Ch có ti ng úng sau mang v n at: • Ào t, d t, ngào ng t, t, xô xát, to tát, c ng cát, rân rát, sây sát Phân bi t iêt / iêc Ch có 13 t mang v n iêc, t t c t l i • u mang v n iêt: c bi c, n chi c, ti c r , ch t thi c, b a ti c, công vi c, ghi c, cá gi c, li c m t, m ng nhi c, di c, làng xi c (xi c) u ý: ch a k lo i t láy p âm c tai, g m u mang nét ngh a “x u”: sách si c, b n bi c… Phân bi t m / âm: t s t mang v n m ch “m c • cao” (30 t ): p l m, h c ch m, rét c m c m, say m, nhìn ch m ch m… th m, cu i g m, ch kh m, m t h m h m, t s t mang v n âm có ý ngh a liên quan n “ph n bên trong” c a s v t (35 t ): - 98 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • Ngâm, ng m, ng m, ng m, ng m, tính nh m, ôm ch m, th m vào, nói th m, m bàn, h m, m m, l m b m… Phân bi t / ay / ây: t s t mang v n có ý ngh a “dài” h oc “kéo dài” (30 t ): • Dai, eo ai, dài, hoài hoài, sóng soài, mi t mài, d i l a, mê m i, tr n i, b i, v ng chãi, mãi, nh n n i… t s t mang v n ay có ngh a “chuy n • ng theo c ng tròn” (10 t ): Xoay, loay hoay, xoáy (khoáy) tóc, ngoáy tai, quay, quày, xay lúa, day tr , ngoay ngo y, ng ngo y… t s t mang v n ây t “ch (26 t ): nh” (11 t ) ho c ch s v t, ng tác “t d i lên” • y, y, ây, bên nây, n y, (ai) n y, v y v y, (làm) v y, bây nhiêu, b y nhiêu, bây gi , b y gi • Cây, dây leo, y r y, c y, khu y, d y lên, y, b y, hây h y, n y lên, rún r y, gi y c , n c nh y, d y, qu y, c a c y… Phân bi t h i / ngã: t ti ng có h B ng (ngang, s c, h i) bi n âm c a c ng có h ng (180 ti ng); m t ti ng có h Tr m (huy n, ngã, n ng) bi n âm c a ng có h Tr m (80 ti ng): • ng: – l n, há – h , ng i – h i, (ch u) c nh – ki ng, (phí) t n – t n, k (m u) – (m ) gh , g i – g i, b o (b i) – b u, m nh – mi ng, ng ng – ng ng, (khinh) r - (khi d ), t - , s (ru ng) – th a, (trí th c) r m – (hàng) d m, qu ng – qu ng… • Tr m: c ng – cùng, – ã, xoà – (tóc) xoã, ( t) m – m, d u – d u, y – y, nh y, l i – lãi, m m – mõm, thòng – thõng, qu y – qu , t - ch , lãnh m) – l nh, (thi) u – , t ( n) – giã, a – d a… • Tr : s a – ch a, mi u – mi u, t - rõ, r i – vãi, gõ – kh , kho ng – quãng Phân bi t ut / uc, un / ung: Các t mang v n un / ut có ý ngh a “gi m b t” (27 t + 20 t ), t mang v n ung / uc ý ngh a này: • Chun (l i), hun, thun, run, vun, ùn, cùn, chùn, dùn, ùn, lùn, dún, lún, sún, (ng n) c n, (cái) c n “váy”, lùn x n, c n c n… • Con út, m t chút, rút b t, lút u, gi m sút, c t ng n, hao h t, dao l t, nh t chí, t c , s t cân, t t xu ng, tr t xu ng… Phân bi t n / ng / nh cu i: uh tt t ng t n b ng ng (42 t ) ho c nh (30 t ): - 99 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • • Oang oang, ùng ùng, lo ng xo ng, oàng oàng, sang s ng, r n r ng, ùng oàng, quang quác… ng ng, ng c, o ng o ng, r ng r c, s ng s c, p ng p ng • Eng éc, beng beng, bi beng, rùm beng, ch p cheng, leng keng, reng reng, phèng phèng, phèng la, l ng k ng, r ng r ng, l ng x ng… • Ùng ùng, ùng ùng, thùng thùng, rùng rùng, p úng, b p bung, b p bùng, thùng, ùng oàng, r ng r nh, lùng túng xèng… • Tr : râm ran, r n r n • u ý: không k lo i t láy âm vút vút) • Bình b ch, thình th ch, hu nh hu ch, ình ch, thình thình, r ng r nh, r p rình, p xình… u ki u chan chát (do chát chát), vun vút (do Phân bi t in / inh: Nhi u t láy • êp âm Rung rinh, u có ti ng ng ng sau mang v n inh (50 t ), ch không ph i in: nh, thùng thình, bùng bình… • p ghình, d p dính, x p xình… • Kháu kh nh, láu l nh, cáu k nh… • Ng ngh nh, v v nh, xoàng x nh, b u b nh, tròn tr nh, lém l nh, b m h nh… • Tr : n n ng b nh, a s t phiên âm mang v n in, mang v n inh: • Lê-nin, c-uyn, ca-bin, at-xpi-rin, c ng-tin, trái mìn, èn pin, v i phin, qu n gin (jean), m ng- ô-lin, pê-nê-xi-lin Phân bi t en / eng: phiên âm ch mang v n en: • En Xan-va- o, áo len, ô-ten, phông-ten, ng-ten, gien (gène), ben-den, a-xê-tilen, chích ven (veine)… t ng ch mang v n eng (x M o lu t 30) Phân bi t an / ang: a s t phiên âm mang v n an, mang v n ang: • An-ba-ni, Pa-xcan, an-bum, lô-can, xi-nhan,can-xi, x ng- an, van (xe an, bom na-pan… • Tr : kinh xáng (chaland), r u vang (vin), tang, cô-tang Phân bi t n / ng, t / c: u h t t phiên âm mang v n ng / c, không mang v n n / t: - 100 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 p), pê- Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • Li-b ng, ng-ghen, xe t ng, nhà b ng, c ng-tin, xi-m ng, ng-ten, èn m ngsông, t ng-gô, d u x ng, ng-xinh, b ng- -rôn, i-v ng, m ng- a, l ng-xê, ga-l ng… • Tr : Viêng-ch n, o n • c L c, công-t c, c quy, tích t c, x c, t c-xi, l p l c (la plaque), ph ctuya… Phân bi t t / c / ch cu i t s ti ng ng sau ng t , tính t y, có v n t n b ng t (60 ti ng): bi u th “m c cao” c a • Tr ng toát, nh n ho t, v t, l nh ng t, chua lét, l ng x t, d to t, t g t, say kh t, dài th t, xanh m t… • Tr : xa l c, thúi ho c, c ng ng c (nh c) ng t , tính t t, non cho t, Phân bi t h i / ngã: t s ti ng ng sau ng t , tính t y, mang d u h i (20 ti ng): bi u th “m c cao” c a ng t , tính t • Nh h u, nh n l u, c t ng n, tr ng nh n, en th i, nóng h i, m t l (l ), x n, chút b o, h n, s c l m, en nh m, d c y, tròn m, ch c m m, sâu h m… • Tr : nh b ng, tr ng nõn, n ng tr u Phân bi t ong / ông: Các t v n ong ch s v t, tr ng thái “cong, vòng tròn” (13 t ) ho c “ph n bên trong” a s v t (8 t ): • Cong, cõng, vòng, còng, g ng, võng, tròng, chong chóng, thòng l ng… • Dòng (sông), lòng, nòng (súng), b ng, h ng, ( ) trong, (cái) phòng, t ng (vào)… Các t v n ông có ngh a “r ng, r ng, cao” (42 t ) ho c “ ng tác m nh”: • Cái ng, c ng, tr ng, l ng, b ng, n ng, gò ng, ng ng, l ng, tr ng l ng, r ng, r ng, ph ng, v ng lên, ph ng m i, ch ng lên… • Tông, t ng, xông, công kích, r ng, n ng, d ng… Phân bi t h i / ngã Các ti ng Hán Vi t kh i u b ng ph âm M, N, Nh, L, V, D, Ng (“Mình Nên Nh Là Vi t D u Ngã”) ch mang d u ngã (180 ti ng), không mang d u h i: • M: mã l c, mãnh thú, m u giáo, mi n d ch… • N: n l c, ph n , noãn sào, trí não… • Nh: nhã, th ch nh , nh ng nhi u, nhi m • L: l th , lãnh t , thành lu , k t li u… c… - 101 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • V: v nh vi n, v l c, v n, vãng lai… • D: h • Ng: Ngôn ng , hàng ng , ý ngh a, ng • Tr : Cây ng i ng d n, d vãng, d ng c m , di m l … ng m … Phân bi t t / c / ch cu i Môt t t n b ng t, bi n âm c a c ng t n b ng t: • t – v t, nh t – nh t, th t – thi t, m t – th t, (r ) sét – rét, quát – n t, nh t – t, r n m t – m t, thét – hét, tái mét – lét, v t – v t, (ng i) b t – ph t, x t, bít – t, keo ki t – keo ki t, hút – nút, vút vút – v t v t, tu t (lúa) – su t, d t – t, xanh m t – m t, l t th t – l t th t… Môt t t n b ng c, bi n âm c a c ng t n b ng c: • ài) – gác, toác – hoác, ngoác (m m), o t c – gi c, ngo c – ngo c (vào), trúc tr c – tr c tr c, (c ng) ng c – nh c, l c c c – l c x c, b c – b c, (thôi) thúc – gi c, l c l o – s c s o, lúc l c – vúc v c, ( i) chác – chu c, lem lu c – nhem nhu c, náo n c – háo h c, tr c – ch c, s c – l c… Môt t t n b ng ch, bi n âm c a c ng t n b ng ch: • Ch ch – x ch, h ch – ngh ch, (tr ng) b ch – (b c) ph ch, th ch, lích kích – l ch ch, l ch ch – l ch b ch, rút – khúc khích… Phân bi t n / ng / nh cu i t t t n b ng n, bi n âm c a c ng t n b ng n: • Chán – ngán, n n, (ta) thán – than, v n – (vô) vàn, (tai) n n – nàn, can – gan, gian – c n, ng n – v n, x n – x n (tay), o n o i – qu n qu i, càn (khôn) – ki n, an – yên, cân – gân, h n – gi n, (s ) ph n – ph n, – l n, y – tr n, liên – sen, nguyên (nhân) – ngu n… t t t n b ng ng, bi n âm c a c ng t n b ng ng: • Hoàng – vàng, ho ng h t – s ng s t, ãng (trí) – lãng (trí), (nhà) hàng – hãng (buôn), (hình) dáng – d ng, c ng – gi ng, hàng (ngày) – h ng, kh ng khít – kh ng khít, (n c) mi ng – mi ng, sàng – gi ng, (l p) ph ng – vuông, (ông) lang – l ng (y), trang – tr ng (v ), nàng – n ng… t t t n b ng nh, bi n âm c a t n b ng nh ho c ng: • Sinh – sanh, th nh – th nh, l nh – lãnh, gh nh – gành, b nh – b nh, l nh – l nh, (bu n) – tanh, v nh (tai) – v nh, kình – k nh càng, binh (v c) – bênh… • (Ch u) c nh – ki ng, kính – ki ng, g ng, linh – thiêng, anh (hùng) – yêng, Trà Vinh – Trà Vang, thinh – ti ng, kh p kh nh – kh p ng, (l ) nh – ãng, thành – thi ng, cánh (hoa) – ki ng… Phân bi t Ch / Tr - 102 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t Ch th ng chuy n i v i Th, T, Ch (m o “Thu t tác chi n”): • Th – Ch: thìa (khoá) – chìa, th c (vào) – ch c, (dây) thun – chun, th (t ) – ch , thi n (môn) – (chùa) chi n, th - ch , th c – chu c, (th i) th ng – chu ng… • T – Ch: t - ch , t - chùa, (v n) t i – ch , t ( ch p, ten (ho n) – chen, t ng (h ng) – ch ng… • Ch – Ch: Ch (nh t) – chúa, (kim) chung – chuông (vàng), (thích) – chua, chuy n – chuy n, chi – chia, ch a – ch a, ch ng – ch ng, chình – ch nh, ch y) – ch … Còn Tr th ng chuy n i v i L, S, , Tr (m o “L ch s ) – che (ch ), ti p (thêm) – i Tr n”): • L – Tr: lên – trên, leo – trèo, lánh – tránh, lêu – trêu, l i – tr i, l n – tr n, n – (tr ) tr n, l n l o – tr n tr o… • S – Tr: (gà) s ng – tr ng, s c (nh ) – tr c, s - tr (xu ng), (chim) sa s - tra tr … • • – Tr: (giúp) - tr (l c), c – (ô) tr c, ìa – trì, úng – trúng… Tr – Tr: ( u) tr – tr , tr - tr , – trung (tâm), trú – tr , (n ng) tr u – tr u, tri u ( ình) – trào, Tràng Ti n – Tr ng Ti n… Phân bi t S / X: S th ng chuy n i v i S, Kh, Gi, R, H, L (“Sau khai gi ng ráng h c lên”): • S – S: s ng – s ng, sài (lang) – sói, s a – s a, sinh – sanh, sênh – sinh, (s ) su t – sót, si – say (mê), san – s n, (ki m) sát – soát, om sòm – um sùm… • Kh – S: Khe kh - se s , (v a) khít – sít, khò khè – sò sè, kh n – s n, kh ng – ng… • Tr : khéo – (tinh) x o, khoáy – xoáy (tóc) • Gi – S: gi (qu ) – s , gi i – (sành) s i, gióng (hàng) – sóng, (cái) giáo – sáo, gi t – sát, gi ng – sàng, giang – sông, (nói) gièm – sàm (t u)… • Tr : giáp (lá cà) – xáp • R – S: r u – s u, r p – s p, ri t – si t, r i – soi, rành – sành, r ng – sáng, rám – m… • H – S: h u – sau, hói (trán) – sói, hãi – s , ho ng h t – s ng s t … • Tr : h ng hái – x ng xái • L – S: liên – sen, l c – s c, (b ch) l p – sáp, li t (kê) – s p (ra), (thanh) l ch – ch, l c l o – s c s o, (thanh) lãng – sóng… Còn X th • ng chuy n i v i X, Ch (“Xu t chúng”): X – X: xa – xe, x m (l c) – x m (t i), xú (u ) – x u, xung (phong) – xông (lên), x n – x n, xoà (tóc) – xoã, xo n – xo n… - 103 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • Ch – X: chen – xen, chung (quanh) – xung, chiêm (tinh) – xem (sao), châm (mình) – xâm, ch - x , ch c (ch n) – xác (th c)… Phân bi t D / Gi / V: D th ng chuy n i v i L, Nh, , D (“Làm nhà o di n”): • L – D: l n l n – d n d n, lay ( ng) – day, l p – d p, l y – d ( dát (m ng), l (r i) – d (l )… • Tr : l t – gi t • Nh – D: nh – d , nhô (ra) – dô, nh p (c u) – d p (c u), nh ng – d ng, nh (nào) – d ng, nh n – d n, nhát – dát, nh n nhác – d n dác… • – D: a – d a, (cây) a – da, (màu) – dà, ao – dao, ( – d ng, ã (qua) – d (vãng)… • D – D: (hình) d ng – dáng, d (h i) – dò, (n i) d y – d y (lên), dù – d u, d u, (gi n) d - d , (s ) d ng – dùng, d - d , di (chuy n) – d i… • Còn Gi th ng chuy n th i gian”): • C – Gi: c n (nhà) – gian, c i (trói) – gi i (phóng), (m c) c - (tr ) giá, kén (ch n) – (tinh) gi n, (tam) c ng – (ba) gi ng, c ng – gi ng, (áo) kép – giáp, keo – (a) giao, kèo – giao (kèo)… • Ch – Gi: chi – gì, ch - gi , ch ng – gi ng (dây), ch m – gi m (l i), chõ – giõ, ch ng – gi ng, (nguy t) – (tháng) giêng, ch p ch n – gi p gi n, chúi – giúi, ch - gi y… • S – Gi: (x M o lu t 42) • Tr – Gi: trùn – giun, tranh – giành, trao – giao, (b o) trì – gi , tr u – gi u, tr i – gi i… • T – Gi: t ( n, t ) – giã, t c – gi c, t t – g t, (tu i) tác – (vóc) gi c, (ng c) t nh – gi ng (ng c), tài – gi i… • Tr : t a – d a, tông (môn) – dòng • Th – Gi: – gi , (thôi) thúc – gi c, thêm – gi m, thìn (n t) – gìn (gi )… • Gi – Gi: gi t – gi t, (cái) gi n – gi n, gi gi m, giá (mà) – gi (s )… Còn V th ph c v ”): ng chuy n t) c tr c), lát – ng m – d m, ình i v i C, Ch, S, Tr, Th, T, Gi (“Các chi n s tr ti c ng – gi ng, gi u – giú, gi m (chân) – i v i Qu, H, Hw, B, M, Ph, V (“ Qu y hàng hoá b n mùa • Qu – V: qu n – v n, qu ng (tr ng) – v ng, qu o – v o, qu n – v n, quây (qu n) – vây (quanh), vun quén – vun vén, qui – v , qu (l y) – v , quét – (v ) vét … • H – V: hai – vài, và, h n – v n, h t – v t, hòng – (hi) v ng, (âm) h (ti ng) vang … - 104 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 ng – Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t • Hw – V: (h i) ho - v , (tai) ho - v , hoang – v ng, hoàng – vàng, ho ch ( nh) – v ch, hoàn (toàn) – v n, (nh n) ho t – v t… • B – V: (t ) b n – v n, biên – ven, bái – vái, bú – vú, b y b - v y vá, b m – m, b n (áo) v n, biên – vi n, b a b a – v a v a… • M – V: mùa – v , múa – v , mùi – v , m a – v , m i – v i, mí – v i, m ng – (c u) v ng, (c ) man – v n, vàn, m a – vô… • Ph – V: phe ph y – ve v y, (l p) ph ng – vuông, ph ng (m nh) – vâng, v ng, phi u – vé, (b ) ph n – ván, ph t – v t, ph t – v t … • V – V: v (k ) – (mình), vi (cá) – vây, v n (th ) – v n, vinh (h nh) – vênh (vang), vi t (dã) – v t ( ng), viên – v n, viên – v n, – vài … Phân bi t W / Hw / Ngw / Qu Khi bi n âm, m t s ti ng v n gi c âm u: • W – W: oai – uy, oan • Hw – Hw: hoa – huê, hoà – hu , (Thu n) Hóa – Hu , (h ) Hoàng – Huynh, hoàng (long) – hu nh, hoãn (l i) – h n, hoàn (thu c) – h n, ho t – hu t… • Ngw – Ngw: ngo i – ngoài, (mèo) ngoao – ngoeo, ngo c (vào) – ngo c, ngo t – ngo t, nguy n - nguy n, ngoay ngo y – ngu y ngu y… • Qu – Qu: (giang) – qua (sông), quay – quày, qu m – qu m, qu n – qu n, qu ng – qu ng, (t p) quán – (thói) quen, qu t – qu t, (th ) qu – qu y, quy n (r ) – (rù) qu n, quí – qu i ( nhân), (cây) qu t – quít, (bát) quái – qu … ng – uyên ng, oa oa – oe oe… - 105 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t k t h p thành phân ti ng k t h p cu ph âm Ph âm u v i âm i ê e ia,ya, iê,yê X X X X Nguyên âm a a, u ô o ua, uô b p m v ph t th x s d gi* r l n tr ch nh kh c k g gh ng ngh h X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X * gi ghép v i i, ia ch vi t m t ch i (Nh ng ô g ch chéo t ti ng Vi t) - 106 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a ng li u cho ki m l i t ti ng Vi t k t h p cu âm v i âm cu i Nguyên âm i/y X X X X i ê e iê i i â a u/o p nh ch X X X X X X X X X X X X X X X X X X X X X X u u o u u X y u X u ô o uô m Âm cu i n t X i i i i i u X X X X ng X X c X X (Nh ng ô g ch chéo t ti ng Vi t) k t h p cu uv iv n n a am an anh ang ap at ach ac c X X X X X X X X Thanh huy n X X X X u h i X X X X (Nh ng ô g ch chéo t ti ng Vi t ) - 107 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 ngã n ng [...]... th c t cho các ngôn ng c ngoài Ph n cu i ch ng s m qua các công trình ã ki m l i ti ng Vi t, cùng v i m t s nh n xét v chúng -3- Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 c công b cho Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t 1.1 Ki m l i chính t c a ti ng n c ngoài 1.1.1 Ki m l i chính t cho các ngôn ng châu Âu Nh ã nói trên, bài toán ki m l i chính t cho các... sĩ Luanvanaz@mail.com - 0972.162.399 Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t 2.2.2 Quy cách ghi d u thanh trên ch vi t Khi b d u thanh theo khoa h c, ta ph i tuân theo 4 quy cách sau ây u ch ghi trên ho c d i nguyên âm, không ghi trên ho c d i ph âm Ví d : láng, b nh, mình ( úng) u ch ghi trên ho c d i âm i nguyên âm (âm chính) , không ghi trên ho c m Ví d : hoà, thu , qu , thu... u ng h p câu sai chính t nh ng v n phân tích cú pháp chính c a ph c ây là h n ch ng pháp này ng v i cách ti p c n trên, [TPLT98] ã xây d ng ch chính t VPCTTV Ch 140 t lo i, 2000 lu n và ng trình ki m l i ng trình này có ph n hoàn ch nh h n [HN99] do có t chính xác 95% - 11 - Viết thuê luận văn thạc sĩ Luanvanaz@mail.com - 0972.162.399 n Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t... 0972.162.399 Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t 2.3 c m chung c a m t h ki m l i chính t 2.3.1 Các ch c n ng chính Nhìn chung, dù có th khác nhau v mô hình và ph ng pháp th c hi n, b t h th ng ki m l i chính t nào c ng bao g m hai kh i ch c n ng chính: • Kh i ki m l i: phát hi n nh ng vùng nghi ng có s hi n di n c a l i chính t • Kh i s a l i: tìm các ng viên thay th cho t b... ng l i sai v cách dùng t , t c là t v n không b sai chính t , nh ng trong hoàn c nh c a câu v n thì vi c dùng nó là không h p lý Tuy nhiên, i cùng v i hi u qu cao là s khó kh n trong cách ti p c n a vào lo i hình ngôn ng (bi n cách hay ki m l i chính t có th c chia thành hai “tr n l p), các ph ng pháp ng phái” chính: ki m l i cho các ngôn ng châu Âu và ki m l i cho các ngôn ng châu Á Ph n chính t ã u... 0972.162.399 Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t Ch ng 1 ng quan nh ng n m 60 c a th k XX, bài toán ki m l i chính t máy tính ã nh n c s quan tâm c a các nhà khoa h c Cho thu t toán, mô hình chúng gi i quy t bài toán này ã ng b ng n nay, r t nhi u c công b , tuy nhiên h u h t u t p trung vào các ngôn ng bi n cách c a châu Âu nh ti ng Anh, ti ng Pháp,… còn ki m l i chính t cho các... báng Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t t h p ó, sau cùng tìm ra cách k t h p có xác su t l n nh t làm l i gi i cho bài toán tách t Theo ánh giá c a tác gi , ph ng pháp này giúp c i thi n chính xác c a OCR t 90% lên 96%, hi u su t tách t là 93% 1.1.3 ánh giá chung v các mô hình trên Các ph ng pháp T ng c nh, c tr ng lân c n và Danh sách quy t ã nh c ng d ng r t thành công cho. . .Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t p nhi u khó kh n Vì v y, cho n nay, m c dù ã có vài công trình v này nh ng h u nh ch a có công trình nào c tiêu c a Nh c áp d ng vào th c t tài ã nói trên, m t ch ng trình ki m l i chính t t trong hoàn c nh hi n nay Tuy ã có m t s công trình v ch a áp d ng tài c vào th c t T nh ng ng là r t c n thi t tài này nh ng h u h t u ki n trên, ... ng cách duy t qua danh sách và so kh p t ng 4 c rút ra các nguyên t c ph thu c vào tr t t Ph 3 c phát này 1.1.1.3 Ph t n d ng u t4 c tr ng v i ang xét Cách ti p c n d a trên ng li u cho ki m l i chính t ti ng Vi t Vì Danh sách quy t nh a ra l i gi i ch d a vào m t c tr ng m nh nh t, hi u su t c a nó ph n l n tùy thu c vào cách xác nh kh n ng quy t cho nh ng ng pháp này, b i vì vi c c tr ng ây chính. .. t cách không h p lý, … 1.2.2 Ki m l i chính t d a vào phân tích cú pháp m 1999, trong lu n v n t t nghi p i h c, Nguy n c H i và Nguy n Ph m H nh Nhi [HN99] ã phân tích cú pháp ây xu t mô hình ki m l i chính t ti ng Vi t b ng cách c xem là cách ti p c n d a trên lu t Theo mô hình này, câu u vào s c h th ng ti n hành phân tích cú pháp b ng thu t toán Earley Nh ng ch không phân tích c s b xem là l i chính

Ngày đăng: 13/07/2016, 15:51

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w