Kiểm lỗi chính tả cảm ngữ cảnh tiếng việt

64 18 0
Kiểm lỗi chính tả cảm ngữ cảnh tiếng việt

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

004 ;\'Â T • i ^ ĐẠI HỌC QUỐC GIA HÀ NỘI KHOA CÔNG NGHÊ NGUYỄN PHƯƠNG THÁI KIỂM LỖI CHÍNH TẢ CẢM NGỮ TIẾNG VIỆT LUẬN VĂN THẠC SỸ CẢNH CHUYÊN NGÀNH: TIN HỌC MÃ NGÀNH: 010110 NGƯỜI HƯỚNG DẪN: PGS NGUYỄN QUỐC TOẢN ĐẠi Mí.:-.: CÍ-:( HÁ NỎI TRUNGTÂM ■Áìi TiiơVIỀN N o V : J -OUA(? L t HÀ NỘI - 2003 M ụ c lụ c Chương 1: B i to n k i ể m G i i t h iệ u c c p h n g p h p k i ể m l ỗ i c h í n h t ả T iế p c ậ n c ủ a c h ú n g t ô i M ộ t s ố p h n g p h p h ọ c m y t h ố n g k ê t r o n gNLP H m p h â n l o i B a y e s " n g â y t h " D a n h s c h q u y ế t đ ị n h N ộ i s u y Chương 2: Đ ặ c đ iể m t i ế n g V i ệ t C c đ n v ị c ủ a t iế n g V i ệ t 2.1 T n iế 2.2 T 2.3 Câu M ộ t s ố đ ố i tư ợ n g n g ô n n g ữ m lu ậ n v ã n s ẽ k h a i t h c 3.1 T n iế T v t l o i Chương 3: C c y ê u c ầ u c h í n h c h o c n g v iệ c X l ý v ă n b ả n Đ n h d ấ u d ữ l i ệ u T o c o r p u s t h ô t I n Chương 4: T ậ p n h ầ m l ẫ n â m t i ế t 1 N h ầ m l ẫ n d o đ n h m y s a i N h ầ m l ẫ n d o p h t â m N h ầ m lẫ n c ủ a c c h ệ n h ậ n d n g .chữ K i ể m l ỗ i c h í n h t ả d ự a v o t đ i ể n T h u ậ t t o n Đ n h g i Chương 5: G i i t h i ệ .u C c t h u ộ c t í n h T g h é p C o l l o c a t i o n T n g ữ c ả n h H u ấ n l u y ệ n T h u ậ t to n k i ể m l ỗ i T h u ậ t to n k i ể m lỗi 3.2 Đánh giá độ phứctạp 4.Đánh giá 1B ộ t e s t 4.2 Độ đo 4.3 Kếtquảvàthảo luận Chương 6: K i ể m l ỗ i c h í n h t ả s d ụ n gh m phân B a y e s 31 32 33 33 34 35 36 38 38 lớp G iớ i t hiệ u 2.T huậ tto n 3.Đ ánh giá th ả o lu ận Kếtl u ậ n ,4 4 T i l i ệ ut h a m k h ả o 46 P h ụ l ụ c C H Ư Ơ N G 1: G IỚ I T H IỆ U Đ â y c h n g n h ậ p đ ề c ủ a lu ậ n v ã n C h n g n y g i i t h iệ u v ề b i to n k iể m l ỗ i c h ín h tả , c c p h n s p h p k iể m l ỗ i c h í n h tả , v m ộ t s ố k ỹ t h u ậ t h ọ c m y s ẽđượcsửdụngtrongcácchươngsau Bài toán kiểm lỗi tả B i to n k i ể m l ỗ i c h í n h t ả k h ô n g tầ m th n g v c ó t í n h ứ n g d ụ n g c a o C c c h n g t r ì n h s o n th ả o v x l ý v ă n b ả n r ấ t c ầ n t í n h n ă n g s o t l ỗ i c h í n h t ả tự đ ộ n g đ ể g iú p n g i s d ụ n g g iả m th i g ia n v c ô n g s ứ c b ỏ C c c h n g t r ì n h n h ậ n d n g v ă n b ả n c ũ n g c ầ n t í n h n ă n g n y đ ể n â n g c a o c h ấ t lư ợ n g n h ậ n d n g Một chưong sốt lỗi trìnhkiểm lỗi gợi ý Chức c h ín h tả cóhai chức n ă n g s o t l ỗ i s ẽ c h ỉ r a c c â m t i ế t s a i, c ò n c h ứ c n ă n g g ợ i ý t h ì đ a r a d a n h s c h ứ n g c v iê n â m t i ế t đ ú n g v i m ỗ i â m t i ế t s a i đ ợ c t ì m M ộ t s ố c h n g t r ì n h k iể m l ỗ i c h í n h t ả t iế n g V i ệ t t h ô n g d ụ n g : V ie t R e s : Đ â y m lỗi l b ộ g õ t iế n g tả âm Việt có chức kiể t iế t , c h y tr ê n h ệ đ iề u h n h D O S n ê n h iệ n g i k h n g c ị n đ ợ c s d ụ n g p h ổ b iế n V ie t S p e l l ếng Việt 2000: mức Chương trình từ v ự n g (dĩ k iể m lỗi tả ti n h iê n l c ả â m t i ế t ) G iói thiệu T a c ó th ế c h i a d ự a tr ê n lu ậ t n h phương kiểm lỗi tả p h p k iể tả t h n h h a i l o i p h n s p h p cácphương m lỗi phươnẹ iề u p h n e N h ê Trong ữngphươngt pháp khoảng mườinăm pháp thống p h pk i ể m l ỗ i c h í n h Anh iế p b ằ n g c c h g tả t iế n phápnàyxemxétvấnđềkiểmlỗiq u i n ó v ề b i to n x l ý n h ậ p n h ằ n g vừaqua, k thống k ê đ ã đ ợ c đề x u ấ t c h í n h t ả h o ặ t r ự c t iế p , h o ặ c g iá n ctừvựne M ộ t s ố n g h iê n c ứ u s d ụ n g m ô h ì n h k ê n h n h iễ u n h M C h a y s v c ộ n g s ự ( 9 ) , urchvàGale(1991),BrillvàMoore(2001).Mơhình k ê n h n h iễ u r ấ t t ổ n g q u v c ó k h ả n ã n g p d ụ n g c h o n h iề u v ấ n đ ề k h c n h a u , v ề m ộ t tr ự c g iá c , k ê n h n h iễ u t k ê n h t r u y ề n t h ô n g m t h ô n g t i n t r u y ề n q u a c ó th ể b ị n h iễ u v k h ó n h ậ n d n g đ ợ c t h ô n g t i n đ ú n g G i ả s o từ ta n h ậ n đ ợ c c u ố i đ ợ k ê n h , ta c ầ n đ o n từ đ ã ctruyềnđi.GiảsửVlàtừvựngcủangơnngữ,khiđó: A w = a r g m a x P ( w I o ) W th e o c ô n g th ứ c B a y e s : P thêm v o đ ó , v ì P ( O ) n hư nhauvớimọiw t huộc V nên: s Aẽ wn= a gr gm ah x Mays(1990)tínhP (0iê n W€V tr ( O lw ) s d ụ n g th u ậ t to ig r n M i n im u m - e d i t - d i a m stance(tacứuởchư ơngsau),cònP(w)đ ợ c c lư ợ n g b ằ n g mơhìnhngơnngữ (word trigram) từ Y a r o w s k y ( 9 ) p d ụ n g d a n h s c h q u y ế t đ ịn h đ ể n h ậ n d n g từ đ ú n g Ư u đ iể m c ủ a p h n g p h p n y s o v i p h n g p h p tr ê n k h ả n ă n g s d ụ n g n h iề u lo i t r i th ứ c n e ô n n g ữ , k h ô n e c h ỉ t r ig r a m Đ iể m đ ặ c b iệ t l n ó r a q u y ế t đ ịn h c h ỉ d ự a tr ê n m ộ t d ấ u h iệ u t i n c ậ ynhất G o l d in s ( 9 )đ ề x u ấ t p h ương p h p lai " n g â yt h " P h n g ph áp nàv c ũ n ec ó khả ngữ danh s c h q u y ế t đ ịn h nhưnc Bayes, sử ụng hàm d p hân n ă n ss d ụ n s n h iề u lo i tri lo B a ại y e th ức s n nh g ô iề u q u y ế t đ ịn hd ự a t r ên kếthợp n d ấu h iệ u G o l d in g v S c h a b e s (1996) kết hợp mơ hình t r ig r a m t lo i v hàm phân lo i B a y e s T r c t iê n , m h ì n h t r is r a m x c đ ịn h từ lo i đ ú n stạivịtríđancxétdựavàongữcảnh,nếucịnnhậpnh ằ n g t h ì p h n g p h p la i B a v e s s ẽ x l ý tiế p G ầ n đ y h n , c ó c c p h n g p h p : h ọ c d ự a tr ê n b iế n đổi(ManguvàBrill,1997),phântíchnghĩaẩn(Jon e s v M a r t in , 9 ) , d if f e r e n t i a l - g r a m m a r s ( P o w e r s , 9 ) , W in n o w - b a s e d ( G o l d i n g v R o t h , 9 ) , v k h ô i p h ụ c c ố k ế t từ v ự n e ( H i r s t v B u d a n it s k y , 0 1) C c p h n g p h p k iể m l ỗ i c h í n h t ả t iế n g V i ệ t d ự a t r ê n lu ậ t đ ợ c n g h iê n c ứ u k h n h iề u , m ứ c â m t i ế t , p h n g p h p s d ụ n g lu ậ t c ấ u tạ o â m t i ế t k ế t h ợ p v i t đ iể n m t iế t c h o k ế t q u ả t ố t n h ấ t ( P h m H n g N g u y ê n , 9 ) Â m t i ế t v o s ẽ đ ợ c p h â n lo i b ằ n g c c h p h â n t í c h c ấ u tạ o v tr a t đ iể n , c c lo i c ósaith cấuể ótạolà, : cảu tạo khơng có từ điển , có từ điển, sai cấu tạo lừ tiếng nước ngồi Ví du: S c ấ u tạ o : te t Đ ú n g c ấ u tạ o n h n g k h n g c ó tr o n g từ đ iể n : h n C ó tr o n g từ đ iể n : v ị t S a i c ấ u tạ o n h n g c ó th ể từ tiế n g n c n g o i: fo r e ig n M ứ c k iể m l ỗ i n y k h ô n g b ắ t đ ợ c c c l ỗ i từ s a i n h n g â m t i ế t đ ú n g v ì k h n g s ửdụngthơngtinngữcảnh m ứ c từ v ự n g , c c l ỗ i s a i t s h é p c ó th ể đ ợ c b d ự a v o từ đ iể n t iế n g V i ệ t ( L u v ắ t H X u y ê n , 0 ) P h n g p h p n y c ó u đ đ n g iả n b ắ t k h t ố t c c l ỗ i iể m từ g h é p m ứ c đ ộ k i ể m t r a n h ỏ ( n h ỏ h n Vietspell 0 ) N h ợ c đ iể m t r a th e o k h ô n g b ắ t đ ợ c l ỗ i từ đ n v h a y b o l ỗ i s a đ ộ k i ể m lớ n ( t h e o V ie t s p e l l i m ứ c 0 ) v ì q u u t iê n từ g h é p C ó m ộ t s ố n g h iê n c ứ u ứ n g d ụ n g p h â n t í c h c ú p h p t r o n s k i ể m l ỗ i c h í n h tả C c th u ậ t to n E a r l e y v C Y K đ ã đ ợ c d ù n g đ ể p h â n t í c h c ú p h p t iế n g V i ệ t p h ụ c v ụ c h o k iể m l ỗ i c h í n h tả ( N s u y ễ n C ô n g T ú , 9 ) ( L ê T h a n h H n g , 9 ) , n h n g k ế t q u ả th ự c n h iệ m đ ã k h ô n g c h ỉ r õ đ ợ c h iệ u q u ả c ủ a p h n g p h p n y C h o đ ế n n a y c h a c ó n g h iê n c ứ u n o ứ n g d ụ n g p h â n t í c h n g ữ n g h ĩ a v n g ữ d ụ n g c h o k iể m l ỗ i c h ín h tả t iế n g V iệ t Tiếp cận chúng tỏi M ộ t n h ợ c đ iể m c h u n g c ủ a c c n c h n g t r ì n h k i ể m l ỗ i c h í n h t ả t iế n g V d i ệ t h iệ n n a y k h ô n g c ó k h ả n ã n g h ọ c ( v ì s n d ụ n g p h n g ự a t r ê n l u ậ t ) , th ê m lo i t r i th ứ c e ô n pháp g ữ đ ợ c k h a i th c l r ấ t h n c h ế vàođócác L u ậ n v ă n n y lự a c h ọ n h a i p h n g p h p c ủ a Y a r o w s k y ( 9 ) v G o ỉ d in g ( 9 , 9 ) đ ể p d ụ n g c h o t iế n g V i ệ t N h ữ n g p h n g p h p n y t h u ộ c t iế p c ậ n d ự a tr ê n th u ộ c t í n h(feature-based method) Ư u đ iể m a i th c n h iề u lo i bậtcủa t r i th ứ c yện Quá cầu corpus cho huấn lu y ệ n ngơn trình ngữ chỉyêu huấn r ú t r a extract() n h ữ n g kiểm lỗi Hơn nữa,khả học kh lu t r i th ứ c c ầ n t h iế t c h o v iệ c m c h o c h r m t r ì n h c ó th ể t h í c h n g h i v i s ự t h a y đ ổ i k h ô n s n g n g c ủ a n g ô n n g ữ v i í t đ ò i h ỏ i v ề s ứ c n g i M ộ t sỏ phương N h iề u vấn đề phân lo i Trong v d ự đ o n " lớ p " n g ô n nageữ A c h í n h x c C ô n g v iệ c n y b a o g m x â y d ự n g m ộ t h m p h â n lo ạci l: B - * A m h o r a c ó th ể đ ợ c th ự c h iệ n v i m ộ t p h â n p h ố i x c s u ấ t đ iề u k i ệ n pP(a, I b) x c s u ấ t c ủ a " l ó p " a k h i c h o tr c " n g ữ c ả n h " b n o đ ó N g ữ c ả n h t r o n g c c b i to n N L P b a o g m í t n h ấ t l c c từ , v n g ữ c ả n h c h í n h xác p h ụ t h u ộ cv o b ả n c h ấ t c ủ a v ấ n n g ữ c ả n hb c ó th ể c h ỉ d u y n h ấ t m ộ t từ , t r o n g c, b bao gồm đề Với số vấn đề, k h i c c b i to n k h m ộ t v i từ v n h ã n c ú p h p tư n g ứ n g C c c o r p u s v ă n b ả n lớ n th n g c h ứ a m ộ t s ố t h ô n g t i n v ề s ựđổng xuất h iệ n c ủ a v i m ọ i c ặ p ( a ,b ) b ộ(j->ơrriơl) cục v P h ầ n n y g iớ i t h iệ u m ộ t s ố m h ì n h h ọ c m y t h ố n g k ê t ổ n g q u t , k h ô n g p h ụ t h u ộ c v o l ĩ n h v ự c h a y ứ n s d ụ n g G i ả sử : - A tậ p c c b iế n c ố ( d ự đ o n ) c ó th ể c ó B t ậ p c c n s ữ c ả n h c ó th ể c ó - T ậ p c c v ị t n g ữ c CPản h= {c p ,, ,cpm} , t r o n g đ ó m ỗ i h m cpị : B —>{true, false) c h o b iế t c ó h a y k h n g t h ô n g t i n h ữ u íc h t r o n g n g ữ b e - Tập huấn lu y ệTn= {(ax,b\), (aN,bN) } , bLó € B n g ữ c ả n h v àaị A < lớ p đ ú n g c ủ a n ó c ảBn nàh o đ ó đ s c h 30/235 t r o n g 347/2941 c ậ p 323/329 m n g 25/560 q u a n g 6/30 c i 0/501 n ă m 110/793 t h n g 134/432 lớ n 54/460 lợ i 38/168 d o a n h 217/352 c h n g 457/499 c ô n g 2001/2608 c h ú n g 122/501 s ắ p 46/81 đ ã 69/1964 đ a n g 1/797 b n 83/213 k h c h 284/317 b i ế n 63/211 T ổ n g Đ ộ c ộ n g c h í n h t o n - 31.2464 m ộ t B ả n g k ế t s c h q u ả 159/235 t r o n g c ậ p :312/329 :94.8328 m n g q u a n g :23/30 c i :489/501 n ă m t h n :76.6667 :515/793 g 39 : 15/4 :64.9433 l n :419/460 l ợ i : / d o a n h :280/352 c h n g c ố n g c h ú n g :369/501 s ắ p : 44/81 đ ã : 1855/1964 đ a n g :732/797 b n : 129/213 k h c h :270/317 b i ế n 150/211 T ổ n g c ộ n g : N h t a n c ữ c ả n h t e s t m d i B ả n g s c h đ â y - t r t h ấ y , k ế t :94/235 o : ng : c ậ p :309/329 m n g :400/5 q u a n g :20/30 c i : / n ă m :524/793 t h n g l n :424/460 lợ i :70/168 d o a n h c h n g c ô n g c h ú n g s ắ p đ ã q u ả :47/81 : 1061/1964 40 đ a n g :417/797 b n :94/213 k h c h b i ế n : 116/211 T ổ n g c ộ n g : K ế t q u ả n y " đ a n g " , k h ổ n g "đã" c h u n g s ẽ n ă n g , g i ả m t ứ c c ả n h l t h n g n g ữ c ó c ả n h t h n g ( d a n h từ , - Đ đ ộ n g c h í n h ộ K Đ ộ N h t h í c h :54.9763 c h í n h x c v ậ y t h e o h ợ p 41 n h ấ t CHƯƠNG 6: KIỂM L ỗ i c h í n h t ả s d ụ n g HÀM PHÂN LOẠI BAYES Giới thiệu C h n g n y " n g â y t r ì n h t h " d n g n h h i ệ u d a n h đ ể C r a c collocation l o q u y ế t i t h u v ộ v ề d ữ l i ệ u , d a n h s c h v c từ đ ộ q u y ế t Thuật toán T h u ậ t t o n đ ị n h d i đ ã t ậ p đ ợ c n h ầ m N l ẫ n h c lạ i c = r ằ n g { w _ Ả w _ , , w L u ậ t r a a agr = q u y ế t m a x ( ] ~ Ị pự I M ’) ) P ( w ’) wẽS fec Đ ể t r n h t r n s ố t r o n g m a y t í n agr = h k h i t í n h t í c h n m a x ( ^ l o g ( / >( / h I H i ề u ’) ) s ố + l o q g u ( / , (H weS fec X c s u ấ t c ủ a t h u ộ c t í n h v i đ i ề u k i ệ n từ : P ( f \ w ) = - Ă ) p l( f \ w ) + Ẳp2( f ) T r o n g đ ó P^P2 l c c x c s u ấ t r ì n t t í n h t h e o M L Thuật toán kiểm lỗi: 42 E , < Ă< n h '))) ỏ , t a s d ụ n g l o g a r i t : tú i G i ả s c â u v o V.V.), v s ố , c h o c c t í n h â m t i ế t Thuật toán: N ế u â m ( ) P h â n ( ) V i tiế t tíc h m ỗ i X c đ ị n h chấp nhận t r T í n h đ i ể m scored) ( ) T đ ợ c c h ọ n t = ỵ\og(PỰ f*c w I vv)) + l o g ( P O ) ) a = arg max score( w) weS G h i n h c c t h u ộ t í n h tiế t c ủ a c â u v o m c c a t h u " c h ộ n c g " đ ể k i ể m p t tr a x u n g đ ộ t c c v ị trí k h c , đ n h d ấ u c c â m lê n Độ phức tạp: T h u ậ t t r c t o n t r ê n c ó đ ộ p h ứ c t n g t ự t h u ậ t t o n đ ợ c t r ì n h b y t r o n g c h n g Tỉa thuộc tính: T r i v i h ệ t ) x u ấ t c c h i ệ n r n e n ữ a , b u ộ c c h ú n g c ủ c ò n hàm a c h ú n s ; tô i ( x e m N v ậ y , t í n h C o l l o c a t i o n T n g ữ c ả n h 43 b ỏ t r c ta T h u ô c p h l o i c h n g h t ợ n g k h ô n g đ n s t h i ệ n n ê n Đánh giá thảo luận D i đ â y b ả n g k ế t q u ả s o s n h g i ữ a b a p h n g p h p : Â D L s c h t r o n g c ậ p m n g 08/560 q u a n g / c 452/501 n ã m /793 t h n g 55/432 lớ n 4 /460 lợ i 135/168 d o a n h /352 c h ư n g c ô n g 2486/2608 c h ú n g s ắ p 80/81 /499 78/501 1814/1964 đ ã đ a n g /797 156/213 b n 283/317 k h c h 174/211 b i ế n T ổ n g c ộ n s - D ộ c h í n h x c K Đ K ế t s c h •c h í n h x c q u ả q u y ế t 44 t e s t n y đ ị n h , KẾT LUẬN Q u a s u t n g c h n g , v ấ n d ụ n g đ ề d a n h C c s c h k ế t - Bằng q u ả c h í n h t h t r o n g l u y ệ n V ậ n n e a n g d ụ n g t r ê n c c I n t e r n e t c p h c c lỗ i t ậ p d a n h n â m q u y ế t C h ú n g tô i i ể n t i k i ể m t i n ế n l ỗ i h v ậ y d ự n g h tiế t s c h đ p g c h í n h t í n h N p h h u ấ n đ ợ c C n c c l i ệ u - ự c r ằ n g V i s ẽ c a o ệ l u ậ n c h n g n g i H n e n g h i ê n - T ố - N - S - N - Á i u g h i ê n b ộ n c ứ u d ụ n g c c g h i ê n c ứ u p d ụ n g n h i ễ u , m 45 c c h ì n Tài liệu tham khảo Tiếng Anh [ ] M i c h a e l M R B D [ ] Eric [ ] A P-1: B r i l l , c h a n n e l s p e l l n d r e w J s e n s i t i v e [ ] t e x t Y u b i n D a i , f o r m u l a Proceedings of ACM SIGIR '99, I n [ ] f o r p D i n h D i e n , NLPRS 11-2001 [ ]X i a n p i n g G e , n u [ ] s A Large Corpora [ ] e R l l i n g c o n d r e w R e a t u [ ] t , B o s A f e n n d r e w p s e c m r e - b a s A n d r e w R c o n t e x t - s e n s i [10] G r a e m r o r s e [11] e b y D a n i e l P r o c e s s i n g [12] K i n C h science, H i n e s e ( [13] i m K C h Languages, [14] s p e - T e n g i n e s e w v C h r i s t o p h e r n a t u r a l l a n g u a g e 46 [15] N g u y e n V a n S u P h s u u N o m n u H g T o h a r i g u c h i , i 0 H o T u S e n t e n K n o B a o c e , R e L e A d u a s e c n h C u o n t i o n U s i n g , g g u y e n S e m a n t i c P a r s i n [ ] M t e a g s w a x t s u i t h a k i s i n R N i c a g g g h a t a e n e w l e 9 r a l i z e d d g e B A u t o f o r w m a a I n te c h /V J F u z z y U 0 t i c r d - b e a c x k t r w a c a t i o r d n o s e a f n r c h e w w o r d s f r o m J a p P roceedings I n a n e s e o f the Conference on E m pirical M ethods in N atural Language Processing [17] D a v i d D s e g m [18] e n t a t i o F P e n g , I n Proceedings o f the th Internation Symposium (IDA2001) [19] J a y M P o n t e , p r o c e d u r e Analysis T R [20] 96-2 A d w a i t R a t n a p a r a m b i g u i t n a l d L y P e n n s y l v a n i a [21] R o [22] R i c h a r d S p r o a t , f i n i t Linguistics, [23] e - s c o p r e s v N g u y e n w o r d s e g m e n t a t i o n u s i n g H i d d e t J m Linguistics, t a V W [ 24] P h u o n g n M a r k o v M o d e l International W orkshop fo r Com puter, Information, an d Com m unication Technologies on State o f the Art and Future Trends o f Information Technologies in K o rea an d Vietnam [ ] D a v i d Y a c c e n t s Workshop on V ery L arge C orpora, [ 9 ] D a v i d C om pu ters an d Humanities a r o w i nS K Y a r o w 47 Tiếng Việt ] D i ệ pQ u a n b ả n t h ể t ê n t r o n g d ị c ] h m y G i o L ê A n h C n g , Hội nghị N hà K hoa học Trẻ, Đ i học Q uốc giơ H Nội, lơn thứ II [29] L ê t [ ] A ự L ] ộ đ ê T ộ N [ n h n h C n g g a A n h i P h m n H H ội thảo Q uốc gia v ề CNTT [ ] H o n g [ 3 ] H o [ ] N g u N ộ [35] P h ê n g y ễ Phê ( c n C i N g u y ễ n đ i ể n d ị c h m y lần thứ II [ ] ủ y K h o a b a n k h o a h ọ c 48 Phụ lục P h C h ụ l ụ c n n c y t r ì n t r ì n h n h y b đ y m ợ c ộ c t i s ố đ ặ t t h ô n t r ê n g t i n m ô i v ề c i t r b ằ n g đ ặ t M c h S V i s u a n n g C n g l t r C + ì n + h k i ể Sơ đồ sử dụng tài nguyên Tạo tập nhầm ỉản ảm tiết T h u ậ t t o n M i n i m u m - e d i t - d i s t a n c e v i ế t n g n g ô ữ + + : int MinEditDistance( LPCTSTR source, LPCTSTR target) I int m, n; int distance! 20]Ị20]; m = _tcslen(source); n = _tcslen(target); distance[0][0]=0; int i, j; for ( i=l; i

Ngày đăng: 11/11/2020, 21:47

Tài liệu cùng người dùng

Tài liệu liên quan