Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 64 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
64
Dung lượng
10,01 MB
Nội dung
004 ;\'Â T • i ^ ĐẠI HỌC QUỐC GIA HÀ NỘI KHOA CÔNG NGHÊ NGUYỄN PHƯƠNG THÁI KIỂM LỖI CHÍNH TẢ CẢM NGỮ TIẾNG VIỆT LUẬN VĂN THẠC SỸ CẢNH CHUYÊN NGÀNH: TIN HỌC MÃ NGÀNH: 010110 NGƯỜI HƯỚNG DẪN: PGS NGUYỄN QUỐC TOẢN ĐẠi Mí.:-.: CÍ-:( HÁ NỎI TRUNGTÂM ■Áìi TiiơVIỀN N o V : J -OUA(? L t HÀ NỘI - 2003 M ụ c lụ c Chương 1: B i to n k i ể m G i i t h iệ u c c p h n g p h p k i ể m l ỗ i c h í n h t ả T iế p c ậ n c ủ a c h ú n g t ô i M ộ t s ố p h n g p h p h ọ c m y t h ố n g k ê t r o n gNLP H m p h â n l o i B a y e s " n g â y t h " D a n h s c h q u y ế t đ ị n h N ộ i s u y Chương 2: Đ ặ c đ iể m t i ế n g V i ệ t C c đ n v ị c ủ a t iế n g V i ệ t 2.1 T n iế 2.2 T 2.3 Câu M ộ t s ố đ ố i tư ợ n g n g ô n n g ữ m lu ậ n v ã n s ẽ k h a i t h c 3.1 T n iế T v t l o i Chương 3: C c y ê u c ầ u c h í n h c h o c n g v iệ c X l ý v ă n b ả n Đ n h d ấ u d ữ l i ệ u T o c o r p u s t h ô t I n Chương 4: T ậ p n h ầ m l ẫ n â m t i ế t 1 N h ầ m l ẫ n d o đ n h m y s a i N h ầ m l ẫ n d o p h t â m N h ầ m lẫ n c ủ a c c h ệ n h ậ n d n g .chữ K i ể m l ỗ i c h í n h t ả d ự a v o t đ i ể n T h u ậ t t o n Đ n h g i Chương 5: G i i t h i ệ .u C c t h u ộ c t í n h T g h é p C o l l o c a t i o n T n g ữ c ả n h H u ấ n l u y ệ n T h u ậ t to n k i ể m l ỗ i T h u ậ t to n k i ể m lỗi 3.2 Đánh giá độ phứctạp 4.Đánh giá 1B ộ t e s t 4.2 Độ đo 4.3 Kếtquảvàthảo luận Chương 6: K i ể m l ỗ i c h í n h t ả s d ụ n gh m phân B a y e s 31 32 33 33 34 35 36 38 38 lớp G iớ i t hiệ u 2.T huậ tto n 3.Đ ánh giá th ả o lu ận Kếtl u ậ n ,4 4 T i l i ệ ut h a m k h ả o 46 P h ụ l ụ c C H Ư Ơ N G 1: G IỚ I T H IỆ U Đ â y c h n g n h ậ p đ ề c ủ a lu ậ n v ã n C h n g n y g i i t h iệ u v ề b i to n k iể m l ỗ i c h ín h tả , c c p h n s p h p k iể m l ỗ i c h í n h tả , v m ộ t s ố k ỹ t h u ậ t h ọ c m y s ẽđượcsửdụngtrongcácchươngsau Bài toán kiểm lỗi tả B i to n k i ể m l ỗ i c h í n h t ả k h ô n g tầ m th n g v c ó t í n h ứ n g d ụ n g c a o C c c h n g t r ì n h s o n th ả o v x l ý v ă n b ả n r ấ t c ầ n t í n h n ă n g s o t l ỗ i c h í n h t ả tự đ ộ n g đ ể g iú p n g i s d ụ n g g iả m th i g ia n v c ô n g s ứ c b ỏ C c c h n g t r ì n h n h ậ n d n g v ă n b ả n c ũ n g c ầ n t í n h n ă n g n y đ ể n â n g c a o c h ấ t lư ợ n g n h ậ n d n g Một chưong sốt lỗi trìnhkiểm lỗi gợi ý Chức c h ín h tả cóhai chức n ă n g s o t l ỗ i s ẽ c h ỉ r a c c â m t i ế t s a i, c ò n c h ứ c n ă n g g ợ i ý t h ì đ a r a d a n h s c h ứ n g c v iê n â m t i ế t đ ú n g v i m ỗ i â m t i ế t s a i đ ợ c t ì m M ộ t s ố c h n g t r ì n h k iể m l ỗ i c h í n h t ả t iế n g V i ệ t t h ô n g d ụ n g : V ie t R e s : Đ â y m lỗi l b ộ g õ t iế n g tả âm Việt có chức kiể t iế t , c h y tr ê n h ệ đ iề u h n h D O S n ê n h iệ n g i k h n g c ị n đ ợ c s d ụ n g p h ổ b iế n V ie t S p e l l ếng Việt 2000: mức Chương trình từ v ự n g (dĩ k iể m lỗi tả ti n h iê n l c ả â m t i ế t ) G iói thiệu T a c ó th ế c h i a d ự a tr ê n lu ậ t n h phương kiểm lỗi tả p h p k iể tả t h n h h a i l o i p h n s p h p cácphương m lỗi phươnẹ iề u p h n e N h ê Trong ữngphươngt pháp khoảng mườinăm pháp thống p h pk i ể m l ỗ i c h í n h Anh iế p b ằ n g c c h g tả t iế n phápnàyxemxétvấnđềkiểmlỗiq u i n ó v ề b i to n x l ý n h ậ p n h ằ n g vừaqua, k thống k ê đ ã đ ợ c đề x u ấ t c h í n h t ả h o ặ t r ự c t iế p , h o ặ c g iá n ctừvựne M ộ t s ố n g h iê n c ứ u s d ụ n g m ô h ì n h k ê n h n h iễ u n h M C h a y s v c ộ n g s ự ( 9 ) , urchvàGale(1991),BrillvàMoore(2001).Mơhình k ê n h n h iễ u r ấ t t ổ n g q u v c ó k h ả n ã n g p d ụ n g c h o n h iề u v ấ n đ ề k h c n h a u , v ề m ộ t tr ự c g iá c , k ê n h n h iễ u t k ê n h t r u y ề n t h ô n g m t h ô n g t i n t r u y ề n q u a c ó th ể b ị n h iễ u v k h ó n h ậ n d n g đ ợ c t h ô n g t i n đ ú n g G i ả s o từ ta n h ậ n đ ợ c c u ố i đ ợ k ê n h , ta c ầ n đ o n từ đ ã ctruyềnđi.GiảsửVlàtừvựngcủangơnngữ,khiđó: A w = a r g m a x P ( w I o ) W th e o c ô n g th ứ c B a y e s : P thêm v o đ ó , v ì P ( O ) n hư nhauvớimọiw t huộc V nên: s Aẽ wn= a gr gm ah x Mays(1990)tínhP (0iê n W€V tr ( O lw ) s d ụ n g th u ậ t to ig r n M i n im u m - e d i t - d i a m stance(tacứuởchư ơngsau),cònP(w)đ ợ c c lư ợ n g b ằ n g mơhìnhngơnngữ (word trigram) từ Y a r o w s k y ( 9 ) p d ụ n g d a n h s c h q u y ế t đ ịn h đ ể n h ậ n d n g từ đ ú n g Ư u đ iể m c ủ a p h n g p h p n y s o v i p h n g p h p tr ê n k h ả n ă n g s d ụ n g n h iề u lo i t r i th ứ c n e ô n n g ữ , k h ô n e c h ỉ t r ig r a m Đ iể m đ ặ c b iệ t l n ó r a q u y ế t đ ịn h c h ỉ d ự a tr ê n m ộ t d ấ u h iệ u t i n c ậ ynhất G o l d in s ( 9 )đ ề x u ấ t p h ương p h p lai " n g â yt h " P h n g ph áp nàv c ũ n ec ó khả ngữ danh s c h q u y ế t đ ịn h nhưnc Bayes, sử ụng hàm d p hân n ă n ss d ụ n s n h iề u lo i tri lo B a ại y e th ức s n nh g ô iề u q u y ế t đ ịn hd ự a t r ên kếthợp n d ấu h iệ u G o l d in g v S c h a b e s (1996) kết hợp mơ hình t r ig r a m t lo i v hàm phân lo i B a y e s T r c t iê n , m h ì n h t r is r a m x c đ ịn h từ lo i đ ú n stạivịtríđancxétdựavàongữcảnh,nếucịnnhậpnh ằ n g t h ì p h n g p h p la i B a v e s s ẽ x l ý tiế p G ầ n đ y h n , c ó c c p h n g p h p : h ọ c d ự a tr ê n b iế n đổi(ManguvàBrill,1997),phântíchnghĩaẩn(Jon e s v M a r t in , 9 ) , d if f e r e n t i a l - g r a m m a r s ( P o w e r s , 9 ) , W in n o w - b a s e d ( G o l d i n g v R o t h , 9 ) , v k h ô i p h ụ c c ố k ế t từ v ự n e ( H i r s t v B u d a n it s k y , 0 1) C c p h n g p h p k iể m l ỗ i c h í n h t ả t iế n g V i ệ t d ự a t r ê n lu ậ t đ ợ c n g h iê n c ứ u k h n h iề u , m ứ c â m t i ế t , p h n g p h p s d ụ n g lu ậ t c ấ u tạ o â m t i ế t k ế t h ợ p v i t đ iể n m t iế t c h o k ế t q u ả t ố t n h ấ t ( P h m H n g N g u y ê n , 9 ) Â m t i ế t v o s ẽ đ ợ c p h â n lo i b ằ n g c c h p h â n t í c h c ấ u tạ o v tr a t đ iể n , c c lo i c ósaith cấuể ótạolà, : cảu tạo khơng có từ điển , có từ điển, sai cấu tạo lừ tiếng nước ngồi Ví du: S c ấ u tạ o : te t Đ ú n g c ấ u tạ o n h n g k h n g c ó tr o n g từ đ iể n : h n C ó tr o n g từ đ iể n : v ị t S a i c ấ u tạ o n h n g c ó th ể từ tiế n g n c n g o i: fo r e ig n M ứ c k iể m l ỗ i n y k h ô n g b ắ t đ ợ c c c l ỗ i từ s a i n h n g â m t i ế t đ ú n g v ì k h n g s ửdụngthơngtinngữcảnh m ứ c từ v ự n g , c c l ỗ i s a i t s h é p c ó th ể đ ợ c b d ự a v o từ đ iể n t iế n g V i ệ t ( L u v ắ t H X u y ê n , 0 ) P h n g p h p n y c ó u đ đ n g iả n b ắ t k h t ố t c c l ỗ i iể m từ g h é p m ứ c đ ộ k i ể m t r a n h ỏ ( n h ỏ h n Vietspell 0 ) N h ợ c đ iể m t r a th e o k h ô n g b ắ t đ ợ c l ỗ i từ đ n v h a y b o l ỗ i s a đ ộ k i ể m lớ n ( t h e o V ie t s p e l l i m ứ c 0 ) v ì q u u t iê n từ g h é p C ó m ộ t s ố n g h iê n c ứ u ứ n g d ụ n g p h â n t í c h c ú p h p t r o n s k i ể m l ỗ i c h í n h tả C c th u ậ t to n E a r l e y v C Y K đ ã đ ợ c d ù n g đ ể p h â n t í c h c ú p h p t iế n g V i ệ t p h ụ c v ụ c h o k iể m l ỗ i c h í n h tả ( N s u y ễ n C ô n g T ú , 9 ) ( L ê T h a n h H n g , 9 ) , n h n g k ế t q u ả th ự c n h iệ m đ ã k h ô n g c h ỉ r õ đ ợ c h iệ u q u ả c ủ a p h n g p h p n y C h o đ ế n n a y c h a c ó n g h iê n c ứ u n o ứ n g d ụ n g p h â n t í c h n g ữ n g h ĩ a v n g ữ d ụ n g c h o k iể m l ỗ i c h ín h tả t iế n g V iệ t Tiếp cận chúng tỏi M ộ t n h ợ c đ iể m c h u n g c ủ a c c n c h n g t r ì n h k i ể m l ỗ i c h í n h t ả t iế n g V d i ệ t h iệ n n a y k h ô n g c ó k h ả n ã n g h ọ c ( v ì s n d ụ n g p h n g ự a t r ê n l u ậ t ) , th ê m lo i t r i th ứ c e ô n pháp g ữ đ ợ c k h a i th c l r ấ t h n c h ế vàođócác L u ậ n v ă n n y lự a c h ọ n h a i p h n g p h p c ủ a Y a r o w s k y ( 9 ) v G o ỉ d in g ( 9 , 9 ) đ ể p d ụ n g c h o t iế n g V i ệ t N h ữ n g p h n g p h p n y t h u ộ c t iế p c ậ n d ự a tr ê n th u ộ c t í n h(feature-based method) Ư u đ iể m a i th c n h iề u lo i bậtcủa t r i th ứ c yện Quá cầu corpus cho huấn lu y ệ n ngơn trình ngữ chỉyêu huấn r ú t r a extract() n h ữ n g kiểm lỗi Hơn nữa,khả học kh lu t r i th ứ c c ầ n t h iế t c h o v iệ c m c h o c h r m t r ì n h c ó th ể t h í c h n g h i v i s ự t h a y đ ổ i k h ô n s n g n g c ủ a n g ô n n g ữ v i í t đ ò i h ỏ i v ề s ứ c n g i M ộ t sỏ phương N h iề u vấn đề phân lo i Trong v d ự đ o n " lớ p " n g ô n nageữ A c h í n h x c C ô n g v iệ c n y b a o g m x â y d ự n g m ộ t h m p h â n lo ạci l: B - * A m h o r a c ó th ể đ ợ c th ự c h iệ n v i m ộ t p h â n p h ố i x c s u ấ t đ iề u k i ệ n pP(a, I b) x c s u ấ t c ủ a " l ó p " a k h i c h o tr c " n g ữ c ả n h " b n o đ ó N g ữ c ả n h t r o n g c c b i to n N L P b a o g m í t n h ấ t l c c từ , v n g ữ c ả n h c h í n h xác p h ụ t h u ộ cv o b ả n c h ấ t c ủ a v ấ n n g ữ c ả n hb c ó th ể c h ỉ d u y n h ấ t m ộ t từ , t r o n g c, b bao gồm đề Với số vấn đề, k h i c c b i to n k h m ộ t v i từ v n h ã n c ú p h p tư n g ứ n g C c c o r p u s v ă n b ả n lớ n th n g c h ứ a m ộ t s ố t h ô n g t i n v ề s ựđổng xuất h iệ n c ủ a v i m ọ i c ặ p ( a ,b ) b ộ(j->ơrriơl) cục v P h ầ n n y g iớ i t h iệ u m ộ t s ố m h ì n h h ọ c m y t h ố n g k ê t ổ n g q u t , k h ô n g p h ụ t h u ộ c v o l ĩ n h v ự c h a y ứ n s d ụ n g G i ả sử : - A tậ p c c b iế n c ố ( d ự đ o n ) c ó th ể c ó B t ậ p c c n s ữ c ả n h c ó th ể c ó - T ậ p c c v ị t n g ữ c CPản h= {c p ,, ,cpm} , t r o n g đ ó m ỗ i h m cpị : B —>{true, false) c h o b iế t c ó h a y k h n g t h ô n g t i n h ữ u íc h t r o n g n g ữ b e - Tập huấn lu y ệTn= {(ax,b\), (aN,bN) } , bLó € B n g ữ c ả n h v àaị A < lớ p đ ú n g c ủ a n ó c ảBn nàh o đ ó đ s c h 30/235 t r o n g 347/2941 c ậ p 323/329 m n g 25/560 q u a n g 6/30 c i 0/501 n ă m 110/793 t h n g 134/432 lớ n 54/460 lợ i 38/168 d o a n h 217/352 c h n g 457/499 c ô n g 2001/2608 c h ú n g 122/501 s ắ p 46/81 đ ã 69/1964 đ a n g 1/797 b n 83/213 k h c h 284/317 b i ế n 63/211 T ổ n g Đ ộ c ộ n g c h í n h t o n - 31.2464 m ộ t B ả n g k ế t s c h q u ả 159/235 t r o n g c ậ p :312/329 :94.8328 m n g q u a n g :23/30 c i :489/501 n ă m t h n :76.6667 :515/793 g 39 : 15/4 :64.9433 l n :419/460 l ợ i : / d o a n h :280/352 c h n g c ố n g c h ú n g :369/501 s ắ p : 44/81 đ ã : 1855/1964 đ a n g :732/797 b n : 129/213 k h c h :270/317 b i ế n 150/211 T ổ n g c ộ n g : N h t a n c ữ c ả n h t e s t m d i B ả n g s c h đ â y - t r t h ấ y , k ế t :94/235 o : ng : c ậ p :309/329 m n g :400/5 q u a n g :20/30 c i : / n ă m :524/793 t h n g l n :424/460 lợ i :70/168 d o a n h c h n g c ô n g c h ú n g s ắ p đ ã q u ả :47/81 : 1061/1964 40 đ a n g :417/797 b n :94/213 k h c h b i ế n : 116/211 T ổ n g c ộ n g : K ế t q u ả n y " đ a n g " , k h ổ n g "đã" c h u n g s ẽ n ă n g , g i ả m t ứ c c ả n h l t h n g n g ữ c ó c ả n h t h n g ( d a n h từ , - Đ đ ộ n g c h í n h ộ K Đ ộ N h t h í c h :54.9763 c h í n h x c v ậ y t h e o h ợ p 41 n h ấ t CHƯƠNG 6: KIỂM L ỗ i c h í n h t ả s d ụ n g HÀM PHÂN LOẠI BAYES Giới thiệu C h n g n y " n g â y t r ì n h t h " d n g n h h i ệ u d a n h đ ể C r a c collocation l o q u y ế t i t h u v ộ v ề d ữ l i ệ u , d a n h s c h v c từ đ ộ q u y ế t Thuật toán T h u ậ t t o n đ ị n h d i đ ã t ậ p đ ợ c n h ầ m N l ẫ n h c lạ i c = r ằ n g { w _ Ả w _ , , w L u ậ t r a a agr = q u y ế t m a x ( ] ~ Ị pự I M ’) ) P ( w ’) wẽS fec Đ ể t r n h t r n s ố t r o n g m a y t í n agr = h k h i t í n h t í c h n m a x ( ^ l o g ( / >( / h I H i ề u ’) ) s ố + l o q g u ( / , (H weS fec X c s u ấ t c ủ a t h u ộ c t í n h v i đ i ề u k i ệ n từ : P ( f \ w ) = - Ă ) p l( f \ w ) + Ẳp2( f ) T r o n g đ ó P^P2 l c c x c s u ấ t r ì n t t í n h t h e o M L Thuật toán kiểm lỗi: 42 E , < Ă< n h '))) ỏ , t a s d ụ n g l o g a r i t : tú i G i ả s c â u v o V.V.), v s ố , c h o c c t í n h â m t i ế t Thuật toán: N ế u â m ( ) P h â n ( ) V i tiế t tíc h m ỗ i X c đ ị n h chấp nhận t r T í n h đ i ể m scored) ( ) T đ ợ c c h ọ n t = ỵ\og(PỰ f*c w I vv)) + l o g ( P O ) ) a = arg max score( w) weS G h i n h c c t h u ộ t í n h tiế t c ủ a c â u v o m c c a t h u " c h ộ n c g " đ ể k i ể m p t tr a x u n g đ ộ t c c v ị trí k h c , đ n h d ấ u c c â m lê n Độ phức tạp: T h u ậ t t r c t o n t r ê n c ó đ ộ p h ứ c t n g t ự t h u ậ t t o n đ ợ c t r ì n h b y t r o n g c h n g Tỉa thuộc tính: T r i v i h ệ t ) x u ấ t c c h i ệ n r n e n ữ a , b u ộ c c h ú n g c ủ c ò n hàm a c h ú n s ; tô i ( x e m N v ậ y , t í n h C o l l o c a t i o n T n g ữ c ả n h 43 b ỏ t r c ta T h u ô c p h l o i c h n g h t ợ n g k h ô n g đ n s t h i ệ n n ê n Đánh giá thảo luận D i đ â y b ả n g k ế t q u ả s o s n h g i ữ a b a p h n g p h p : Â D L s c h t r o n g c ậ p m n g 08/560 q u a n g / c 452/501 n ã m /793 t h n g 55/432 lớ n 4 /460 lợ i 135/168 d o a n h /352 c h ư n g c ô n g 2486/2608 c h ú n g s ắ p 80/81 /499 78/501 1814/1964 đ ã đ a n g /797 156/213 b n 283/317 k h c h 174/211 b i ế n T ổ n g c ộ n s - D ộ c h í n h x c K Đ K ế t s c h •c h í n h x c q u ả q u y ế t 44 t e s t n y đ ị n h , KẾT LUẬN Q u a s u t n g c h n g , v ấ n d ụ n g đ ề d a n h C c s c h k ế t - Bằng q u ả c h í n h t h t r o n g l u y ệ n V ậ n n e a n g d ụ n g t r ê n c c I n t e r n e t c p h c c lỗ i t ậ p d a n h n â m q u y ế t C h ú n g tô i i ể n t i k i ể m t i n ế n l ỗ i h v ậ y d ự n g h tiế t s c h đ p g c h í n h t í n h N p h h u ấ n đ ợ c C n c c l i ệ u - ự c r ằ n g V i s ẽ c a o ệ l u ậ n c h n g n g i H n e n g h i ê n - T ố - N - S - N - Á i u g h i ê n b ộ n c ứ u d ụ n g c c g h i ê n c ứ u p d ụ n g n h i ễ u , m 45 c c h ì n Tài liệu tham khảo Tiếng Anh [ ] M i c h a e l M R B D [ ] Eric [ ] A P-1: B r i l l , c h a n n e l s p e l l n d r e w J s e n s i t i v e [ ] t e x t Y u b i n D a i , f o r m u l a Proceedings of ACM SIGIR '99, I n [ ] f o r p D i n h D i e n , NLPRS 11-2001 [ ]X i a n p i n g G e , n u [ ] s A Large Corpora [ ] e R l l i n g c o n d r e w R e a t u [ ] t , B o s A f e n n d r e w p s e c m r e - b a s A n d r e w R c o n t e x t - s e n s i [10] G r a e m r o r s e [11] e b y D a n i e l P r o c e s s i n g [12] K i n C h science, H i n e s e ( [13] i m K C h Languages, [14] s p e - T e n g i n e s e w v C h r i s t o p h e r n a t u r a l l a n g u a g e 46 [15] N g u y e n V a n S u P h s u u N o m n u H g T o h a r i g u c h i , i 0 H o T u S e n t e n K n o B a o c e , R e L e A d u a s e c n h C u o n t i o n U s i n g , g g u y e n S e m a n t i c P a r s i n [ ] M t e a g s w a x t s u i t h a k i s i n R N i c a g g g h a t a e n e w l e 9 r a l i z e d d g e B A u t o f o r w m a a I n te c h /V J F u z z y U 0 t i c r d - b e a c x k t r w a c a t i o r d n o s e a f n r c h e w w o r d s f r o m J a p P roceedings I n a n e s e o f the Conference on E m pirical M ethods in N atural Language Processing [17] D a v i d D s e g m [18] e n t a t i o F P e n g , I n Proceedings o f the th Internation Symposium (IDA2001) [19] J a y M P o n t e , p r o c e d u r e Analysis T R [20] 96-2 A d w a i t R a t n a p a r a m b i g u i t n a l d L y P e n n s y l v a n i a [21] R o [22] R i c h a r d S p r o a t , f i n i t Linguistics, [23] e - s c o p r e s v N g u y e n w o r d s e g m e n t a t i o n u s i n g H i d d e t J m Linguistics, t a V W [ 24] P h u o n g n M a r k o v M o d e l International W orkshop fo r Com puter, Information, an d Com m unication Technologies on State o f the Art and Future Trends o f Information Technologies in K o rea an d Vietnam [ ] D a v i d Y a c c e n t s Workshop on V ery L arge C orpora, [ 9 ] D a v i d C om pu ters an d Humanities a r o w i nS K Y a r o w 47 Tiếng Việt ] D i ệ pQ u a n b ả n t h ể t ê n t r o n g d ị c ] h m y G i o L ê A n h C n g , Hội nghị N hà K hoa học Trẻ, Đ i học Q uốc giơ H Nội, lơn thứ II [29] L ê t [ ] A ự L ] ộ đ ê T ộ N [ n h n h C n g g a A n h i P h m n H H ội thảo Q uốc gia v ề CNTT [ ] H o n g [ 3 ] H o [ ] N g u N ộ [35] P h ê n g y ễ Phê ( c n C i N g u y ễ n đ i ể n d ị c h m y lần thứ II [ ] ủ y K h o a b a n k h o a h ọ c 48 Phụ lục P h C h ụ l ụ c n n c y t r ì n t r ì n h n h y b đ y m ợ c ộ c t i s ố đ ặ t t h ô n t r ê n g t i n m ô i v ề c i t r b ằ n g đ ặ t M c h S V i s u a n n g C n g l t r C + ì n + h k i ể Sơ đồ sử dụng tài nguyên Tạo tập nhầm ỉản ảm tiết T h u ậ t t o n M i n i m u m - e d i t - d i s t a n c e v i ế t n g n g ô ữ + + : int MinEditDistance( LPCTSTR source, LPCTSTR target) I int m, n; int distance! 20]Ị20]; m = _tcslen(source); n = _tcslen(target); distance[0][0]=0; int i, j; for ( i=l; i