Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 103 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
103
Dung lượng
39,43 MB
Nội dung
Đ Ạ I H Ọ C Ọ Ư Ó C G IA H À N Ộ I KHOA CỒNG NGHỆ NGUYẺN THỊ THANH TÂN NHẬN DẠNG CHỮ VIẾT TAY HẠN CHÉ DựA TRÊN MƠ HÌNH MANG NƠRON KÉT HỢP VỚI THÓNG KE n g ữ c ả n h Chuyên ngành: Công nghệ thông tin Mã số: 1.01.10 LUẬN V ĂN THẠC s ĩ N g i h n g d ẫ n k h o a học: PGS TS Ngô Quoc Tạo Hà N ộ i - 2004 Nguyễn Thị Thanh Tân Trang - - Luận văn thạc sĩ MỤC LỤC M Ở Đ Ầ U .3 C H Ư Ơ N G - T Ổ N G Q U A N VỀ N H Ậ N D Ạ N G C H Ữ D ự A T R Ê N M Ơ H ÌN H M Ạ N G N Ơ R O N 1.1 T ổn g quan mạng n ro n 1.1.1 C ấu trúc n r o n 1.1.2 Các phươ ng pháp huấn luyện m ột mạng n r o n 10 1.2 Qui trình chung m ột hệ nhận d ạng c h ữ 12 1.2.1 Phân lớp m ẫ u .12 1.2.2 N hận dạng văn b ả n 13 1.3 M ạn g M L P ứng dụng nhận dạng c h ữ 16 1.3.1 C ấu trúc P e rc e p tro n 16 1.3.2 K iến trúc m ạng nhiều lớp truyền thẳng (M L P ) 17 1.3.3 Q uá trình huấn luyện m ạng M L P 18 1.3.4 Ưu, nhược điểm m ạng M L P 26 1.4 K ết l u ậ n 27 C H Ư Ơ N G - N H Ậ N D Ạ N G T Ừ D ự A T R Ê N M Ạ N G B Ố N L Ớ P CẢI TIẾ N K ẾT H Ợ P VỚI T H Ố N G K Ê N G Ữ c ả n h ' 28 2.1 M n g nơron bốn lớp cải t i ế n 30 2.1.1 Ki ến trúc m n g 31 2.1.2 T hu ật toán huấn luyện m n g 36 2.1.3 K h ả nhận dạng m n g .40 2.2 B ộ thống kê ngữ c ả n h 41 2.2.1 C ác khái niệm sử dụng thống k ê 41 2.2.2 C ác cấu trúc liệu sử dụng trình thống k ê 43 2.2.3 T h u ật toán kiểm tra m ức độ hợp lý m ột kí tự x â u 44 2.2.4 T h u ật toán lựa chọn m ột từ danh sách từ ứng cử v i ê n 45 2.3 Q uá trình nhận dạng t 46 2.3.1 P h n g pháp nhận d n g 46 2.3.2 C ấu trúc liệu sử dụng trình nhận d n g 47 2.3.3 Q u trình xác định vị trí cắt khác ảnh đầu v o 50 MỞ ĐẢU Nguyễn Thị Thanh Tản 2.3.4 Trang - - Luận văn thạc sĩ Thuật toán nhận dạng từ 52 2.4 Đánh giá khả nhận dạng mơ h ìn h 60 2.5 Kết l u ậ n 60 C H Ư Ơ N G - CÀI Đ Ậ T HỆ T H Ố N G N H Ậ N D Ạ N G C H Ữ V IẾ T T A Y H Ạ N C H Ế 62 3.1 Qui trình hoạt động hệ t h ố n g .62 3.2 Q uá trình tiền xử lý 64 3.2.1 Tiền xử lý trước phân tích ảnh văn cần nhận d n g .64 3.2.2 Tiền xử lý trước phân đoạn từ cần nhận d n g 70 3.2.3 Tiền xử lý trước nhận dạng kí t ự 74 3.3 Q uá trình phân vùng ả n h 74 3.3.1 Tách dòng văn b ả n 75 3.3.2 Tách t 77 3.4 Q uá trình nhận d n g 79 3.5 Quá trình hậu xử lý 79 3.6 Kết l u ậ n 80 C H Ư Ơ N G - T H Ử N G H IỆ M H Ệ T H Ố N G N H Ậ N D Ạ N G C H Ữ V IẾ T T A Y H Ạ N C H Ế ’ 81 4.1 M ôi trường thử n g h i ệ m 81 4.2 D ữ liệu v kết thử n g h i ệ m 81 4.2.1 T nghiệm nhận dạng chữ số viết t a y 81 4.2.2 T nghiệm nhận dạng chữ không dấu viết t a y 83 4.2.3 T nghiệm nhận dạng từ n g u y ê n 84 K Ế T L U Ậ N 86 T À I L IỆ U T H A M K H Ả O 91 P H Ụ L Ụ C A - G IA O D IỆN C Ủ A H Ệ N H Ậ N D Ạ N G .93 P H Ụ L Ụ C B - G IA O D IỆ N C Ủ A H Ệ N H Ậ N D Ạ N G 94 PHỤ LỤC c - GIAO DIỆN CỦA HỆ HỌC M ẠNG 96 P H Ụ L Ụ C D - M Ộ T SÔ K Ế T Q U Ả T H Ố N G K Ê .98 P H Ụ L Ụ C E - D A N H M ỤC C Á C T H U Ậ T T O Á N .101 P H Ụ L Ụ C F - D A N H M ự c C Á C H ÌN H V Ẽ 102 P H Ụ L Ụ C F - D A N H M Ụ C C Á C B Ả N G B I Ế U 103 MỜ ĐÂU Nũuvễi Thị Thanh Tân Trang - - Luận vSn thạc sĩ MỜĐẦU Nhận dạng mẫu nơành khoa học mà vai trị phân lớp đổi tượng thành m ột số loại số lớp riêng biệt [22], Tuỳ thuộc vào lĩnh vực ứng dụng, đối tượng dạng ảnh, dạng tín hiệu sóng m ột kiểu liệu có mà cần phải phân lớp N hững đối tượng gọi bàng m ột thuật ngữ chung “ m ẫ u ” (pattern) N hận dạng m ẫu biết đến từ lâu, trước n hững năm 1960 chi kết nghiên cứu mặt lý thuyết lĩnh \ự c thống kê Tuy nhiên, với phát triển không n s n g khoa học kỹ thuật phần cứng phần mềm, yêu cầu mặt ứng d ụ n g th ự c tế lĩnh vực nhạn dạng mẫu ngày tăng lên nhận dạng mẫu sử dụng nhiều lĩnh vực y học, tự động hoá số qui trình sản xuất cơng nghiệp, d ự báo thời tiêt, dự báo cháy rừng,v.v Ngoài nhận dạng mẫu thành p hần quan trọng hầu hết hệ thống máy tính thơng minh xây dựng để thực việc định C ù n với phát triển nhận dạn ẹ mầu, nhận dạng chữ ngày trở thành m ột ứng dụng thiếu đời sống xã hội người Nhận dạng chữ viết ứng dụng để tự động hoá số cơng việc văn phịng lưu t:ữ văn phân loại thư tín, , nhằm giảm bớt cơng việc nhàm chán địi hỏi nhiều thời gian cơng sức người Với tìm quan trọng mình, nhận dạng chữ viết m ột lĩnh vực thu hút quan tâm, nghiên cứu nhà khoa học Hiện nay, toán nhận dạng chữ h giải gần trọn vẹn, giới V iệt N am có sản phẩm có giá trị thực tế cao, kể đến như: sản phẩm FineR eader hăng A B B Y Y nhận dạng 20 thứ tiếng khác nhau, sản phẩm O m niPage hãng ScanSoft nhận dạng chữ tiếng Anh, sản p hẩm V n D O C R V iện Công nghệ Thông tin nhận dạng chữ Việt in, Song, với toán nhận dạng chữ viết tay thi v ắ i đề trở lên phức tạp nhiều lý sau đây: MỜ Đ ÂU NiỉU>ẻn I hi (hanh • ĩrang - - Luận văn thạc sĩ Với chừ viết tay khơng thể có khái niệm font chừ, kích cỡ chừ C ác kí tự tron? văn chừ viết tay thườno có kích thước khác T hậm chí, kí tự trono văn m ột người viết nhiều có độ rộng, hẹp, cao, thấp khác nhau, • Với nhữnơ ns;ười viết khác chữ viết có độ nghiêng khác (chừ n ghiêng nhiều/ít, chừ nơhiêng trái/phải ,) • Các kí tự từ ván chữ viết tay đơi với hầu hết người viết tlurờno bị dính khó xác định đượ c phân cách chúng • Các văn bàn chừ viết tay cịn có trư n g hợp dính dịng (d ịn g bị dính chồng lên dịng trên) C h ín h khó khăn trên, nói, thời diểm ch ưa có m ộ t giải pháp đủ tốt để giải trọn vẹn toán nhận dạng chữ viết tay Hiện nay, e;iới V iệt N a m có m ộ t số nh óm nghiên cứu đầu tư nhiều thời gian cho nhận dạng chữ viết tay thu m ột sô kết Song, kết áp dụng m ột cách hạn chế n hững lĩnh vực hẹp, số nhóm điển hình kể đến như: nhóm nghiên cứu Đại Học Q u ổ c Gia T P H C M cài đặt thử nghiệm hệ thống nhận d ạng chữ số chữ viết tay rời rạc phiếu xuất nhập cảnh [4], n h ó m nghiên cứu Sim on O B aret (L aorỉa/C N R S & EN PC, Paris) cài đặt m ột hệ th ố ng nhận d ạng c h ữ viết tay tro n g lĩnh vực kiểm tra tài khoản ngân h àn g [16], nh ó m nghiên c ứ u J.J.Hull, T k.H o, J.Favata, V G ovindaraju S.N Srihari trung tâm nghiên cứu vê nhận d n g phân tích văn trư ờng Đại H ọc T ổ n g H ợp N e w Y ork cài đặt hệ th ố n g chuyên nhận dạng địa thư b u điện [17], nhóm nghiên cứu Fujisaki, H S.M B eigi, C C.Tapert, M U k e iso n C G W o lf p h ò n g nghiên cứu W atson IB M cài đặt hệ thống nhận dạng c h ữ viết tay hạn chế trực tuyến trạ m làm v iệc IB M [21) Như- vậy, việc tìm m ột lời giải khả thi cho toán nhận dạng chữ viết tay vấn đề cấp thiết p h ứ c tạp, cần đầu tư nhiều thời gian công sức MỞ Đ ÂU Nguyen Thị Thanh Tân Trang - - Luận văn thạc sĩ c u a n s i T r o n c luận văn này, chúnG, c ũ n g k h ô n g kỳ v ọ n g giải q u y ế t chọn vẹn toán nhận dạng chừ viết tay m hy vọng dóng góp thêm m ộ t phương pháp khả thi để giải m ột lớp toán lĩnh vực nhận d ạn g chữ viết tay Bài toán đặt trons luận văn “ n h ậ n d n g c h ù ’ viết ta y h n ch ế d ự a tr ê n mơ hình inạng noron kết họp vói th ố n g kê n gữ c ả n h ” , v ấ n đề “chữ viết tay hạn chế” hay “ chữ viết tay có ràng buộc” luận văn quan niệm sau: • C hữ viết tay xem xét chừ số chữ tiếng A n h viết tay khơng dấu • K hoảng cách dòng chữ văn đầu vào phải xác định (tức d ò n s chừ phải có m ột kh oảng cách tư ng đơi, khơng dính hay chồng lên nhau) • G iữa từ dịng chữ phải có m ột kh oảng cách định (các từ k hơng dính hay m óc nối vào nhau) • Các kí tự văn cần nhận dạng k h ôn g đ ượ c nghiêng Sở dĩ, lựa chọn m ạng nơron làm c ơn g cụ để thể thuật tốn nhận d ạng lẽ m hình m ạng nơron xây dự n g theo ngu yên tắc m ô p hỏ ng hoạt đ ộn g não người nên thích hợp với toán nhận d ạn g so với c n g cụ khác m n e nơron có nh ững ưu điểm vượt trội sau: • M ạn g nơron coi m ột xấp xỉ vạn • C ó khả học thích nghi với m ẫu • C ó k tổng qt hố: M ạn g đưa n h ữ n g kết m ang tính tơng qt hố • C ó khả dung thứ lỗi: Có thể chấp nhận sai số tron g tập d ữ liệu đầu vào • M ạn g có tốc độ tính tốn cao dẫn đến tốc độ nhận dạng nhanh Trên cở sở đó, nội dung luận văn tập trun g chủ y ể u vào m ột sô vân đê sau: MỜ ĐẢU Nii'UV’n Thị Thanh Tàn Trang - - Luận văn thạc sĩ • Khảo sát cách tiếp cận nhận d n s dựa m hình m ạng nơron • Đánh giá khả nhận d ang c ũ n s ưu, nhược điểm m a n e nhiều lớp truyền thana M LP (M ultilayer Perceptrons) • Đe xuất mơ hình m ạng nơron bốn lớp cải tiến thích hợp cho nhận dạng kí tự viết tay • Đe xuất mơ hình nhận dạng từ dira kết hợp nhận dạng kí tự với m ột thống kê nofr cảnh • Xây d ự n g hệ thốne; nhận dạng chữ viết tay hạn chế Với nội dung trên, cấu trúc luận văn gồm n h ững phần sau đây: C h u o n g I: T ô n g quan vê nhận dạn g c h ữ dựa mô hình m n g noron N ội dưng chương tập trung khảo sát cách tiếp cận nhận d ạn g dira mơ hình m ạng nơron thơng qua mơ hình m ạng nhiều lớp truyền thẳng M L P (M ultilayer Perceptrons) T đánh giá ưu, nhược điểm m ạng M L P , tiền đề cho q trình xây d ự n g m hình nhận d ạng c h n g sau C h n g 2: Nhận dạn g từ dựa mơ hình m ạn g no ro n bốn lóp cải tiến kết họp vó i thống kê ngữ cảnh C h n g tập trung vào việc xây d ựng mô hình hiệu để n h ận dạng chữ viết tay hạn chế với nội dung sau đây: • Sơ đồ tổng quan mơ hình nhận dạng từ đ ượ c đề xuất bời luận văn • Q uá trình xây dựng m ạng nơron bổn lớp cải tiến • Q trình xây dựng thống kê • Q trình xây nhận dạng từ • Đ ánh giá khả nhận dạng m ô hình Chu o n g 3: Cài đặt hệ thống nhận n g c h ữ viết tay hạn chế Tran” - - N” U\en Thị Thanh Tân Luận văn thạc sĩ C h n g m ô tả cách cụ thể qui trình nhận dạng chừ viết tay hạn chế Đ ồng thời, cụ thể hóa đến mức chi tiết có thề việc ứng dụng m hình nhận dạng đề xuất chương để nhận dạng chữ viết tay hạn chế C h n g 4: T h nghiệm hệ thống nhận dạn g chữ viết tay hạn chế C h n g m ô tả chi tiết trình thử nohiệm cũno kết thử nghiệm hệ thống với tập liệu khác P hần kết luận P hần nêu lên vấn đề giải được, chưa giải v hướng phát triển trone tư n g lai luận văn C ác phần phụ lục A, B, c C ác phần phụ lục cung cấp thơng tin tham khảo có giá trị kết q u ả thực n ghiệm chương trình, kí hiệu, từ khóa sử dụng luận văn, tài liệu tham khảo, M Ở ĐÂU Nguvcn T hị Thanh Tàn Trans - Luận vãn thạc sĩ CHƯƠNG - TỔNG QUAN VÈ NHẬN DẠNG CHỮ DỰA TRÊN MƠ HÌNH MẠNG NƠRON 1.1 Tổng quan mạng noron 1.1.1 Cấu trúc nơron M ột nơron m ột đơn vị xử lý thôn° tin thành phần m ột m n s nơron c ấ u trúc m ột nơron đươc mô tả Hình 1.1 /v v , Hàm kích hoạt \ Các tín hiệu vào \ x2 o - — @ — f(.) Hàm XP c>- — Q — Đầu tổng Các trọng số liên kết Hình 1.1: c ấ u trúc noron Trong đó: (Xi, x 2, Xp ): L c c tín h iệ u đầu v o ( in p u t s i g n a l s ) c ủ a m ộ t n r o n , c c tín hiệu thường đưa vào dạng m ột vector p chiều (w kl, w k2, w kp): Là tập trọng số liên kết nơron k với p đầu vào, trọng số liên kết tín hiệu vào thứ j với nơron k thường kí hiệu w/ỳ T hơng thường, trọng số liên kết nơron khởi tạo m ột cách ngẫu nhiên thời điểm khởi tạo m ạng v cập nhật liên tục trình học mạng Z : Là hàm tổng nơron, dùng để tính tổng giá trị kích hoạt lên nơron ( thường tính bang tổng tích đầu vảo với trọng số liên kêt nó) TỔNG QUAN VỀ N H Ậ N D ẠN G C HỮ D ự A TRÊN M Ơ H ÌN H M ẠN G NƠRON Trang - - Nixuyễn Thị Thanh Tân • Luận văn thạc sĩ uk\ Là tơng giá trị kích hoạt lên nơron thứ k (giá trị đầu hàm tổng) • bk- Là độ lệch nơron thứ k, giá trị d ùng n h m ột thành phần phân ngưỡng hàm kích hoạt • f(.): Là hàm kích hoạt (Activation function), hàm dùng để giới hạn phạm vi đầu nơron G iá trị h àm th n g xác định dựa hàm to n s độ lệch cho T h ô n g thường, p h ạm vi đâu nơron giới hạn đoạn [0,1] [-1, 1], Các hàm kích hoạt hàm tuyến tính phi tuyến V iệc lựa chọn h àm kích hoạt tuỳ thuộc vào toán Một số hàm kích hoạt thườ ng sử dụng mơ hình m ạng nơron thể Bảng 1-1 • yk‘ Là tín hiệu đâu nơron, m nơron có tơi đa m ột đâu Với thuật ngữ toán học, cấu trúc nơron k, m ô tả bàng cặp biểu thức sau: P uk = x wkjxj yk =f (uk - bk) y H àm Symm etrical +1 H ard Lim it (hardlims) ü~ -1 X y H àm tuyển tính +1 L inear (purelin) X -1 T ỎNG Q U A N VÈ N H Ậ N D Ạ N G C H Ữ D ự A T R Ê N M Ơ HÌNH M Ạ N G N Ơ R O N Nguyễn Thị Thanh Tân Trang - 88 - Luận văn thạc sĩ (dãy nhiễu đổm nối với nhau) phươ ng pháp lọc tỏ kh ông hiệu Giải pháp xử lý kết hợp phương pháp lọc (trung vị) với p h n g pháp khử nhiễu theo miền liên thôna Phương pháp giải tốt loại nhiễu đốm nhiễu vạch N gồi ra, q trình nghiên cứu, tơi nhận thấy tích luỹ thêm nhiều kiến thức m ạng nơron nhân tạo, lĩnh vực nhận dạn?, xử lý ảnh lĩnh vực liên quan N h ữ n g kiến thức giúp ích cho tơi nhiều q trình làm việc nghiên cứu sâu II N HỮ NG VẤN ĐỀ CHƯA ĐƯỢC GIẢI QUYẾT BỞI LUẬN VĂN Do bị giới hạn mặt thời gian m khối lượng công việc cần thực lại lớn nên bên cạnh kết đạt được, nhiều vấn đề tồn m luận văn chưa giải được, đỏ kể đến m ột số vấn đề sau: 1) D o sở liệu mẫu chữ thu thập hạn chế vê mặt số số lượng mẫu tính đa dạng m ẫu việc th nghiệm nhận dạng chữ viết tay rời rạc không dấu thử nghiệm nhận dạng từ chưa nhiều 2) M hình nhận dạng chưa giải trường hợp hai kí từ bị dính sít chẳng hạn như, với ảnh từ copy sau chương trình khơng thể tìm vị trí cắt chữ o chữ p 3) Luận văn xem xét đến văn cô cấu trúc đơn giản: khối text, 4) L uận văn dịng viết rời chưa đặt vấn đề giải trường hợp chữ hoa, chữ thường III.H Ư ỚN G PHÁT TRIỀN D ựa nh ững kêt đạt hạn vẩn đề cịn tơn tại, tơi xin đê xí m ột số hư n g phát triển thời gian tới nhằm nâng cao chất lượng nhận K.ÊT LU Ậ N Nguyễn Thị Thanh Tàn Trang - 89 - Luận văn thạc sĩ dạng hệ thống đồng thời nới lỏng bớt điều kiện ràng buộc đầu vào hệ thống 1) T iến hành thu thập thêm mẫu c hữ viết tay k hô ng dấu n hằm xây dựng m ột tập liệu đủ tốt để huấn luyện mạng 2) Thiết kế thêm m ột số lớp m ạng để nhận dạng từ đôi 3) Tiến hành nghiên cứu sâu đặc trưng chữ viết tay n hằm hoàn thiện tập đườ ng cong đặc trưng điều nâng cao hiệu q u ả q trình xác định vị trí cat từ 4) Cẩu trúc lại lớp F (bổ sung đặc trưng khác) để hệ thống có nhiều thơng tin cho việc nhận dạng 5) Bổ sung thêm phần p hân tích cú pháp p hân tích n g ữ ng hĩa tro ng câu để lựa chọn xác kết trả m ạng nơron K Ế T LU Ậ N Trang - 90 - Nguyễn Thị Thanh Tản Luận văn thạc sĩ TÀI LIỆU THAM KHẢO ■ T i liêu t h a m k h ả o tiế n go V iê• t • [ 1] Lương Mạnh Bá, Nguyễn Thanh Thuỷ ( ] 999), Học K ỹ Thuật [2] Nguyễn Hữu Hoà (2001 ), ứ n g d ụ n g m n g n r o n m t r o n g n h ậ n d n g c h ữ v i ế t t a y t i ế n g Luận văn tốt nghiệp đại học, Khoa Công nghệ Thông tin, Đại học Bách khoa Hà Nội [3] Lê M inh Hoàng (2001), M ộ t p h n g p h p n h ậ n Khoa Công nghệ, Đại học Quốc gia Hà Nội [4] Hoàng Kiếm, Nguyễn Hồng Sơn, Đào Minh Sơn (2001), “ ủ n g dụng mạng nơron nhân tạo hệ thống xử lý biểu mẫu tự động” , k ý y ế u h ộ i n g h ị k ỳ n i ệ m n ă m t h n h l ậ p V i ệ n C ô n g N h ập M ôn X Lý A nh s ố , d n g v ă n b ả n tiế n g Nhà Xuất Khoa V iệ t, V iệ t, Luận văn thạc sỹ, n g h ệ T h ô n g t in [5] Nguyễn Thị Thanh Tân (1999), T h u ậ t t o n p h â n t í c h E a r l e y v i m g d ụ n g t r o n g k i ê m l ô i n g ô n n g ữ đ ặ c t ả RAISE, Luận Văn Tốt Nghiệp Đại Học, Đại học Khoa Học Tự Nhiên, Đại học Quốc gia Hà Nội T i liệu t h a m k h ả o tiế n g A n h [6] [7] A nil K Jain, F u n d a m Sciences Series e n ta ls D ig ita l I m a g e P r o c e s s in g , Prentice Hall Information and System AZahour, B.Taconet and A.Faure (1992), “ Machine Recognition o f Arabic Cursive W riting” , 289-296 F r o m P i x e l s T o F e a t u r e s I I I F r o n t i e r s in H a n d w r i t i n g R e c o g n i t i o n , [8] B effe rt H and Shinghal (1989) “ Skeletonizing binary patterns on the homogeneous mulptiprocessor” , J o u r n a l o f P a t t e r n R e c o g n i t i o n a n d A r t i f i c i a l I n t e l l i g e n c e , vol 3, N o.2, pp 207-216 [9] Carl Grant Looney (1997), Press P a tter n R e c o g n itio n U s in g N e u r a l N e t w o r k s , Oxford University [10] C.J.Wells, L.J.Evett, p.E.Whitby, and W hitrow, “ fast dictionaryloookup for contextual work recognition” , P a t t e r n R e c o g n i t i o n [11] Denis Ricard, Helle Hvid Hansen, M ike Wozniewski, D e s c r i p t i o n , M cG ill University L in e a r F ea tu re E x tr a c tio n an d [12] E.Kavallieratou, N.Fakotakis, and G.Kokkinakis, S k e w a n g l e e s t i m a t i o n in d o c u m e n t p r o c e s s i n g u s i n g C o h e n ' s c l a s s d i s t r i b u t i o n s , Wire Communications Laboratory, University o f Patras [13] Homik, K., M.Stinchcommbe, and H.White (1989) “ M ultilayer feed-forward networks are universal approximator” N e u r a l N e t w o r k , 259-366 [14] Ioannis Andreadis, Maria I Vardavoulia, Gerasimos Louverdis and Nikolaos Papamarkos, C o l o u r i m a g e s k e l e t o n i s a t i o n , Democritus University o f Thrace [15] J.Camillerapp, G.Lorette, G.Menier, H,Oulhadj and J.C.Petttier (1992), “ O ff-line and On-line Methods For HandwritingRecognition” , F r o m P i x e l s T o F e a t u r e s I I I F r o n t i e r s in H a n d w r i t i n g R e c o g n i t i o n , 273-288 T À I L IỆ U T H A M K H Ả O Nguyễn Thị Thanh Tân Traníĩ - 91 - Luận văn thạc sĩ [16] J.C.Simon and O.Baret, “ Cursive Words Recognition” (1992), F rom P ix e ls To F ea tu re s III Frontiers in Handwriting Recognition, 241-260 [17] J.J Hull, T.K.H o, J.Favata, V.Govindaraju and S.N.Srihari (1992), “ Combination o f segmentation-based and whoüstic handwritten word recognition algorithms” , F r o m P i x e l s T o F e a t u r e s I I I F r o n t i e r s in H a n d w r i t i n g R e c o g n i t i o n , 261-272 [18] Kavallieratou, E.N.Fakotakis, and G Kokkinakis (1999), New A l g o r i t h m C o r r e c t i o n t a n d S l a n t R e m o v a l O n W o r d - L e v e l , In Proc O f ICECS’99, V.2 [19] M artin T Hagan, Howard B Demuth, Mark Beale, Thomson Publishing Company N e u r a l N e t w o r k D e s ig n , F or S s k e w in g An International [20] Naccache, N J and Shinghal, R (1984), “ SPTA: A proposed algorithm for thinning binary patterns,” I E E E T r a n s a c t i o n s o n S y s t e m s , Man, and Cybernetics, vol S M C -14, 409-418 [21] P.S.P Wang, M.V.Nagendraprasad and A Gupta (1992), “ a neural net based “ H ybrid” approach to handwritten numeral recognition” , F r o m P i x e l s T o F e a t u r e s I I I F r o n t i e r s in H a n d w r i t i n g R e c o g n i t i o n , 145 - 154 [22] Sergios Theodoridis & Konstantinos Koutroumbas (1999), Press, America [23] Simon Haykin (1994), Publishing Company N eu l N etw ork A C o m p r e h e n s iv e P a ttern R e c o g n itio n F o u n d a tio n , , Academic Macmillan College [24] S.M Smith and J.M Brady SUSAN (1997), a new approach to low level image processing I n t J o u r n a l o f C o m p u t e r V i s i o n , 45—78 [25] S Pal Some Low Level Image Segmentation Methods, Algorithm s and their Analysis PhD thesis, Indian Institute o f Technology, 1991 [26] Stefanelli, R and Rosenfeld (1971), “ Some parallel thinning algorithms for digital pictures,” J o u r n a l o f t h e A C M , vol 18, 255-264 [27] T.Fujisaki, H.S.M.Beigi, C.C.Tappert, M Ukelson and C G W o lf (1992), “ Online recognition o f unconstrained handprinting: a stroke-based system and its evaluation” , F r o m P i x e l s T o F e a t u r e s I I I F r o n t i e r s i n H a n d w r i t i n g R e c o g n i t i o n , 297 - 12 [28] Y LeCun, B Boser, J s Denker, D Henderson, R E Howard, w Hubbard, and L D Jackel (1992), "Handwritten d ig it recognition w ith a back-propagation network", N e u r a l N e t w o t k s , c u r r e n t a p p l i c a t i o n s , (Lisboa P.G.J., e