Nhận dạng chữ viết tay hạn chế dựa trên mô hình mạng nơron kết hợp với thống kê ngữ cảnh

103 47 0
Nhận dạng chữ viết tay hạn chế dựa trên mô hình mạng nơron kết hợp với thống kê ngữ cảnh

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Đ Ạ I H Ọ C Ọ Ư Ó C G IA H À N Ộ I KHOA CỒNG NGHỆ NGUYẺN THỊ THANH TÂN NHẬN DẠNG CHỮ VIẾT TAY HẠN CHÉ DựA TRÊN MƠ HÌNH MANG NƠRON KÉT HỢP VỚI THÓNG KE n g ữ c ả n h Chuyên ngành: Công nghệ thông tin Mã số: 1.01.10 LUẬN V ĂN THẠC s ĩ N g i h n g d ẫ n k h o a học: PGS TS Ngô Quoc Tạo Hà N ộ i - 2004 Nguyễn Thị Thanh Tân Trang - - Luận văn thạc sĩ MỤC LỤC M Ở Đ Ầ U .3 C H Ư Ơ N G - T Ổ N G Q U A N VỀ N H Ậ N D Ạ N G C H Ữ D ự A T R Ê N M Ơ H ÌN H M Ạ N G N Ơ R O N 1.1 T ổn g quan mạng n ro n 1.1.1 C ấu trúc n r o n 1.1.2 Các phươ ng pháp huấn luyện m ột mạng n r o n 10 1.2 Qui trình chung m ột hệ nhận d ạng c h ữ 12 1.2.1 Phân lớp m ẫ u .12 1.2.2 N hận dạng văn b ả n 13 1.3 M ạn g M L P ứng dụng nhận dạng c h ữ 16 1.3.1 C ấu trúc P e rc e p tro n 16 1.3.2 K iến trúc m ạng nhiều lớp truyền thẳng (M L P ) 17 1.3.3 Q uá trình huấn luyện m ạng M L P 18 1.3.4 Ưu, nhược điểm m ạng M L P 26 1.4 K ết l u ậ n 27 C H Ư Ơ N G - N H Ậ N D Ạ N G T Ừ D ự A T R Ê N M Ạ N G B Ố N L Ớ P CẢI TIẾ N K ẾT H Ợ P VỚI T H Ố N G K Ê N G Ữ c ả n h ' 28 2.1 M n g nơron bốn lớp cải t i ế n 30 2.1.1 Ki ến trúc m n g 31 2.1.2 T hu ật toán huấn luyện m n g 36 2.1.3 K h ả nhận dạng m n g .40 2.2 B ộ thống kê ngữ c ả n h 41 2.2.1 C ác khái niệm sử dụng thống k ê 41 2.2.2 C ác cấu trúc liệu sử dụng trình thống k ê 43 2.2.3 T h u ật toán kiểm tra m ức độ hợp lý m ột kí tự x â u 44 2.2.4 T h u ật toán lựa chọn m ột từ danh sách từ ứng cử v i ê n 45 2.3 Q uá trình nhận dạng t 46 2.3.1 P h n g pháp nhận d n g 46 2.3.2 C ấu trúc liệu sử dụng trình nhận d n g 47 2.3.3 Q u trình xác định vị trí cắt khác ảnh đầu v o 50 MỞ ĐẢU Nguyễn Thị Thanh Tản 2.3.4 Trang - - Luận văn thạc sĩ Thuật toán nhận dạng từ 52 2.4 Đánh giá khả nhận dạng mơ h ìn h 60 2.5 Kết l u ậ n 60 C H Ư Ơ N G - CÀI Đ Ậ T HỆ T H Ố N G N H Ậ N D Ạ N G C H Ữ V IẾ T T A Y H Ạ N C H Ế 62 3.1 Qui trình hoạt động hệ t h ố n g .62 3.2 Q uá trình tiền xử lý 64 3.2.1 Tiền xử lý trước phân tích ảnh văn cần nhận d n g .64 3.2.2 Tiền xử lý trước phân đoạn từ cần nhận d n g 70 3.2.3 Tiền xử lý trước nhận dạng kí t ự 74 3.3 Q uá trình phân vùng ả n h 74 3.3.1 Tách dòng văn b ả n 75 3.3.2 Tách t 77 3.4 Q uá trình nhận d n g 79 3.5 Quá trình hậu xử lý 79 3.6 Kết l u ậ n 80 C H Ư Ơ N G - T H Ử N G H IỆ M H Ệ T H Ố N G N H Ậ N D Ạ N G C H Ữ V IẾ T T A Y H Ạ N C H Ế ’ 81 4.1 M ôi trường thử n g h i ệ m 81 4.2 D ữ liệu v kết thử n g h i ệ m 81 4.2.1 T nghiệm nhận dạng chữ số viết t a y 81 4.2.2 T nghiệm nhận dạng chữ không dấu viết t a y 83 4.2.3 T nghiệm nhận dạng từ n g u y ê n 84 K Ế T L U Ậ N 86 T À I L IỆ U T H A M K H Ả O 91 P H Ụ L Ụ C A - G IA O D IỆN C Ủ A H Ệ N H Ậ N D Ạ N G .93 P H Ụ L Ụ C B - G IA O D IỆ N C Ủ A H Ệ N H Ậ N D Ạ N G 94 PHỤ LỤC c - GIAO DIỆN CỦA HỆ HỌC M ẠNG 96 P H Ụ L Ụ C D - M Ộ T SÔ K Ế T Q U Ả T H Ố N G K Ê .98 P H Ụ L Ụ C E - D A N H M ỤC C Á C T H U Ậ T T O Á N .101 P H Ụ L Ụ C F - D A N H M ự c C Á C H ÌN H V Ẽ 102 P H Ụ L Ụ C F - D A N H M Ụ C C Á C B Ả N G B I Ế U 103 MỜ ĐÂU Nũuvễi Thị Thanh Tân Trang - - Luận vSn thạc sĩ MỜĐẦU Nhận dạng mẫu nơành khoa học mà vai trị phân lớp đổi tượng thành m ột số loại số lớp riêng biệt [22], Tuỳ thuộc vào lĩnh vực ứng dụng, đối tượng dạng ảnh, dạng tín hiệu sóng m ột kiểu liệu có mà cần phải phân lớp N hững đối tượng gọi bàng m ột thuật ngữ chung “ m ẫ u ” (pattern) N hận dạng m ẫu biết đến từ lâu, trước n hững năm 1960 chi kết nghiên cứu mặt lý thuyết lĩnh \ự c thống kê Tuy nhiên, với phát triển không n s n g khoa học kỹ thuật phần cứng phần mềm, yêu cầu mặt ứng d ụ n g th ự c tế lĩnh vực nhạn dạng mẫu ngày tăng lên nhận dạng mẫu sử dụng nhiều lĩnh vực y học, tự động hoá số qui trình sản xuất cơng nghiệp, d ự báo thời tiêt, dự báo cháy rừng,v.v Ngoài nhận dạng mẫu thành p hần quan trọng hầu hết hệ thống máy tính thơng minh xây dựng để thực việc định C ù n với phát triển nhận dạn ẹ mầu, nhận dạng chữ ngày trở thành m ột ứng dụng thiếu đời sống xã hội người Nhận dạng chữ viết ứng dụng để tự động hoá số cơng việc văn phịng lưu t:ữ văn phân loại thư tín, , nhằm giảm bớt cơng việc nhàm chán địi hỏi nhiều thời gian cơng sức người Với tìm quan trọng mình, nhận dạng chữ viết m ột lĩnh vực thu hút quan tâm, nghiên cứu nhà khoa học Hiện nay, toán nhận dạng chữ h giải gần trọn vẹn, giới V iệt N am có sản phẩm có giá trị thực tế cao, kể đến như: sản phẩm FineR eader hăng A B B Y Y nhận dạng 20 thứ tiếng khác nhau, sản phẩm O m niPage hãng ScanSoft nhận dạng chữ tiếng Anh, sản p hẩm V n D O C R V iện Công nghệ Thông tin nhận dạng chữ Việt in, Song, với toán nhận dạng chữ viết tay thi v ắ i đề trở lên phức tạp nhiều lý sau đây: MỜ Đ ÂU NiỉU>ẻn I hi (hanh • ĩrang - - Luận văn thạc sĩ Với chừ viết tay khơng thể có khái niệm font chừ, kích cỡ chừ C ác kí tự tron? văn chừ viết tay thườno có kích thước khác T hậm chí, kí tự trono văn m ột người viết nhiều có độ rộng, hẹp, cao, thấp khác nhau, • Với nhữnơ ns;ười viết khác chữ viết có độ nghiêng khác (chừ n ghiêng nhiều/ít, chừ nơhiêng trái/phải ,) • Các kí tự từ ván chữ viết tay đơi với hầu hết người viết tlurờno bị dính khó xác định đượ c phân cách chúng • Các văn bàn chừ viết tay cịn có trư n g hợp dính dịng (d ịn g bị dính chồng lên dịng trên) C h ín h khó khăn trên, nói, thời diểm ch ưa có m ộ t giải pháp đủ tốt để giải trọn vẹn toán nhận dạng chữ viết tay Hiện nay, e;iới V iệt N a m có m ộ t số nh óm nghiên cứu đầu tư nhiều thời gian cho nhận dạng chữ viết tay thu m ột sô kết Song, kết áp dụng m ột cách hạn chế n hững lĩnh vực hẹp, số nhóm điển hình kể đến như: nhóm nghiên cứu Đại Học Q u ổ c Gia T P H C M cài đặt thử nghiệm hệ thống nhận d ạng chữ số chữ viết tay rời rạc phiếu xuất nhập cảnh [4], n h ó m nghiên cứu Sim on O B aret (L aorỉa/C N R S & EN PC, Paris) cài đặt m ột hệ th ố ng nhận d ạng c h ữ viết tay tro n g lĩnh vực kiểm tra tài khoản ngân h àn g [16], nh ó m nghiên c ứ u J.J.Hull, T k.H o, J.Favata, V G ovindaraju S.N Srihari trung tâm nghiên cứu vê nhận d n g phân tích văn trư ờng Đại H ọc T ổ n g H ợp N e w Y ork cài đặt hệ th ố n g chuyên nhận dạng địa thư b u điện [17], nhóm nghiên cứu Fujisaki, H S.M B eigi, C C.Tapert, M U k e iso n C G W o lf p h ò n g nghiên cứu W atson IB M cài đặt hệ thống nhận dạng c h ữ viết tay hạn chế trực tuyến trạ m làm v iệc IB M [21) Như- vậy, việc tìm m ột lời giải khả thi cho toán nhận dạng chữ viết tay vấn đề cấp thiết p h ứ c tạp, cần đầu tư nhiều thời gian công sức MỞ Đ ÂU Nguyen Thị Thanh Tân Trang - - Luận văn thạc sĩ c u a n s i T r o n c luận văn này, chúnG, c ũ n g k h ô n g kỳ v ọ n g giải q u y ế t chọn vẹn toán nhận dạng chừ viết tay m hy vọng dóng góp thêm m ộ t phương pháp khả thi để giải m ột lớp toán lĩnh vực nhận d ạn g chữ viết tay Bài toán đặt trons luận văn “ n h ậ n d n g c h ù ’ viết ta y h n ch ế d ự a tr ê n mơ hình inạng noron kết họp vói th ố n g kê n gữ c ả n h ” , v ấ n đề “chữ viết tay hạn chế” hay “ chữ viết tay có ràng buộc” luận văn quan niệm sau: • C hữ viết tay xem xét chừ số chữ tiếng A n h viết tay khơng dấu • K hoảng cách dòng chữ văn đầu vào phải xác định (tức d ò n s chừ phải có m ột kh oảng cách tư ng đơi, khơng dính hay chồng lên nhau) • G iữa từ dịng chữ phải có m ột kh oảng cách định (các từ k hơng dính hay m óc nối vào nhau) • Các kí tự văn cần nhận dạng k h ôn g đ ượ c nghiêng Sở dĩ, lựa chọn m ạng nơron làm c ơn g cụ để thể thuật tốn nhận d ạng lẽ m hình m ạng nơron xây dự n g theo ngu yên tắc m ô p hỏ ng hoạt đ ộn g não người nên thích hợp với toán nhận d ạn g so với c n g cụ khác m n e nơron có nh ững ưu điểm vượt trội sau: • M ạn g nơron coi m ột xấp xỉ vạn • C ó khả học thích nghi với m ẫu • C ó k tổng qt hố: M ạn g đưa n h ữ n g kết m ang tính tơng qt hố • C ó khả dung thứ lỗi: Có thể chấp nhận sai số tron g tập d ữ liệu đầu vào • M ạn g có tốc độ tính tốn cao dẫn đến tốc độ nhận dạng nhanh Trên cở sở đó, nội dung luận văn tập trun g chủ y ể u vào m ột sô vân đê sau: MỜ ĐẢU Nii'UV’n Thị Thanh Tàn Trang - - Luận văn thạc sĩ • Khảo sát cách tiếp cận nhận d n s dựa m hình m ạng nơron • Đánh giá khả nhận d ang c ũ n s ưu, nhược điểm m a n e nhiều lớp truyền thana M LP (M ultilayer Perceptrons) • Đe xuất mơ hình m ạng nơron bốn lớp cải tiến thích hợp cho nhận dạng kí tự viết tay • Đe xuất mơ hình nhận dạng từ dira kết hợp nhận dạng kí tự với m ột thống kê nofr cảnh • Xây d ự n g hệ thốne; nhận dạng chữ viết tay hạn chế Với nội dung trên, cấu trúc luận văn gồm n h ững phần sau đây: C h u o n g I: T ô n g quan vê nhận dạn g c h ữ dựa mô hình m n g noron N ội dưng chương tập trung khảo sát cách tiếp cận nhận d ạn g dira mơ hình m ạng nơron thơng qua mơ hình m ạng nhiều lớp truyền thẳng M L P (M ultilayer Perceptrons) T đánh giá ưu, nhược điểm m ạng M L P , tiền đề cho q trình xây d ự n g m hình nhận d ạng c h n g sau C h n g 2: Nhận dạn g từ dựa mơ hình m ạn g no ro n bốn lóp cải tiến kết họp vó i thống kê ngữ cảnh C h n g tập trung vào việc xây d ựng mô hình hiệu để n h ận dạng chữ viết tay hạn chế với nội dung sau đây: • Sơ đồ tổng quan mơ hình nhận dạng từ đ ượ c đề xuất bời luận văn • Q uá trình xây dựng m ạng nơron bổn lớp cải tiến • Q trình xây dựng thống kê • Q trình xây nhận dạng từ • Đ ánh giá khả nhận dạng m ô hình Chu o n g 3: Cài đặt hệ thống nhận n g c h ữ viết tay hạn chế Tran” - - N” U\en Thị Thanh Tân Luận văn thạc sĩ C h n g m ô tả cách cụ thể qui trình nhận dạng chừ viết tay hạn chế Đ ồng thời, cụ thể hóa đến mức chi tiết có thề việc ứng dụng m hình nhận dạng đề xuất chương để nhận dạng chữ viết tay hạn chế C h n g 4: T h nghiệm hệ thống nhận dạn g chữ viết tay hạn chế C h n g m ô tả chi tiết trình thử nohiệm cũno kết thử nghiệm hệ thống với tập liệu khác P hần kết luận P hần nêu lên vấn đề giải được, chưa giải v hướng phát triển trone tư n g lai luận văn C ác phần phụ lục A, B, c C ác phần phụ lục cung cấp thơng tin tham khảo có giá trị kết q u ả thực n ghiệm chương trình, kí hiệu, từ khóa sử dụng luận văn, tài liệu tham khảo, M Ở ĐÂU Nguvcn T hị Thanh Tàn Trans - Luận vãn thạc sĩ CHƯƠNG - TỔNG QUAN VÈ NHẬN DẠNG CHỮ DỰA TRÊN MƠ HÌNH MẠNG NƠRON 1.1 Tổng quan mạng noron 1.1.1 Cấu trúc nơron M ột nơron m ột đơn vị xử lý thôn° tin thành phần m ột m n s nơron c ấ u trúc m ột nơron đươc mô tả Hình 1.1 /v v , Hàm kích hoạt \ Các tín hiệu vào \ x2 o - — @ — f(.) Hàm XP c>- — Q — Đầu tổng Các trọng số liên kết Hình 1.1: c ấ u trúc noron Trong đó: (Xi, x 2, Xp ): L c c tín h iệ u đầu v o ( in p u t s i g n a l s ) c ủ a m ộ t n r o n , c c tín hiệu thường đưa vào dạng m ột vector p chiều (w kl, w k2, w kp): Là tập trọng số liên kết nơron k với p đầu vào, trọng số liên kết tín hiệu vào thứ j với nơron k thường kí hiệu w/ỳ T hơng thường, trọng số liên kết nơron khởi tạo m ột cách ngẫu nhiên thời điểm khởi tạo m ạng v cập nhật liên tục trình học mạng Z : Là hàm tổng nơron, dùng để tính tổng giá trị kích hoạt lên nơron ( thường tính bang tổng tích đầu vảo với trọng số liên kêt nó) TỔNG QUAN VỀ N H Ậ N D ẠN G C HỮ D ự A TRÊN M Ơ H ÌN H M ẠN G NƠRON Trang - - Nixuyễn Thị Thanh Tân • Luận văn thạc sĩ uk\ Là tơng giá trị kích hoạt lên nơron thứ k (giá trị đầu hàm tổng) • bk- Là độ lệch nơron thứ k, giá trị d ùng n h m ột thành phần phân ngưỡng hàm kích hoạt • f(.): Là hàm kích hoạt (Activation function), hàm dùng để giới hạn phạm vi đầu nơron G iá trị h àm th n g xác định dựa hàm to n s độ lệch cho T h ô n g thường, p h ạm vi đâu nơron giới hạn đoạn [0,1] [-1, 1], Các hàm kích hoạt hàm tuyến tính phi tuyến V iệc lựa chọn h àm kích hoạt tuỳ thuộc vào toán Một số hàm kích hoạt thườ ng sử dụng mơ hình m ạng nơron thể Bảng 1-1 • yk‘ Là tín hiệu đâu nơron, m nơron có tơi đa m ột đâu Với thuật ngữ toán học, cấu trúc nơron k, m ô tả bàng cặp biểu thức sau: P uk = x wkjxj yk =f (uk - bk) y H àm Symm etrical +1 H ard Lim it (hardlims) ü~ -1 X y H àm tuyển tính +1 L inear (purelin) X -1 T ỎNG Q U A N VÈ N H Ậ N D Ạ N G C H Ữ D ự A T R Ê N M Ơ HÌNH M Ạ N G N Ơ R O N Nguyễn Thị Thanh Tân Trang - 88 - Luận văn thạc sĩ (dãy nhiễu đổm nối với nhau) phươ ng pháp lọc tỏ kh ông hiệu Giải pháp xử lý kết hợp phương pháp lọc (trung vị) với p h n g pháp khử nhiễu theo miền liên thôna Phương pháp giải tốt loại nhiễu đốm nhiễu vạch N gồi ra, q trình nghiên cứu, tơi nhận thấy tích luỹ thêm nhiều kiến thức m ạng nơron nhân tạo, lĩnh vực nhận dạn?, xử lý ảnh lĩnh vực liên quan N h ữ n g kiến thức giúp ích cho tơi nhiều q trình làm việc nghiên cứu sâu II N HỮ NG VẤN ĐỀ CHƯA ĐƯỢC GIẢI QUYẾT BỞI LUẬN VĂN Do bị giới hạn mặt thời gian m khối lượng công việc cần thực lại lớn nên bên cạnh kết đạt được, nhiều vấn đề tồn m luận văn chưa giải được, đỏ kể đến m ột số vấn đề sau: 1) D o sở liệu mẫu chữ thu thập hạn chế vê mặt số số lượng mẫu tính đa dạng m ẫu việc th nghiệm nhận dạng chữ viết tay rời rạc không dấu thử nghiệm nhận dạng từ chưa nhiều 2) M hình nhận dạng chưa giải trường hợp hai kí từ bị dính sít chẳng hạn như, với ảnh từ copy sau chương trình khơng thể tìm vị trí cắt chữ o chữ p 3) Luận văn xem xét đến văn cô cấu trúc đơn giản: khối text, 4) L uận văn dịng viết rời chưa đặt vấn đề giải trường hợp chữ hoa, chữ thường III.H Ư ỚN G PHÁT TRIỀN D ựa nh ững kêt đạt hạn vẩn đề cịn tơn tại, tơi xin đê xí m ột số hư n g phát triển thời gian tới nhằm nâng cao chất lượng nhận K.ÊT LU Ậ N Nguyễn Thị Thanh Tàn Trang - 89 - Luận văn thạc sĩ dạng hệ thống đồng thời nới lỏng bớt điều kiện ràng buộc đầu vào hệ thống 1) T iến hành thu thập thêm mẫu c hữ viết tay k hô ng dấu n hằm xây dựng m ột tập liệu đủ tốt để huấn luyện mạng 2) Thiết kế thêm m ột số lớp m ạng để nhận dạng từ đôi 3) Tiến hành nghiên cứu sâu đặc trưng chữ viết tay n hằm hoàn thiện tập đườ ng cong đặc trưng điều nâng cao hiệu q u ả q trình xác định vị trí cat từ 4) Cẩu trúc lại lớp F (bổ sung đặc trưng khác) để hệ thống có nhiều thơng tin cho việc nhận dạng 5) Bổ sung thêm phần p hân tích cú pháp p hân tích n g ữ ng hĩa tro ng câu để lựa chọn xác kết trả m ạng nơron K Ế T LU Ậ N Trang - 90 - Nguyễn Thị Thanh Tản Luận văn thạc sĩ TÀI LIỆU THAM KHẢO ■ T i liêu t h a m k h ả o tiế n go V iê• t • [ 1] Lương Mạnh Bá, Nguyễn Thanh Thuỷ ( ] 999), Học K ỹ Thuật [2] Nguyễn Hữu Hoà (2001 ), ứ n g d ụ n g m n g n r o n m t r o n g n h ậ n d n g c h ữ v i ế t t a y t i ế n g Luận văn tốt nghiệp đại học, Khoa Công nghệ Thông tin, Đại học Bách khoa Hà Nội [3] Lê M inh Hoàng (2001), M ộ t p h n g p h p n h ậ n Khoa Công nghệ, Đại học Quốc gia Hà Nội [4] Hoàng Kiếm, Nguyễn Hồng Sơn, Đào Minh Sơn (2001), “ ủ n g dụng mạng nơron nhân tạo hệ thống xử lý biểu mẫu tự động” , k ý y ế u h ộ i n g h ị k ỳ n i ệ m n ă m t h n h l ậ p V i ệ n C ô n g N h ập M ôn X Lý A nh s ố , d n g v ă n b ả n tiế n g Nhà Xuất Khoa V iệ t, V iệ t, Luận văn thạc sỹ, n g h ệ T h ô n g t in [5] Nguyễn Thị Thanh Tân (1999), T h u ậ t t o n p h â n t í c h E a r l e y v i m g d ụ n g t r o n g k i ê m l ô i n g ô n n g ữ đ ặ c t ả RAISE, Luận Văn Tốt Nghiệp Đại Học, Đại học Khoa Học Tự Nhiên, Đại học Quốc gia Hà Nội T i liệu t h a m k h ả o tiế n g A n h [6] [7] A nil K Jain, F u n d a m Sciences Series e n ta ls D ig ita l I m a g e P r o c e s s in g , Prentice Hall Information and System AZahour, B.Taconet and A.Faure (1992), “ Machine Recognition o f Arabic Cursive W riting” , 289-296 F r o m P i x e l s T o F e a t u r e s I I I F r o n t i e r s in H a n d w r i t i n g R e c o g n i t i o n , [8] B effe rt H and Shinghal (1989) “ Skeletonizing binary patterns on the homogeneous mulptiprocessor” , J o u r n a l o f P a t t e r n R e c o g n i t i o n a n d A r t i f i c i a l I n t e l l i g e n c e , vol 3, N o.2, pp 207-216 [9] Carl Grant Looney (1997), Press P a tter n R e c o g n itio n U s in g N e u r a l N e t w o r k s , Oxford University [10] C.J.Wells, L.J.Evett, p.E.Whitby, and W hitrow, “ fast dictionaryloookup for contextual work recognition” , P a t t e r n R e c o g n i t i o n [11] Denis Ricard, Helle Hvid Hansen, M ike Wozniewski, D e s c r i p t i o n , M cG ill University L in e a r F ea tu re E x tr a c tio n an d [12] E.Kavallieratou, N.Fakotakis, and G.Kokkinakis, S k e w a n g l e e s t i m a t i o n in d o c u m e n t p r o c e s s i n g u s i n g C o h e n ' s c l a s s d i s t r i b u t i o n s , Wire Communications Laboratory, University o f Patras [13] Homik, K., M.Stinchcommbe, and H.White (1989) “ M ultilayer feed-forward networks are universal approximator” N e u r a l N e t w o r k , 259-366 [14] Ioannis Andreadis, Maria I Vardavoulia, Gerasimos Louverdis and Nikolaos Papamarkos, C o l o u r i m a g e s k e l e t o n i s a t i o n , Democritus University o f Thrace [15] J.Camillerapp, G.Lorette, G.Menier, H,Oulhadj and J.C.Petttier (1992), “ O ff-line and On-line Methods For HandwritingRecognition” , F r o m P i x e l s T o F e a t u r e s I I I F r o n t i e r s in H a n d w r i t i n g R e c o g n i t i o n , 273-288 T À I L IỆ U T H A M K H Ả O Nguyễn Thị Thanh Tân Traníĩ - 91 - Luận văn thạc sĩ [16] J.C.Simon and O.Baret, “ Cursive Words Recognition” (1992), F rom P ix e ls To F ea tu re s III Frontiers in Handwriting Recognition, 241-260 [17] J.J Hull, T.K.H o, J.Favata, V.Govindaraju and S.N.Srihari (1992), “ Combination o f segmentation-based and whoüstic handwritten word recognition algorithms” , F r o m P i x e l s T o F e a t u r e s I I I F r o n t i e r s in H a n d w r i t i n g R e c o g n i t i o n , 261-272 [18] Kavallieratou, E.N.Fakotakis, and G Kokkinakis (1999), New A l g o r i t h m C o r r e c t i o n t a n d S l a n t R e m o v a l O n W o r d - L e v e l , In Proc O f ICECS’99, V.2 [19] M artin T Hagan, Howard B Demuth, Mark Beale, Thomson Publishing Company N e u r a l N e t w o r k D e s ig n , F or S s k e w in g An International [20] Naccache, N J and Shinghal, R (1984), “ SPTA: A proposed algorithm for thinning binary patterns,” I E E E T r a n s a c t i o n s o n S y s t e m s , Man, and Cybernetics, vol S M C -14, 409-418 [21] P.S.P Wang, M.V.Nagendraprasad and A Gupta (1992), “ a neural net based “ H ybrid” approach to handwritten numeral recognition” , F r o m P i x e l s T o F e a t u r e s I I I F r o n t i e r s in H a n d w r i t i n g R e c o g n i t i o n , 145 - 154 [22] Sergios Theodoridis & Konstantinos Koutroumbas (1999), Press, America [23] Simon Haykin (1994), Publishing Company N eu l N etw ork A C o m p r e h e n s iv e P a ttern R e c o g n itio n F o u n d a tio n , , Academic Macmillan College [24] S.M Smith and J.M Brady SUSAN (1997), a new approach to low level image processing I n t J o u r n a l o f C o m p u t e r V i s i o n , 45—78 [25] S Pal Some Low Level Image Segmentation Methods, Algorithm s and their Analysis PhD thesis, Indian Institute o f Technology, 1991 [26] Stefanelli, R and Rosenfeld (1971), “ Some parallel thinning algorithms for digital pictures,” J o u r n a l o f t h e A C M , vol 18, 255-264 [27] T.Fujisaki, H.S.M.Beigi, C.C.Tappert, M Ukelson and C G W o lf (1992), “ Online recognition o f unconstrained handprinting: a stroke-based system and its evaluation” , F r o m P i x e l s T o F e a t u r e s I I I F r o n t i e r s i n H a n d w r i t i n g R e c o g n i t i o n , 297 - 12 [28] Y LeCun, B Boser, J s Denker, D Henderson, R E Howard, w Hubbard, and L D Jackel (1992), "Handwritten d ig it recognition w ith a back-propagation network", N e u r a l N e t w o t k s , c u r r e n t a p p l i c a t i o n s , (Lisboa P.G.J., e

Ngày đăng: 23/09/2020, 21:00

Mục lục

  • MỤC LỤC

  • MỜĐẦU

  • 1.1 Tổng quan về mạng noron

  • 1.1.1 Cấu trúc của một nơron

  • 1.1.2 Các phương pháp huấn luyện một mạng nơron

  • 1.2 Qui trình chung của một hệ nhận dạng chữ

  • 1.2.1 Phân lớp mẫu

  • 1.2.2 Nhận dạng văn bản

  • 1.3 Mạng MLP và ứng dụng trong nhận dạng chữ

  • 1.3.1 Cấu trúc một Perceptron

  • 1.3.2 Kiến trúc mạng nhiều lớp truyền thẳng (MLP)

  • 1.3.3 Quá trình huấn luyện mạng MLP

  • 1.3.4 Ưu, nhược điểm của mạng MLP

  • 1.4 Kết luận

  • CHƯƠNG 2 - NHẬN DẠNG TỪ DỰA TRÊN MẠNG BỐN LỚP CÀI TIẾN KẾT HỢP VỚI THỐNG KÊ NGỮ CẢNH

  • 2.1 Mạng nơron bốn lớp cải tiến

  • 2.1.1 Kiến trúc mạng

  • 2.1.2 Thuật toán huấn luyện mạng

  • 2.1.3 Khả năng nhận dạng của mạng

  • 2.2 Bộ thống kê ngữ cảnh

Tài liệu cùng người dùng

Tài liệu liên quan