Nghiên cứu ứng dụng mạng Nơron nhận dạng chữ Hán-Nôm Trương Thị Hương Trường Đại học Công nghệ Luận văn Thạc sĩ ngành: Kỹ thuật phần mềm; Mã số: 60 48 01 03 Người hướng dẫn: PGS.TS Nguyễn Ngọc Bình Năm bảo vệ: 2014 Keywords Mạng nơron; Nhận dạng ký tự; Chữ Hán Nôm; Công nghệ thông tin Content Chữ Nơm hình thành phát triển từ kỷ X tới kỷ XX Là di sản văn hóa, có vai trị đặc biệt quan trọng việc tạo nên văn học rực rỡ xuyên suốt nhiều kỷ Viện Nghiên cứu Hán Nôm Việt Nam lưu giữ hàng trăm ngàn đơn vị tư liệu chữ Nơm có giá trị việc nghiên cứu đời sống người Việt thời xa xưa nhiều mảng lĩnh vực: văn học, tư tưởng, triết học, ngôn ngữ, luật pháp, đạo đức… Tuy nhiên số người đọc viết chữ Nơm nước ta cịn khơng nhiều, việc đưa chữ Nơm vào máy tính, xây dựng từ điển chữ Nơm, nhận dạng, đốn nhận khơi phục chữ Nơm lỗi, thiếu lĩnh vực nghiên cứu có ý nghĩa thực tiễn quan trọng Mạng nơ-ron cơng cụ nhận dạng tốt đặc trưng sau: Khả học từ kinh nghiệm (khả huấn luyện), khả xử lý song song với tốc độ xử lý nhanh, khả học thích nghi, khả khái qt hố cho đầu vào khơng huấn luyện, ví dụ dựa vào cách học mạng tiên đốn đầu từ đầu vào khơng biết trước [15, 16] Tuy nhiên nhược điểm dùng mạng nơ-ron chưa có phương pháp luận chung thiết kế cấu trúc mạng cho toán nhận dạng điều khiển mà phải cần tới kiến thức chuyên gia Mặt khác xấp xỉ mạng nơ-ron với hệ phi tuyến khó khăn luyện mạng khơng tìm điểm tối ưu tồn cục Vì tồn lớn gặp phải tìm nghiệm tối ưu tồn cục, đặc biệt áp dụng cho toán lớn, hệ thống điều khiển q trình Trong luận văn tơi trình bày hoàn chỉnh phương pháp ứng dụng mạng nơ-ron nhận dạng chữ Hán-Nôm với mong muốn đưa phương pháp nhận dạng tốt, góp phần xây dựng cơng cụ nhận dạng, chuyển đổi văn chữ HánNôm thành chữ Quốc ngữ nhằm làm sáng tỏ giá trị văn hóa lưu trữ Cấu trúc luận văn gồm phần sau: Chương Tổng quan: Nội dung chương trình bày tổng quan chữ Nơm, lịch sử hình thành phát triển chữ Nơm, mơ hình tổng quan hệ thống nhận dạng chữ Nôm Chương Mạng Nơ-ron: Nội dung chương trình bày tổng quan mạng Nơron, cách xây dựng mạng, đánh giá yếu tố trình huấn luyện mạng tổng hợp số phương pháp nhận dạng chữ tượng hình dựa mạng Nơ-ron Chương Giải thuật di truyền: Chương giới thiệu giải thuật di truyền, thành phần giải thuật di truyền Chương Nhận dạng chữ Hán-Nôm dựa mạng nơ-ron kết GA: Chương đề xuất phương pháp kết hợp giải thuật di truyền trình huấn luyện mạng Nơ-ron nhằm tìm số tối ưu cho mạng Trình bày kết thực nghiệm nhận dạng 2970 chữ Hán-Nôm Phần kết luận: Phần trình bày đóng góp luận văn, tồn tại, hạn chế chưa giải hướng giải References Tiếng Việt [1] Nguyễn Tuấn Cường, “Thời điểm xuất chữ Nôm sơ đồ cấu trúc chữ Nôm”, 2009 [2] Phạm Văn Hưởng, Trần Minh Tuấn, Nguyễn Thị Ngọc Hương, Bùi Thị Hồng Hạnh, Lê Hồng Trang, Vũ Thanh Nhân, Trương Anh Hồng, Vũ Quang Dũng, Nguyễn Ngọc Bình (2008), “Một số phương pháp nhận dạng chữ Nôm”, Hội thảo Khoa học Quốc gia Lần thứ IV CNTT-TT (ICT.rda’2008), Hà Nội [3] GS.TSKH Nguyễn Quang Hồng, Khái lược văn tự học chữ Nôm , Nhà xuất giáo dục , 2008 Tiếng Anh [4] Mingrui Wu, Bo Zhang, Ling Zhang, “A Neural Network Based Classifier for Handwritten Chinese Character Recognition”, ICPR'00 - Volume 2, 2000 [5] Il-SeokOh, Ching Y Suen, “A class-modular feedforward neural network for handwriting recognition”, Pattern Recognition 35 (2002) 229-244 [6] Srinivasa Kumar Devireddy, Settipalliappa Rao(2009), “Hand written character recognition using back propagation network”, Journal of Theoretical and Applied Information Technology [7] Richard Romero, Robert Berger, Robert Thibadeau, and Dave Touretsky, “Neural Network Classifiers for Optical Chinese Character Recognition” [8] Richard Romero, David Touretzky, and Robert Thibadeau, “Optical Chinese Character Recognition using Probabilistic Neural Networks” [9] D.E Rumelhart; G.E Hinton and R.J Williams (1986), “Learning internal representations by error propagation”, Parallel distributed processing: Explorations in the microstructure of cognition (Cambridge MA.: MIT Press), 318-362 [10] Tadashi Horiuchi, Satoru Kato, “a study on japanese historical character recognition using modular neural networks”, International Journal of InnovativeComputing, Information and Control, Volume 7, Number 8, August 2011 [11] Geva, Shlomo, and Joaquin Sitte: “Adaptive Nearest Neighbor Pattern Classification, IEEE Transactions on Neural Networks”, 1991, Vol.2, No [12] H.-H Song, S.-W.Lee, “A self-organizing neural tree forlarge-set pattern classication”, IEEE Trans Neural Net-works (3) (1998) 369}380 [13] H.-M Lee, C.-C.Lin, J.-M.Chen, “A preclassi"cationmethod for handwritten Chinese character recognition viafuzzy rules and SEART neural net”, Int J Pattern Recogni-tion Artif.Intell.12 (6) (1998) 743}761 [14] Juan Diego Rodrıguez, Aritz Perez, Jose Antonio Lozano, Member, IEEE, “Sensitivity Analysis of k-Fold Cross Validation in Prediction Error Estimation”, IEEE Transactions on pattern analysis and machine intelligence, Vol 32, No 3, March 2010 [15] Jeffrey T Spooner, Mangredi Maggiore, Rẳl Ordónez, Kelvin M Passino (2002), “Stable Adaptive Control and Estimation for Nonlinear Systems: Neural and Fuzzy Approximator Techniques”, Wiley Interscience, USA.] [16] Jyh-Shing Roger Jang, Chuen-Tsai Sun, Eiji Mizutani (1996), “Neuro-Fuzzy and Soft Computing: A Computational Approach to Learning and Machine Intelligence”, Prentice Hall, USA.] [17] L.F.A Wessels, E Barnard, “Avoiding false local minima by proper initialization of connections”, IEEE Trans Neural Networks (1992) 899-905 [18] R.Ashok Kumar Reddy, G Venkata Narasimhulu, Dr S A K Jilani, Dr D.Seshappa, “Genetic Algorithm based Gait Recognition”, International Journal of Electronics and Computer Science Engineering ISSN- 2277-1956 [19] David J Montana, Lawrence Davis “Training feedforward neural networks using genetic algorithms” IJCAI'89 Proceedings of the 11th international joint conference on Artificial intelligence - Volume [20] Yas Abbas Alsultanny, Musbah M Aqel, “Pattern recognition using multilayer neuralgenetic algorithm”, Neurocomputing 51 (2003) 237 – 247 ... Nhận dạng chữ Hán- Nôm dựa mạng nơ-ron kết GA: Chương đề xuất phương pháp kết hợp giải thuật di truyền trình huấn luyện mạng Nơ-ron nhằm tìm số tối ưu cho mạng Trình bày kết thực nghiệm nhận dạng. .. 2970 chữ Hán- Nôm Phần kết luận: Phần trình bày đóng góp luận văn, tồn tại, hạn chế chưa giải hướng giải References Tiếng Việt [1] Nguyễn Tuấn Cường, “Thời điểm xuất chữ Nôm sơ đồ cấu trúc chữ Nôm? ??,... “Một số phương pháp nhận dạng chữ Nôm? ??, Hội thảo Khoa học Quốc gia Lần thứ IV CNTT-TT (ICT.rda’2008), Hà Nội [3] GS.TSKH Nguyễn Quang Hồng, Khái lược văn tự học chữ Nôm , Nhà xuất giáo dục