NghiêncứuứngdụngmạngNơronnhậndạngchữHán-Nôm Trương Thị Hương Trường Đại học Công nghệ Luận văn Thạc sĩ ngành: Kỹ thuật phần mềm; Mã số: 60 48 01 03 Người hướng dẫn: PGS.TS Nguyễn Ngọc Bình Năm bảo vệ: 2014 Keywords Mạng nơron; Nhậndạng ký tự; Chữ Hán Nôm; Công nghệ thông tin Content Chữ Nơm hình thành phát triển từ kỷ X tới kỷ XX Là di sản văn hóa, có vai trò đặc biệt quan trọng việc tạo nên văn học rực rỡ xuyên suốt nhiều kỷ Viện Nghiêncứu Hán Nôm Việt Nam lưu giữ hàng trăm ngàn đơn vị tư liệu chữ Nơm có giá trị việc nghiêncứu đời sống người Việt thời xa xưa nhiều mảng lĩnh vực: văn học, tư tưởng, triết học, ngôn ngữ, luật pháp, đạo đức… Tuy nhiên số người đọc viết chữ Nơm nước ta khơng nhiều, việc đưa chữ Nơm vào máy tính, xây dựng từ điển chữ Nơm, nhận dạng, đốn nhận khơi phục chữ Nơm lỗi, thiếu lĩnh vực nghiêncứu có ý nghĩa thực tiễn quan trọngMạng nơ-ron cơng cụ nhậndạng tốt đặc trưng sau: Khả học từ kinh nghiệm (khả huấn luyện), khả xử lý song song với tốc độ xử lý nhanh, khả học thích nghi, khả khái qt hố cho đầu vào khơng huấn luyện, ví dụ dựa vào cách học mạng tiên đốn đầu từ đầu vào khơng biết trước [15, 16] Tuy nhiên nhược điểm dùngmạng nơ-ron chưa có phương pháp luận chung thiết kế cấu trúc mạng cho toán nhậndạng điều khiển mà phải cần tới kiến thức chuyên gia Mặt khác xấp xỉ mạng nơ-ron với hệ phi tuyến khó khăn luyện mạng khơng tìm điểm tối ưu tồn cục Vì tồn lớn gặp phải tìm nghiệm tối ưu tồn cục, đặc biệt áp dụng cho toán lớn, hệ thống điều khiển q trình Trong luận văn tơi trình bày hoàn chỉnh phương pháp ứngdụngmạng nơ-ron nhậndạngchữHán-Nôm với mong muốn đưa phương pháp nhậndạng tốt, góp phần xây dựng cơng cụ nhận dạng, chuyển đổi văn chữ HánNôm thành chữ Quốc ngữ nhằm làm sáng tỏ giá trị văn hóa lưu trữ Cấu trúc luận văn gồm phần sau: Chương Tổng quan: Nội dung chương trình bày tổng quan chữ Nơm, lịch sử hình thành phát triển chữ Nơm, mơ hình tổng quan hệ thống nhậndạngchữ Nôm Chương Mạng Nơ-ron: Nội dung chương trình bày tổng quan mạng Nơron, cách xây dựng mạng, đánh giá yếu tố trình huấn luyện mạng tổng hợp số phương pháp nhậndạngchữ tượng hình dựa mạng Nơ-ron Chương Giải thuật di truyền: Chương giới thiệu giải thuật di truyền, thành phần giải thuật di truyền Chương NhậndạngchữHán-Nôm dựa mạng nơ-ron kết GA: Chương đề xuất phương pháp kết hợp giải thuật di truyền trình huấn luyện mạng Nơ-ron nhằm tìm số tối ưu cho mạng Trình bày kết thực nghiệm nhậndạng 2970 chữHán-Nôm Phần kết luận: Phần trình bày đóng góp luận văn, tồn tại, hạn chế chưa giải hướng giải References Tiếng Việt [1] Nguyễn Tuấn Cường, “Thời điểm xuất chữ Nôm sơ đồ cấu trúc chữ Nôm”, 2009 [2] Phạm Văn Hưởng, Trần Minh Tuấn, Nguyễn Thị Ngọc Hương, Bùi Thị Hồng Hạnh, Lê Hồng Trang, Vũ Thanh Nhân, Trương Anh Hồng, Vũ Quang Dũng, Nguyễn Ngọc Bình (2008), “Một số phương pháp nhậndạngchữ Nôm”, Hội thảo Khoa học Quốc gia Lần thứ IV CNTT-TT (ICT.rda’2008), Hà Nội [3] GS.TSKH Nguyễn Quang Hồng, Khái lược văn tự học chữ Nôm , Nhà xuất giáo dục , 2008 Tiếng Anh [4] Mingrui Wu, Bo Zhang, Ling Zhang, “A Neural Network Based Classifier for Handwritten Chinese Character Recognition”, ICPR'00 - Volume 2, 2000 [5] Il-SeokOh, Ching Y Suen, “A class-modular feedforward neural network for handwriting recognition”, Pattern Recognition 35 (2002) 229-244 [6] Srinivasa Kumar Devireddy, Settipalliappa Rao(2009), “Hand written character recognition using back propagation network”, Journal of Theoretical and Applied Information Technology [7] Richard Romero, Robert Berger, Robert Thibadeau, and Dave Touretsky, “Neural Network Classifiers for Optical Chinese Character Recognition” [8] Richard Romero, David Touretzky, and Robert Thibadeau, “Optical Chinese Character Recognition using Probabilistic Neural Networks” [9] D.E Rumelhart; G.E Hinton and R.J Williams (1986), “Learning internal representations by error propagation”, Parallel distributed processing: Explorations in the microstructure of cognition (Cambridge MA.: MIT Press), 318-362 [10] Tadashi Horiuchi, Satoru Kato, “a study on japanese historical character recognition using modular neural networks”, International Journal of InnovativeComputing, Information and Control, Volume 7, Number 8, August 2011 [11] Geva, Shlomo, and Joaquin Sitte: “Adaptive Nearest Neighbor Pattern Classification, IEEE Transactions on Neural Networks”, 1991, Vol.2, No [12] H.-H Song, S.-W.Lee, “A self-organizing neural tree forlarge-set pattern classication”, IEEE Trans Neural Net-works (3) (1998) 369}380 [13] H.-M Lee, C.-C.Lin, J.-M.Chen, “A preclassi"cationmethod for handwritten Chinese character recognition viafuzzy rules and SEART neural net”, Int J Pattern Recogni-tion Artif.Intell.12 (6) (1998) 743}761 [14] Juan Diego Rodrıguez, Aritz Perez, Jose Antonio Lozano, Member, IEEE, “Sensitivity Analysis of k-Fold Cross Validation in Prediction Error Estimation”, IEEE Transactions on pattern analysis and machine intelligence, Vol 32, No 3, March 2010 [15] Jeffrey T Spooner, Mangredi Maggiore, Rẳl Ordónez, Kelvin M Passino (2002), “Stable Adaptive Control and Estimation for Nonlinear Systems: Neural and Fuzzy Approximator Techniques”, Wiley Interscience, USA.] [16] Jyh-Shing Roger Jang, Chuen-Tsai Sun, Eiji Mizutani (1996), “Neuro-Fuzzy and Soft Computing: A Computational Approach to Learning and Machine Intelligence”, Prentice Hall, USA.] [17] L.F.A Wessels, E Barnard, “Avoiding false local minima by proper initialization of connections”, IEEE Trans Neural Networks (1992) 899-905 [18] R.Ashok Kumar Reddy, G Venkata Narasimhulu, Dr S A K Jilani, Dr D.Seshappa, “Genetic Algorithm based Gait Recognition”, International Journal of Electronics and Computer Science Engineering ISSN- 2277-1956 [19] David J Montana, Lawrence Davis “Training feedforward neural networks using genetic algorithms” IJCAI'89 Proceedings of the 11th international joint conference on Artificial intelligence - Volume [20] Yas Abbas Alsultanny, Musbah M Aqel, “Pattern recognition using multilayer neuralgenetic algorithm”, Neurocomputing 51 (2003) 237 – 247 ... Nhận dạng chữ Hán-Nôm dựa mạng nơ-ron kết GA: Chương đề xuất phương pháp kết hợp giải thuật di truyền trình huấn luyện mạng Nơ-ron nhằm tìm số tối ưu cho mạng Trình bày kết thực nghiệm nhận dạng. .. representations by error propagation”, Parallel distributed processing: Explorations in the microstructure of cognition (Cambridge MA.: MIT Press), 318-362 [10] Tadashi Horiuchi, Satoru Kato, “a... International Journal of InnovativeComputing, Information and Control, Volume 7, Number 8, August 2011 [11] Geva, Shlomo, and Joaquin Sitte: “Adaptive Nearest Neighbor Pattern Classification,