-73- NGHIÊN CỨU MẠNG NEURAL NETWORK TRONG NHẬN DẠNG CHỮ VIẾT Lê Nho Thủy MSV: 0320311 Email: nhothuy48cb@gmail.com Người hướng dẫn: Vũ Quang Dũng. 1. Giới thiệu Nhận dạng chữ viết là bài toán thu hút được rất nhiều sự quan tâm nghiên cứu của nhiều nhà khoa học trên thế giới và đặc biệt là những năm gần đây. Hiện nay có rất nhiều phương pháp nhận dạng: - Dùng mạng Neural Network. - Dùng HMM (Hiden Markov Model). - Dynamic programming. Khóa luận sẽ giới thiệu từng bước từ nghiên cứu lý thuyết cho tới tiến hành thực nghiệm việc xây dựng một hệ thống có khả năng nhận dạng chữ viết. Và phương pháp nhận dạng sử dụng là mạng Neural Network. 2. Tổng quan về mạng Neural 1) Giới thiệu mạng Neural nhân tạo Mạng neural nhân tạo là một mô hình xử lý thông tin phỏng theo cách thức xử lý thông tin của các hệ neural sinh học. Nó được tạo lên từ một số lượng lớn các phần tử (neural) kết nối với nhau thông qua các liên kết (trọng số liên kết) làm việc như một thể thống nhất để giải quyết một vấn đề cụ thể nào đó. Mộ t neural là một đơn vị xử lí thông tin và là thành phần cơ bản của một mạng Neural. 2) Kiến trúc mạng Neural Network - Mạng một lớp: - Mạng nhiều lớp: Các neural vẫn hoạt động độc lập với nhau nhưng đầu ra của lớp này là đầu vào của lớp tiếp theo. Một hệ thống như vậy có khả năng phân chia không gian đầu vào thành những vùng có hình dạng phức tạp hơn nhiều so với neural một lớp. 3) Mạng Network nhiều tầng MLP Mô hình mạng neural được sử dụng rộng rãi nhất là mô hình mạng nhiều tầng truyền thẳng (MLP: Multi Layer Perceptron). Một mạng MLP tổng quát là mạng có n (n≥2) tầng (thông thường tầng đầu vào không được tính đến): trong đó gồm một tầng đầu ra (tầng thứ n) và (n-1) tầng ẩn. 4) Huấn luyện mạng Có thể nói đặc trưng cơ bản nhất của mạng neural là khả năng học và tổng quát hoá. - Học: là khả năng mà mạng neural có thể phân loại chính xác những mẫu đã được huấn luyện. - Tổng quát hoá: là khả năng mạng có thể nhận biết được những mẫu chưa từng được huấn luyện. Chính khả năng này tạo nên sức mạnh của mạng. Có ba phương pháp học phổ biến: - Học có giám sát - Học không giám sát - Học tăng cường 3. Thực nghiệm Mạng MLP Neural Networks được sử dụng trong project này là mạng Neural Network ba -74- lớp, một lớp đầu vào (input), một lớp ẩn và một lớp đầu ra (ouput). Chức năng chính của chương trình: - Xây dựng mạng Neural Networks và khởi tạo trọng số (Weight) một cách thường xuyên. - Phân tích ảnh điểm của những ảnh cho kí tự được nhận được. - Tải thường xuyên những ảnh đầu vào huấn luyện và tương ứng với những kí tự đầu ra tương ứng trong một files riêng biệt cho tập hợp những kí tự huấn luyện (*.cts – character trainer sets). - Tải và lưu trữ thường xuyên mạng đã huấn luyện. - Chuyển đổi kí tự sang mã nhị phân Unicode và ngược lại một cách thường xuyên. - Tính toán lỗi (error), điểm ra (output) và trọng số (weight) thường xuyên. - Xây dựng mạng Neural Network. 1) Huấn luyện mạng Lưu đồ giải thuật huấn luyện mạng của chương trình: 2) Thực nghiệm Lưu đồ giải thuật huấn luyện mạng của chương trình: 3) Kết quả - Số lượng của kí tự=90 - Tốc độ học (Learning rate)=150 - Sigmoid slope=0.014 Bảng kết quả đối với sự thay đổi của số vòng lặp Tài liệu tham khảo [1] Nguyễn Thị Thanh Tân. Nhận dạng chữ viết tay hạn chế dựa trên mô hình mạng neuron kết hợp với thống kê ngữ cảnh. Luận văn thạc sỹ, ĐHQGHN. [2] Nguyễn Thị Minh Ánh. Nghiên cứu và ứng dụng mạng neural trong nhận dạng chữ viết tay tiếng Việt. Khóa luận tốt nghiệp đại học 2005, Đại học Công Nghệ, ĐHQGHN. [3] Artificial Intelligence and cognitive science. © 2006, Nils J.Nilsson Stanford AI Lab http://ai.stanford.edu/~nilsson [4] Offline Handwring Recognition Using Artificial Neural Networks © 2000, Andrew T.Wilson University of Minnesota, Morris . năng nhận dạng chữ viết. Và phương pháp nhận dạng sử dụng là mạng Neural Network. 2. Tổng quan về mạng Neural 1) Giới thiệu mạng Neural nhân tạo Mạng neural. -73- NGHIÊN CỨU MẠNG NEURAL NETWORK TRONG NHẬN DẠNG CHỮ VIẾT Lê Nho Thủy MSV: 0320311 Email: nhothuy48cb@gmail.com