3.4.1. Sai số trong nhận dạng ký tự:
Việc nhận dạng ký tự đôi khi bị sai hoặc thiếu chính xác, là do nhiều vấn đề liên quan như :
- Sự phức tạp của dữ liệu đầu vào, các giá trị chọn lựa như độ lệch, lỗi ngưỡng, số nơ-ron mỗi lớp,…. chưa được chọn lựa chính xác.
- Sai số trong nhận dạng kí tự lớn hay nhỏ là phụ thuộc vào nhiều yếu tố: độ chuẩn của ảnh đưa vào, size font chữ, độ phức tạp của font chữ.
- Việc chọn mô hình mạng phù hợp, giá trị ngưỡng lỗi, độ lệch, tốc độ học...đều ảnh hưởng đến tính chính xác trong nhận dạng ký tự.
Ví dụ:
Với cùng các tham số đầu vào, khi nhận dạng 90 ký tự font Times New Roman 36pt với hai mạng nơ-ron được huấn luyện với số vòng lặp khác nhau sẽ cho tỷ lệ lỗi khác nhau:
Số vòng lặp = 300 (Hình 3.8): số ký tự nhận dạng lỗi là 2/90. Số vòng lặp = 600 (Hình 3.9): số ký tự nhận dạng lỗi là 1/90.
3.4.2. Những hạn chế của chƣơng trình:
Chương trình nhận dạng ký tự còn một vài hạn chế sau:
- Chỉ ở mức nhận dạng chữ không dấu, tính chính xác vẫn chưa hoàn toàn tuyệt đối.
- Số ký tự trong file ảnh đầu vào để nhận dạng còn hạn chế, trong khoảng hơn 1000 ký tự.
- Trong quá trình huấn luyện, hai ký tự là chữ “I_Hoa”mã 49h và chữ “l_Thường” mã 6Ch khi tách kí tự, chia lưới và đưa kết quả vào mạng sẽ làm cho mạng không phân biệt được hai kí tự này dẫn đến sau này nhận dạng sai. Phương pháp này cần tăng số lần lặp cho quá trình huấn luyện.
- Ngoài ra còn một số trường hợp ảnh của hai kí tự nằm chéo nhau, do việc phân tích ký tự chưa chính xác nên dẫn đến nhận dạng sai, ví dụ như:
Nguyễn Thị Quyên Trang 69
KẾT LUẬN
Trên đây là báo cáo Đồ án tốt nghiệp của em với các nội dung chính: - Tìm hiểu mạng nơ-ron nhân tạo.
- Tìm hiểu bài toán nhận dạng.
- Mô tả bài toán ứng dụng mạng nơ-ron trong nhận dạng kí tự. - Phân tích cụ thể bài toán nhận dạng.
- Thiết kế mạng và huấn luyện mạng nơ-ron cho bài toán “Ứng dụng mạng nơ- ron trong nhận dạng kí tự ”.
- Cài đặt và kiểm tra thực nghiệm bài toán này.
Nhận dạng kí tự là một phần rất quan trọng của lĩnh vực nhận dạng nói riêng và xử lý ảnh nói chung. Cùng với việc sử dụng công cụ là mạng nơ-ron là một lĩnh vực còn khá mới cần được phát triển hơn.
Trong Báo cáo này em mới chỉ dừng lại ở phần thử nghiệm trên một số loại font và kích thước nhất định.
Hướng phát triển tiếp theo của khóa luận này trong tương lai:
- Nâng cao hiệu quả và độ chính xác trong việc nhận dạng kí tự. - Tăng số ký tự trong file ảnh đầu vào có thể nhận dạng được. - Mở rộng thêm nhiều loại font.
- Mở rộng các cỡ chữ đặc biệt là các cỡ chữ dùng nhiều trong văn bản.
Vì thời gian thực hiện không nhiều và năng lực của bản thân còn hạn chế nên chắc chắn không tránh khỏi thiếu xót. Em hi vọng sẽ nhận được những ý kiến đóng góp của thầy cô và các bạn để em có thể rút được kinh nghiệm cũng như hoàn thiện bài báo cáo này trong tương lai.
Cuối cùng, em xin gửi lời cảm ơn chân thành đến các thầy cô trong khoa Công nghệ Thông tin Trường Đại học Giao thông vận tải đã tận tình dạy dỗ, truyền đạt cho em nhiều kiến thức quý báu. Đặc biệt là T.S Đặng Thị Thu Hiền trong thời gian qua đã nhiệt tình chỉ bảo, đóng góp ý kiến bổ sung để em có thể hoàn thành bài báo cáo này.
Nguyễn Thị Quyên Trang 70
TÀI LIỆU THAM KHẢO
[1.] Tài liệu về mạng nơ-ron nhân tạo do T.s Đặng Thị Thu Hiền cung cấp.
[2.] Lương Mạnh Bá, Nguyễn Thanh Thủy, Nhập môn xử lý ảnh số, Nhà xuất bản Khoa học và kỹ thuật, 2008.
[3.] Học viện công nghệ Bưu chính Viễn Thông (2007), Nhập môn Trí tuệ Nhân tạo, Hà Nội, tr 118-133.
[4.] Artificial Neural Networks and Information theory, colin Fyfe, department of computing and information system, the university of Paisley.
[5.] Math Neural Networks. Ben Krose, faculty of Mathematics and computer science, university of Amsterdam. And Patrick van der smagt, institute of robotics and system dynamics German aerospase Reseach establishment. [6.] William K.Partt, Digital Image Processing.