Nhƣ chúng ta đã biết sự có nhiều yếu tố ảnh hƣởng tới quá trình huấn luyện mạng nhƣ là: sự đa dạng của đầu vào: kích thƣớc, phong cách…
Một điều cần thiết là chuẩn bị trình tự của các ảnh kí tự đầu vào trong một file ảnh đơn giản (*.bmp [bitmap] mở rộng), tƣơng ứng với các kí tự trong file văn bản (*.cts [character trainer set] mở rộng) và lƣu trữ hai file này trong cùng một thƣ mục (cả hai file này cùng tên nhƣng khác phần mở rộng). Ứng dụng sẽ cung cấp cho ngƣời dùng một hộp thoại lựa chọn đƣờng dẫn tới vị trí của file văn bản *.cts và sẽ đƣa file ảnh tƣơng ứng với chính nó.
Trong khóa luận này một số tham số đƣợc lựa chọn sau: Tốc độ học = 150.
Hệ số góc Sigmoid = 0.014. Trọng số kết nối cơ sở = 30.
Số lần lại 300-600 tùy độ phức tạp của từng loại font. Trung bình ngƣỡng của lỗi = 0.0002.
Mẫu dùng trong quá trình thực nghiệm huấn luyện:
Ảnh đầu vào:
Hình 3.12: Ảnh đầu dùng để huấn luyện
67
Hình 3.13: File là đầu ra mong muốn
Kết quả huấn luyện: Sau khi huấn luyện xong lƣu lại kết quả vào thƣ mục “Mang” với *.ann để mỗi khi nhận dạng ta đƣa giá trị này vào mạng nơron.
Dƣới dây hình 3.14 là một ví dụ các giá trị trọng số của file sau khi huấn luyện
Hình 3.14: Kết quả sau khi huấn luyện
Ung Dung Mang Nơron Trong Nhan Dang Ky Tu- Do Thanh Ba –DHSP2
Network Name = Arial8 Hidden Layer Size = 500 Number of Patterns= 124 Number of Epochs = 300 Learning Rate = 150 Sigmoid Slope = 0.014 Weight Bias = 30 Weight[1 , 0 , 0] = -75.64764 Weight[1 , 0 , 1] = 165.6839 Weight[1 , 0 , 2] = -315.9442 Weight[1 , 0 , 3] = 20.66214 Weight[1 , 0 , 4] = -100.0667 Weight[1 , 0 , 5] = 211.1713 Weight[1 , 0 , 6] = 133.3773 . . ABCDEFGHlJKLMNOPQRSTUVWXYZ abcdefghijklmnopqrstuvwxyz 0123456789 ~!@#$%^&*()-+=\{}[]:’;<>,.?
68
Nhận xét quá trình huấn luyện :
Đối với font Arial có:
Hình 3.15a: chữ “I_ hoa” mã 48h Hình 3.15b: chữ “l_thƣờng” mã 6Ch Đối với quá trình huấn luyện ta cần chú ý nhiều vào font Arial nhƣ ở hình 3.15a và hình 3.15b chữ “I_Hoa”mã 49h và chữ “l_Thƣờng ” mã 6Ch khi tách kí tự, chia lƣới và đƣa kết quả vào mạng sẽ làm cho mạng không phân biệt đƣợc hai kí tự này dẫn đến sau này nhận dạng sai. Phƣơng pháp này cần tăng số lần lặp cho quá trình huấn luyện.