Thực nghiệm huấn luyên mạng nơ-ron:

Một phần của tài liệu đồ án tốt nghiệp sử dụng mạng nơ ron nhận dạng ký tự (Trang 57)

Để chuẩn bị cho quá trình huấn luyện của mạng nơ-ron, ta cần chuẩn bị:

 Một file ảnh gồm các ký tự cần huấn luyện (có phần mở rộng là *.bmp [bitmap]).

 Một file văn bản tương ứng (có phần mở rộng là *.cts [character trainer set]). Hai file này được đặt cùng tên, chỉ khác phần mở rộng và lưu trữ trong cùng một thư mục.

Nguyễn Thị Quyên Trang 58  Click vào nút “Đưa tập huấn luyện vào” trong phần HUẤN LUYỆN của

chương trình. Ứng dụng sẽ cung cấp cho người dùng một hộp thoại lựa chọn đường dẫn tới vị trí của file văn bản *.cts cần huấn luyện, chương trình đồng thời sẽ hiển thị file ảnh tương ứng với chính nó trong khung “Ảnh đầu vào”.

 Trong đồ án này, em chỉ tiến hành huấn luyện thử nghiệm với 90 ký tự cơ bản sau với 2 loại kích thước là 72pt và 36pt:

ABCDEFGHIJKLMNOPQRSTUVWXYZ abcdefghijklmnopqrstuvwxyz

0123456789

~!@#$%^&*()-+=\{}[]:';<>,./?

Ví dụ mẫu dùng trong quá trình thực nghiệm huấn luyện:

Font chữ Arial:

Ảnh đầu vào:

Đầu ra mong muốn:

ABCDEFGHIJKLMNOPQRSTUVWXYZ abcdefghijklmnopqrstuvwxyz

0123456789

Nguyễn Thị Quyên Trang 59

Font chữ Times New Roman:

Ảnh đầu vào:

Đầu ra mong muốn:

ABCDEFGHIJKLMNOPQRSTUVWXYZ abcdefghijklmnopqrstuvwxyz 0123456789 ~!@#$%^&*()-+=\{}[]:';<>,./? Font chữ Tahoma: Ảnh đầu vào:

Đầu ra mong muốn:

ABCDEFGHIJKLMNOPQRSTUVWXYZ abcdefghijklmnopqrstuvwxyz

0123456789

Nguyễn Thị Quyên Trang 60  Click nút “Bắt đầu” trong phần HUẤN LUYỆN để tiến hành phân tích ảnh và

huấn luyện mạng.Trong đồ án này một số tham số được lựa chọn để huấn luyện như sau:

 Tốc độ học = 150.

 Hệ số góc Sigmoid= 0.014.

 Trọng số kết nối cơ sở= 30.

 Số lần lại 300-600 tùy độ phức tạp của từng loại font.

 Trung bình ngưỡng của lỗi = 0.0002.

Hình 3.2 Huấn luyện mạng nơ-ron (adsbygoogle = window.adsbygoogle || []).push({});

 Khi phần “Trạng thái” có thông báo “Hoàn thành” tức là chương trình đã huấn luyện xong, click vào nút “Ghi mạng” để lưu lại kết quả huấn luyện. Kết quả sẽ được 1 mạng lưu dưới dạng file có phần mở rộng là *.ann [Artificial Neural Networks] chứa các giá trị trọng số trong quá trình huấn luyện mạng, ta sẽ dử dụng file này để phục vụ cho việc nhận dạng ký tự.

Nguyễn Thị Quyên Trang 61

Ví dụ một mạng thu được sau khi huấn luyện:

Nhan dang ky tu bang mang no-ron. Nguyen Thi Quyen - HTTTK49.

Ten mang = Latin Times Roman

So lop an = 250

So ky tu = 90 So vong lap = 300 Toc do hoc = 150

He so goc ham Sigmod = 0.014 Sai lech trong so = 30

Weight[1 , 0 , 0] = 92.68587 Weight[1 , 0 , 1] = -505.8851 Weight[1 , 0 , 2] = 269.4137 Weight[1 , 0 , 3] = 162.8794 Weight[1 , 0 , 4] = 155.2899 Weight[1 , 0 , 5] = 407.1724 Weight[1 , 0 , 6] = 153.9269 Weight[1 , 0 , 7] = 277.4919 Weight[1 , 0 , 8] = 48.67392 Weight[1 , 0 , 9] = 74.01836 Weight[1 , 0 , 10] = 76.98925 Weight[1 , 0 , 11] = -2.640896 Weight[1 , 0 , 12] = 130.0587 Weight[1 , 0 , 13] = 217.0493 Weight[1 , 0 , 14] = 374.2686 Weight[1 , 0 , 15] = -537.3345 ……….. ……….. Weight[2 , 15 , 242] = -25.75582 Weight[2 , 15 , 243] = 0.8294762 Weight[2 , 15 , 244] = 9.753311 Weight[2 , 15 , 245] = 21.77102 Weight[2 , 15 , 246] = 3.452326 Weight[2 , 15 , 247] = 23.15486 Weight[2 , 15 , 248] = -17.0192 Weight[2 , 15 , 249] = 24.86844

Nguyễn Thị Quyên Trang 62

Một phần của tài liệu đồ án tốt nghiệp sử dụng mạng nơ ron nhận dạng ký tự (Trang 57)