Giới thiệu về mạng nơ ron:
Mạng nơron là công cụ dùng để tìm gần đúng nhất bài giải của một vấn đề bất kỳ mà không cần quan tâm đến nội dung chi tiết bên trong của bài toán. Để làm được điều này, mạng nơron cần phải trải qua một quá trình, gọi là quá trình học được thực hiện lặp đi lặp lại trên tập mẫu có sẵn. Sau khi được học xong, mạng nơron có thể giải quyết các vấn đề liên quan đến bài toán đã cho cũng như các bài toán cùng loại tương tự với độ chính xác chấp nhận được.
Mạng nơron được ứng dụng trong các bài toán nhận dạng, phân lớp như nhận dạng mặt người, nhận dạng ký tự...
Lý thuyết về mạng nơron được bàn đến trong phần Phụ Lục.
Áp dụng:
Đối với đề tài luận văn này, việc áp dụng mạng nơron [1] để nhận dạng ký tự được thực hiện như sau:
Thông thường, mạng nơron dùng để nhận dạng ký tự sẽ cho biết ký tự đang xét là ký tự gì. Tuy nhiên, do ở đây, ký tự được xác định song song bằng nhận dạng đi kèm với việc kiểm tra vị trí tô của ký tự tương ứng trong bài làm của thí sinh. Cho nên, để đơn giản vấn đề, ta sẽ: xác định ký tự được chọn bằng cách dựa vào vị trí tô của ký tự trong bài thi trước; rồi từ đó xác định xem ký tự viết tay có đúng là ký tự đó hay không.
Như vậy, giờ đây vấn đề đã đơn giản hơn. Ta sẽ tạo ra tổng cộng là 36 mạng nơron, mỗi mạng được áp dụng riêng cho từng chữ cái hoặc chữ số. Với mỗi mạng nơron này, chỉ cần một nút xuất duy nhất để cho biết đúng ký tự đó hay không.
Cấu tạo của dạng mạng nơ ron:
Như đã phân tích ở trên, các mạng nơ ron này được sử dụng để xét xem một ký tự có phải là ký tự cần tìm hay không.
Do đó, các mạng nơ ron này sẽ có cấu tạo tương tự nhau. Mỗi mạng sẽ gồm 3 lớp: lớp nút nhập, lớp nút ẩn và lớp nút xuất. Mạng sẽ không có đường nối trực tiếp từ lớp nhập đến lớp xuất. Đầu vào của mạng sẽ là vùng ảnh chứa ký tự đã được biến đổi theo tỉ lệ chuẩn 16x16, đầu ra duy nhất cho biết giá trị là đúng hay sai (đúng khi lớn hơn 0,5, sai khi ngược lại). Vì vậy, mạng có 256 nút nhập, 1 nút xuất. Số nút ẩn được chọn là 3.
Sơđồ cấu tạo của mạng như sau:
Hình 2-22: cấu tạo của mạng nơ ron được áp dụng cho đề tài
Thực nghiệm:
Mỗi mạng nơ ron được học trên 4644 mẫu (bao gồm tất cả các ký tự), trong đó số mẫu đúng (chứa ký tự áp dụng cho từng mạng) là 129, còn lại là các mẫu sai.
Mỗi mạng được học trong khoảng thời gian hơn 4 tiếng.
Một số mạng có tỉ lệ nhận dạng đúng là 80%. Tuy nhiên, đa số chỉ đạt được 70%.
Đánh giá:
Chương 3: THIẾT KẾ CHƯƠNG TRÌNH