- Tách từ riêng biệt ra khỏi dòng ký tự.
5. Quá trình huấn luyện mạng
Quá trình huấn luyện là quá trình học với các tập mẫu (X , T) , s = 1, N để điều chỉnh tập trọng số liên kết. Giải thuật huấn luyện được áp dụng trong thiết kế chương trình nhận dạng ký tự là giải thuật lan truyền ngược sai số Back Propagation.
Bước 1: Lan truyền xuôi đầu vào X ={x , x , …, x } qua mạng: * Đầu ra tại nơ tron j của lớp ẩn:
y = g∑ w . x − θ (1) * Đầu ra tại nơ tron k của lớp ra:
y = g(∑ y . w )
= g( w . g( w . x − θ)− θ ) (2)
Bước 2:
Lan truyền ngược sai số: So sánh các phần tử của vectơ đầu ra thực Y với các phần tử tương ứng của vectơ đầu ra mẫu Tđể tính sai lệch: e = t −y bình phương sai số của mạng ứng với mẫu học (X , T):
27 E = (y −t ) E = (y −t )
p là số phần tử của vectơ Yvà T.
Thông tin về sai số được lan truyền ngược qua mạng để điều chỉnh lại các giá trị trọng số tại vòng lặp thứ 1:
* Với liên kết giữa nơ tron ẩn và nơ tron ra: ∆w = ȵ.δ (l). y (l)
với là hệ số học, y tính theo cơng thức
δ (l) = e (l). g (y (l))
w (l + 1) = w (l) +∆w
* Với liên kết giữa nơ tron vào và nơ tron ẩn:
∆w =ȵ.δ(l). x
δ(l) = g y . δ (l). w (l + 1) w (l + 1) = w (l) + ∆w
Sau khi hiệu chỉnh trọng số, mẫu X tiếp tục được đưa vào mạng lần thứ (l+1) và tiếp tục thuật toán hiệu chỉnh trọng số cho đến khi E< cho trước hoặc số vòng lặp đạt đến mức định trước.
Mẫu tiếp theo được đưa vào mạng và quá trình huấn luyện lặp lại như trên cho đến khi mạng học thuộc tất cả các mẫu. Lưu cấu hình mạng lại để sẵn sàng đưa vào sử dụng.
Hàm kích hoạt sử dụng trong mạng Perceptron nhiều lớp là hàm sigmoid lưỡng cực: g(x)=
1 1
2
ex hoặc hàm sigmoid đơn cực : g(x)= x
e 1 2 và đạo hàm đều là : g’(x) = g(x) (1- g(x)) Mạng nơ tron nhận dạng ký tự :
Mạng sau khi được huấn luyện được sử dụng như một bảng tra. Các ảnh ký tự sau bước tiền xử lý được đưa vào đầu vào mạng, đầu ra mạng là vectơ Y với các phần tử Y được tính theo công thức (1) và (2). Như vậy đầu ra mạng là giá trị Unicode của ký tự.