Bước tiếp theo là ta phải ánh xạ ảnh của kí tự vào một ma trận nhị phân hai chiều tương ứng. Vấn đề quan trọng ở là việc lựa chọn kích cỡ của ma trận. Nếu tất cả các điểm ảnh của kí tự được ánh xạ vào ma trận thì khả năng học và phân biệt các ký tự sẽ tốt hơn. Tuy nhiên điều này sẽ mất nhiều thời gian để xử lý. Để giảm thiểu được thời gian mà không ảnh hưởng đến sự phân chia của mô hình mạng, ta sẽ chuẩn hóa cỡ của ma trận bằng 10x15 với 150 phần tử.
Nguyễn Thị Quyên Trang 48
Thuật toán:
a. Xét chiều rộng
Ánh xạ điểm đầu và điểm cuối của ký tự ảnh tương ứng với giá trị đầu và cuối của ma trận .
Khởi tạo với 20 phần tử tương ứng.
Ánh xạ tọa độ điểm đầu (0,y) và điểm cuối (width,y) của ảnh kí tự tương ứng với giá trị đầu (0,y) và giá trị cuối (20,y) của ma trận.
Chia nhỏ chiều rộng thành 10 mốc giá trị, ánh xạ vào chiều rộng của ma trận pixel.
b.Đối với chiều cao:
Khởi tạo với 30 phần tử tương ứng.
Ánh xạ điểm đầu (x,0) và điểm cuối (x,height) của ảnh kí tự tương ứng với giá trị đầu (x,0) và giá trị cuối (x,30) của ma trận.
Chia nhỏ chiều cao thành 15 mốc giá trị, ánh xạ tương ứng vào chiều cao của ma trận pixel.
Lấy các giá trị pixel trong file ảnh tuyến tính hóa vào trong ma trận pixel bằng cách kết hợp tọa độ chiều cao và chiều rộng.
Ví dụ :MT[i,j]=img[xMT[i],yMT[j]]
Hình 2.6 Quá trình chia lưới ký tự
0 15 0 10 (0,0) (10,15)
Nguyễn Thị Quyên Trang 49
Để đưa giá trị vào mạng nơ-ron ta cần chuyển ma trận điểm ảnh sang ma trận giá trị.
Thuật toán:
1. Bắt đầu từ phần tử (0,0) của ma trận pixel.
2. Tăng x, giữ nguyên giá trị y cho tới khi bằng chiều rộng của ma trận.
Ánh xạ mỗi phần tử tới một phần tử của mảng tuyến tính.
- Nếu là điểm đen thì nhận giá trị bằng 1.
- Ngược lại nhận giá trị bằng 0.
- Nếu x = chiều rộng thì khởi động lại x và tăng y (y++).
Lặp lại cho tới khi (x,y)=( C_Rong, C_Cao).
Từ ma trận ảnh này ta ánh xạ thành mảng 1 chiều 150 cột 1 dòng, và chuyển thành 150 noron đầu vào.
Hình 2.7 Quá trình ánh xạ từ ma trận điểm sang ma trận giá trị
2.3.5. Huấn luyện mạng nơ-ron:
Một mạng nơ-ron đã được xây dựng sẽ được huấn luyện trên một không gian đầu vào đã được chuẩn bị trước. Khi hoạt động mạng nơ-ron sẽ đọc tập giá trị đã được huấn luyện.
Nguyễn Thị Quyên Trang 50
Một vài vấn đề cẩn thiết cho việc huấn luyện mạng:
Sự khác nhau giữa các không gian đầu vào.
Việc xác định các tham số cho quá trình huấn luyện mạng:
- Tốc độ học.
- Hệ số góc Sigmoid.
- Trọng số kết nối cơ sở.
Số lần lặp cần thiết cho việc huấn luyện mạng của một tập đầu vào.
Giá trị ngưỡng của lỗi được sử dụng để so sánh tương phản trong việc xác định quá trình dừng của việc lặp lại nếu có nhu cầu xuất hiện.
Mỗi một ký tự lại có một số đặc tính phân biệt mà cần phải tính toán để nhận dạng nó một cách chính xác. Nếu không kết quả nhận dạng sẽ thiếu chính xác trong trường hợp các mẫu có sự tương đồng.
Thuật toán:
1. Xây dựng cấu trúc mạng với mô hình 3 lớp.
2. Khởi tạo giá trị trọng số với giá trị ngẫu nhiên trong khoảng [- độ lệch,độ lêch].
3. Nạp file huấn luyện (cả ảnh đầu vào và đầu ra mong muốn). 4. Phân tích ảnh và ánh xạ thành 150 nơ-ron đầu vào.
5. Đọc giá trị đầu ra mong muốn từ file và chuyển đổi từng kí tự tới giá trị nhị phân Unicode và lưu trữ riêng biệt.
6. Với mỗi kí tự:
Tính toán giá trị đầu ra của mạng Feed ForWard.
So sánh với giá trị đầu ra mong muốn tương ứng với từng kí tự và tính toán lỗi.
Lan truyền ngược giá trị từ đầu và với mỗi liên kết điều chỉnh trọng số liên kết.
Nguyễn Thị Quyên Trang 51
7. Chuyển sang kí tự tiếp theo và lặp lại bước 6 cho tới khi hết các kí tự. 8. Tính toán trung bình lỗi cho tất cả các kí tự.
9. Lặp lại từ bước 6 đến 8 cho tới khi đạt số đưa vào của số lần lặp tối đa.
Nếu lỗi trung bình đạt thấp hơn giá trị ngưỡng của lỗi thì dừng.
Nếu không thì tiếp tục lặp lại.
Nguyễn Thị Quyên Trang 52
Hình 2.8: Sơ đồ khối quá trình huấn luyện mạng nơ-ron
Đ S Đ Đ Đ S S S Đ S Cập nhật trọng số BẮT ĐẦU Xây dựng mạng Khởi tạo trọng số
Nạp file huấn luyện
Phân tích ảnh Phát hiện kí tự tiếp theo Các kí tự sẵn sàng ? Các kí tự sẵn sàng ?
Đọc đầu ra mong muốn
Tính đầu ra của mạng Tính lỗi Các kí tự sẵn sàng ? Lỗi < ngưỡng ? Số lần lặp = max epochs ? Tính trung bình lỗi Vector đầu vào tiếp theo KẾT THÚC
Nguyễn Thị Quyên Trang 53