III- Phương pháp trích trọn đặc trưng kết hợp với SVM (Support Vector Machine) cho việc nhận dạng.
9. Xây dựng ma trận điểm ảnh nhận dạng.
Việc tiếp theo là ánh xạ ma trận điểm ảnh ký tự vào ma trận nhị phân tương ứng. Một vấn đề quan trọng để xem xét ởđây sẽđược quyết định kích thước của ma trận. Nếu tất cả các điểm ảnh của ký tựđược ánh xạ vào ma trận thì việc nhận dạng ký tự
sẽ đảm bảo độ chính xác. Tuy nhiên một vấn đề được đặt ra là với kích thước của ký tự lớn, việc xử lý ma trận xẽ không đảm bảo về mặt thời gian Do đó để khắc phục vấn đề này ta sử dụng một chiến lược lấy mẫu với quy định lấy mẫu trên các
điểm ảnh tương ứng với ma trận nhị phân 20x30 với chỉ 600 yếu tố. Kể từ khi chiều cao và chiều rộng của hình ảnh cá nhân khác nhau, một thuật toán lấy mẫu thích
ứng được thực hiện. Thuật toán là liệt kê dưới đây Thuật toán: Quá trình tìm giới hạn Gới hạn trên ký tự Gới hạn dưới ký tự
¾ Khởi tạo với 20 phần tử tương ứng.
¾ Ánh xạ điểm đầu (0,y) và điểm cuối (C_rong,y) của ảnh kí tự tương
ứng với giá trịđầu (0,y) và giá trị cuối (20,y) của ma trận.
¾ Chia nhỏ chiều rộng thành 20 giá trị tương ứng. 2. Đối với chiều cao:
¾ Khởi tạo với 30 phần tử tương ứng.
¾ Ánh xạ điểm đầu (x,0) và điểm cuối (x,C_cao) của ảnh kí tự tương
ứng với giá trịđầu (x,0) và giá trị cuối (x,30) của ma trận.
¾ Chia nhỏ chiều cao thành 30 giá trị tương ứng.
Hình 27: Quá trình chia lưới
Để đưa giá trị vào mạng neural ta cần chuyển ma trận điểm ảnh sang ma trận giá trị.
Thuật toán:
1. Bắt đầu từ phần tử (0,0).
2. Tăng x giữ nguyên giá trị y cho tới khi bằng chiều rộng của ma trận.
Nếu là điểm đen thì nhận giá trị bằng 1. Ngược lại nhận giá trị bằng 0.
¾ Nếu x = chiều rộng thì khởi động lại x và tăng y. Lặp lại cho tới khi (x,y)=( C_Rong, C_Cao).