Ánh xạ ký tự thành ma trận (tiền xử lý dữ liệu đầu vào)

Một phần của tài liệu báo cáo tìm hiểu mạng nơ tron ứng dụng trong nhận dạng chữ viết (Trang 25 - 26)

- Tách từ riêng biệt ra khỏi dòng ký tự.

c) Ánh xạ ký tự thành ma trận (tiền xử lý dữ liệu đầu vào)

Quá trình tiền xử lý ký tự giải quyết vấn đề ánh xạ giá trị pixel ảnh ký tự vào ma trận 10x15 và tuyến tính hóa ma trận thành 150 giá trị đưa vào 150 nơ tron ở lớp vào của mạng.

Bước tiếp theo là lập bản đồ hình ảnh biểu tượng ký tự tương ứng với một ma trận nhị phân hai chiều. Một vấn đề quan trọng được xem xét ở đây để quyết định kích thước của ma trận. Nếu tất cả các điểm ảnh của biểu tượng được ánh xạ vào ma trận, một trong những chắc chắn sẽ có thể có được tất cả các tính năng pixel phân biệt các ký hiệu và giảm thiểu trùng lặp với các biểu tượng khác. Tuy nhiên chiến lược này sẽ bao hàm sự duy trì và xử lý một ma trận rất lớn (lên đến 1500 phần tử cho một hình ảnh 100x150 pixel). Do đó sự cân bằng hợp lý là cần thiết để giảm thiểu thời gian xử lý này sẽ không ảnh hưởng lớn tới tách của các mẫu dữ liệu. Trong Demo sử dụng một chiến lược lấy mẫu với việc thiết lập bản đồ hình ảnh biểu tượng vào một ma trận nhị phân 10x15 với chỉ có 150 phần tử. Với chiều cao và chiều rộng của hình ảnh đơn lẻ khác nhau, một thuật tốn lấy mẫu thích hợp được đưa ra như sau :

26

i. Chuyển Điểm đầu (0,y) và cuối (width,y) thành điểm đầu (0,y) và cuối (20,y) của ma trận

ii. Điểm giửa (width/2,y) -> điễm thứ 10th của ma trận b) Đối với chiều cao ( khởi tạo 30 điểm)

i. Điểm đầu ( x,0) và cuối (x,height) thành điểm đầu(x,0) và cuối (x,30) của ma trận ii. Điểm giửa (x,height/2) -> điểm 15th

iii. Có thể chia nhỏ hơn cho phù hợp

c) Giảm ma trận thành 10x15 cũng như 2 phía dài và rộng của kí tự

Một phần của tài liệu báo cáo tìm hiểu mạng nơ tron ứng dụng trong nhận dạng chữ viết (Trang 25 - 26)