Luận văn hướng tới nhận dạng form nhập dữ liệu, là loại form mà ta đã biết trước thông tin về cấu trúc, ta cũng có thể đưa ra một số quy tắc ràng buộc để tăng độ chính xác cho việc nhận dạng. Sử dụng số viết theo kiểu này là một cách áp đặt cũng như việc áp đặt khi tô các ô trong vùng đánh dấu phải tô kín và tô đậm, giúp cho nhận dạng nhanh hơn và chính xác hơn rất nhiều. Bên cạnh đó các áp đặt này không quá khó cho người điền thông tin vào form thực hiện cũng như không làm giảm thẩm mỹ của form.
Để nhận dạng số viết tay trong các ô, trước tiên cần thực hiện hai bước xử lý : khử nhiễu trong ô và tìm hình bao của ảnh
Khử nhiễu trong ô : Bên cạnh các nhiễu nền, nhiễu ngẫu nhiên sinh ra trong
quá trình quét ảnh đã được xử lý đáng kể ở phần tách nhiễu và khử nền ở chương trước, một số nhiễu vẫn tồn tại trong ảnh là các nhiễu tạo bởi các đường chấm được thêm để tăng độ chính xác các khung số như trong hình vẽ. Bản chất của những nhiễu này là rời rạc và có kích thước nhỏ.
Để khử các nhiễu này trước tiên ta co vùng về kích thước như kích thước trong mẫu. Khi đó các điểm chấm trên ảnh sẽ chỉ có kích thước là 1 hoặc 2 pixel. Áp dụng thuật toán lọc trung vị [2] theo hai chiều với kích thước cửa sổ là 3, những điểm đen rời rạc có giá trị đột biến này sẽ bị đưa về giá trị nền của các điểm ảnh lân cận.