Đây là quá trình tăng chất lƣợng ảnh đầu vào để cho thuật toán xử lý đƣợc chính xác hơn. Nó có thể làm tốc độ của hệ thống chậm lại nếu dữ liệu đầu vào chƣa chuẩn. Nếu nguồn dữ liệu đầu vào của hệ thống tốt thì ta có thể lƣợc bỏ bớt các giai đoạn của quá trình tiền xử lý này để làm tăng tốc độ tính toán của hệ thống.
Nhị phân hóa ảnh: Nhị phân hóa ảnh là một quá trình chuyển từ ảnh gốc sang ảnh nhị phân, đây là một kỹ thuật cần thiết để xác định các đối tƣợng chính là các ký tự trong một bức ảnh đầu vào. Nhị phân hóa ảnh đƣợc chia ra làm hai phần chính: phần nền của ảnh và phần chữ. Hầu hết các thuật toán nhị phân hóa ảnh hiện nay đều dựa trên một nguyên tắc xử lý chung là lựa chọn một ngƣỡng thích hợp theo cƣờng độ sáng của ảnh, tất cả các điểm ảnh có độ sáng lớn hơn ngƣỡng này thành giá trị 1, các điểm ảnh có độ sáng nhỏ hơn ngƣỡng này thành giá trị 0 (Hai giá trị 1 và 0 có thể hiểu là mầu đen và mầu trắng).
Lọc nhiễu: Nhiễu trên một ảnh đầu vào là các điểm sáng thừa trên ảnh, không phải là một bộ phận của ký tự đầu vào, nó cũng có thể là các nét còn thiếu trên ảnh. Một số loại nhiễu thƣờng gặp nhƣ:
Nhiễu đốm: là các đốm trên ảnh đầu vào, có thể lọc đƣợc bằng các phƣơng pháp nhƣ: lọc trung bình, lọc vị...
Nhiễu vệt, nhiễu có kích thƣớc lớn: có thể lọc đƣợc bằng phƣơng pháp khử vùng liên thông.
Chuẩn hóa kích thƣớc ảnh: Các ký tự trong văn bản đầu vào, tùy từng vị trí có thể có kích thƣớc chữ khác nhau do ngƣời viết. Chuẩn hóa kích thƣớc ảnh là công việc đƣa các ký tự trong một văn bản đầu vào về cùng một kích thƣớc bằng nhau, giúp cho việc nhận dạng đƣợc dễ dàng hơn. Thuật toán chuẩn hóa kích thƣớc ảnh đƣợc giải quyết bằng việc xác định trọng tâm của ảnh, sau khi có trọng tâm của ảnh, ta xác định khoảng cách từ tâm đến cách điểm viền của ảnh, từ đó xác định đƣợc tỷ lệ co giãn của ảnh gốc so với kích thƣớc chuẩn mong muốn. Từ tỷ lệ co giãn này, ta có thể hiệu chỉnh ảnh để ảnh đầu vào có kích thƣớc chuẩn.
Làm trơn biên chữ: Chữ trong văn bản đầu vào có thể không trơn, xuất hiện nhiều vết răng cƣa do nguồn ảnh đầu vào kém chất lƣợng hoặc quá trình chuẩn hóa kích thƣớc ảnh làm ảnh xuất hiện nhiều vết răng cƣa trên biên của ký tự. Ta có thể sử dụng thuật toán làm trơn để xử lý các ảnh loại này.
Làm đầy chữ: Làm đầy chữ là quá trình nhận dạng các đƣờng bị đứt nét và lấp đầy sự đứt nét này, làm tăng tính đúng đắn khi tách chữ.
Làm mảnh chữ: Đây là bƣớc rất quan trọng và cần sự chính xác cao trong quá trình xử lý ảnh đầu vào. Làm mảnh chữ là quá trình tìm khung của một ký tự bằng việc loại bỏ các biên ngoài của các nét trong một ký tự. Hiện nay, để làm mảnh chữ, ngƣời ta hay sử dụng thuật toán tìm khung chữ.
Chuẩn hóa độ nghiêng: Trong quá trình nhập ảnh đầu vào, ảnh có thể bị nghiêng một góc so với bình thƣờng. Ta cần hiệu chỉnh lại độ nghiêng này về 0. Có rất nhiều thuật toán xử lý độ nghiêng của văn bản, một thuật toán phổ thông và hay dùng hiện nay là sử dụng biểu đồ chiếu (projection profile) của ảnh tài liệu.