Một trang tài liệu chuẩn là trang tài liệu có góc nghiêng bằng không, tức là các dòng văn bản theo hƣớng ngang hay hƣớng dọc đều song song với các cạnh của trang tài liệu, tuy nhiên, trong quá trình scan hoặc copy mà độ nghiêng của trang tài liệu khác không và dẫn tới hiện tƣợng văn bản trong trang tài liệu bị nghiêng so với lề của trang. Trong hầu hết các phƣơng pháp giải quyết bài toán OCR, việc văn bản bị nghiêng ảnh hƣởng rất nghiêm trọng đến các bƣớc tiếp theo nhƣ: tách khối, phân tích bố cục, thuật toán nhận dạng OCR…, ngay cả khi góc nghiêng của văn bản rất nhỏ vào khoảng 5o
.
Hình 2.8: Ví dụ một ảnh tài liệu bị nghiêng một góc 5o
Dò và xử lý độ nghiêng của tài liệu là tìm các dòng bị nghiêng và xử lý chúng sao cho thẳng hàng, đây là công việc quan trọng tạo điều kiện thuận lợi cho việc thực hiện các bƣớc tiếp theo trong quá trình nhận dạng sau này. Các thuật toán
phát hiện góc nghiêng thƣờng đƣợc xây dựng cho các hệ thống phân tích ảnh văn bản khác nhau nên chỉ giải quyết cho những loại ảnh văn bản cụ thể. Có thể chia ra một số hƣớng tiếp cận cơ bản cho bài toán góc nghiêng văn bản nhƣ sau:
Phƣơng pháp dựa vào phép biến đổi Hough (Hough Transform). Phƣơng pháp dựa trên phép chiếu nghiêng (Projection Profiles). Phƣơng pháp láng giềng gần nhất (Nearest-Neighbor Methods). Phƣơng pháp dựa trên phép biến đổi Morphology.
Một số phƣơng pháp khác thì dựa vào sự tƣơng quan chéo (Cross Correlation), dựa vào sự phân tích gradient (Gradient Analysis), dựa vào phân bố Fourier, .v..v.
Sau đây luận văn tập trung nghiên cứu một số kỹ thuật.