PHÁT HIỆN VÀ HIỆU CHỈNH GÓC NGHIÊNG

Một phần của tài liệu Nâng cao chất lượng hệ thống nhập dữ liệu tự động theo FORM (Trang 34 - 35)

Một trang tài liệu chuẩn là trang tài liệu có góc nghiêng bằng không, tức là các dòng văn bản theo hƣớng ngang hay hƣớng dọc đều song song với các cạnh của trang tài liệu, tuy nhiên, trong quá trình scan hoặc copy mà độ nghiêng của trang tài liệu khác không và dẫn tới hiện tƣợng văn bản trong trang tài liệu bị nghiêng so với lề của trang. Trong hầu hết các phƣơng pháp giải quyết bài toán OCR, việc văn bản bị nghiêng ảnh hƣởng rất nghiêm trọng đến các bƣớc tiếp theo nhƣ: tách khối, phân tích bố cục, thuật toán nhận dạng OCR…, ngay cả khi góc nghiêng của văn bản rất nhỏ vào khoảng 5o

.

Hình 2.8: Ví dụ một ảnh tài liệu bị nghiêng một góc 5o

Dò và xử lý độ nghiêng của tài liệu là tìm các dòng bị nghiêng và xử lý chúng sao cho thẳng hàng, đây là công việc quan trọng tạo điều kiện thuận lợi cho việc thực hiện các bƣớc tiếp theo trong quá trình nhận dạng sau này. Các thuật toán

phát hiện góc nghiêng thƣờng đƣợc xây dựng cho các hệ thống phân tích ảnh văn bản khác nhau nên chỉ giải quyết cho những loại ảnh văn bản cụ thể. Có thể chia ra một số hƣớng tiếp cận cơ bản cho bài toán góc nghiêng văn bản nhƣ sau:

 Phƣơng pháp dựa vào phép biến đổi Hough (Hough Transform).  Phƣơng pháp dựa trên phép chiếu nghiêng (Projection Profiles).  Phƣơng pháp láng giềng gần nhất (Nearest-Neighbor Methods).  Phƣơng pháp dựa trên phép biến đổi Morphology.

 Một số phƣơng pháp khác thì dựa vào sự tƣơng quan chéo (Cross Correlation), dựa vào sự phân tích gradient (Gradient Analysis), dựa vào phân bố Fourier, .v..v.

Sau đây luận văn tập trung nghiên cứu một số kỹ thuật.

Một phần của tài liệu Nâng cao chất lượng hệ thống nhập dữ liệu tự động theo FORM (Trang 34 - 35)

Tải bản đầy đủ (PDF)

(68 trang)