Nếu cấu trúc phức tạp của tài liệu giấy không được tái tạo

Một phần của tài liệu guide_vietnamese (Trang 44 - 45)

Gợi ý để cải thiện chất lượng OCR

Nếu cấu trúc phức tạp của tài liệu giấy không được tái tạo

 Nếu bạn đang xử lý một số lượng lớn tài liệu có bố cục tương tự nhau

 Nếu bảng không được phát hiện

 Nếu ảnh không được phát hiện

 Điều chỉnh thuộc tính vùng

 Nếu bạn thấy "?" hoặc "□" thay thế các chữ cái trong cửa sổ Văn bản

 Nếu tài liệu in của bạn chứa phông chữ phi tiêu chuẩn

 Nếu văn bản chứa nhiều thuật ngữ chuyên ngành hoặc từ hiếm

 Nếu chương trình không nhận dạng được một số ký tự

 Nếu văn bản dọc hoặc đảo ngược không được nhận dạng

 Nếu mã vạch không được phát hiện

Nếu cấu trúc phức tạp của tài liệu giấy không được tái tạo

Trước khi chạy quy trình nhận dạng tài liệu, ABBYY FineReader thực hiện phân tích cấu trúc lôgic của tài liệu và phát hiện các vùng chứa văn bản, ảnh, bảng và mã vạch. Chương trình sau đó dựa vào phân tích này để xác định các vùng và thứ tự mà vùng được nhận dạng. Thông tin này giúp tái tạo định dạng của tài liệu gốc.

Theo mặc định, ABBYY FineReader sẽ phân tích tài liệu tự động. Tuy nhiên, trong trường hợp định dạng rất phức tạp, một số vùng có thể được phát hiện không chính xác và bạn có thể muốn sửa chúng thủ công.

Sử dụng các công cụ và lệnh sau để sửa vùng:

 Công cụ điều chỉnh vùng thủ công trên thanh công cụ của cửa sổ Hình ảnh.

 Các lệnh menu chuột phải sẵn có bằng cách nhấp chuột phải vào vùng đã chọn trong cửa sổ Hình ảnh hoặc cửa sổ Thu phóng.

 Các lệnh trong menu Vùng.

Bắt đầu lại quy trình OCR sau khi thực hiện điều chỉnh mong muốn.

Cài đặt nhận dạng, cài đặt thuộc tính vùng và lưu cũng có ảnh hưởng đến việc bố cục của tài liệu gốc được lập mẫu lại tốt như thế nào. Để biết chi tiết, xem các phần sau: "Tùy chọn OCR", "Điều chỉnh thuộc tính vùng" và "Lưu kết quả OCR".

45 Nếu vùng được phát hiện không chính xác

Một phần của tài liệu guide_vietnamese (Trang 44 - 45)

Tải bản đầy đủ (PDF)

(125 trang)