Nhận dạng tài liệu
Tùy chọn OCR
Sử dụng danh sách thả xuống Chế độ màu trong hộp thoại Tác vụ hoặc
Chọn một trong các tùy chọn trong Chế độ màu trên tab Tài liệu của hộp thoại Tùy chọn (Công cụ > Tùy chọn…).
Quan trọng! Sau khi tài liệu được chuyển đổi sang dạng đen trắng, bạn sẽ không thể khôi phục màu. Để có tài liệu màu, mở tệp với hình ảnh màu hoặc quét tài liệu giấy ở chế độ màu.
Tùy chọn OCR
Chọn tùy chọn OCR đúng rất quan trọng nếu bạn muốn có kết quả nhanh, chính xác. Khi quyết định bạn muốn sử dụng tùy chọn nào, bạn phải cân nhắc không chỉ loại và mức độ phức tạp của tài liệu của bạn mà còn cách bạn định sử dụng các kết quả. Các nhóm tùy chọn sau đây có sẵn:
39
Phát hiện thành phần cấu trúc
Lập mẫu
Ngôn ngữ và mẫu người dùng
Phông chữ
Mã vạch
Bạn có thể tìm thấy các tùy chọn OCR trong tab Đọc của hộp thoại Tùy chọn (Công cụ > Tùy chọn…).
Quan trọng! ABBYY FineReader tự động nhận dạng mọi trang bạn thêm vào tài liệu FineReader. Các tùy chọn hiện đã chọn sẽ được sử dụng để nhận dạng. Bạn có thể tắt tự động phân tích và OCR hình ảnh mới được thêm trong tab Quét/Mở của hộp thoại Tùy chọn (Công cụ > Tùy chọn…).
Lưu ý: Nếu bạn thay đổi các tùy chọn OCR sau khi tài liệu đã được nhận dạng, chạy lại quy trình OCR để nhận dạng tài liệu bằng các tùy chọn mới.
Chế độ đọc
Có hai chế độ đọc trong ABBYY FineReader 12:
Đọc kỹ
Trong chế độ này, ABBYY FineReader phân tích và nhận dạng cả tài liệu đơn giản và tài liệu có bố cục phức tạp, thậm chí cả tài liệu có văn bản in trên nền màu hoặc đường quét và tài liệu có bảng phức hợp (bao gồm bảng có đường lưới màu trắng và bảng có ô màu). Lưu ý: So với chế độ Nhanh, chế độ Kỹ tốn nhiều thời gian hơn nhưng đảm bảo chất lượng nhận dạng tốt hơn.
Đọc nhanh
Chế độ này được đề xuất để xử lý tài liệu lớn có bố cục đơn giản và hình ảnh chất lượng tốt.
Phát hiện thành phần cấu trúc
Chọn các thành phần cấu trúc mà bạn muốn chương trình phát hiện: đầu trang và chân trang, chú thích cuối trang, mục lục và danh sách. Những thành phần đã chọn sẽ tương tác khi tài liệu được lưu.
Lập mẫu
Nhận dạng và lập mẫu được sử dụng để nhận dạng các loại văn bản sau:
Văn bản có các thành phần trang trí
Văn bản có các ký hiệu đặc biệt (ví dụ: ký hiệu toán học ít gặp)
Khối lượng lớn văn bản từ hình ảnh chất lượng kém (trên 100 trang)
Tùy chọn Đọc và huấn luyện bị tắt theo mặc định. Bật tùy chọn này để lập mẫu cho ABBYY FineReader khi nhận dạng văn bản.
Bạn có thể sử dụng các mẫu tích hợp hoặc tùy chỉnh để nhận dạng. Chọn một trong các tùy chọn trong Huấn luyện để chọn mẫu nào bạn muốn sử dụng.
Ngôn ngữ và mẫu người dùng
40 Phông chữ
Tại đây bạn có thể chọn phông chữ sẽ được sử dụng khi lưu văn bản được nhận dạng.
Để chọn phông chữ:
1. Nhấp vào nút Phông chữ….
2. Chọn phông chữ mong muốn và nhấp vào OK. Mã vạch
Nếu tài liệu của bạn chứa mã vạch và bạn muốn chuyển đổi chúng sang chuỗi chữ cái và chữ số thay vì lưu dưới dạng ảnh, chọn Tìm kiếm mã vạch. Tính năng này bị tắt theo mặc định.
Làm việc với ngôn ngữ chữ viết phức tạp