Tùy chọn OCR

Một phần của tài liệu guide_vietnamese (Trang 38 - 40)

Nhận dạng tài liệu

Tùy chọn OCR

 Sử dụng danh sách thả xuống Chế độ màu trong hộp thoại Tác vụ hoặc

 Chọn một trong các tùy chọn trong Chế độ màu trên tab Tài liệu của hộp thoại Tùy chọn (Công cụ > Tùy chọn…).

Quan trọng! Sau khi tài liệu được chuyển đổi sang dạng đen trắng, bạn sẽ không thể khôi phục màu. Để có tài liệu màu, mở tệp với hình ảnh màu hoặc quét tài liệu giấy ở chế độ màu.

Tùy chọn OCR

Chọn tùy chọn OCR đúng rất quan trọng nếu bạn muốn có kết quả nhanh, chính xác. Khi quyết định bạn muốn sử dụng tùy chọn nào, bạn phải cân nhắc không chỉ loại và mức độ phức tạp của tài liệu của bạn mà còn cách bạn định sử dụng các kết quả. Các nhóm tùy chọn sau đây có sẵn:

39

 Phát hiện thành phần cấu trúc

 Lập mẫu

 Ngôn ngữ và mẫu người dùng

 Phông chữ

 Mã vạch

Bạn có thể tìm thấy các tùy chọn OCR trong tab Đọc của hộp thoại Tùy chọn (Công cụ > Tùy chọn…).

Quan trọng! ABBYY FineReader tự động nhận dạng mọi trang bạn thêm vào tài liệu FineReader. Các tùy chọn hiện đã chọn sẽ được sử dụng để nhận dạng. Bạn có thể tắt tự động phân tích và OCR hình ảnh mới được thêm trong tab Quét/Mở của hộp thoại Tùy chọn (Công cụ > Tùy chọn…).

Lưu ý: Nếu bạn thay đổi các tùy chọn OCR sau khi tài liệu đã được nhận dạng, chạy lại quy trình OCR để nhận dạng tài liệu bằng các tùy chọn mới.

Chế độ đọc

Có hai chế độ đọc trong ABBYY FineReader 12:

Đọc kỹ

Trong chế độ này, ABBYY FineReader phân tích và nhận dạng cả tài liệu đơn giản và tài liệu có bố cục phức tạp, thậm chí cả tài liệu có văn bản in trên nền màu hoặc đường quét và tài liệu có bảng phức hợp (bao gồm bảng có đường lưới màu trắng và bảng có ô màu). Lưu ý: So với chế độ Nhanh, chế độ Kỹ tốn nhiều thời gian hơn nhưng đảm bảo chất lượng nhận dạng tốt hơn.

Đọc nhanh

Chế độ này được đề xuất để xử lý tài liệu lớn có bố cục đơn giản và hình ảnh chất lượng tốt.

Phát hiện thành phần cấu trúc

Chọn các thành phần cấu trúc mà bạn muốn chương trình phát hiện: đầu trang và chân trang, chú thích cuối trang, mục lục và danh sách. Những thành phần đã chọn sẽ tương tác khi tài liệu được lưu.

Lập mẫu

Nhận dạng và lập mẫu được sử dụng để nhận dạng các loại văn bản sau:

 Văn bản có các thành phần trang trí

 Văn bản có các ký hiệu đặc biệt (ví dụ: ký hiệu toán học ít gặp)

 Khối lượng lớn văn bản từ hình ảnh chất lượng kém (trên 100 trang)

Tùy chọn Đọc và huấn luyện bị tắt theo mặc định. Bật tùy chọn này để lập mẫu cho ABBYY FineReader khi nhận dạng văn bản.

Bạn có thể sử dụng các mẫu tích hợp hoặc tùy chỉnh để nhận dạng. Chọn một trong các tùy chọn trong Huấn luyện để chọn mẫu nào bạn muốn sử dụng.

Ngôn ngữ và mẫu người dùng

40 Phông chữ

Tại đây bạn có thể chọn phông chữ sẽ được sử dụng khi lưu văn bản được nhận dạng.

 Để chọn phông chữ:

1. Nhấp vào nút Phông chữ….

2. Chọn phông chữ mong muốn và nhấp vào OK. Mã vạch

Nếu tài liệu của bạn chứa mã vạch và bạn muốn chuyển đổi chúng sang chuỗi chữ cái và chữ số thay vì lưu dưới dạng ảnh, chọn Tìm kiếm mã vạch. Tính năng này bị tắt theo mặc định.

Làm việc với ngôn ngữ chữ viết phức tạp

Một phần của tài liệu guide_vietnamese (Trang 38 - 40)

Tải bản đầy đủ (PDF)

(125 trang)