Sử dụng phộp toỏn hỡnh thỏi trong nối chữ đứt nột

Một phần của tài liệu Nâng cao chất lượng ảnh nhị phân bằng phương pháp morphotogy báo cáo nghiên cứu khoa học giáo viên (Trang 60 - 61)

Một trong những vấn đề khú khăn của cỏc hệ thống nhận dạng chữ Việt là chữ bị dớnh hoặc đứt nột. Đối với cỏc văn bản photocopy đặc biệt là F1, F2 chữ thƣờng bị đứt nột. Mục này đề cập đến việc ứng dụng phộp toỏn hỡnh thỏi trong việc khụi phục chữ bị đứt.

Ta cú một số nhận xột sau:

- Phần lớn cỏc văn bản photocopy đều cú cỏc nột chữ bị đứt. - Cỏc nột chữ bị đứt tập trung chủ yếu vào cỏc chỗ mảnh.

- Cỏc nột đứt thƣờng cú khoảng cỏch nhỏ hơn khoảng cỏch chõn cỏc chữ. - Cỏc nột bị đứt thƣờng nằm ở trờn hoặc ở dƣới của chữ cỏi, trừ 1 số chữ nhƣ g, k , t và một số chữ khỏc.

- Những phần đầu của nột chữ bị đứt thƣờng cong và nhụ ra ngoài của thõn chữ.

Cỏc yờu cầu:

- Tuỳ theo từng văn bản photocopy mà độ đứt nột cỏc chữ là khỏc nhau và khoảng cỏch bị đứt là khỏc nhau nờn để cho độ chớnh xỏc gần với mong muốn hơn ta nờn chọn khoảng cỏch cho phộp là bao nhiờu.

- Mặt khỏc những chỗ giỏp cả 2 chữ thƣờng gần hơn hoặc xấp xỉ bằng với khoảng cỏch bị đứt nột, nờn ta phải loại bỏ cỏc phần bị nối liền giữa cỏc chữ cỏi với nhau.

Trong phần này chỳng ta chỉ xột đến trƣờng hợp cỏc chữ bị đứt nột với khoảng cỏch nhỏ, và cỏc chữ thƣờng gặp, cú nột lƣợn là trũn.

Chọn mẫu:

- Ta thấy khi cỏc nột đứt trờn, dƣới của chữ ta chỉ cần nối phần ngang, khụng cần cỏc nột nối theo chiều dọc của chữ.

- Ngoài ra nếu bị đứt theo chiều dọc thỡ độ đứt khụng đỏng kể.

Một phần của tài liệu Nâng cao chất lượng ảnh nhị phân bằng phương pháp morphotogy báo cáo nghiên cứu khoa học giáo viên (Trang 60 - 61)