CHƯƠNG III ỨNG DỤNG CỦA PHẫP TOÁN HèNH THÁ
3.2. Sử dụng phộp toỏn hỡnh thỏi trong nối chữ đứt nột.
Một trong những vấn đề khú khăn của cỏc hệ thống nhận dạng chữ Việt là chữ bị dớnh hoặc đứt nột. Đối với cỏc văn bản photocopy đặc biệt là F1, F2 chữ thường bị đứt nột. Mục này đề cập đến việc ứng dụng phộp toỏn hỡnh thỏi trong việc khụi phục chữ bị đứt.
Ta cú một số nhận xột sau:
- Phần lớn cỏc văn bản photocopy đều cú cỏc nột chữ bị đứt. - Cỏc nột chữ bị đứt tập trung chủ yếu vào cỏc chỗ mảnh.
- Cỏc nột đứt thường cú khoảng cỏch nhỏ hơn khoảng cỏch chõn cỏc chữ. - Cỏc nột bị đứt thường nằm ở trờn hoặc ở dưới của chữ cỏi, trừ 1 số chữ như g, k , t và một số chữ khỏc.
- Những phần đầu của nột chữ bị đứt thường cong và nhụ ra ngoài của thõn chữ.
Cỏc yờu cầu:
- Tuỳ theo từng văn bản photocopy mà độ đứt nột cỏc chữ là khỏc nhau và khoảng cỏch bị đứt là khỏc nhau nờn để cho độ chớnh xỏc gần với mong muốn hơn ta nờn chọn khoảng cỏch cho phộp là bao nhiờu.
- Mặt khỏc những chỗ giỏp cả 2 chữ thường gần hơn hoặc xấp xỉ bằng với khoảng cỏch bị đứt nột, nờn ta phải loại bỏ cỏc phần bị nối liền giữa cỏc chữ cỏi với nhau.
Giới hạn:
Trong phần này chỳng ta chỉ xột đến trường hợp cỏc chữ bị đứt nột với khoảng cỏch nhỏ, và cỏc chữ thường gặp, cú nột lượn là trũn.
Chọn mẫu:
cần cỏc nột nối theo chiều dọc của chữ.
- Ngoài ra nếu bị đứt theo chiều dọc thỡ độ đứt khụng đỏng kể.