Cắt bằng thuật toán mẹo

Một phần của tài liệu Nhận dạng chữ viết tay tiếng Việt trên các thiết bị cầm tay (Trang 55)

Trong nhận dạng chữ viết tay trực tuyến, chúng ta có thể phát hiện được cụm các ký tự tạo nên từ. Đối với nhận dạng chữ viết tay offline, khi các cụm từ này đè lên nhau, sẽ không phát hiện được từ được viết gồm nhiều cụm từ tạo nên. Ví dụ khi ta viết từ “chúng”

Như vậy đối với chữ viết tay, kết quả phân tách từ sẽ cho độ chính xác cao hơn so việc phân tách từ trong chữ viết tay offline. Ta đã có các điểm cắt tiềm năng lầ kết thúc của các nét bút Như ví dụ trên chúng ta đã có các điểm cắt kết thúc của 3 cụm “Chu”, “un” và “g”.

Thuật toán mẹo được thực hiện bằng cách duyệt qua các cụm từ để tìm các cung hoặc các điểm chiếu theo phương thẳng đứng có số điểm đen là ít nhất. Trong nhiều trường hợp các cung sẽ là nơi quyết định điểm cắt, tuy nhiên trong một số trường hợp các cung sẽ không có điểm cắt tại đó ví dụ như như tại các ký tự “a”, “u” và “o”. Để tránh trường hợp cắt nhầm trong các trường hợp này ta phải kết hợp với thủ tục tìm đường cong. Khi tìm thấy một cung, ta kiểm tra

54

xem việc cắt có phân ký tự thành hai phần hay không. Nếu đường cong của ký tự được tìm thấy thì không tiến hành cắt.

Mỗi khi tìm được điểm cắt ta cũng kiểm tra xem điểm cắt có gần với điểm cắt trước đó hay không. Nếu như quá gần điểm cắt trước đó thì điểm cắt cũng bị hủy bỏ.

Thuật toán mẹo để cắt các ký tự được miêu tả như sau[22]:

Bước 1. Ước lượng kích thước trung bình của các ký tự trong một từ. Việc này được thực hiện bằng cách dùng kích thước của các ký tự đơn lẻ.

Bước 2. Đi theo từng cột của ma trận điểm ảnh lần lượt từ trái qua phải. Nếu tồn tại ít nhất một một điểm đen(Có giá trị là 1) trên cột đó. Chuyển tới bước tiếp theo. Ngược lại, chuyển sang bước 8.

Bước 3. Kiểm tra hai bên của điểm dang xét để xem nó có nằm ở chỗ trũng hay không. Nếu có chuyển sang bước 4, ngược lại quay lại bước 2.

Bước 4. Tính xem có bao nhiêu cột kể từ điểm cắt trước đó.

Bước 5. Nếu số lượng cột tính từ điểm cắt gần nhất lớn hơn kích thước trung bình của một ký tự. Chuyển sang bước 6. Ngược lại, quay lại bước 2.

Bước 6. Kiểm tra xem điểm đang xét có là một phần của cung cong hoàn toàn hoặc một phần hay không.

Bước 7. Nếu bước 6 cho kết quả là sai, điểm cắt được xác định, ngược lại quay lại bước 2.

55

Một phần của tài liệu Nhận dạng chữ viết tay tiếng Việt trên các thiết bị cầm tay (Trang 55)

Tải bản đầy đủ (PDF)

(100 trang)