Phương pháp nhận dạng

Một phần của tài liệu Nhận dạng chữ viết tay hạn chế dựa trên mô hình mạng nơron kết hợp với thống kê ngữ cảnh (Trang 47)

V ới cách tiếp cận truyền thống, các bước trone; quá trinh nhận dạng th ư ờ n g đư ợ c th ự c hiện m ột cách tuần tự. C h ẳng hạn, để nhận dạng m ột từ, trước hết phải tá ch tất cả các kí tự ra khỏi từ, sau đó mới thực hiện đến bước nhận dạng kí tự. Đ ặc điểm c ủa p h ư ơ n g pháp này là với mồi ảnh đầu vào, ta chỉ xét đến m ột khả n ă n g ph â n đoạn. N h ư vậy, nếu vị trí cắt xác định được không chính xác sẽ dẫn đến kết quả nhận dạ n g bị sai. N hìn chung, cách tiếp cận này chỉ thích hợp với chữ in bởi vì g iữ a các kí tự thườ ng có khoảng cách và các vị trí cắt xác định được trên ảnh là tư ơ n g đối chính xác. Còn đối với chữ viết tay thì cách tiếp cận này kh ông khả thi bởi lẽ c h ữ viết tay được viết tự do và thường bị dính nhau nên rất khó xác định đ ư ợ c các vị trí cắt m ột cách chính xác.

Đ ể k hắc phục vấn đề này, luận văn đã đề xuất ra m ột phư ơ ng pháp nh ận d ạ n g từ theo cách tiếp cận khác: Trong quá trình nhận dạng, các công đoạn tách, nhận d ạ n g và kiểm tra kí tự sẽ k hông tách rời nhau m à được thực hiện đan xen với nhau. Ý tư ở n g cơ bản của ph ư ơ n g pháp này n hư sau:

Đ ể n hận dạng m ột từ, trước tiên ta sẽ xác định các vị trí cắt có thể có írên ảnh gốc của từ đó. Sau đó, ta sẽ duyệt lần lượt từng vị trí cắt đã được xác định, tại m ỗi vị trí cắt, ảnh đầu vào sẽ được chia thành hai phần: phần ảnh đ ư ợ c cắt ra phần ản h

c ò n lại. T iếp theo, ta sẽ tiến hành nhận dạng phần ảnh được cắt ra bởi m ạ n g n ơ ro n bốn lớp đồng thời kiểm tra xem kí tự v ừa nhận dạng được có hợp lý k h ô n g ? n ế u th o ả m ã n ta sẽ ghi nhận vị trí cắt hiện tại và lặp lại các thao tác này với p h ầ n ảnh còn lại, nếu ngượ c lại (không thoả mãn), ta sẽ loại bỏ lựa chọn này. N h ư vậ y q u á trình n h ậ n dạng sẽ được tiến hành theo từng cách phân đoạn, với m ỗi cách p h â n đoạn ta sẽ có tương ứng một đư ờ ng đi, mỗi điểm trên đườ ng đi đó là m ột kí tự đã đư ợ c n h ậ n dạng, sau khi ghép lại tất cả các điểm trên đường đi ta sẽ có đ ư ợ c m ộ t từ tư ơ n g ứ n g (ta gọi là từ ứng cử viên). N h ư vậy, nếu xác định được tổ n g số vị trí cắt có thể có trên ảnh gốc của từ cần nhận dạng là n thì số từ ứng cử viên tối đa đ ư ợ c

Nguyễn Thị Thanh Tân Trang - 47 - Luận văn thạc sĩ

sinh ra sẽ là n ỉ từ. Cuối cùng, ta sẽ tiến hành chọn ra m ột từ trong danh sách các từ ứn g cử viên đă thu được sao cho khả năng lựa chọn của từ đó là cao nhất. V à từ này chính là kết quả trả về của mô hình nhận dạng.

Một phần của tài liệu Nhận dạng chữ viết tay hạn chế dựa trên mô hình mạng nơron kết hợp với thống kê ngữ cảnh (Trang 47)

Tải bản đầy đủ (PDF)

(103 trang)