Giới thiệu về nhận dạng chữ viết tay

Nhận dạng chữ viết bao gồm hai kiểu chính là nhận dạng chữ in và nhận dạng chữ viết tay. Cho đến nay bài toán nhận dạng chữ in đã được giải quyết khá trọn vẹn với sự ra đời của nhiều hệ thống nhận dạng đạt tới độ chính xác gần như tuyệt đối. Trên thế giới hiện nay có nhiều chương trình nhận dạng chữ

viết (chữ in và viết tay) bằng các thứ tiếng Anh, Nga… như các hệ OMNIPAGE, READ-WRITE, WORD-SCAN,... Tiêu biểu có hệ nhận dạng chữ in dựa trên mô hình mạng neural bốn lớp của J. Wang và J.S.N. Jean đạt tới tỷ lệ chính xác 99.75%. [12]

Ở Việt Nam hiện đã có sản phẩm VNDOCR của Viện Công nghệ thông tin nhận dạng chữ in tiếng Việt với độ chính xác tới 99%, có khả năng nhận dạng trực tiếp các loại tài liệu được quét qua máy quét, không cần lưu trữdưới dạng tệp ảnh trung gian. Các trang tài liệu có thể được quét và lưu trữ dưới dạng tệp tin nhiều trang. Kết quả nhận dạng được lưu trữsang định dạng của Microsoft Word, Excel... phục vụ rất tốt nhu cầu số hóa dữ liệu. Hệnhư WORC

của công ty 3C, VIET-IN của công ty SEATIC, Image Scon của Trung Tâm Tự động hoá thiết kế.

Nhận dạng chữ viết tay là một lĩnh vực nghiên cứu sôi nổi, với tỷ lệ nhận dạng thậm chí còn thấp hơn cả văn bản in bằng tay. Tỷ lệ nhận dạng cao hơn

của những bản viết tay chung chung hầu như là không thể nếu không sử dụng thông tin về ngữ pháp và văn cảnh. Nhận dạng chữ viết tay đang là vấn đề

thách thức lớn đối với các nhà nghiên cứu, chưa thể giải quyết trọn vẹn được vì nó phụ thuộc quá nhiều vào người viết, sự biến đổi quá đa dạng trong cách viết và trạng thái tinh thần của từng người viết. Cho đến nay, bài toán nhận dạng chữ viết tay cũng đã có một số kết quả khả quan, chủ yếu tập trung trên các tập dữ liệu chữ số viết tay như USPS và MNIST, một số kết quả khác mở

rộng đối với các chữ hệ La tinh, Hy lạp.... Đặc biệt đối với việc nhận dạng chữ

viết tay tiếng Việt lại càng gặp nhiều khó khăn hơn do bộ ký tự tiếng Việt có nhiều ký tự có hình dáng rất giống nhau, chỉ khác nhau chút ít về phần dấu. Do

đó có rất ít kết quả nghiên cứu về nhận dạng chữ viết tay tiếng Việt và các kết quả nghiên cứu chủ yếu cũng chỉ tập trung vào chữ viết tay trực tuyến . Bài toán em đặt ra ở đây là xây dựng một mô hình nhận dạng ký tự Việt viết tay rời rạc trực tuyến. Bộ ký tự tiếng Việt bao gồm tập ký tự không dấu như A, B,

C, D, Đ,… và các ký tự có dấu Ă, Â,Ơ, Ô…

Nhận dạng chữ viết tay được chia thành hai lớp bài toán lớn là nhận dạng chữ viết tay trực tuyến (online) và nhận dạng chữ viết tay ngoại tuyến (offline). Trong nhận dạng chữ viết tay ngoại tuyến, dữ liệu đầu vào được cho dưới dạng các ảnh được quét từ các giấy tờ, văn bản. Ngược lại nhận dạng chữ viết tay trực tuyến là nhận dạng các chữ trên màn hình ngay khi nó được viết.

Trong đó:

+ Tiền xử lý: là quá trình chuẩn hóa dữ liệu vào, gồm các công việc như

xử lý nhiễu, chuẩn hóa kích thước dữ liệu, …

+ Trích chọn đặc trưng: là quá trình tìm ra các thông tin hữu ích và đặc

trưng nhất cho mẫu đầu vào để sử dụng cho quá trình nhận dạng.

+ Nhận dạng: là quá trình sử dụng một mô hình nhận dạng cụ thể với một thuật toán cụ thểđể trả lời mẫu đầu vào là chữ nào.

+ Hậu xử lý: là quá trình xử lý kết quả cho phù hợp với từng ứng dụng cụ thể.

Giới thiệu về nhận dạng chữ viết tay

Thực thi của mạng neural Kohonen[10]

Hướng phát triển tiếp theo