Giới thiệu về bài toán nhận dạng chữ viết tay Tiến- 123docz.net

Nhận dạng chữ cái Tiếng Việt cũng nhƣ nhận dạng nói chung là dùng các thuật toán để tìm ra các đặc điểm riêng của từng cá thể trong quần thể mà chúng ta phải nhận dạng. Với mỗi dữ liệu nhập vào ta sẽ phải xuất ra một kết quả tƣơng tự nhất. Nhận dạng chữ cái Tiếng Việt bao gồm hai kiểu chính đó là nhận dạng chữ in và nhận dạng chữ viết tay.

Trong khi nhận dạng chữ in đƣợc xem là vấn đề đã đƣợc giải quyết đạt tới độ chính xác rất cao với sự ra đời của nhiều hệ thống nhƣ: Hệ nhận dạng chữ in dựa trên mô hình mạng Nơron bốn lớp của hai tác giả J.Wang và J.S.N. Jean có tỷ lệ nhận dạng chính xác đạt tới 99.75%. Phần mềm Simple OCR là một phần mềm khá mạnh dùng cho máy quét đã đƣợc hàng trăm ngàn ngƣời sử dụng trên thế giới. Là một công cụ mạnh về nhận dạng kí tự quang học thay cho việc đánh máy nhàm chán, ngoài ra phần mềm này còn có thể nhận dạng chữ viết tay và

học từ mới. Ở Việt Nam cũng đã có sản phẩm VnDOCR của Viện Công nghệ thông tin chƣơng trình hỗ trợ nhận dạng cho các dạng ảnh PDF, TIFF, JPEG, GIF, PNG, và BMP. Qua rất nhiều thử nghiệm đã cho thấy VnDOCR đã nhận dạng chữ in tiếng Việt rất thành công với độ chính xác rất cao.

Tuy nhiên, cho đến ngày nay thì nhận dạng chữ viết tay có thể nói là chƣa đƣợc ứng dụng nhiều trong thực tế, nhận dạng chữ viết tay đƣợc thực hiện qua hai hình thức chính đó là nhận dạng chữ viết tay trực tuyến (online) và nhận dạng chữ viết tay ngoại tuyến (offline). Cụ thể bài toán nhận dạng chữ trực tuyến (online) là nhận dạng các chữ trên màn hình ngay khi chữ đƣợc viết. Trong hệ nhận dạng này máy tính sẽ lƣu lại các thông tin về nét chữ, thứ tự nét viết, hƣớng và tốc độ của nét…Đây chính là cơ sở để máy tính nhận diện đƣợc chữ cái, do đó việc nhận dạng không gặp quá nhiều khó khăn. Hệ thống nhận dạng chữ viết tay hạn chế trực tuyến trên một trạm làm việc của IBM do nhóm nghiên cứu gồm H.S.M.Beigi, C.C.Tapert, M.Ukeison và C.G.Wolf ở phòng thực hành Watson IBM cài đặt là một trong những sản phẩm nhận dạng chữ viết tay online tiêu biểu nhất. Nhận dạng chữ trực tuyến (online) đƣợc ứng dụng trên các máy nhƣ: Tablet PC, Palmtop, PocketPC, ….Vì các thiết bị trên có sự hỗ trợ các thao tác với bút và mực, cho phép ngƣời dùng có thể giao tiếp bằng cách dùng bút vẽ trực tiếp lên màn hình. Với nhận dạng chữ viết tay ngoại tuyến (offline) thì dữ liệu đầu vào đƣợc cho dƣới dạng các ảnh. Kết quả của nhận dạng chữ viết tay offline hiện nay còn rất nhiều nhƣợc điểm và gặp rất nhiều khó khăn nhƣ:

- Với chữ viết tay để có một kích thƣớc giống nhau thật là khó, chúng ta không thể đảm bảo đƣợc chữ viết của cùng một từ trên một dòng hay cùng một kí tự trong một văn bản do một ngƣời viết có thể có kích thƣớc nhƣ nhau.

- Mỗi một ngƣời có một kiểu và dáng chữ khác nhau. Có ngƣời thì viết chữ thƣờng hay nghiêng về bên phải, hay nghiêng về bên trái và cũng có ngƣời nghiêng nhiều…

- Không chỉ kiểu chữ, kích thƣớc, hình dáng khác nhau mà chữ viết tay đôi khi còn bị thiếu nét thừa nét, giữa các kí tự trong cùng một từ thƣờng có những nét nối hoặc thậm chí chúng còn bị dính vào nhau hay kí tự thuộc dòng dƣới bị dính, bị chồng lên các kí tự thuộc dòng trên nên rất khó khăn trong việc tách dòng, xác định phân cách giữa chúng….

Tuy nhận dạng chữ viết tay gặp rất nhiều những khó khăn nhƣng nhận dạng chữ viết tay cũng có một số chƣơng trình tiêu biểu có thể kể đến nhƣ: Hệ thống phân loại tự động địa chỉ thƣ ở bƣu điện của tác giả M.Pfister, S.Behnke và R.Rojas ở Đại học tổng hợp Berlin, Đức. Hệ nhận dạng chữ viết tay trong lĩnh vực kiểm tra tài khoản ở ngân hàng của nhóm nghiên cứu Simon và O.Baret ở Paris.Ở Việt Nam, chúng ta mới chỉ có đƣợc những sản phẩm thử nghiệm nhƣ hệ thống nhận dạng chữ số và chữ cái viết tay rời rạc trên các phiếu xuất nhập cảnh của nhóm nghiên cứu ở Đại học quốc gia thành phố Hồ Chí Minh,… Có thể nói, bài toán nhận dạng chữ viết tay vẫn cần đƣợc đầu tƣ nhiều thời gian và công sức của con ngƣời để có đƣợc những sản phẩm có ý nghĩa thực tiễn rộng hơn.

Hiện nay có rất nhiều phƣơng pháp nhận dạng, và dƣới đây liệt kê vài phƣơng pháp nhận dạng cơ bản:

- Dùng mạng Nơron: ƣu điểm là thiết kế và coding đơn giản, nhƣợc điểm là tính chậm và xác suất không cao.

- Dùng HMM (Hiden Markov Model): ƣu điểm là thiết kế và coding đơn giản, không dùng nhiều bộ nhớ. Nhƣợc điểm là rất khó phân lớp dữ liệu.

- Dynamic programming: đơn giản, nhƣng hiệu quả không cao.

Dù là phƣơng pháp nào thì việc nhận dạng chữ viết đều thƣờng đƣợc tiến hành theo mô hình các bƣớc nhƣ sau:

Hình 2.1: Mô hình chung trong nhận dạng chữ viết

Trong đó:

 Tiền xử lý: : là quá trình chuẩn hóa dữ liệu vào, gồm các công việc nhƣ xử lý nhiễu, chuẩn hóa kích thƣớc dữ liệu, ...

 Trích chọn đặc trƣng: là quá trình tìm ra các thông tin hữu ích và đặc trƣng nhất cho mẫu đầu vào để sử dụng cho quá trình nhận dạng.

 Nhận dạng: là quá trình sử dụng một mô hình nhận dạng cụ thể với một thuật toán cụ thể để trả lời mẫu đầu vào là chữ (ký tự) nào.

 Hậu xử lý: là quá trình xử lý kết quả cho phù hợp với từng ứng dụng cụ thể.

Nhƣ vậy, chúng ta đã đƣợc biết sơ qua tình hình chung của bài toán nhận dạng chữ viết trên thế giới cũng nhƣ ở Việt Nam: những ứng dụng thực tế, những kết quả đã đạt đƣợc và những gì chúng ta cần phải cố gắng thêm nữa đặc biệt là với bài toán nhận dạng chữ viết.

Giới thiệu về bài toán nhận dạng chữ viết tay Tiếng Việt

Mạng hồi quy (Recurrent Neutral Network)

Các lĩnh vực ứng dụng mạng nơron