TỔNG QUAN NHẬN DẠNG CHỮ VIẾT TAY

2.1. TỔNG QUAN NHẬN DẠNG CHỮ VIẾT TAY2.1.1. Nhận dạng chữ 2.1.1. Nhận dạng chữ

Bài toán nhận dạng chữ là một bài toán nhận dạng tiêu biểu mà ứng dụng của nó khá phổ biến: các hệ nhận dạng chữ OCR (Optical Character

Recognizer). Bài toán này được phân thành 2 nhánh lớn:

oNhận dạng chữ in để phục vụ cho công tác đọc tự động văn bản, đẩy nhanh việc nhập thông tin vào máy.

oNhận dạng chữ viết tay với các kiểu chữ khác nhau, phục vụ cho các ứng dụng đọc và xử lý hoá đơn, văn bản…

2.1.2. Quá trình nhận dạng

Quá trình nhận dạng gồm 3 giai đoạn chính:

oLựa chọn mơ hình biểu diễn đối tượng.

oLựa chọn phương pháp nhận dạng và huấn luyện hệ thống.

oTiến hành nhận dạng.

Khi mơ hình biểu diễn đối tượng đã xác định, có thể là định lượng (mơ

hình tham số) hay định tính (mơ hình cấu trúc) thì chúng ta có thể thực hiện

giai đoạn học. Trước khi nhận dạng hệ thống phải được huấn luyện (học) nhằm điều chỉnh phân hoạch tập đối tượng thành các lớp. Do đó, học là một giai đoạn rất quan trọng trong hệ thớng nhận dạng.

• Học có giám sát

Kỹ thuật phân loại nhờ kiến thức biết trước gọi là học có giám sát. Đặc điểm cơ bản của kỹ thuật này là người ta có một thư viện các mẫu chuẩn để xem nó thuộc loại nào. Ví dụ như trong một ảnh ký tự, người ta muốn phân

biệt chữ cái này là chữ ‘C’ hay không phải là chữ ‘C’; tập mẫu này là chữ ‘A’, tập mẫu kia là chữ ‘O’, trong đó các đối tượng này đã được miêu tả. Vấn đề chủ yếu là thiết kế một hệ thống để có thể đối sánh đối tượng trong ảnh với mẫu chuẩn và quyết định gán cho chúng vào một lớp. Việc đối sánh nhờ vào các thủ tục ra quyết định dựa trên một công cụ gọi là hàm phân lớp hay hàm ra quyết định.

• Học khơng giám sát

Kỹ thuật học này phải tự định ra các lớp khác nhau và xác định các tham số đặc trưng cho từng lớp. Học khơng có thầy đương nhiên là khó khăn hơn. Một mặt, do số lớp không biết trước, mặt khác những đặc trưng của các lớp cũng không biết trước. Kỹ thuật này nhằm tiến hành một cách gộp nhóm có thể và chọn lựa cách tốt nhất. Bắt đầu từ tập dữ liệu, nhiều thủ tục xử lý khác nhau nhằm phân lớp và nâng cấp dần để đạt được một phương án phân loại.

2.2. QUY TRÌNH XỬ LÝ NHẬN DẠNG CHỮ VIẾT TAY

Quy trình xử lý nhận dạng chữ viết tay được thể hiện ở hình 2.1.

Hình 2.1. Sơ đồ tổng quát của quá trình nhận dạng chữ viết tay. 2.2.1. Giai đoạn tiền xử lý ảnh

Đây là giai đoạn quan trọng ảnh hưởng đến kết quả nhận dạng. Tuỳ thuộc vào chất lượng ảnh được quét mà ta tiến hành các thủ tục xử lý khác nhau. Vì q trình xử lý sơ bộ có thể làm chậm tốc độ xử lý của hệ thống nên nếu ảnh qt vào là tốt thì có thể bỏ qua bước này. Theo [15] thì bất kỳ một ứng dụng xử lý ảnh nào cũng bị nhiễu như những điểm cô lập. Nhiễu làm tăng đặc trưng không xác định và cho ra kết quả hiệu suất và tính chính xác trong

F ile ả nh k ý tự H uấ n lu yệ n và nh ận d ạn g T iề n xử lý T rí ch lọ c đặ c tr ưn g ch ữ vi ết H ậu x ử lý K ết q uả nh ận d ạn g

nhận dạng giảm đi. Do đó phần tiền xử lý được thực hiện trước khi chúng ta bắt đầu phương pháp trích lọc đặc trưng. Ở đây chuỗi các hoạt động được tiến hành liên tiếp như biểu đồ luồng (hình 2.2). Chúng ta sử dụng lọc trung vị cho ảnh ký tự tốt hơn trong việc thực hiện để loại bỏ những điểm không mong muốn hoặc những điểm cơ lập. Sau đó làm mỏng ảnh để có được xương của ảnh ký tự giúp cho quá trình quan sát dễ dàng hơn và làm tăng tốc độ xử lý của các quá trình sau.

Hình 2.2. Giai đoạn tiền xử lý.

2.2.2. Phương pháp nhận dạng chữ viết tay

Nhận dạng chữ viết là một lĩnh vực thu hút được sự quan tâm nghiên cứu của các nhà khoa học. Lĩnh vực nghiên cứu này bắt đầu từ vài thập kỷ trước và hiện nay đã thu được một số thành công đáng kể. Trên thế giới đã xuất hiện nhiều ứng dụng thương mại thực hiện nhận dạng chữ tùy theo từng yêu cầu cụ thể, có thể là nhận dạng chữ in trên một kiểu chữ, hoặc nhiều kiểu chữ (omni font), có thể là nhận dạng trên một ngơn ngữ hoặc là nhiều ngôn ngữ (omni language), hoặc là nhận dạng chữ số viết tay có ràng buộc. Ta có thể kể

Ảnh ký tự (character Image)

Làm dày ảnh (thickening)

Tạo ngưỡng (Thresholding)

Lọc trung vị (Median Filtering) Tìm xương ảnh (Thinning)

ra một số sản phẩm tiêu biểu như: OmniPage... ở Việt Nam [24], việc nghiên cứu xây dựng các hệ nhận dạng chữ tiếng Việt cũng được bắt đầu rất sớm. Hiện tại trong lĩnh vực nhận dạng chữ in đã có một số sản phẩm thương mại với chất lượng tốt như VnDOCR [16] của Viện Công Nghệ Thông Tin, ImageScan của CadPro. Tuy nhiên, việc nhận dạng chữ viết tay cũng chưa đạt được nhiều kết quả. Để giải quyết các khó khăn của nhận dạng chữ nói chung và nhận dạng chữ viết tay nói riêng, các nhà nghiên cứu đã đề xuất rất nhiều các kỹ thuật nhận dạng dựa trên cơ sở của lý thuyết thống kê, cấu trúc chữ, đặc trưng, HMM và mạng nơron.

TỔNG QUAN NHẬN DẠNG CHỮ VIẾT TAY

Phương pháp tiếp cận cấu trúc