Hình chữ nhật bao quanh các đôi tƣợng tìm đƣợc

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Tách và nhận dạng số viết tay trong phiếu nhập dữ liệu (Trang 48 - 51)

Kết luận : thực nghiệm cho thấy việc xác định kích cỡ chữ trung bình cho kết

quả rất chính xác, thời gian tính toán khoảng 30ms đối với ảnh có độ phân giải 300DPI. Đây là một khoảng thời gian hoàn toàn chấp nhận được so với hiệu quả mang lại, giúp cho xác định các đường thẳng thẳng trên ảnh chính xác và ít nhiễu hơn.

2.1.4.6 Tách vùng nhập dữ liệu trên ảnh scan

Sau khi xác định các đường thẳng trên ảnh scan và đối chiếu các đường thẳng này với các đường thẳng trên form mẫu thông qua các thông tin được cung cấp bởi module hỗ trợ nhận dạng, ta tiến hành tách các vùng cần nhận dạng dựa trên các đường thẳng được đối chiếu chính xác.

Xét thông tin về một vùng nhập liệu cần nhận dạng trên form mẫu, vùng này là một vùng hình chữ nhật được xác định bởi đỉnh trên bên trái và đỉnh dưới bên phải với tọa độ tuyệt đối (Xmin,Ymin) , (Xmax,Ymax) . Mục đích của ta là tách ra vùng tương ứng với vùng này trên ảnh scan.

Để đảm bảo cho chất lượng nhận dạng của module nhận dạng chữ viết, ảnh thường được scan với độ phân giải 150DPI đến 300DPI. Những ảnh này thường có kích thước lớn, do đó sai số về vị trí khi tách vùng trên ảnh scan tương ứng với vùng nhập liệu trên ảnh mẫu dựa vào tọa độ tuyệt đối cũng lớn. Mặt khác, với nhận xét từ trước là khoảng cách giữa các vùng nhập thông tin đến các đường thẳng là nhỏ, để giảm bớt sai số ta sẽ tách vùng dựa trên vị trí tương đối của các vùng nhập thông tin đối với các đường thẳng.

Giả sử như khi nhận dạng các đường thẳng, một số đường thẳng bị mất do ảnh quá mờ, Khi đó vị trí của vùng nhập thông tin sẽ được xác định thông qua đường thẳng gần nó nhất mà ta xác định được.

Các bước để thực hiện tách vùng :

Bƣớc 1 : Tìm các đường thẳng gần vùng cần tách nhất

Tìm các đường thẳng gần vùng theo từng cạnh: trên, dưới, trái, phải. Không mất tính tổng quát, ta xét với cạnh trái của vùng.

Giả sử tập các đường thẳng trên mẫu là Lh, Lvvà trên ảnh là '

h L , '

v

L . Sau khi đối chiếu, các đường thẳng không đối chiếu được sẽ bị loại ra khỏi các tập này. Xác định đường thẳng đứng l li(iLv)thỏa mãn điều kiện khoảng cách của đường thẳng này đến cạnh trái có tọa độ Xmin của vùng đang xét là nhỏ nhất.

Bƣớc 2 : Xác định vị trí tương đối của vùng đối với các đường thẳng này

Vị trí tương đối của cạnh trái vùng đang xét trong mẫu với đường thẳng gần nó nhất :

1

Xmin Xmin l

D   X

Công thức 2-11

Bƣớc 3 : Xác định vị trí của vùng trên ảnh dựa vào vị trí tương đối.

Dựa vào thông tin về vùng cần tách, vị trí tương đối của nó đối với các đường thẳng lân cận và hệ số thay đối kích thước giữa hai ảnh, ta tính ra được vùng cần tách trên ảnh scan. Cụ thể là : ' 1 ' min l Xmin XXDscale Công thức 2-12

Tương tự với các cạnh còn lại ta xác định được ' max X , ' min Y , ' max Y (a) (b) (c) (d)

Hình 2-23: (a) vùng nhập dữ liệu trên ảnh mẫu; (b) ảnh scan;

(c) các đƣờng thẳng gần vùng nhập dữ liệu nhất; (d) kết quả tách vùng trên ảnh scan

Từ hình vẽ trên ta thấy, do các vùng cần tách nằm sát các đường thẳng nên các vùng này được tách rất chính xác.

2.2 Nhận dạng vùng nhập liệu

Sau khi tách được các vùng nhập liệu trên ảnh theo các giải pháp đã đề xuất, công việc tiếp theo là nhận dạn. Các vùng dữ liệu cần nhận dạng giới hạn cụ thể trong khuôn khổ luận văn này thuộc các dạng như sau : các vùng đánh dấu, các dãy ô vuông nhập liệu dạng ký tự. Đối với các dãy ô nhập liệu dạng ký tự, ta sẽ chỉ tập trung vào các ký tự dạng số mà đặc biệt là dạng số nét thẳng.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Tách và nhận dạng số viết tay trong phiếu nhập dữ liệu (Trang 48 - 51)

Tải bản đầy đủ (PDF)

(96 trang)