Block trong mẫu và block bị nghiêng trong ảnh scan

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Tách và nhận dạng số viết tay trong phiếu nhập dữ liệu (Trang 27 - 29)

Khi ảnh không bị nghiêng mật độ điểm đen của block là 1/1( 1 điểm đen trên 1 pixel) đối với block dạng hình chữ nhật và hình vuông. Với block dạng hình tròn mật độ điểm đen là π/4.

Khi ảnh bị nghiêng một góc α, với hình tròn thì mật độ điểm đen không thay đổi, tuy nhiên với hình vuông và hình chữ nhật như hình vẽ trên thì mật độ điểm đen trên hình bao quanh block sẽ bị giảm đi.

 sin cos  cos sin 

1 h w h w Density wh       2 2 sin 2 1 1 2 h w Density wh     Công thức 1-12

Cụ thể với block hình vuông bị nghiêng 15% thì mật độ là :

Density = 1/(1 + sin30o) = 2/3

Đối tƣợng gần lề nhất

Như hình 1-13 (e), Khi hai đối tượng a và b có phần trùng nhau khi chiếu lên trục y, nghĩa là YmaxaYminb ,YmaxbYmina , thì đối tượng nào có tọa độ trên trục x lớn hơn sẽ được đánh giá là gần lề hơn.

Trình tự các bước thực hiện thuật toán như sau :

Bƣớc 2 : loại tất cả các đối tượng quá lớn hoặc quá bé

Bƣớc 3 : loại tất cả các đối tượng có mật độ điểm đen nhỏ hơn ngưỡng density Bƣớc 4 : loại tất cả các đối tượng không phải ở phía trái/phải nhất của lề

Bƣớc 5 : xấp xỉ một đường thẳng qua tâm các đối tượng còn lại. Nếu không

tìm được, quay lại bước 1 với các đối tượng ở lề đối diện.

Bƣớc 6 : góc nghiêng của ảnh chính là góc nghiên của đường thẳng tìm được

ở bước 5. Nếu đã biết thông tin về ảnh thuộc form mẫu nào, dựa trên thông tin đã biết trước để xác định ảnh ngược

(a) (b) (c)

(d) (e) (f)

Hình 1-13: (a) ảnh scan bị nghiêng; (b) các đối tƣợng tìm đƣợc trên ảnh; (c) sau khi loại các đối tƣợng quá lớn, bé; (d) sau khi loại các đối tƣợng rỗng; (e) sau khi loại các đối tƣợng không sát lề; (f) xấp xỉ đƣờng

CHƯƠNG 2 – ĐỀ XUẤT GIẢI PHÁP PHÂN VÙNG VÀ NHẬN DẠNG ẢNH ẢNH

2.1 Tách vùng nhập dữ liệu trên ảnh

2.1.1 Đặc trƣng bài toán

Sau các bước tiền xử lý lọc nhiễu, xác định góc nghiêng, công việc tiếp theo cần tiến hành đó là xác định các vùng văn bản cần xử lý, đây cũng chính là đầu vào cho phần nhận dạng dữ liệu.

Văn bản tôi xử lý trong khuôn khổ luận văn này là văn bản dạng form nhập dữ liệu dựa trên mẫu form đã có sẵn. Sau khi form được nhập dữ liệu và quét lại vào máy tính, dựa trên mẫu có sẵn và đối chiếu với ảnh scan, ta tìm các vùng trên ảnh scan được nhập dữ liệu và xử lý nhận dạng trên các vùng này. Dữ liệu sau khi nhận dạng sẽ được lưu lại tương ứng với các trường dữ liệu trong form mẫu. Khi xử lý văn bản, ta không cần nhận dạng toàn bộ văn bản mà chỉ giới hạn nhận dạng trên các vùng mà thông tin được nhập vào.

Điểm khác biệt trong việc phân vùng ảnh trên form nhập dữ liệu và phân vùng ảnh trên văn bản tổng quát là : đối với form nhập dữ liệu, ta thực hiện phân vùng trên ảnh đã biết trước cấu trúc và ta chỉ cần tách ra các vùng đã được định nghĩa từ trước là sẽ được nhập dữ liệu để sau đó tiến hành nhận dạng trên các vùng này. Chính nhờ việc biết trước một số thông tin mà kết quả phân vùng chính xác hơn rất nhiều cũng như thời gian xử lý giảm đi đáng kể do ta chỉ cần tách ra một số vùng cần thiết.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Tách và nhận dạng số viết tay trong phiếu nhập dữ liệu (Trang 27 - 29)

Tải bản đầy đủ (PDF)

(96 trang)