(a)ảnh gốc; (b)ảnh scan sau khi tiền xử lý

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Tách và nhận dạng số viết tay trong phiếu nhập dữ liệu (Trang 31 - 33)

Nhận xét :

 Ưu điểm : đơn giản, dễ hiểu, dễ cài đặt, tính toán đơn giản

 Nhược điểm : độ chính xác không cao nhất là trên những ảnh có kích thước lớn

2.1.3 Xác định vùng dựa vào vị trí tƣơng đối đến các các mốc quy chiếu trên form

Trong phương pháp phân vùng trình bày ở trên, do trong quá trình scan, ảnh có thể bị biến dạng làm cho vị trí các vùng thay đổi. Thêm vào đó, sai số trong việc xác định góc quay và độ dịch của ảnh cũng ảnh hưởng đến vị trí tuyệt đối của các vùng. Theo phương pháp này, các vùng càng xa gốc tọa độ thì sai số về vị trí càng lớn. Tuy nhiên phương pháp này đơn giản và dễ cài đặt.

Để giảm bớt sai số, tách vùng ảnh thường được thực hiện thông qua vị trí tương đối đến các mốc quy chiếu. Việc chọn các đối tượng làm mốc quy chiếu có ảnh hưởng rất lớn đến độ chính xác. Một số phương pháp có thể kể đến như [12] sử dụng chuỗi ký tự được nhận dạng trên form, [27] sử dụng ma trận giao điểm của các đường thẳng, [20] [21] sử dụng danh sách các khối đối tượng( cụm ký tự, ảnh,…). Các phương pháp này một mặt khá nhạy cảm với nhiễu và biến dạng của ảnh, mặt khác có thể kém chính xác khi không xác định được đầy đủ các đối tượng trong danh sách.

Khối lượng tính toán lớn cũng là một trong những vấn đề cần cân nhắc. Tuy nhiên các phương pháp này có thể áp dụng được trên form tổng quát.

Phương pháp tách vùng tôi trình bày trong phần này sử dụng các block là các hộp đen hoặc các ô tròn bên lề form. Đây là các đối tượng bền vững với nhiễu và biến dạng ảnh. Chi phí tính toán nhỏ cùng với độ chính xác cao là lý do tôi lựa chọn phương pháp này.

Theo đó, Vị trí của vùng sẽ được tính thông qua vị trí tương đối, là vị trí tới đối tượng lân cận đã đƣợc phát hiện trên ảnh. Vị trí này thay đổi tùy thuộc vào đối

tượng và kết quả xác định những đối tượng trước đó. Những đối tượng đầu tiên cần được phát hiện trên ảnh là những đối tượng có đặc điểm nổi bật nhất - các block đen bên lề của form. Trong phần xác định góc nghiêng ở chương trước, các block đen trên ảnh có một vai trò rất quan trọng, dựa vào các ô này ảnh có thể được khử nghiêng và phát hiện ảnh ngược nhanh hơn rất nhiều so với các phương pháp tổng quát. Bên cạnh đó, ý nghĩa chính của việc sử dụng các ô đen là để cung cấp một mốc quy chiếu từ đó xác định vị trí các vùng nhập dữ liệu.

2.1.3.1 Phát hiện các block đen bên cạnh ảnh

Trong phần trước, để tìm được góc nghiêng của ảnh, chỉ cần xác thực sự tồn tại của dãy ô đen bên cạnh ảnh. Tuy nhiên để có thể dựa vào các đối tượng này để xác định những vùng nhập liệu thì trước hết phải biết được ảnh là ảnh của form mẫu nào và thứ tự tương ứng của các block so với các block của mẫu.

Trình tự thực hiện như sau :

Bƣớc 1: xác định tất cả các block bên lề của ảnh( thực hiện ở chương trước) Bƣớc 2: nội suy các ô bị mất

Blocks là những đối tượng có kích thước tương đối, có mức xám bằng không do đó khá bền vững trước những biến dạng của ảnh cũng như không bị ảnh hưởng bởi nhiễu trừ những trường hợp đặc biệt. Tuy nhiên block đầu tiên và cuối cùng có thể bị mất nếu các block đặt quá sát lề và khi scan ảnh bị đặt lệch.

Những block không tìm thấy sẽ được nội suy từ những block khác với khoảng cách đến block gần nhất bằng khoảng cách trung bình giữa các block

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Tách và nhận dạng số viết tay trong phiếu nhập dữ liệu (Trang 31 - 33)

Tải bản đầy đủ (PDF)

(96 trang)