Xác định vùng dựa vào vị trí tương đối đến các các mốc quy chiếu trên form

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Tách và nhận dạng số viết tay trong phiếu nhập dữ liệu (Trang 31 - 37)

CHƯƠNG 2 ĐỀ XUẤT GIẢI PHÁP PHÂN VÙNG VÀ NHẬN DẠNG ẢNH . 21

2.1 Tách vùng nhập dữ liệu trên ảnh

2.1.3 Xác định vùng dựa vào vị trí tương đối đến các các mốc quy chiếu trên form

Trong phương pháp phân vùng trình bày ở trên, do trong quá trình scan, ảnh có thể bị biến dạng làm cho vị trí các vùng thay đổi. Thêm vào đó, sai số trong việc xác định góc quay và độ dịch của ảnh cũng ảnh hưởng đến vị trí tuyệt đối của các vùng. Theo phương pháp này, các vùng càng xa gốc tọa độ thì sai số về vị trí càng lớn.

Tuy nhiên phương pháp này đơn giản và dễ cài đặt.

Để giảm bớt sai số, tách vùng ảnh thường được thực hiện thông qua vị trí tương đối đến các mốc quy chiếu. Việc chọn các đối tượng làm mốc quy chiếu có ảnh hưởng rất lớn đến độ chính xác. Một số phương pháp có thể kể đến như [12] sử dụng chuỗi ký tự được nhận dạng trên form, [27] sử dụng ma trận giao điểm của các đường thẳng, [20] [21] sử dụng danh sách các khối đối tượng( cụm ký tự, ảnh,…). Các phương pháp này một mặt khá nhạy cảm với nhiễu và biến dạng của ảnh, mặt khác có thể kém chính xác khi không xác định được đầy đủ các đối tượng trong danh sách.

Khối lượng tính toán lớn cũng là một trong những vấn đề cần cân nhắc. Tuy nhiên các phương pháp này có thể áp dụng được trên form tổng quát.

Phương pháp tách vùng tôi trình bày trong phần này sử dụng các block là các hộp đen hoặc các ô tròn bên lề form. Đây là các đối tượng bền vững với nhiễu và biến dạng ảnh. Chi phí tính toán nhỏ cùng với độ chính xác cao là lý do tôi lựa chọn phương pháp này.

Theo đó, Vị trí của vùng sẽ được tính thông qua vị trí tương đối, là vị trí tới đối tượng lân cận đã đƣợc phát hiện trên ảnh. Vị trí này thay đổi tùy thuộc vào đối tượng và kết quả xác định những đối tượng trước đó. Những đối tượng đầu tiên cần được phát hiện trên ảnh là những đối tượng có đặc điểm nổi bật nhất - các block đen bên lề của form. Trong phần xác định góc nghiêng ở chương trước, các block đen trên ảnh có một vai trò rất quan trọng, dựa vào các ô này ảnh có thể được khử nghiêng và phát hiện ảnh ngược nhanh hơn rất nhiều so với các phương pháp tổng quát. Bên cạnh đó, ý nghĩa chính của việc sử dụng các ô đen là để cung cấp một mốc quy chiếu từ đó xác định vị trí các vùng nhập dữ liệu.

2.1.3.1 Phát hiện các block đen bên cạnh ảnh

Trong phần trước, để tìm được góc nghiêng của ảnh, chỉ cần xác thực sự tồn tại của dãy ô đen bên cạnh ảnh. Tuy nhiên để có thể dựa vào các đối tượng này để xác định những vùng nhập liệu thì trước hết phải biết được ảnh là ảnh của form mẫu nào và thứ tự tương ứng của các block so với các block của mẫu.

Trình tự thực hiện như sau :

Bước 1: xác định tất cả các block bên lề của ảnh( thực hiện ở chương trước) Bước 2: nội suy các ô bị mất

Blocks là những đối tượng có kích thước tương đối, có mức xám bằng không do đó khá bền vững trước những biến dạng của ảnh cũng như không bị ảnh hưởng bởi nhiễu trừ những trường hợp đặc biệt. Tuy nhiên block đầu tiên và cuối cùng có thể bị mất nếu các block đặt quá sát lề và khi scan ảnh bị đặt lệch.

Những block không tìm thấy sẽ được nội suy từ những block khác với khoảng cách đến block gần nhất bằng khoảng cách trung bình giữa các block

Hình 2-4: Nội suy block bị mất

Bước 3: đối chiếu khoảng cách giữa các block này với các block trong mẫu để xác định tỉ lệ co giãn ảnh với giả thiết là ảnh co giãn theo cùng một tỉ lệ ở cả chiều dọc và chiều ngang

Hình 2-5: Khoảng cách các block trong mẫu và trong ảnh scan

Tỉ lệ co giãn giữa ảnh so với mẫu ở trên là

H 1

scale

H

Công thức 2-2: độ co giãn của ảnh scan so với ảnh mẫu

Sau các bước trên ta đã có được sự tương ứng 1:1 giữa các block trên ảnh và trên mẫu cũng như tỉ lệ co giãn ảnh. Những thông tin này sẽ được sử dụng để xác định các vùng nhập liệu.

2.1.3.2 Xác định vùng nhập liệu

Như đã phân tích ở trên, khoảng cách của một đối tượng đến một đối tượng khác càng gần thì việc sử dụng đối tượng này để suy ra vị trí của đối tượng kia càng chính xác. Với các thông tin đã biết trước về vị trí tuyệt đối của các vùng nhập liệu và các mốc quy chiếu trong mẫu, ta cần suy ra vị trí tương đối của từng vùng nhập liệu đến mốc quy chiếu gần nhất để tìm vị trí của các vùng này trên ảnh.

Với hướng tiếp cận của giải pháp này, sau tiền xử lý ảnh các mốc quy chiếu đầu tiên là các block đen bên cạnh ảnh. Các vùng nhập liệu tìm được bởi các mốc quy chiếu này sẽ tiếp tục được đưa vào danh sách quy chiếu và có thể được sử dụng để tìm vị trí các vùng nhập liệu khác. Việc xác định các vùng được thực hiện như vậy cho đến khi xác định được tất cả các vùng nhập liệu trên ảnh.

Trình tự thực hiện như sau :

Bước 1: tương ứng các block trên ảnh với các block trong mẫu, đưa vào tập mốc quy chiếu

Giả sử trong mẫu có n blocks : b b 1 , 2 ,..., b n , ta tìm được n blocks trong ảnh

' ' '

1 , 2 ,..., n

b b b tương ứng với các blocks trong mẫu. Đưa hai tập này vào hai tập mốc quy chiếu QQ '

Hình 2-6: Tương ứng các mốc quy chiếu trong ảnh scan và trong mẫu

Bước 2: Chọn ra vùng nhập liệu trong mẫu có mốc quy chiếu gần nhất.

Tập vùng nhập liệu được định nghĩa trong mẫu là A , tìm vùng nhập liệu

 

i i

a aA sao cho tồn tại một mốc quy chiếu q q j ( jQ ) thỏa mãn khoảng cách từ q j đến a i là gần nhất nghĩa là Distance( , ) q a j i  min Distance(  q a q k , l ) kQ a , lA

Hình 2-7: Mốc quy chiếu gần nhất đến các vùng nhập liệu

Ví dụ như trong mẫu trên, block 1 là đối tượng mốc quy chiếu gần nhất của vùng 1 và vùng 2. Vùng 1 được chọn do khoảng cách của nó đến mốc quy chiếu là gần nhất.

Bước 3: xác định vùng tìm kiếm cho vùng nhập liệu được chọn ra ở bước 2 được suy ra từ mốc quy chiếu gần vùng này nhất và tỉ lệ co giãn tìm được ở trên.

Trên mẫu vùng a i được giởi hạn bởi hình bao H X a ( min a , Y min a , X max a , Y max a ) , q j được giới hạn bởi hình bao H q ( X min q , Y min q , X max q , Y max q ) , mốc quy chiếu tương ứng với q j tìm được trên ảnh là q ' j được giởi hạn bởi hình bao H q ' ( X min q ' , Y min q ' , X max q ' , Y max q ' ) . Vùng xác định để tìm kiếm a i trên ảnh là H a ' ( X min a ' , Y min a ' , X max a ' , Y max a ' ) được suy ra bởi H a , H q , H q ' và tỉ lệ co giãn ảnh scale như sau :

Tìm X min a ' , giả sử abs X ( min aX min q )  abs X ( min aX max q ) thì

' '

min a min q ( min a min q )

XXXX scale

Công thức 2-3: Vùng tìm kiếm đƣợc suy ra từ mốc quy chiếu và độ co giãn ảnh

Làm tương tự với các cạnh còn lại ta sẽ xác định được H a '

Hình 2-8: Vùng tìm kiếm đƣợc xác định trên ảnh

Bước 4: Nhận dạng vùng này, đánh dấu vùng này đã được xác định và thêm vùng này vào danh sách quy chiếu. Quay lại bước 2.

Nhận dạng vùng nhập liệu được xác định bởi hình bao H a ' theo các phương pháp được trình bày trong 3.2. Sau khi nhận dạng vùng bao H a ' sẽ được chính xác hóa.

Ta thêm vùng nhập liệu a i và vùng nhập liệu đã nhận dạng a i ' vào hai tập mốc quy chiếu QQ ' . Hai vùng nhập liệu này có thể được coi là mốc quy chiếu để tìm kiếm các vùng nhập liệu tiếp theo.

Hình 2-9: Vùng nhập liệu đƣợc sử dụng làm mốc quy chiếu

Hình 2-10: Cập nhật khoảng cách đến mốc quy chiếu gần nhất

Kết luận : qua quá trình nghiên cứu, giải pháp này đã chứng minh được tính hiệu quả và thực dụng trong việc nhận dạng form dữ liệu, đặc biệt là trong việc nhận dạng với số lượng lớn. Những ưu điểm và nhược điểm của phương pháp

Ưu điểm :

 Cho độ chính xác cao, thời gian xử lý nhanh

 Dễ kiểm soát và bảo trì Nhược điểm :

 Ảnh buộc phải có các block ở bên lề, có thể tạo ra một số vấn đề về mặt thẩm mỹ

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Tách và nhận dạng số viết tay trong phiếu nhập dữ liệu (Trang 31 - 37)

Tải bản đầy đủ (PDF)

(96 trang)