Giới thiệu về hệ thống xử lý biểu mẫu

Một phần của tài liệu Nhận dạng các biểu mẫu tài liệu (Trang 57 - 58)

3.1 Hệ thống xử lý biểu mẫu động

3.1.1Giới thiệu về hệ thống xử lý biểu mẫu

Trong hầu hết các hệ thống xử lý biểu mẫu đang đƣợc sử dụng ngày nay, màu sắc đƣợc sử dụng trong các biểu mẫu, nhƣ là các dòng chữ in giới thiệu hoặc các khung điền thông tin, mục đích nhằm phân tách chúng đối với phần chữ viết tay. Do đó, các hệ thống này sẽ đòi hỏi máy in màu và máy quét ảnh màu hay đầu đọc màu. Các biểu mẫu và các bản copy đồng màu (đen trắng hay đa cấp xám) của chúng không thể sử dụng đƣợc trong trƣờng hợp này. Vì thế chi phí cho các hệ thống này sẽ bị nâng lên cao. Đối ngƣợc lại các biểu mẫu màu, thì các biểu mẫu đồng màu (đen/trắng hoặc đa cấp xám) đòi hỏi chi phí thấp và thuận lợi cho việc sử dụng, nhƣng chúng lại có một số nhƣợc điểm. Chúng ta sẽ gặp khó khăn trong việc phân tách chữ viết tay ra khỏi khung điền trong trƣờng hợp chữ viết tay đè lên khung điền. Đã có nhiều giải pháp đƣợc đƣa ra song vẫn chƣa giải quyết triệt để đƣợc vấn đề này. Hơn nữa, trong hầu hết các hệ thống nhận dạng biểu mẫu đang đƣợc sử dụng, các biểu mẫu đều phải đƣợc đăng ký trƣớc để hệ thống hiểu đƣợc các khung điền ở đâu, cái gì đƣợc viết trong các khung, xử lý từng khung nhƣ thế nào… Để giải quyết vấn đề này, tôi đề xuất sử dụng biểu mẫu “động”. Biểu mẫu động là biểu mẫu có các khung điền đƣợc hình thành bởi các “cấu trúc chấm nhỏ”. Bằng cách thức này, chúng ta có thể dễ dàng phân tách chữ viết tay ra khỏi khung điền một cách nhanh chóng và dễ dàng bằng các thuật toán xử lý ảnh đơn giản. Chúng ta cũng có thể loại bỏ việc đăng ký biểu mẫu mà hệ thống của chúng ta vẫn biết đƣợc các thuộc tính của chữ viết tay, cách xử lý chúng nhƣ thế nào trong từng khung điền bởi vì chúng trong có thể mã hóa thông tin vào khung điền. Việc mã

60

hóa này đƣợc thực hiện thông qua các cấu trúc điểm nhỏ cấu tạo nên khung điền. Chính vì những lý do này mà chúng tôi gọi hệ thống này là “biểu mẫu động”.

Một phần của tài liệu Nhận dạng các biểu mẫu tài liệu (Trang 57 - 58)