Bƣớc 3: Tìm độ dài giả địnhLeni0 i 9 của các số từ 0 đến 9 nếu được viết trong hình bao này
Ví dụ : nếu số 1 được viết trong hình bao( kích thước WH) do số 1 tạo bởi hai nét 6 và 7(hình 2-41) nên Len1H. Nếu số 2 được viết, do số 2 được tạo bởi 3 nét ngang 1,2,3 và hai nét đứng 5 và 6 nên Len2 3 W H
Bƣớc 4 : Xác định số dựa vào mức độ hoàn thiện nét của các nét tìm được so
Các nét tìm được trong hình bao có độ dài lần lượt là stroke stroke1, 2,...,stroke7( những nét nào không có thì có độ dài là 0). Tổng độ dài của các nét
7 1 sum k k l stroke Công thức 2-14 Tập các nét tạo nên số i(0 i 9) là Si k:1 k 7
Độ dài của các nét trong hình để tạo nên số i là
i i j j S l stroke Công thức 2-15
Độ dài của các nét lỗi
i sum i
e l l
Công thức 2-16
Các nét lỗi là các nét làm cho số trong hình khác với số i, nét lỗi càng nhiều thì càng làm cho sai biệt lớn. Do đó để đánh giá ta phải nhân độ dài các nét lỗi với một hệ số âm
Đánh giá số trong hình bao so với số i dựa trên công thức
i i i l e Len Công thức 2-17
Xét i với các giá trị từ 0 đến 9, kết quả nhận dạng là giá trị i làm cho biểu thức trên có giá trị là lớn nhất.
Nhận xét : phương pháp đề xuất đơn giản và dễ cài đặt. Các số được điền
cũng không cần quá thẳng hoặc bám sát vào khung hướng dẫn được in sẵn trong ô. Do đó người nhập form có thể dễ dàng thực hiện mà không cần chỉ dẫn nhiều.
Thực nghiệm cho thấy độ chính xác của phương pháp này là rất cao. Tuy có nhược điểm là không nhận dạng được số viết tay thông thường nhưng với những ưu điểm đã nêu, các ô số dạng nét thẳng vẫn có thể được áp dụng rộng rãi vào các form nhập liệu trên thực tế.
CHƯƠNG 3 - XÂY DỰNG HỆ THỐNG TÍCH HỢP
Trong các chương trước, tôi đã trình bày các bước trong quy trình nhận dạng ảnh bao gồm tiền xử lý, tách vùng, nhận dạng. Một vấn đề xuyên suốt toàn bộ luận văn đó là nhận dạng ảnh được thực hiện dựa trên các thông tin đã biết trước về mẫu sử dụng để tạo ra ảnh. Các thông tin này cần được lưu trữ, sắp xếp một cách hợp lý nhằm hỗ trợ cho nhận dạng và quản lý.
Khác với các hệ thống nhận dạng ảnh khác như hệ thống chấm thi trắc nghiệm, hệ thống bầu cử,… Những hệ thống này là những hệ thống gắn chặt với một nghiệp vụ cụ thể và thông thường chỉ có một hặc vài loại phiếu nhập. Các thông tin trên phiếu nhập được liên kết với các dữ liệu có ngữ nghĩa trong cơ sở dữ liệu và được sử dụng để thực hiện các chức năng của hệ thống như phân loại sinh viên, lập báo cáo,... Phiếu nhập trong những hệ thống này hoàn toàn có thể được thay thể bởi một form trong chương trình để nhập thông tin vào từ máy tính thay vì điền vào phiếu trên giấy sau đó nhận dạng.
Hệ quản trị phiếu nhập được xây dựng ở đây là một chương trình trung gian. Là phần chỉ liên quan đến xử lý ảnh được tách riêng ra khỏi các hệ thống trên. Trong hệ thống này các mẫu phiếu được thiết kế và nhận dạng để được sử dụng trong các ứng dụng độc lập khác. Dữ liệu nhận dạng tương ứng cũng được đưa vào cơ sở dữ liệu của các ứng dụng đó. Hệ quản trị phiếu không nhằm mục đích quản lý các dữ liệu nhận dạng được mà chỉ quản lý các thông tin dùng để định nghĩa và hỗ trợ cho nhận dạng.
Bên cạnh quản trị phiếu nhập, hệ thống hoàn thiện cũng cần phải có một quy trình xử lý ảnh tích hợp các giải pháp đã trình bày ở các chương 2, 3 bắt đầu từ khi nhận được ảnh cho đến khi có được kết quả nhận dạng cuối cùng.
Chương xây dựng hệ thống tích hợp sẽ tập trung vào các chức năng : quản trị phiếu nhập( thiết kế form, lưu trữ và quản lý form), hỗ trợ nhận dạng form.
3.1 Phân tích bài toán
Chức năng quản trị phiếu nhập đảm nhiệm tất cả các công việc liên quan đến lưu trữ, thiết kế, chỉnh sửa form. Người dùng có thể lựa chọn form đã tạo từ trước, hoặc tạo ra form mới để chỉnh sửa. Những thay đổi đến bất cứ thành phần nào trên form sẽ được ghi nhận. Sau đó, form có thể được xuất ra ảnh hoặc in ra giấy, khi đã được điền thông tin form được quét qua máy scan và tạo ra các file ảnh cần xử lý.
Chức năng hỗ trợ nhận dạng hỗ trợ người dùng thực hiện xử lý ảnh một cách trực quan. Người dùng có thể tiến hành các chức năng xử lý ảnh riêng biệt như tách nền, chỉnh góc nghiêng, tìm đường thẳng để thấy được các kết quả trung gian trong toàn bộ quá trình xử lý. Kết quả cuối cùng khi tích hợp các module nhận dạng sẽ được
lưu lại và sử dụng sau đó với các mục đích cụ thể ví dụ như đưa vào cơ sở dữ liệu của ứng dụng có sử dụng mẫu phiếu của ảnh được xử lý.
Mô tả form
Mẫu form mà luận văn hướng đến áp đặt một số quy tắc cần thiết giúp nâng cao độ chính xác khi nhận dạng. Một mẫu form nhập liệu điển hình có những đặc điểm như sau:
Form có thể có các dòng chữ bao gồm tiêu đề của mẫu, nội dung, hướng dẫn nhập liệu, chú thích,…
Form có thể có một dãy block ở bên lề .
Form có thể chứa mã của mẫu phiếu và mã của số thứ tự tờ trong mẫu, giúp cho việc tự động xác định mẫu khi xử lý ảnh.
Form có thể chứa các hình ảnh, biểu tượng được thêm vào để trang trí, các đường thẳng để phân chia khu vực nhập liệu,…
Form có các vùng đánh dấu được định nghĩa cụ thể bao gồm số hàng, số cột, hình dạng( tròn/vuông) để phục vụ cho việc hiển thị và các thông tin đơn định dạng, đa định dạng, nhóm dòng/cột để phục vụ cho nhận dạng.
Form có các ô nhập dữ liệu dạng số, ký tự được định nghĩa bao gồm các thông số hiển thị như : số ô, kích thước ô, độ dày đường bao,… và các thông số hỗ trợ nhận dạng như định dạng của dữ liệu sẽ được nhập vào trong ô : chữ/số/số vuông.
Sau đây là một số mẫu phiếu được thiết kế bởi module quản trị phiếu nhập tuân thủ các ràng buộc đã xác định.