- 4 1tiế n hành khi chúng ta đ ã xây d ự ng đựợ c
a) Giải pháp khử nghiêng
Qua việc nghiên cứu rất nhiều dạng Form văn bản khác nhau bao gồm cả văn bản tiếng việt và tiếng anh cùng với việc nghiên cứu nhiều thuật tốn, chúng tơi thấy rằng phương pháp phép chiếu là một phương pháp thích hợp để xác định gĩc nghiêng của các form văn bản trong phạm vi của bài tốn. Bởi vì :
• Phương pháp phép chiếu cho kết quả với độ chính cao trên các form văn bản thuộc pham vi của bài tốn. • Cĩ thể thực hiện một số cải tiến để giảm bớt khối lượng tính tốn. • Dễ hiểu, dễ bảo trì. b) Giải pháp phân vùng ảnh Dựa trên đặc điểm của kiểu form nhập dữ liệu là dữ liệu được nhập vào các ơ trên form ( nghĩa là nằm trong giới hạn giữa các đường thẳng) Chúng tơi đưa ra thuật tốn xác định vùng nhập dữ liệu thơng qua việc xác định các đường thẳng.
Trong phương pháp này, trước tiên chúng tơi nhận dạng tất cả các đường thẳng cĩ trong ảnh. Sau đĩ các đường thẳng này sẽ được đối chiếu với các đường thẳng cĩ trong form mẫu để xác định thứ tự chính xác và khử nhiễu. Cuối cùng sau khi nhận dạng được các đường thẳng, vùng nhập dữ liệu sẽ được tính thơng qua tọa độ gián tiếp tới các đường thẳng đĩ. Và bởi vì các tọa độ gián tiếp này là các tọa độ địa phương nên độ chính xác trong việc xác định các vùng là rất cao.
4. Thực nghiệm
Với mục đích đánh giá độ chính xác và hiệu năng thực hiện của các phương pháp, chúng tơi đã tuyển tập rất nhiều các tài liệu dạng ảnh trên các kiểu form khác nhau như: phiếu đăng ký, phiếu điều tra, hĩa đơn, ….Các ảnh này được tìm thấy phần lớn là thơng qua trang tìm kiếm Google để cĩ thểđảm bảo được sựđa dạng về kiểu form, về chất lượng ảnh, về kích cỡ và ngơn ngữ.