Tách và nhận dạng số viết tay trong phiếu nhập dữ liệu

94 475 0
Tách và nhận dạng số viết tay trong phiếu nhập dữ liệu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

i MỤC LỤC MỤC LỤC i MỘT SỐ THUẬT NGỮ ANH-VIỆT iii DANH MỤC HÌNH VẼ iv DANH MỤC BẢNG vi MỞ ĐẦU 1 1.1 Đặt vấn đề 1 1.2 Nội dung và cấu trúc của khóa luận 3 Mở đầu 3 Chương 1: Đề xuất giải pháp tiền xử lý ảnh 4 Chương 2: Đề xuất giải pháp phân vùng và nhận dạng ảnh 4 Chương 3: Xây dựng hệ thống tích hợp 5 Chương 4: Thực nghiệm 5 Kết luận 5 CHƢƠNG 1 – ĐỀ XUẤT GIẢI PHÁP TIỀN XỬ LÝ ẢNH 6 1.1 Lọc nhiễu và nhị phân hoá. 6 Mô tả thuật toán 6 1.2 Xác định góc nghiêng của ảnh 11 1.2.1 Phương pháp xác định góc nghiêng dựa trên phép chiếu. 13 1.2.2 Phương pháp xác định góc nghiêng dựa trên các block. 18 CHƢƠNG 2 – ĐỀ XUẤT GIẢI PHÁP PHÂN VÙNG VÀ NHẬN DẠNG ẢNH . 21 2.1 Tách vùng nhập dữ liệu trên ảnh 21 2.1.1 Đặc trưng bài toán 21 2.1.2 Xác định vùng nhập liệu dựa trên các mốc quy chiếu 22 2.1.3 Xác định vùng dựa vào vị trí tương đối đến các các mốc quy chiếu trên form 23 2.1.4 Xác định vùng nhận dạng dựa trên vị trí tương đối đến các đường thẳng 29 2.2 Nhận dạng vùng nhập liệu 42 2.2.1 Nhận dạng vùng đánh dấu 43 2.2.2 Nhận dạng vùng nhập liệu dạng số 48 CHƢƠNG 3 - XÂY DỰNG HỆ THỐNG TÍCH HỢP 55 3.1 Phân tích bài toán 55 3.2 Xây dựng hệ thống 62 3.2.1 Xác định các đối tượng 62 3.2.2 Mô hình khái niệm 63 3.2.3 Biểu đồ các quy trình thiết kế, nhận dạng 67 CHƢƠNG 4 – THỰC NGHIỆM 72 4.1 Môi trường thực nghiệm 72 ii 4.2 Thực nghiệm về Lọc nhiễu, tách nền và tìm ngưỡng nhị phân hóa. 72 4.3 Thực nghiệm về xác định góc nghiêng của ảnh dựa trên phép chiếu 73 4.4 Thực nghiệm về xác định góc nghiêng của ảnh dựa trên block 75 4.5 Thực nghiệm về phân vùng ảnh dựa trên block 76 4.6 Thực nghiệm về phân vùng ảnh dựa trên đường thẳng 77 4.6.1 Thực nghiệm 1: Xác định các đường thẳng 77 4.6.2 Thực nghiệm 2: Tìm cặp các đường thẳng giữa ảnh scan với ảnh mẫu. 78 4.6.3 Thực nghiệm 3: Xác định các vùng cần nhận dạng 78 4.6.4 Thực nghiệm 4: tìm kích thước trung bình trên ảnh 79 4.7 Thực nghiệm nhận dạng 80 4.7.1 Thực nghiệm nhận dạng ô đánh dấu 80 4.7.2 Thực nghiệm nhận dạng số 81 4.8 Thực nghiệm tích hợp các thành phần 81 KẾT LUẬN 83 TÀI LIỆU THAM KHẢO 85 iii MỘT SỐ THUẬT NGỮ ANH-VIỆT Thuật ngữ Giải nghĩa Black run Tập hợp các điểm đen liên tiếp kề nhau theo chiều thẳng đứng hoặc theo chiều ngang trên ảnh Block Một hoặc một cụm các đối tượng được coi là liền kề nhau Bounding Box Hình hộp bao quanh một đối tượng hay một khối các đối tượng Deskew Khử nghiêng DPI Dots per inch – Số lượng các điểm trên một inch Form Recognition Nhận dạng form Object Là một tập hợp các điểm đen liền kề nhau để tạo nên một đối tượng như chữ cái, đường thẳng, điểm, … Region Extraction Tách vùng Resolution Độ phân giải Skewed Image Ảnh bị nghiêng iv DANH MỤC HÌNH VẼ Hình 1-1: Lƣợc đồ mức xám của ảnh 7 Hình 1-2: Đồ thị biến đổi mức xám 8 Hình 1-3: Ảnh trƣớc (a) và sau biến đổi lần 1 (b) 9 Hình 1-4: (a) Ảnh scan; (b) Ảnh sau lần lọc thứ nhất; (c) Ảnh sau lần lọc cuối cùng; (d) Ảnh sau khi nhị phân hóa 11 Hình 1-5: (a) ảnh sau khi khử nhiễu và tách nền; (b) ảnh sau khi khử nghiêng 12 Hình 1-6: (a)ảnh với góc nghiêng bằng không; (b) đồ thị của phép chiếu ngang trên ảnh (a) 13 Hình 1-7: (a) ảnh với góc nghiêng 5 0 ; (b) đồ thị của phép chiếu ngang trên ảnh (a) 13 Hình 1-8: (a) Ảnh scan, các đƣờng màu đỏ là các đƣờng chiếu ở góc nghiêng θ. (b) Ảnh đƣợc xấp xỉ bởi các hình bình hành 15 Hình 1-9: (a) Ảnh scan. (b) (c) (d) Ảnh các đƣờng chiếu đen và trắng ở các góc nghiêng - 2.5, -3.5, 2 15 Hình 1-10: (a) Ảnh scan. (b) Ảnh sau khi chính xác góc nghiêng 17 Hình 1-11: Một phần ảnh mẫu với các block ở lề phải 18 Hình 1-12: block trong mẫu và block bị nghiêng trong ảnh scan 19 Hình 1-13: (a) ảnh scan bị nghiêng; (b) các đối tƣợng tìm đƣợc trên ảnh; (c) sau khi loại các đối tƣợng quá lớn, bé; (d) sau khi loại các đối tƣợng rỗng; (e) sau khi loại các đối tƣợng không sát lề; (f) xấp xỉ đƣờng thẳng qua các block 20 Hình 2-1: form mẫu và các vùng nhập dữ liệu đƣợc định nghĩa 21 Hình 2-2: Form sau khi đƣợc in ra, điền thông tin và scan vào máy tính 22 Hình 2-3: (a) ảnh gốc; (b) ảnh scan sau khi tiền xử lý 23 Hình 2-4: Nội suy block bị mất 25 Hình 2-5: Khoảng cách các block trong mẫu và trong ảnh scan 25 Hình 2-6: Tƣơng ứng các mốc quy chiếu trong ảnh scan và trong mẫu 26 Hình 2-7: Mốc quy chiếu gần nhất đến các vùng nhập liệu 27 Hình 2-8: Vùng tìm kiếm đƣợc xác định trên ảnh 27 Hình 2-9: Vùng nhập liệu đƣợc sử dụng làm mốc quy chiếu 28 Hình 2-10: Cập nhật khoảng cách đến mốc quy chiếu gần nhất 28 Hình 2-11: (a)ảnh sau khi tiền xử lý; (b)ảnh sau khi lọc các black run ngắn theo chiều ngang (c) ảnh sau khi hợp cách black run dài theo chiều ngang; (d) ảnh sau khi lọc các black run ngắn theo chiều thẳng đứng (e)ảnh sau khi hợp các black run dài theo chiều thẳng đứng (f)các đƣờng thẳng xác định đƣợc trên ảnh 30 Hình 2-12: (a) đƣờng thẳng mờ và bị đứt doạn (b) đƣờng thẳng xác định đƣợc khi tính đến mật độ 31 Hình 2-13: xác định nhầm đƣờng thẳng do phân bố không đều trên đƣờng 31 Hình 2-14: chia đƣờng thẳng thành các đoạn ngắn rồi tính mật độ trên các đoạn này 32 Hình 2-15: Ảnh cần xác định kích thƣớc font chữ trung bình 36 Hình 2-16: Hình chữ nhật bao các đối tƣợng tìm đƣợc trên ảnh 36 Hình 2-17: Hình chữ nhật bao quanh các đối tƣợng chữ tìm đƣợc trên ảnh 36 Hình 2-18: Đối tƣợng tạo bởi các black run 37 v Hình 2-19: gán nhãn các đối tƣợng trên ảnh nhị phân 38 Hình 2-20: ảnh sau khi giảm bớt các điểm đen 39 Hình 2-21: Kết quả xác định các đối tƣợng 40 Hình 2-22: Hình chữ nhật bao quanh các đôi tƣợng tìm đƣợc 40 Hình 2-23: (a) vùng nhập dữ liệu trên ảnh mẫu; (b) ảnh scan; (c) các đƣờng thẳng gần vùng nhập dữ liệu nhất; (d) kết quả tách vùng trên ảnh scan 42 Hình 2-24: Những kiểu vùng nhập dữ liệu giải quyết trong luận văn 43 Hình 2-25: Vùng đánh dấu trả lời câu hỏi trong bài thi trắc nghiệm 43 Hình 2-26: Kết quả phép chiếu theo chiều ngang 44 Hình 2-27: Các phân đoạn tiềm năng 45 Hình 2-28: Các phân đoạn đúng tìm đƣợc 45 Hình 2-29: (a) Kết quả phép chiếu theo chiều dọc, (b) các phân đoạn tiềm năng, (c) các phân đoạn đúng tìm đƣợc 45 Hình 2-30: Vùng nhập số 48 Hình 2-31: (a) vùng tìm kiếm bị mất đƣờng bao; (b) vùng tìm kiếm đƣợc mở rộng 48 Hình 2-32: Các đƣờng thẳng trong vùng 49 Hình 2-33: Các đƣờng thẳng sau bƣớc 2 49 Hình 2-34: Các đƣờng thẳng sau bƣớc 3 49 Hình 2-35: Các đƣờng đứng xác định đƣợc sau bƣớc 4 49 Hình 2-36: Kết quả tách ô bởi các đƣờng thẳng bƣớc 3,4 50 Hình 2-37: Vùng nhập số trong mẫu và trong ảnh scan 50 Hình 2-38: Ảnh trƣớc và sau khi lọc nhiễu 51 Hình 2-39: Hình bao xác định đƣợc trên ảnh 51 Hình 2-40: Các nét cơ bản tạo nên số dạng nét thẳng 51 Hình 2-41: Các số mẫu từ 0 đến 9 51 Hình 2-42: Các nét ngang 52 Hình 2-43: Các nét đứng 52 Hình 3-1: Mẫu form nhập liệu “Sample Dta Etry Form” 57 Hình 3-2: Mẫu form nhập liệu “Sample Data Entry Form” có sử dụng block 58 Hình 3-3: Mẫu form nhập liệu “Mẫu Dữ Liệu Số” với các block và vùng định danh form 59 Hình 3-4: Mẫu form nhập liệu “Mẫu Phiếu Trả Lời Bài Thi Trắc Nghiệm” 60 Hình 3-5: Mẫu form nhập liệu “Phiếu Đánh giá môn học” 61 Hình 3-6: Mô hình khái niệm 64 Hình 3-7: Quy trình thiết kế mẫu phiếu 68 Hình 3-8: Vùng mã form trên ảnh 69 Hình 3-9: Quy trình nhận dạng mẫu phiếu khi chƣa biết mã phiếu 70 Hình 3-10: Quy trình nhận dạng mẫu phiếu khi đã biết mã phiếu 71 Hình 4-2: Vùng cần xác định bị lệch so với vùng xác định thực tế 79 Hình 4-3: (a) Ảnh mẫu (b) Kết quả thu đƣợc sau khi phân vùng 79 Hình 4-1: (a) ảnh thử nghiệm; (b) Một phần của ảnh đƣợc phóng to 80 vi DANH MỤC BẢNG Bảng 1: Bảng phân loại ảnh 72 Bảng 2: Lọc nhiễu 73 Bảng 3: Góc nghiêng với ảnh 150DPI 74 Bảng 4: độ lệch trung bình so với góc thực tế 74 Bảng 5: So sánh hiệu năng của phƣơng pháp phép chiếu tối ƣu với phƣơng pháp phép chiếu 75 Bảng 6: Kết quả xác định góc nghiêng bằng block 76 Bảng 7: Thời gian xâc định block 76 Bảng 8: Độ chính xác phƣơng pháp tách vùng dựa trên block 77 Bảng 9: Độ chính xác của phƣơng pháp xác định đƣờng thẳng 77 Bảng 10: Độ chính xác của phƣơng pháp ghép cặp các đƣờng thẳng trong tập mẫu và tập ảnh mới 78 Bảng 11: Độ chính xác phƣơng pháp tách vùng dựa trên đƣờng thẳng 79 Bảng 12: Kết quả xác định kích thƣớc trung bình của các đối tƣợng 80 Bảng 13: Thời gian xác định kích thƣớc trung bình 80 Bảng 14: Độ chính xác phƣơng pháp tách vùng dựa trên đƣờng thẳng 81 Bảng 15: Kết quả thực nghiệm nhận dạng số 81 Bảng 16: Kết quả thực nghiệm tích hợp 82 1 MỞ ĐẦU 1.1 Đặt vấn đề Nhận dạng là bài toán đã xuất hiện khá lâu và đã đạt được nhiều thành tựu. Tuy nhiên nhận dạng một văn bản bất kì bao gồm cả các văn bản có lẫn chữ viết tay hoặc hình ảnh luôn là một bài toán khó mà cho đến nay vẫn chưa thật sự có giải pháp hoàn chỉnh. Để giải quyết bài toán nhận dạng hiện đang có nhiều xu hướng tiếp cận khác nhau tương ứng với những loại văn bản khác nhau, trong đó nhập dữ liệu tự động là phương pháp tiếp cận về nhận dạng đối với các văn bản kiểu form nhập liệu. Càng ngày nhu cầu xử lý dữ liệu của con người trên máy tính càng tăng lên. Chính vì lý do đó bài toán nhập dự liệu tự động đang ngày càng thu hút được nhiều sự chú ý và đầu tư. Nó đã vượt ra ngoài khuôn khổ các lĩnh vực nghiên cứu và đang dần được áp dụng vào thực tế bởi khả năng áp dụng rộng rãi cùng những hiệu quả mà nó có thể mang lại. Trên thế giới, hiện đã có nhiều ứng dụng liên quan đến vấn đề nhận dạng văn bản hay nhập dữ liệu tự động. Có thể kể đến như : sản phẩm FineReader, Scan To Office của hãng ABBYY, Smart scan Xpress của Pegasus Image, các ứng dụng chấm thi tự động …Ở Việt Nam cũng đã có các ứng dụng nhận dạng văn bản như VNDocR của Viện Công nghệ Thông tin hay ImageScan của CardPro. Đây là các ứng dụng nhận dạng chữ in. Việc nhận dạng chữ viết tay đang còn là một thách thức. Đã có một số nghiên cứu về nhận dạng chữ viết tay và chữ viết tay tiếng Việt như đề tài "Ứng dụng mạng Neural trong nhận dạng văn bản"[1]. Tuy nhiên các nghiên cứu này vẫn còn rất nhiều hạn chế do khả năng nhận dạng chữ viết tay chưa đạt được độ chính xác cần thiết để có thể áp dụng trên thực tế một cách rộng rãi. Cùng với sự phát triển của công nghệ thông tin hiện nay, các thuật toán nhận dạng cũng ngày càng chính xác và đưa ra được các kết quả đáng tin cậy. Ngay cả đối với chữ viết tay cũng có thể đạt được độ chính xác cao với điều kiện là chỉ nhận dạng từng chữ riêng biệt và chữ viết đẹp. Với các văn bản thông thường ta khó có thể đạt được điều này. Tuy nhiên, Các form nhập liệu là kiểu văn bản có cấu trúc và ta có thể đưa ra một số quy tắc ràng buộc để tăng độ chính xác cho việc nhận dạng - chẳng hạn như: các chữ được viết riêng rẽ trên các ô riêng biệt của các vùng nhập liệu. Mặt khác, việc nhận dạng không cần thiết phải tiến hành trên toàn bộ ảnh của tài liệu mà chỉ giới hạn ở những vùng nhập dữ liệu. Đặc điểm này cũng cho phép ta tiếp cận bài toán một cách hiệu quả hơn, chẳng hạn có thể sử dụng các thông tin sẵn có từ form mẫu như định dạng vùng nhập liệu, kích thước ô,…làm tham số nhận dạng. Một khía cạnh khác của nhận dạng form nhập liệu là các dữ liệu nhận dạng được của mỗi vùng trên form sẽ phải được tự động gắn vào một trường dữ liệu xác định của ứng dụng. 2 Bài toán nhập liệu tự động từ form tài liệu bao gồm các vấn đề sau :  Quản trị form: thiết kế form nhập liệu ; quản lý và lưu trữ tự động các tham số của form để có thể cung cấp dữ liệu cho quá trình nhận dạng sau này nhanh chóng và tin cậy ; tích hợp với cơ sở dữ liệu.  Nhận dạng các vùng dữ liệu (bài toán phát hiện và phân vùng dữ liệu).  Nhận dạng chữ viết tay trên các vùng dữ liệu ; xử lý từ vựng và ghi nhận vào cơ sở dữ liệu.  Nhưng trước hết phải tiền xử lý ảnh để làm tốt ảnh, phục vụ cho quá trình nhận dạng, đảm bảo độ tin cây. Hình 0-1: Sơ đồ hệ thống Luận văn này chỉ giới hạn trình bày các giải pháp bao gồm các công việc cụ thể như sau :  tiền xử lý ảnh để làm tốt ảnh, phục vụ cho quá trình nhận dạng, đảm bảo độ tin cậy. - Thuật toán lọc nhiễu, khử nền và nhị phân hóa ảnh. - Thuật toán xác định góc nghiêng dựa trên phép chiếu. - Thuật toán xác định góc nghiêng dựa trên các block.  Tách các vùng nhập dữ liệu (bài toán phát hiện và phân vùng dữ liệu). - Thuật toán xác định các đường thẳng trong văn bản phục vụ cho việc xác định các vùng nhận dạng. 3 - Phân vùng ảnh dựa trên các đường thẳng xác định được. - Phân vùng ảnh dựa trên vị trí tương đối đến các mốc quy chiếu.  Nhận dạng các vùng nhập liệu. - Nhận dạng số viết tay dạng nét thẳng. - Nhận dạng các ô đánh dấu.  Quản trị form - Thiết kế form nhập liệu. - Quản lý và lưu trữ tự động các tham số của form để có thể cung cấp thông tin cho quá trình nhận dạng sau này nhanh chóng và tin cậy ; hỗ trợ các thông tin để tích hợp với cơ sở dữ liệu. 1.2 Nội dung và cấu trúc của khóa luận Hệ thống mà tôi thực hiện như đã giới thiệu ở trên là bài toán xác định dữ liệu được nhập vào form sau khi có ảnh từ máy quét. Quy trình xử lý bao gồm : tiền xử lý ảnh, phân vùng ảnh, nhận dạng ảnh và quản trị form. Nắm bắt được khó khăn cũng như những đặc trưng của bài toán này, hệ thống được xây dựng đã áp dụng các giải pháp có độ chính xác cao, phù hợp với đặc trưng ảnh của form nhập dữ liệu với các giả thiết, ràng buộc của loại ảnh này sẽ được nêu cụ thể ở từng chương tương ứng. Với nội dung chính là trình bày những lý thuyết cơ bản về xử lý ảnh, về các bước trong quy trình xử lý của hệ thống và lựa chọn các giải pháp áp dụng vào bài toán, khóa luận được tổ chức như sau : Mở đầu Phần mở đầu giới thiệu về bài toán nhập dữ liệu tự động nói chung: tình hình Việt Nam và thế giới, các thành tựu đã đạt được trong lĩnh vực nhận dạng chữ viết, những khó khăn cũng như các đặc trưng của bài toán nhận dạng form nhập dữ liệu so với các bài toán nhận dạng khác. Phần tiếp theo giới thiệu về hệ thống mà tôi đang tiến hành nghiên cứu và xây dựng : Tách và nhận dạng số viết tay trong phiếu nhập dữ liệu cùng với quy trình nhập dữ liệu tự động bằng nhận dạng quang học, phạm vi giới hạn và trình tự giải quyết bài toán. Từ đó nêu lên nội dung mà tôi nghiên cứu và thực hiện thông qua việc trình bày nội dung và cấu trúc của khóa luận. 4 Chƣơng 1: Đề xuất giải pháp tiền xử lý ảnh Chương này trình bày về các phần việc chính liên quan đến tiền xử lý ảnh trong hệ thống đó là : Giải pháp lọc nhiễu, khử nền và nhị phân hóa thông qua giãn độ tương phản kết hợp loại bỏ nền lặp lại nhiều lần trên lược đồ histogram; Giải pháp cho việc khử nghiêng ảnh bằng phép chiếu, bằng các block với các biện pháp tối ưu hóa và xác định ảnh ngược. Nội dung của chương tập trung vào:  Phân tích những đặc trƣng của ảnh dạng form nhập liệu từ đó đưa ra giải pháp cho việc tiền xử lý ảnh.  Quy trình thực hiện các giải pháp này.  Đánh giá ưu và nhược điểm của các phương pháp. Chƣơng 2: Đề xuất giải pháp phân vùng và nhận dạng ảnh Chương này trình bày về các giải pháp tách vùng nhập liệu trên ảnh dựa vào các thông tin cung cấp bởi các form mẫu. Tập trung vào hai hướng chính là xác định vị trí các vùng theo tọa độ tương đối từ các đường thẳng trên form và từ các mốc quy chiếu. Sau khi tách các vùng nhập liệu trên ảnh, các vùng này sẽ được nhận dạng. Trong khuôn khổ luận văn chỉ trình bày về nhận dạng số viết tay dạng nét thẳng và các ô đánh dấu là các đối tượng nhập liệu phổ biến nhất. Nội dung của chương tập trung vào:  Phân tích những đặc trƣng của ảnh dạng form nhập liệu từ đó đưa ra giải pháp cho việc tách vùng và nhận dạng.  Xác định các đối tượng làm mốc quy chiếu trên ảnh( đường thẳng, các block bên cạnh form).  Tách vùng nhập liệu.  Nhận dạng số viết tay và các ô đánh dấu.  Đánh giá ưu và nhược điểm của các phương pháp. [...]... dữ liệu và quét lại vào máy tính, dựa trên mẫu có sẵn và đối chiếu với ảnh scan, ta tìm các vùng trên ảnh scan được nhập dữ liệu và xử lý nhận dạng trên các vùng này Dữ liệu sau khi nhận dạng sẽ được lưu lại tương ứng với các trường dữ liệu trong form mẫu Khi xử lý văn bản, ta không cần nhận dạng toàn bộ văn bản mà chỉ giới hạn nhận dạng trên các vùng mà thông tin được nhập vào Điểm khác biệt trong việc... định và thêm vùng này vào danh sách quy chiếu Quay lại bước 2 Nhận dạng vùng nhập liệu được xác định bởi hình bao H a ' theo các phương pháp được trình bày trong 3.2 Sau khi nhận dạng vùng bao H a ' sẽ được chính xác hóa Ta thêm vùng nhập liệu ai và vùng nhập liệu đã nhận dạng ai' vào hai tập mốc quy chiếu Q và Q ' Hai vùng nhập liệu này có thể được coi là mốc quy chiếu để tìm kiếm các vùng nhập liệu. .. VÀ NHẬN DẠNG ẢNH 2.1 Tách vùng nhập dữ liệu trên ảnh 2.1.1 Đặc trƣng bài toán Sau các bước tiền xử lý lọc nhiễu, xác định góc nghiêng, công việc tiếp theo cần tiến hành đó là xác định các vùng văn bản cần xử lý, đây cũng chính là đầu vào cho phần nhận dạng dữ liệu Văn bản tôi xử lý trong khuôn khổ luận văn này là văn bản dạng form nhập dữ liệu dựa trên mẫu form đã có sẵn Sau khi form được nhập dữ liệu. .. blocks : b1 , b2 , , bn , ta tìm được n blocks trong ảnh ' ' b1' , b2 , , bn tương ứng với các blocks trong mẫu Đưa hai tập này vào hai tập mốc quy chiếu Q và Q ' Hình 2-6: Tƣơng ứng các mốc quy chiếu trong ảnh scan và trong mẫu Bƣớc 2: Chọn ra vùng nhập liệu trong mẫu có mốc quy chiếu gần nhất Tập vùng nhập liệu được định nghĩa trong mẫu là A , tìm vùng nhập liệu ai  ai  A sao cho tồn tại một mốc quy... Điểm khác biệt trong việc phân vùng ảnh trên form nhập dữ liệu và phân vùng ảnh trên văn bản tổng quát là : đối với form nhập dữ liệu, ta thực hiện phân vùng trên ảnh đã biết trước cấu trúc và ta chỉ cần tách ra các vùng đã được định nghĩa từ trước là sẽ được nhập dữ liệu để sau đó tiến hành nhận dạng trên các vùng này Chính nhờ việc biết trước một số thông tin mà kết quả phân vùng chính xác hơn rất... cần tách ra một số vùng cần thiết Hình 2-1: form mẫu và các vùng nhập dữ liệu đƣợc định nghĩa 22 Hình 2-2: Form sau khi đƣợc in ra, điền thông tin và scan vào máy tính Khi tách vùng trên ảnh scan, ta luôn phải đối chiếu với ảnh mẫu để xác định vị trí tương ứng của các vùng trên ảnh scan so với các vùng trên ảnh mẫu Xác định các vùng cần nhận dạng luôn luôn là công việc quan trọng nhất trong nhận dạng. .. Vùng nhập liệu đƣợc sử dụng làm mốc quy chiếu Hình 2-10: Cập nhật khoảng cách đến mốc quy chiếu gần nhất Kết luận : qua quá trình nghiên cứu, giải pháp này đã chứng minh được tính hiệu quả và thực dụng trong việc nhận dạng form dữ liệu, đặc biệt là trong việc nhận dạng với số lượng lớn Những ưu điểm và nhược điểm của phương pháp Ưu điểm :  Cho độ chính xác cao, thời gian xử lý nhanh  Dễ kiểm soát và. .. tạo ra một số vấn đề về mặt thẩm mỹ 29 2.1.4 Xác định vùng nhận dạng dựa trên vị trí tƣơng đối đến các đƣờng thẳng Đặc điểm của kiểu form nhập dữ liệu là dữ liệu được nhập vào các ô trên form, các ô này được bao quanh bởi các đường thẳng, thêm vào đó trên form còn có thể có khung hoặc các đường phân cách khu vực, đường trang trí Do đó chúng tôi đã đưa ra giải pháp xác định vùng nhập dữ liệu thông qua... module quản trị form nhập liệu cho các nhóm form với các đặc điểm mà các giải pháp ở các chương trước hướng đến Nội dung của chương tập trung vào:  Giới thiệu đặc trƣng của các form nhập liệu mà luận văn này tập trung giải quyết  Thiết kế form nhập liệu  Quản lý và lưu trữ tự động các tham số của form để có thể cung cấp thông tin cho quá trình nhận dạng ảnh sau này nhanh chóng và tin cậy ; hỗ trợ... văn bản với số lượng lớn 1.2 Xác định góc nghiêng của ảnh Văn bản bị nghiêng xảy ra trong quá trình copy hoặc khi quét vào máy tính, điều này ảnh hưởng đến toàn bộ các đối tượng có trong văn bản nhất là các vùng mà ta cần phải nhận dạng Văn bản bị nghiêng là một điều không thể tránh khỏi, và trong nhiều trường hợp gây ảnh hưởng không tốt đến độ chính xác đối với kết quả phân vùng và nhận dạng ký tự . tiến hành nghiên cứu và xây dựng : Tách và nhận dạng số viết tay trong phiếu nhập dữ liệu cùng với quy trình nhập dữ liệu tự động bằng nhận dạng quang học, phạm vi giới hạn và trình tự giải quyết. cấp dữ liệu cho quá trình nhận dạng sau này nhanh chóng và tin cậy ; tích hợp với cơ sở dữ liệu.  Nhận dạng các vùng dữ liệu (bài toán phát hiện và phân vùng dữ liệu) .  Nhận dạng chữ viết tay.  Nhận dạng các vùng nhập liệu. - Nhận dạng số viết tay dạng nét thẳng. - Nhận dạng các ô đánh dấu.  Quản trị form - Thiết kế form nhập liệu. - Quản lý và lưu trữ tự động các tham số của

Ngày đăng: 02/07/2015, 16:42

Từ khóa liên quan

Mục lục

  • MỤC LỤC

  • MỘT SỐ THUẬT NGỮ ANH-VIỆT

  • DANH MỤC HÌNH VẼ

  • DANH MỤC BẢNG

  • MỞ ĐẦU

  • CHƯƠNG 1 – ĐỀ XUẤT GIẢI PHÁP TIỀN XỬ LÝ ẢNH

  • 1.1 Lọc nhiễu và nhị phân hoá.

  • 1.2 Xác định góc nghiêng của ảnh

  • 1.2.1 Phương pháp xác định góc nghiêng dựa trên phép chiếu.

  • 1.2.2 Phương pháp xác định góc nghiêng dựa trên các block.

  • 2.1 Tách vùng nhập dữ liệu trên ảnh

  • 2.1.1 Đặc trưng bài toán

  • 2.1.2 Xác định vùng nhập liệu dựa trên các mốc quy chiếu

  • 2.2 Nhận dạng vùng nhập liệu

  • 2.2.1 Nhận dạng vùng đánh dấu

  • 2.2.2 Nhận dạng vùng nhập liệu dạng số

  • CHƯƠNG 3 - XÂY DỰNG HỆ THỐNG TÍCH HỢP

  • 3.1 Phân tích bài toán

  • 3.2 Xây dựng hệ thống

  • 3.2.1 Xác định các đối tượng

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan