Nghiên cứu một số kỹ thuật xác định vùng chữ số phục vụ bài toán nhập điểm tự động

55 239 0
Nghiên cứu một số kỹ thuật xác định vùng chữ số phục vụ bài toán nhập điểm tự động

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐH CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG Vũ Thị Hằng NGHIÊN CỨU MỘT SỐ KỸ THUẬT XÁC ĐỊNH VÙNG CHỮ SỐ PHỤC VỤ BÀI TOÁN NHẬP ĐIỂM TỰ ĐỘNG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2015 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐH CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG Vũ Thị Hằng NGHIÊN CỨU MỘT SỐ KỸ THUẬT XÁC ĐỊNH VÙNG CHỮ SỐ PHỤC VỤ BÀI TOÁN NHẬP ĐIỂM TỰ ĐỘNG Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƢỜI HƢỚNG DẪN KHOA HỌC TS Vũ Duy Linh Thái Nguyên - 2015 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ LỜI CAM ĐOAN Tôi xin cam đoan toàn nội dung luận văn tự sƣu tầm, tra cứu xếp cho phù hợp với nội dung yêu cầu đề tài Nội dung luận văn chƣa đƣợc công bố hay xuất dƣới hình thức không đƣợc chép từ công trình nghiên cứu Tất phần mã nguồn chƣơng trình tự thiết kế xây dựng, có sử dụng số thƣ viện chuẩn thuật toán đƣợc tác giả xuất công khai miễn phí mạng Internet Nếu sai xin hoàn toàn chịu trách nhiệm Thái Nguyên, ngày tháng 07 năm 2015 Ngƣời cam đoan Vũ Thị Hằng Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ LỜI CẢM ƠN Trong trình học tập nghiên cứu lớp Cao học khóa 12 chuyên ngành Khoa học máy tính trƣờng ĐH Công nghệ thông tin truyền thông - Đại học Thái Nguyên, nhận đƣợc nhiều bảo, dìu dắt, giảng dậy nhiệt tình thầy, cô giáo Viện công nghệ thông tin Các thầy cô giáo quản lý trƣờng ĐH Công nghệ thông tin truyền thông - Đại học Thái Nguyên giúp đỡ, tạo điều kiện tốt cho trình công tác nhƣ học tập Nhân dịp xin bày tỏ lời cảm ơn chân thành tới tập thể thầy, cô giáo Viện công nghệ thông tin, thầy cô giáo trƣờng ĐH Công nghệ thông tin truyền thông - Đại học Thái Nguyên Tôi xin chân thành cảm ơn sâu sắc tới thầy giáo TS Vũ Duy Linh cho nhiều ý kiến đóng góp quý báu, tận tình hƣớng dẫn tạo điều kiện cho hoàn thành tốt luận văn tốt nghiệp Tôi xin cảm ơn đồng nghiệp ngƣời thân động viên, giúp đỡ trình nghiên cứu thực luận văn Quá trình thực đề tài không tránh khỏi thiếu sót, mong tiếp tục nhận đƣợc đóng góp ý kiến thầy, cô giáo, bạn đồng nghiệp đề tài nghiên cứu để đề tài đƣợc hoàn thiện Tôi xin trân trọng cảm ơn! Thái Nguyên, ngày tháng 07 năm 2015 Vũ Thị Hằng Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ DANH MỤC CÁC HÌNH VẼ Trang Hình 2.1 Xấp xỉ xấp xỉ dƣới X 20 Hình 2.2 Kết ảnh biên thu đƣợc số phƣơng pháp 22 Hình 2.3 Đƣờng thẳng Hough tọa độ cực 26 Hình 2.4 Biến đổi Hough phát góc nghiêng 28 Hình 2.5 Đƣờng biên lý tƣởng Error! Bookmark not defined Hình 2.6 Đƣờng biên dốc Error! Bookmark not defined Hình 2.7 Đƣờng biên không trơn Error! Bookmark not defined Hình 2.8 Sơ đồ phân tích ảnh Error! Bookmark not defined Hình 2.9 Toán tử lân cận Error! Bookmark not defined Hình 2.10 Ví dụ chu tuyến đối ngẫu Error! Bookmark not defined Hình 2.11 Chu tuyến chu tuyến đối tƣợng Error! Bookmark not defined Hình 3.1 Mẫu bảng điểm 44 Hình 3.2 Hình ảnh bảng điểm chƣa xác định đƣợc vùng chứa điểm 50 Hình 3.3 Hình ảnh bảng điểm xác định đƣợc vùng chứa điểm 50 Bảng 4.1: Kết thực nghiệm 51 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ MỤC LỤC MỞ ĐẦU Chƣơng 1: KHÁI QUÁT NHẬP ĐIỂM TỰ ĐỘNG VÀ BÀI TOÁN ĐỊNH VỊ VÙNG 10 1.1 Khái quát nhận dạng văn nhập điểm tự động 10 1.1.1 Nhận dạng văn 10 1.1.2 Quản lý nhập điểm 11 1.2 Bài toán định vị vùng nhập điểm tự động 13 1.2.1 Mô tả toán 13 1.2.2 Một số cách tiếp cận 14 Chƣơng 2: MỘT SỐ KỸ THUẬT ĐỊNH VỊ VÙNG 15 2.1 Định vị vùng theo phƣơng pháp hình thái học 15 2.1.1 Các phép toán hình thái 15 2.1.1.1 Một số định nghĩa 15 2.1.1.2 Một số tính chất phép toán hình thái 16 2.1.2 Phát biên dựa vào phép toán hình thái 18 2.1.2.1 Xấp xỉ xấp xỉ dƣới đối tƣợng ảnh 18 2.1.2.2.Thuật toán phát biên dựa vào phép toán hình thái 19 2.1.3 Định vị vùng sử dụng phƣơng pháp hình thái học 21 2.2 Định vị vùng sử dụng phép biến đổi Hough 22 2.2.1 Biến đổi Hough cho đƣờng thẳng 22 2.2.2 Biến đổi Hough cho đƣờng thẳng tọa độ cực 25 2.2.3 Biến đổi Hough phát góc nghiêng phiếu điểm 26 2.2.3.1 Áp dụng biến đổi Hough phát góc nghiêng phiếu điểm 26 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 2.2.3.2 Thuật toán phát hiệu chỉnh góc nghiêng phiếu điểm 27 2.2.4 Định vị vùng sử dụng phép biến đổi Hough 29 2.3 Kỹ thuật định vị vùng sử dụng phƣơng pháp lần đƣờng biên 30 2.3.1 Biên đối tƣợng ảnh 30 2.3.1.1 Biên kiểu biên ảnh 30 2.3.1.2 Vai trò biên nhận dạng 33 2.3.2 Kỹ thuật dò biên 35 2.3.2.1 Phƣơng pháp dò biên trực tiếp 35 2.3.2.2 Phƣơng pháp dò biên gián tiếp 43 2.3.2.3 Thuật toán dò biên tổng quát 47 Chƣơng 3: CHƢƠNG TRÌNH THỬ NGHIỆM 51 3.1 Bài toán 51 3.2 Phân tích toán 52 3.3 Chƣơng trình thử nghiệm 55 3.3.1 Thiết kế chƣơng trình 55 3.3.2 Một số kết chƣơng trình 58 PHẦN KẾT LUẬN 60 TÀI LIỆU THAM KHẢO 62 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ MỞ ĐẦU Lý chọn đề tài Xử lý ảnh khoa học tƣơng đối mẻ so với nhiều ngành khoa học khác, quy mô công nghiệp, song xử lý ảnh bắt đầu xuất máy tính chuyên dụng Nhận dạng phận quan trọng xử lý ảnh đƣợc ứng dụng hiệu nhiều lĩnh vực khác nhƣ y tế, giáo dục, quốc phòng, nghiên cứu vũ trụ Trong trình công tác, nhận thấy rằng: Việc xử lý kết thi sinh viên hầu hết trƣờng đƣợc thực cách thủ công Kết thi sau đƣợc giảng viên ghi vào biên chấm thi đƣợc nhập vào máy tính để lƣu trữ xử lý Việc nhập điểm thủ công nhƣ tốn nhiều công sức khả nhầm lẫn cao Nếu công việc nhập điểm từ biên chấm thi vào máy tính đƣợc tự động hóa hiệu nhiều Để giúp cho việc đòi hỏi phải xây dựng đƣợc công cụ hữu hiệu việc nhận dạng vùng chứa liệu bảng điểm, nhận dạng đƣợc chữ số viết tay Trong phạm vi đề tài luận văn thạc sỹ, sâu vào tìm hiểu kỹ thuật phát định vị vùng chứa chữ số viết tay bảng điểm phục vụ cho toán nhập phiếu điểm tự động Do chọn đề tài: “Nghiên cứu số kỹ thuật xác định vùng chữ số phục vụ toán nhập điểm tự động” Đối tƣợng phạm vi nghiên cứu a Đối tƣợng nghiên cứu - Phiếu điểm (biên chấm thi) số trƣờng học - Các kỹ thuật xử lý nhận dạng ảnh Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ - Xây dựng phần mềm mô nhận dạng vùng chứa liệu ảnh b Phạm vi nghiên cứu - Ảnh phiếu điểm dạng đen trắng, độ phân giải 300DPI - Một số kỹ thuật hỗ trợ xác định vùng chứa liệu điểm Nhiệm vụ nghiên cứu - Nghiên cứu kỹ thuật xử lý nhận dạng ảnh - Nghiên cứu cấu trúc bảng điểm từ đề xuất mẫu phiếu điểm giúp cho việc nhận dạng tự động đƣợc xác Đóng góp Đề tài hoàn thành giải phần quan trọng toán nhập điểm tự động: Xác định vùng chứa liệu điểm Đây sở để phát triển ứng dụng áp dụng thực tế trƣờng học Phƣơng pháp nghiên cứu - Nghiên cứu tài liệu, tìm hiểu thông tin Intenet kỹ thuật có liên quan - Sử dụng thử nghiệm công cụ có sẵn để hiểu rõ chất vấn đề, sau xây dựng chƣơng trình theo demo Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 10 Chƣơng 1: KHÁI QUÁT NHẬP ĐIỂM TỰ ĐỘNG VÀ BÀI TOÁN ĐỊNH VỊ VÙNG 1.1 Khái quát nhận dạng văn nhập điểm tự động 1.1.1 Nhận dạng văn Nhận dạng văn hay nhận dạng ký tự quang học (tiếng Anh: Optical Character Recognition, viết tắt OCR), loại phần mềm máy tính đƣợc tạo để chuyển hình ảnh chữ viết tay chữ đánh máy (thƣờng đƣợc quét máy scanner) thành văn tài liệu OCR đƣợc hình thành từ lĩnh vực nghiên cứu nhận dạng mẫu, trí tuệ nhận tạo machine vision Mặc dù công việc nghiên cứu học thuật tiếp tục, phần công việc OCR chuyển sang ứng dụng thực tế với kỹ thuật đƣợc chứng minh Nhận dạng ký tự quang học (dùng kỹ thuật quang học chẳng hạn nhƣ gƣơng ống kính) nhận dạng ký tự số (sử dụng máy quét thuật toán máy tính) lúc đầu đƣợc xem xét nhƣ hai lĩnh vực khác Bởi có ứng dụng tồn với kỹ thuật quang học thực sự, thuật ngữ Nhận dạng ký tự quang học đƣợc mở rộng bao gồm ý nghĩa nhận dạng ký tự số Đầu tiên hệ thống nhận dạng yêu cầu phải đƣợc huấn luyện với mẫu ký tự cụ thể Các hệ thống "thông minh" với độ xác nhận dạng cao hầu hết cácphông chữ trở nên phổ biến Một số hệ thống có khả tái tạo lại định dạng tài liệu gần giống với gốc bao gồm: hình ảnh, cột, bảng biểu, thành phần văn Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 41 5.2.1.4 Xấp xỉ đa giác đa giác n cạnh Gọi M(x0,y0) trọng tâm đa giác, lấy đỉnh Q tuỳ ý đa giác, xét đa giác n cạnh Pg’ tạo đỉnh Q với tâm M Kí hiệu E(Pg, Pg’)= area( Pg) area( Pg') E(Pg, En)=min E(Pg,Pg’) Q chạy khắp đỉnh đa giác 5.2.2 Xấp xỉ đa giác theo bất biến aphin Trong [7] đƣa mô hình chuẩn tắc bất biến aphin, cho phép chuyển toán xấp xỉ đối tƣợng bất biến aphin toán xấp xỉ mẫu dạng chuẩn tắc Nhƣ đƣa việc đối sánh đối tƣợng với mẫu bất biến đồng dạng, chẳng hạn việc xấp xỉ tam giác, hình bình hành, ellipse tƣơng đƣơng với xấp xỉ tam giác đều, hình vuông, hình tròn v.v Thủ tục xấp xỉ theo bất biến aphin đa giác với hình sở đƣợc thực nhƣ sau: + Bước 0: Phân loại bất biến aphin dạng hình sở Dạng hình sở Dạng chuẩn tắc Tam giác Tam giác Hình bình hành Hình vuông Ellipse Đƣờng tròn + Bước 1: Tìm dạng chuẩn tắc sở Pg' thoả mãn điều kiện: m01 m02 m13 m10 m20 m31 (phép tịnh tiến) (phép co dãn theo hai trục x, y) (**) + Bước 2: Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 42 Xác định biến đổi aphin T chuyển đa giác thành đa giác Pg dạng chuẩn tắc (thoả mãn tính chất (**)) Xấp xỉ đa giác Pg với dạng chuẩn tắc sở Pg’ tìm đƣợc bƣớc với độ đo xấp xỉ E(Pg,Pg’) + Bước 3: Kết luận, đa giác ban đầu xấp xỉ T-1(Pg’) với độ đo xấp xỉ E(Pg,Pg’) Đối với bƣớc [7] đƣa hai ví dụ sau: Ví dụ 1: Tồn tam giác P1P2P3 thoả mãn tính chất (**) P1=(0,-2 ),P2= ( , ) , P3= ( , ), 28 3 Ví dụ 2: Tồn hai hình vuông P1P2 P3 P4 thoả mãn tính chất (**) Hình vuông thứ có đỉnh tƣơng ứng (-p,-p),(-p,p), (p,-p),(p,p), với p= 4 Hình vuông thứ hai có đỉnh tƣơng ứng (-p,0),(p,0), (0,-p),(0,p), với p= Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 43 Chƣơng 3: CHƢƠNG TRÌNH THỬ NGHIỆM Nhƣ trình bày chƣơng 2, có nhiều phƣơng pháp để định vị vùng nhập điểm tự động Trong phạm vi luận văn này, tác giả sâu vào thử nghiệm phƣơng định vị vùng phƣơng pháp kết hợp hình thái học với Heuristic để tăng tốc độ xử lý tác giả sử dụng phiếu điểm đƣợc xây dựng phù hợp cho trình nhận dạng phƣơng pháp 3.1 Bài toán Hiện nay, đa phần trƣờng học sử dụng phần mềm tin học để quản lý điểm Việc này, giúp việc quản lý đƣợc xác, tra cứu nhanh chóng Tuy nhiên, theo tìm hiểu tác giả phần mềm cho cho phép in biên chấm để giáo viên chấm thi nhập điểm ngƣời phụ trách điểm phải có trách nhiệm nhập điểm tay Mặc dù phần mềm có chức in kiểm dò, nhƣng công việc hoàn toàn thủ công dẫn tới có nhiều sai sót Bài toán nhập điểm tự động đƣợc giải khắc phục đƣợc vấn đề mà tác giả nêu Việc nhập điểm tự động trình thu thập ảnh biên chấm thi (thông thƣờng qua máy Scanner) sau xử lý để đƣa đƣợc bảng điểm xác dƣới dạng số máy tính Trong toán này, có hai toán nhỏ cần giải là: Xác định vùng chứa liệu điểm nhận dạng chữ số viết tay Trong phạm vi nghiên cứu luận văn, tác giả tập trung nghiên cứu vào việc xác định vùng chứa liệu điểm Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 44 Để hệ thống nhận dạng đƣợc bảng điểm, phiếu phải tuân theo mẫu chuẩn Mẫu đƣợc thiết kế cho trình nhận dạng đƣợc thực cách nhanh chóng xác Tác giả đề xuất mẫu bảng điểm dùng đề nhận dạng nhƣ sau: Hình 3.1 Mẫu bảng điểm Nhằm giúp trình định vị vùng chứa điểm đƣợc xác, tác giả loại bỏ đƣờng viền ô không liên quan tới ô điểm Đối với ô chứa điểm, dùng đƣờng kẻ liền với độ rộng 1.5 pt 3.2 Phân tích toán Trƣớc hết, ta phân tích ƣu nhƣợc điểm phƣơng pháp phát vùng chƣơng đem áp dụng vào toán phát vùng nhập điểm tự động Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 45 Với phƣơng pháp biến đổi Hough, ta thấy nhƣ thích hợp cho toán chất bảng điểm đƣợc tạo từ đƣờng thẳng ngang, dọc Vì vậy, ta dùng biến đổi Hough để tìm đƣờng thẳng rõ ràng ta hoàn toàn xác định đƣợc vùng chứa điểm Tuy nhiên, qua thực nghiệm tác giả nhận thấy đƣờng thẳng nét mỏng nhƣ bảng điểm qua trình quét ảnh đƣờng thẳng thƣờng bị đứt nét dẫn tới khó để định vị đƣợc đƣờng thảng Chúng ta xử lý vấn đề cách tăng độ dày đƣờng này, nhiên điều dẫn tới bảng điểm tính thẩm mỹ Với phƣơng pháp phát vùng theo phƣơng pháp hình thái học, ta thấy đặc tính quan trọng để định vị đƣợc vùng cần tìm xác định đƣợc ngƣỡng xám Trên vùng chứa liệu điểm, phân bố mức xám không đặc biệt so với vùng khác Vì mà đƣợc nhị phân hóa vùng liệu điểm có đặc thù hình thái Điều đẫn tới khó khăn việc định vị vùng Với phƣơng pháp phân loại Heuristic, ta xây dựng phân loại thông qua tiêu chí sau: Màu sắc Kích thƣớc chiều dài, chiều rộng Tỉ lệ chiều dài chiều rộng Diện tích vùng chứa liệu điểm Số lƣợng vùng Với tiêu chí ta xây dựng đƣợc phân loại Tốc độ tỷ lệ xác tùy thuộc vào cách xếp phân loại Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 46 Lƣợc đồ sau cho thấy cách xếp phân loại mà thực nghiệm cho kết khả quan: Vùng ứng viên chứa điểm Kích thƣớc hai chiều khoảng [20, 50] pixel Không phải Có khả Diện tích khoảng [50, 300] pixel Không phải Có khả Chứa từ đến vùng diện tích [10, 50] Không phải Bổ sung vùng ảnh vào tập kết tìm đƣợc Để khắc phục nhƣợc điểm phƣơng pháp ta kết hợp phƣơng pháp hình thái học với phân loại Heuristic: Nâng cao chất lƣợng ảnh đầu vào Phát biên sử dụng mặt nạ Sobel thu đƣợc ảnh IS Sau nhị phân hóa IS thu đƣợc ảnh chứa tập cạnh IE Tìm vùng liên thông IE (mỗi vùng hình bao đối tƣợng ảnh) Ta gọi tập vùng liên thông {Ic} Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 47 Xác định vùng điểm tập {Ic} Ta gọi tiêu chuẩn giúp xác định vùng biển số tập {Ic} Heuristic: o 20 pixel ≤ chiều cao, chiều rộng ≤ 50 pixel o 50 pixel ≤ diện tích Ici ≤ 300 pixel o Mật độ điểm ảnh o Ici vùng chứa liệu điểm chứa từ đến đến vùng (là vùng chứa ký tự) 3.3 Chƣơng trình thử nghiệm 3.3.1 Thiết kế chƣơng trình Qua phân tích trên, tác giả xây dựng chƣơng trình thử nghiệm với đầu vào ảnh bảng điểm đƣợc nhập từ thiết bị thu nhận ảnh Chƣơng trình cho phép phát vùng chứa liệu ảnh cách xác Chƣơng trình có module nhƣ sau: Module: Đọc liệu đầu vào o Đầu vào: File ảnh bảng điểm o Đầu ra: Ảnh xám Dữ liệu đầu vào đƣợc thu nhận từ file ảnh BMP Chƣơng trình đọc trực tiếp file ảnh sau chuyển sang ảnh xám lƣu định dạng ma trận bitmap hai chiều Module: Tiền xử lý o Đầu vào: Ảnh xám o Đầu ra: Ảnh sau chuẩn hóa kích thƣớc 640 x 480 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 48 Module làm nhiệm vụ nâng cao chất lƣợc ảnh đầu vào thông qua số bƣớc xử lý nhƣ làm sắc nét ảnh, cần độ tƣơng phản, , đƣa ảnh kích thƣớc 640 x 480 để phục vụ cho bƣớc sau Module: Đƣa ảnh nhị phân o Đầu vào: Ảnh xám o Đầu ra: Ảnh nhị phân Sử dụng thuật toán SIS trình bày phần đƣa ảnh ảnh nhị phân phục vụ cho giai đoạn sau Module: Tìm biên ảnh o Đầu vào: Ảnh nhị phân o Đầu ra: Ảnh biên Sobel Do vùng liên thông ảnh mờ không rõ nét Nhƣ để giai đoạn tìm vùng liên thông cho kết tốt ta tiến hành tìm biên Sobel trƣớc tìm vùng liên thông Module: Tách vùng liên thông ảnh o Đầu vào: Ảnh sau dò biên o Đầu ra: Tập vùng liên thông {IC} Từ ảnh sau tìm biên Sobel ta tiến hành dò tìm vùng liên thông ảnh lƣu vào tập {IC} Module: Xác định vùng ứng viên chứa điểm o Đầu vào: Tập vùng liên thông {IC} o Đầu ra: Tập vùng ứng viên chứa điểm {IL} Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 49 Từ tập vùng liên thông {IC} ta sử dụng phƣơng pháp kết hợp hình thái học với Heuristic nhƣ trình bày phần để xác định vùng ứng viên chứa {IL} Module: Loại bỏ vùng ứng viên chứa điểm tập {IL} o Đầu vào: Tập {IL} o Đầu ra: Tập {IL} sau loại bỏ vùng ứng viên vùng chứa điểm Dựa vào thông tin tỷ lệ cạnh, chiều cao, độ rộng vùng ta xác định vùng IL tƣơng ứng có phải vùng chứa điểm hay không Module: Hiển thị kết o Đầu vào: Tập {IL} o Đầu ra: Ảnh sau khoanh vùng (đổi màu) chứa liệu điểm Với ảnh tập {IL} ta tiến hành khoanh vùng chứa liệu điểm ảnh gốc hiển thị kết cho đầu vào tƣơng ứng Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 50 3.3.2 Một số kết chƣơng trình Hình 3.2 Hình ảnh bảng điểm chƣa xác định đƣợc vùng chứa điểm Hình 3.3 Hình ảnh bảng điểm xác định đƣợc vùng chứa điểm Thông qua tiến hành thực nghiệm file ảnh, chƣơng trình thu đƣợc kết nhƣ sau: Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 51 Máy chạy thực nghiệm: AMD Turion 64 x TL – 58 1.9 GHz, Ram 2GB Kết thực nghiệm: Đƣợc bảng 3.1 Bảng 4.1: Kết thực nghiệm Đầu vào File ảnh Số lƣợng/ Lần Thành công (%) Lỗi (%) 100 96 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 52 PHẦN KẾT LUẬN Trong giai đoạn hệ thống nhập điểm tự động, giai đoạn phát tách vùng chứa điểm giai đoạn khó khăn đòi hỏi nhiều thời gian ảnh thu đƣợc từ thiết bị thƣờng bị sai lệch yếu tố nhƣ góc quay, khoảng cách, ánh sáng, Phần lớn kết nhận dạng sai không phát đƣợc xác vùng chứa điểm Đề tài nghiên cứu số kỹ thuật phát vùng áp dụng vào toán phát vùng chứa liệu điểm toán nhập điểm tự động Trong thời gian nghiên cứu thực luận văn, tác giả đạt đƣợc số kết sau: - Nghiên cứu số kỹ thuật tiền xử lý ảnh nhằm nâng cao chất lƣợng ảnh đầu vào; - Nghiên cứu số kỹ thuật phát vùng ảnh: Phát vùng theo phƣơng pháp hình thái học, phát vùng sử dụng phƣơng pháp phân loại Heuristic, phát vùng sử dụng phép biến đổi Hough phát vùng sử dụng phƣơng pháp hình thái học kết hợp với Heuristic; - Thiết kế chƣơng trình phát vùng chứa điểm bảng điểm sử dụng phƣơng pháp kết hợp hình thái học với Heuristic Chƣơng trình cho phép nhận ảnh bảng điểm từ file Qua thực nghiệm cho thấy chƣơng trình làm việc tốt với ảnh đầu vào mức độ khác chất lƣợng ảnh Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 53 Một số đề xuất Trong thời gian tới, báo cáo nhƣ chƣơng trình đƣợc nghiên cứu, phát triển thêm số chức năng: - Cải tiến số chức chƣơng trình cho phép nâng cao hiệu phát vùng chứa liệu điểm bảng điểm giảm thiểu thời gian xử lý; - Tích hợp thêm chức nhận dạng chữ số viết tay để hoàn thiện chƣơng trình nhập điểm tự động Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 54 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Đỗ Năng Toàn, Phạm Việt Bình (2008), Giáo trình xử lý ảnh, Nxb Khoa học Kỹ thuật, 2008 [2] Đỗ Năng Toàn, Phạm Văn Dũng, Phạm Việt Bình (2005), “Ứng dụng chu tuyến phát góc nghiêng văn bản”, Kỷ yếu Hội thảo Quốc gia lần thứ - Một số vấn đề chọn lọc Công nghệ Thông tin Truyền thông, Đà Nẵng 18-20/08 /2004, Nxb KH&KT, Hà Nội 2005, 432-441 [3] Đỗ Năng Toàn, Ngô Quốc Tạo, Một số phương pháp nâng cao hiệu nhận dạng phiếu điều tra dạng dấu phục vụ cho thiết kế hệ nhập liệu tự động markread, Tạp chí Tin học Điều khiển học, Tập 15, số 4, năm 1999 Tiếng Anh [4] A Amin and S Fischer, A Document Skew Detection Method Using the Hough Transform, Pattern Analysis & Applications, 2000 [5] H Baird, “The skew angle of printed documents” Society of Photographic Scientists and Engineers, 1987 [6] J Canny, A Computational Approach To Edge Detection, IEEE Trans Pattern Analysis and Machine Intelligence, 1986 [7] Castan, S.; Zhao, J and Shen, J."New edge detection methods based on exponential filter", Pattern Recognition, vol.1, Jun 1990 [8] A.K Das, B.Chada A fast algorithm for skew detection of document images using morphological Proc of International Journal on Document Analysis and Recognition, vol.4, 2001 [9] S C Hinds, J L Fisher and D P D'Amato A Document Skew Detection Method Using Run-Length Encoding and the Hough Transform 10th International Conference on Pattern Recognition, vol 1, 1990 [10] X Jaing, H Bunke, D Widmer-Kljajo Skew detection of document image by focused nearest-neighbour-clustering Proc Of the 5th Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 55 International Conference on Document Analysis and Recognition, Bangalore 1999 [11] Kimmel, Ron and Bruckstein, Alfred M "On regularized Laplacian zero crossings and other optimal edge integrators", International Journal of Computer Vision, 2003 [12] D X Le, "Automated Document Skew Angle Detection Using Projection Profiles, Variances, Component Labelling and the Hough Transform," M.S thesis, Computer Science Department, George Mason University, November 17th, 1992 [13] Shutao Li, Qinghua Shen and Jun Sun Recognition Letters, Volume 28, Issue 5, April 2007 [14] Yue Lu and Chew Lim Tan, “A nearest neighbor chain based approach to skew estimation in document images”, Pattern Recognition Letters 24, 2003 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ [...]... dụng một thuật toán cho phép xác định ngƣỡng xám một cách tự động Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 23 Thuật toán SIS (Simple Image Statistics) là một trong các thuật toán để xác định ngƣỡng xám Thuật toán cho phép tách ngƣỡng tự động sử dụng kỹ thuật gradient với mặt nạ nhân chập theo hai hƣớng x, y: = , Thuật toán đƣợc mô tả dƣới dạng mã giả nhƣ sau: Với mỗi điểm ảnh I(x,... quả Để khắc phục hạn chế trên ta sẽ phân tích toán tử dò biên thành hai bƣớc: + Xác định cặp nền vùng tiếp theo + Lựa chọn điểm biên * Bởi vậy thuật toán tổng quát sẽ trở thành: + Bước 1: Xác định cặp nền vùng xuất phát + Bước 2: Xác định cặp nền vùng tiếp theo + Bước 3: Lặp lại bƣớc hai cho đến khi gặp cặp nền vùng xuất phát Khái niệm cặp vùng nền đƣợc định nghĩa gồm một điểm vùng và một điểm nền, trong... trung nghiên cứu vào việc xác định vùng chứa dữ liệu điểm Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 15 1.2.2 Một số cách tiếp cận Có nhiều phƣơng pháp xác định vùng trong nhập điểm tự động Dựa vào tính chất của các phƣơng pháp xác định vùng dữ liệu điểm, có thể chỉ ra hai phƣơng pháp tiếp cận chính: Hƣớng tiếp cận dựa trên tri thức: Mã hóa các hiểu biết của con ngƣời về các vùng. .. phiếu điểm thì hoàn toàn có thể sử dụng phƣơng pháp này Khi cần nhận dạng một bảng điểm để xác định vùng chứa dữ liệu điểm, ta sẽ đi so khớp với các mẫu Xác định đƣợc bảng điểm thuộc mẫu nào thì rõ ràng chúng ta đã xác định đƣợc vùng chứa dữ liệu điểm (các mẫu đƣợc lƣu trữ đều có cấu trúc riêng) Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 16 Chƣơng 2: MỘT SỐ KỸ THUẬT ĐỊNH VỊ VÙNG... giải quyết sẽ khắc phục đƣợc các vấn đề mà tác giả đã nêu ở trên Việc nhập điểm tự động sẽ là quá trình thu thập ảnh biên bản chấm thi (thông thƣờng qua máy Scanner) sau đó sẽ xử lý để đƣa ra đƣợc bảng điểm chính xác dƣới dạng số trên máy tính Trong bài toán này, có hai bài toán nhỏ cần giải quyết đó là: Xác định vùng chứa dữ liệu điểm và nhận dạng chữ số viết tay Trong phạm vi nghiên cứu của luận văn,... duyệt đến Điểm nền xuất phát là điểm ngay sau điểm vùng xuất phát (theo chiều ngang) + Bước 2: Ta gọi ánh xạ cặp nền vùng tiếp theo là toán tử dò biên Cách tìm cặp nền vùng tiếp theo nhƣ sau: lấy tâm là điểm vùng hiện tại, ta xoay theo chiều kim đồng hồ bắt đầu từ điểm nền hiện tại, cho đến khi gặp một điểm vùng là 8láng giềng của điểm vùng hiện tại thì dừng lại, điểm đó chính là điểm vùng tiếp Số hóa... 2.2.4 Định vị vùng sử dụng phép biến đổi Hough Nhƣ đã trình này ở các phần trên, ta có thể sử dụng phép biến đổi Hough để chỉnh độ nghiêng của phiếu điểm, tìm kiếm các đƣờng thẳng Đối với bài toán định vị vùng trong nhập điểm tự động thì bản thân các bảng điểm đƣợc tạo ra bởi các đƣờng thẳng, vì vậy mà khi ta tìm đƣợc các đƣờng thẳng tạo nên bảng thì ta sẽ hoàn toàn xác định đƣợc vị trí các vùng chứa điểm. ..11 1.1.2 Quản lý và nhập điểm tự động Có nhiều bài toán hiệu quả và độ tin cậy phụ thuộc rất nhiều vào khâu nhập số liệu nhƣ các bài toán điều tra xã hội học, thi tuyển sinh qua trắc nghiệm, nhập chứng từ ngân hàng, nhập các tờ khai thuế Khó khăn ở chỗ khối lƣợng nhập rất nhiều và việc kiểm soát nhập có chính xác không là một vấn đề nan giải Nhập dữ liệu theo kiểu thủ công truyền... vuông, chữ nhật, hình tròn, e-lip) đã đƣợc điền - Tên các trƣờng đƣợc sinh ra một cách tự động hoặc đƣợc ngƣời dùng đƣa vào Tiếp cận phƣơng pháp nhận dạng nhãn quang học hiện đại: - Tự động xử lý các bản kiểm tra, phiếu thăm dò, câu hỏi và các phiếu mẫu 1.2 Bài toán định vị vùng trong nhập điểm tự động 1.2.1 Mô tả bài toán Hiện nay, đa phần các trƣờng học đều sử dụng phần mềm tin học để quản lý điểm. .. trong đó nếu điểm vùng đi đƣợc một vòng chu tuyến thì điểm nền cũng đi đƣợc một vòng chu tuyến đối ngẫu *Các bước được mô tả cụ thể như sau: + Bước 1: Việc xác định cặp nền vùng xuất phát đƣợc xác định bằng cách duyệt ảnh lần lƣợt từ trên xuống dƣới, từ trái qua phải, rồi kiểm tra điều kiện theo định nghĩa ánh xạ cặp nền vùng (chỉ mang tính quy ƣớc) Ở đây ta chọn điểm vùng xuất phát là điểm vùng đầu tiên

Ngày đăng: 05/02/2016, 09:20

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan