1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu một số kỹ thuật xác định vùng chữ số phục vụ bài toán nhập điểm tự động

72 116 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 72
Dung lượng 1,86 MB

Nội dung

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐH CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG Vũ Thị Hằng NGHIÊN CỨU MỘT SỐ KỸ THUẬT XÁC ĐỊNH VÙNG CHỮ SỐ PHỤC VỤ BÀI TOÁN NHẬP ĐIỂM TỰ ĐỘNG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2015 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐH CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG Vũ Thị Hằng NGHIÊN CỨU MỘT SỐ KỸ THUẬT XÁC ĐỊNH VÙNG CHỮ SỐ PHỤC VỤ BÀI TOÁN NHẬP ĐIỂM TỰ ĐỘNG Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC TS Vũ Duy Linh Thái Nguyên - 2015 LỜI CAM ĐOAN Tôi xin cam đoan toàn nội dung luận văn tự sưu tầm, tra cứu xếp cho phù hợp với nội dung yêu cầu đề tài Nội dung luận văn chưa công bố hay xuất hình thức không chép từ công trình nghiên cứu Tất phần mã nguồn chương trình tơi tự thiết kế xây dựng, có sử dụng số thư viện chuẩn thuật toán tác giả xuất cơng khai miễn phí mạng Internet Nếu sai tơi xin hồn tồn chịu trách nhiệm Thái Ngun, ngày tháng 07 năm 2015 Người cam đoan Vũ Thị Hằng LỜI CẢM ƠN Trong trình học tập nghiên cứu lớp Cao học khóa 12 chuyên ngành Khoa học máy tính trường ĐH Cơng nghệ thông tn truyền thông - Đại học Thái Nguyên, tơi nhận nhiều bảo, dìu dắt, giảng dậy nhiệt tình thầy, giáo Viện công nghệ thông tin Các thầy cô giáo quản lý trường ĐH Công nghệ thông tin truyền thông - Đại học Thái Nguyên giúp đỡ, tạo điều kiện tốt cho trình cơng tác học tập Nhân dịp xin bày tỏ lời cảm ơn chân thành tới tập thể thầy, cô giáo Viện công nghệ thông tin, thầy cô giáo trường ĐH Công nghệ thông tn truyền thông - Đại học Thái Nguyên Tôi xin chân thành cảm ơn sâu sắc tới thầy giáo TS Vũ Duy Linh cho nhiều ý kiến đóng góp q báu, tận tình hướng dẫn tạo điều kiện cho tơi hồn thành tốt luận văn tốt nghiệp Tôi xin cảm ơn đồng nghiệp người thân động viên, giúp đỡ tơi q trình nghiên cứu thực luận văn Q trình thực đề tài khơng tránh khỏi thiếu sót, mong tiếp tục nhận đóng góp ý kiến thầy, giáo, bạn đồng nghiệp đề tài nghiên cứu tơi để đề tài hồn thiện Tôi xin trân trọng cảm ơn! Thái Nguyên, ngày tháng 07 năm 2015 Vũ Thị Hằng DANH MỤC CÁC HÌNH VẼ Trang Hình 2.1 Xấp xỉ xấp xỉ X 20 Hình 2.2 Kết ảnh biên thu số phương pháp 22 Hình 2.3 Đường thẳng Hough tọa độ cực 26 Hình 2.4 Biến đổi Hough phát góc nghiêng 28 Hình 2.5 Đường biên lý tưởng Error! Bookmark not defined Hình 2.6 Đường biên dốc Error! Bookmark not defined Hình 2.7 Đường biên khơng trơn Error! Bookmark not defined Hình 2.8 Sơ đồ phân tích ảnh Error! Bookmark not defined Hình 2.9 Toán tử lân cận Error! Bookmark not defined Hình 2.10 Ví dụ chu tuyến đối ngẫu Error! Bookmark not defined Hình 2.11 Chu tuyến chu tuyến ngồi đối tượng Error! Bookmark not defined Hình 3.1 Mẫu bảng điểm 44 Hình 3.2 Hình ảnh bảng điểm chưa xác định vùng chứa điểm 50 Hình 3.3 Hình ảnh bảng điểm xác định vùng chứa điểm 50 Bảng 4.1: Kết thực nghiệm 51 MỤC LỤC MỞ ĐẦU Chương 1: KHÁI QUÁT NHẬP ĐIỂM TỰ ĐỘNG VÀ BÀI TOÁN ĐỊNH VỊ VÙNG 10 1.1 Khái quát nhận dạng văn nhập điểm tự động 10 1.1.1 Nhận dạng văn 10 1.1.2 Quản lý nhập điểm 11 1.2 Bài toán định vị vùng nhập điểm tự động 13 1.2.1 Mơ tả tốn 13 1.2.2 Một số cách tiếp cận 14 Chương 2: MỘT SỐ KỸ THUẬT ĐỊNH VỊ VÙNG 15 2.1 Định vị vùng theo phương pháp hình thái học 15 2.1.1 Các phép tốn hình thái 15 2.1.1.1 Một số định nghĩa 15 2.1.1.2 Một số tính chất phép tốn hình thái 16 2.1.2 Phát biên dựa vào phép tốn hình thái 18 2.1.2.1 Xấp xỉ xấp xỉ đối tượng ảnh 18 2.1.2.2.Thuật toán phát biên dựa vào phép tốn hình thái 19 2.1.3 Định vị vùng sử dụng phương pháp hình thái học 21 2.2 Định vị vùng sử dụng phép biến đổi Hough 22 2.2.1 Biến đổi Hough cho đường thẳng 22 2.2.2 Biến đổi Hough cho đường thẳng tọa độ cực 25 2.2.3 Biến đổi Hough phát góc nghiêng phiếu điểm 26 2.2.3.1 Áp dụng biến đổi Hough phát góc nghiêng phiếu điểm 26 2.2.3.2 Thuật toán phát hiệu chỉnh góc nghiêng phiếu điểm 27 2.2.4 Định vị vùng sử dụng phép biến đổi Hough 29 2.3 Kỹ thuật định vị vùng sử dụng phương pháp lần đường biên 30 2.3.1 Biên đối tượng ảnh 30 2.3.1.1 Biên kiểu biên ảnh 30 2.3.1.2 Vai trò biên nhận dạng 33 2.3.2 Kỹ thuật dò biên 35 2.3.2.1 Phương pháp dò biên trực tiếp 35 2.3.2.2 Phương pháp dò biên gián tiếp 43 2.3.2.3 Thuật tốn dò biên tổng qt 47 Chương 3: CHƯƠNG TRÌNH THỬ NGHIỆM 51 3.1 Bài toán 51 3.2 Phân tích tốn 52 3.3 Chương trình thử nghiệm 55 3.3.1 Thiết kế chương trình 55 3.3.2 Một số kết chương trình 58 PHẦN KẾT LUẬN 60 TÀI LIỆU THAM KHẢO 62 10 MỞ ĐẦU Lý chọn đề tài Xử lý ảnh khoa học tương đối mẻ so với nhiều ngành khoa học khác, quy mô công nghiệp, song xử lý ảnh bắt đầu xuất máy tính chuyên dụng Nhận dạng phận quan trọng xử lý ảnh ứng dụng hiệu nhiều lĩnh vực khác y tế, giáo dục, quốc phòng, nghiên cứu vũ trụ Trong q trình cơng tác, tơi nhận thấy rằng: Việc xử lý kết thi sinh viên hầu hết trường thực cách thủ công Kết thi sau giảng viên ghi vào biên chấm thi nhập vào máy tính để lưu trữ xử lý Việc nhập điểm thủ công tốn nhiều công sức khả nhầm lẫn cao Nếu công việc nhập điểm từ biên chấm thi vào máy tính tự động hóa hiệu nhiều Để giúp cho việc đòi hỏi phải xây dựng công cụ hữu hiệu việc nhận dạng vùng chứa liệu bảng điểm, nhận dạng chữ số viết tay Trong phạm vi đề tài luận văn thạc sỹ, sâu vào tm hiểu kỹ thuật phát định vị vùng chứa chữ số viết tay bảng điểm phục vụ cho toán nhập phiếu điểm tự động Do tơi chọn đề tài: “Nghiên cứu số kỹ thuật xác định vùng chữ số phục vụ toán nhập điểm tự động” Đối tượng phạm vi nghiên cứu a Đối tượng nghiên cứu - Phiếu điểm (biên chấm thi) số trường học tự động 45 Với phương pháp biến đổi Hough, ta thấy thích hợp cho tốn chất bảng điểm tạo từ đường thẳng ngang, dọc Vì vậy, ta dùng biến đổi Hough để tìm đường thẳng rõ ràng ta hồn tồn xác định vùng chứa điểm Tuy nhiên, qua thực nghiệm tác giả nhận thấy đường thẳng nét mỏng bảng điểm qua trình quét ảnh đường thẳng thường bị đứt nét dẫn tới khó để định vị đường thảng Chúng ta xử lý vấn đề cách tăng độ dày đường này, nhiên điều dẫn tới bảng điểm tính thẩm mỹ Với phương pháp phát vùng theo phương pháp hình thái học, ta thấy đặc tính quan trọng để định vị vùng cần tm xác định ngưỡng xám Trên vùng chứa liệu điểm, phân bố mức xám không đặc biệt so với vùng khác Vì mà nhị phân hóa vùng liệu điểm có đặc thù hình thái Điều đẫn tới khó khăn việc định vị vùng Với phương pháp phân loại Heuristic, ta xây dựng phân loại thơng qua tiêu chí sau: Màu sắc Kích thước chiều dài, chiều rộng Tỉ lệ chiều dài chiều rộng Diện tích vùng chứa liệu điểm Số lượng vùng 46 Với têu chí ta xây dựng phân loại Tốc độ tỷ lệ xác tùy thuộc vào cách xếp phân loại 46 Lược đồ sau cho thấy cách xếp phân loại mà thực nghiệm cho kết khả quan: Vùng ứng viên chứa điểm Kích thước hai chiều khoảng [20, 50] pixel Khơng phải Có khả Diện tích khoảng [50, 300] pixel Khơng phải Có khả Chứa từ đến vùng diện tích [10, 50] Khơng phải Bổ sung vùng ảnh vào tập kết tìm Để khắc phục nhược điểm phương pháp ta kết hợp phương pháp hình thái học với phân loại Heuristic: Nâng cao chất lượng ảnh đầu vào Phát biên sử dụng mặt nạ Sobel thu ảnh IS Sau nhị phân hóa IS thu ảnh chứa tập cạnh IE Tìm vùng liên thơng IE (mỗi vùng hình bao đối tượng ảnh) Ta gọi tập vùng liên thông {Ic} 47 Xác định vùng điểm tập {Ic} Ta gọi tiêu chuẩn giúp xác định vùng biển số tập {Ic} Heuristc: o 20 pixel ≤ chiều cao, chiều rộng ≤ 50 pixel o 50 pixel ≤ diện tích Ici ≤ 300 pixel o Mật độ điểm ảnh o Ici vùng chứa liệu điểm chứa từ đến đến vùng (là vùng chứa ký tự) 3.3 Chương trình thử nghiệm 3.3.1 Thiết kế chương trình Qua phân tích trên, tác giả xây dựng chương trình thử nghiệm với đầu vào ảnh bảng điểm nhập từ thiết bị thu nhận ảnh Chương trình cho phép phát vùng chứa liệu ảnh cách xác Chương trình có module sau: Module: Đọc liệu đầu vào o Đầu vào: File ảnh bảng điểm o Đầu ra: Ảnh xám Dữ liệu đầu vào thu nhận từ file ảnh BMP Chương trình đọc trực tếp file ảnh sau chuyển sang ảnh xám lưu định dạng ma trận bitmap hai chiều Module: Tiền xử lý o Đầu vào: Ảnh xám 48 o Đầu ra: Ảnh sau chuẩn hóa kích thước 640 x 480 48 Module làm nhiệm vụ nâng cao chất lược ảnh đầu vào thông qua số bước xử lý làm sắc nét ảnh, cần độ tương phản, , đưa ảnh kích thước 640 x 480 để phục vụ cho bước sau Module: Đưa ảnh nhị phân o Đầu vào: Ảnh xám o Đầu ra: Ảnh nhị phân Sử dụng thuật toán SIS trình bày phần đưa ảnh ảnh nhị phân phục vụ cho giai đoạn sau Module: Tìm biên ảnh o Đầu vào: Ảnh nhị phân o Đầu ra: Ảnh biên Sobel Do vùng liên thông ảnh mờ khơng rõ nét Như để giai đoạn tìm vùng liên thơng cho kết tốt ta tiến hành tìm biên Sobel trước tm vùng liên thông Module: Tách vùng liên thơng ảnh o Đầu vào: Ảnh sau dò biên o Đầu ra: Tập vùng liên thông {IC} Từ ảnh sau tìm biên Sobel ta tiến hành dò tìm vùng liên thơng ảnh lưu vào tập {IC} Module: Xác định vùng ứng viên chứa điểm o Đầu vào: Tập vùng liên thông {IC} o Đầu ra: Tập vùng ứng viên chứa điểm {IL} 49 Từ tập vùng liên thông {IC} ta sử dụng phương pháp kết hợp hình thái học với Heuristic trình bày phần để xác định vùng ứng viên chứa {IL} Module: Loại bỏ vùng ứng viên chứa điểm tập {IL} o Đầu vào: Tập {IL} o Đầu ra: Tập {IL} sau loại bỏ vùng ứng viên vùng chứa điểm Dựa vào thông tin tỷ lệ cạnh, chiều cao, độ rộng vùng ta xác định vùng IL tương ứng có phải vùng chứa điểm hay không Module: Hiển thị kết o Đầu vào: Tập {IL} o Đầu ra: Ảnh sau khoanh vùng (đổi màu) chứa liệu điểm Với ảnh tập {IL} ta tiến hành khoanh vùng chứa liệu điểm ảnh gốc hiển thị kết cho đầu vào tương ứng 50 3.3.2 Một số kết chương trình Hình 3.2 Hình ảnh bảng điểm chưa xác định vùng chứa điểm Hình 3.3 Hình ảnh bảng điểm xác định vùng chứa điểm Thông qua tiến hành thực nghiệm file ảnh, chương trình thu kết sau: 51 Máy chạy thực nghiệm: AMD Turion 64 x TL – 58 1.9 GHz, Ram 2GB Kết thực nghiệm: Được bảng 3.1 Bảng 4.1: Kết thực nghiệm Đầu vào File ảnh Số lượng/ Lần 100 Thành công (%) 96 Lỗi (%) 52 PHẦN KẾT LUẬN Trong giai đoạn hệ thống nhập điểm tự động, giai đoạn phát tách vùng chứa điểm giai đoạn khó khăn đòi hỏi nhiều thời gian ảnh thu từ thiết bị thường bị sai lệch yếu tố góc quay, khoảng cách, ánh sáng, Phần lớn kết nhận dạng sai khơng phát xác vùng chứa điểm Đề tài nghiên cứu số kỹ thuật phát vùng áp dụng vào toán phát vùng chứa liệu điểm toán nhập điểm tự động Trong thời gian nghiên cứu thực luận văn, tác giả đạt số kết sau: - Nghiên cứu số kỹ thuật tiền xử lý ảnh nhằm nâng cao chất lượng ảnh đầu vào; - Nghiên cứu số kỹ thuật phát vùng ảnh: Phát vùng theo phương pháp hình thái học, phát vùng sử dụng phương pháp phân loại Heuristc, phát vùng sử dụng phép biến đổi Hough phát vùng sử dụng phương pháp hình thái học kết hợp với Heuristic; - Thiết kế chương trình phát vùng chứa điểm bảng điểm sử dụng phương pháp kết hợp hình thái học với Heuristc Chương trình cho phép nhận ảnh bảng điểm từ file Qua thực nghiệm cho thấy chương trình làm việc tốt với ảnh đầu vào mức độ khác chất lượng ảnh 53 Một số đề xuất Trong thời gian tới, báo cáo chương trình nghiên cứu, phát triển thêm số chức năng: - Cải tiến số chức chương trình cho phép nâng cao hiệu phát vùng chứa liệu điểm bảng điểm giảm thiểu thời gian xử lý; - Tích hợp thêm chức nhận dạng chữ số viết tay để hoàn thiện chương trình nhập điểm tự động 54 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Đỗ Năng Tồn, Phạm Việt Bình (2008), Giáo trình xử lý ảnh, Nxb Khoa học Kỹ thuật, 2008 [2] Đỗ Năng Toàn, Phạm Văn Dũng, Phạm Việt Bình (2005), “Ứng dụng chu tuyến phát góc nghiêng văn bản”, Kỷ yếu Hội thảo Quốc gia lần thứ Một số vấn đề chọn lọc Công nghệ Thông tin Truyền thông, Đà Nẵng 18-20/08 /2004, Nxb KH&KT, Hà Nội 2005, 432-441 [3] Đỗ Năng Tồn, Ngơ Quốc Tạo, Một số phương pháp nâng cao hiệu nhận dạng phiếu điều tra dạng dấu phục vụ cho thiết kế hệ nhập liệu tự động markread, Tạp chí Tin học Điều khiển học, Tập 15, số 4, năm 1999 Tiếng Anh [4] A Amin and S Fischer, A Document Skew Detection Method Using the Hough Transform, Pattern Analysis & Applications, 2000 [5] H Baird, “The skew angle of printed documents” Society of Photographic Scientists and Engineers, 1987 [6] J Canny, A Computational Approach To Edge Detection, IEEE Trans Pattern Analysis and Machine Intelligence, 1986 [7] Castan, S.; Zhao, J and Shen, J."New edge detecton methods based on exponential filter", Patern Recognition, vol.1, Jun 1990 [8] A.K Das, B.Chada A fast algorithm for skew detection of document images using morphological Proc of International Journal on Document Analysis and Recognition, vol.4, 2001 [9] S C Hinds, J L Fisher and D P D'Amato A Document Skew Detecton Method Using Run-Length Encoding and the Hough Transform 10th International Conference on Pattern Recognition, vol 1, 1990 55 [10] X Jaing, H Bunke, D Widmer-Kljajo Skew detection of document image by focused nearest-neighbour-clustering Proc Of the 5th 56 International Conference on Document Analysis and Recogniton, Bangalore 1999 [11] Kimmel, Ron and Bruckstein, Alfred M "On regularized Laplacian zero crossings and other optmal edge integrators", Internatonal Journal of Computer Vision, 2003 [12] D X Le, "Automated Document Skew Angle Detecton Using Projecton Profiles, Variances, Component Labelling and the Hough Transform," M.S thesis, Computer Science Department, George Mason University, November 17th, 1992 [13] Shutao Li, Qinghua Shen and Jun Sun Recognition Letters, Volume 28, Issue 5, April 2007 [14] Yue Lu and Chew Lim Tan, “A nearest neighbor chain based approach to skew estimaton in document images”, Pattern Recognition Letters 24, 2003 ... nhập phiếu điểm tự động Do tơi chọn đề tài: Nghiên cứu số kỹ thuật xác định vùng chữ số phục vụ toán nhập điểm tự động Đối tượng phạm vi nghiên cứu a Đối tượng nghiên cứu - Phiếu điểm (biên... THÔNG TIN VÀ TRUYỀN THÔNG Vũ Thị Hằng NGHIÊN CỨU MỘT SỐ KỸ THUẬT XÁC ĐỊNH VÙNG CHỮ SỐ PHỤC VỤ BÀI TOÁN NHẬP ĐIỂM TỰ ĐỘNG Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 LUẬN VĂN THẠC SĨ KHOA... số kỹ thuật hỗ trợ xác định vùng chứa liệu điểm Nhiệm vụ nghiên cứu - Nghiên cứu kỹ thuật xử lý nhận dạng ảnh - Nghiên cứu cấu trúc bảng điểm từ đề xuất mẫu phiếu điểm giúp cho việc nhận dạng tự

Ngày đăng: 08/01/2019, 13:07

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w