1. Trang chủ
  2. » Công Nghệ Thông Tin

Phát hiện độ dịch chuyển của phiếu điểm

73 268 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 73
Dung lượng 2 MB

Nội dung

i ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG ĐÀO SƠN PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2015 ĐẠI HỌC THÁI NGUYÊN ii ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG ĐÀO SƠN PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: PGS.TS ĐỖ NĂNG TOÀN Thái Nguyên - 2015 i LỜI CAM ĐOAN Tôi xin cam đoan kết luận văn sản phẩm riêng cá nhân Trong toàn nội dung luận văn, điều trình bày cá nhân tổng hợp từ nhiều nguồn tài liệu Tất tài liệu tham khảo có xuất xứ rõ ràng trích dẫn hợp pháp Tôi xin hoàn toàn chịu trách nhiệm theo quy định cho lời cam đoan Người cam đoan Đào Sơn ii LỜI CẢM ƠN Trước hết em xin gửi lời cảm ơn sâu sắc đến thầy hướng dẫn khoa học PGS.TS Đỗ Năng Toàn dẫn khoa học, định hướng nghiên cứu tận tình hướng dẫn suốt trình làm luận văn Em xin cảm ơn Thầy viện Công Nghệ Thông Tin, Thầy Cô trường Đại học Công Nghệ Thông Tin Truyền Thông - Đại học Thái Nguyên quan tâm bảo trực tiếp giảng dạy, giúp đỡ suốt trình học tập nghiên cứu Tôi xin chân cảm ơn lãnh đạo phòng, ban trường Cao đẳng Cơ khí – Luyện kim tạo điều kiện cho học tập nghiên cứu đề tài Cuối cùng, xin cảm ơn gia đình bạn bè, người ủng hộ động viên để yên tâm nghiên cứu luận văn Đào Sơn iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC HÌNH ẢNH v MỞ ĐẦU Chương : KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NHẬN DẠNG BIỂU MẪU 1.1 KHÁI QUÁT VỀ XỬ LÝ ẢNH 1.1.1 Xử lý ảnh 1.1.2 Mô tả ảnh 1.1.2.1 Picture Element: phần tử ảnh 1.1.2.2 Grey level: mức xám 1.1.2.3 Quan hệ điểm ảnh 1.1.3 Các vấn đề xử lý ảnh 11 1.1.3.1 Kỹ thuật tăng, giảm độ sáng 11 1.1.3.2 Kỹ thuật tăng, giảm độ tương phản 13 1.1.3.3 Tách ngưỡng 14 1.1.3.4 Chuyển đổi sang ảnh nhị phân 14 1.1.3.5 Loại bỏ nhiễu 17 1.2 NHẬN DẠNG PHIẾU ĐIỂM 20 1.2.1 Biểu diễn phiếu điểm 20 1.2.1.1 Cấu trúc vật lý 21 1.2.1.2 Cấu trúc logic 22 1.2.2 Phân tách vùng chứa liệu 23 1.2.3 Tách dòng tách kí tự 26 1.2.3.1 Giải thuật Horizontal Projection 26 iv 1.2.3.2.Giải thuật Vertical Projection 26 1.2.4 Trích rút đặc trưng 27 Chương : KỸ THUẬT PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM 28 2.1 KHỬ NHIỄU 28 2.1.1 Nhiễu ảnh 28 2.1.2 Khử nhiễu 29 2.1.2.1 Lọc tuyến tính (Linear Filter) 29 2.1.2.2 Lọc phi tuyến (NonLinear Filter) 35 2.1.2.3 Mặt nạ gờ sai phân làm nhăn (Unharp Masking and Crispering) 38 2.1.2.4 Lọc thông thấp, thông cao lọc dải thông 39 2.2 PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM DỰA VÀO HISTOGRAM 41 2.3 PHÁT HIỆN ĐỘ DỊCH CHUYỂN PHIẾU ĐIỂM THEO VĂN BẢN MẪU 48 Chương : CHƯƠNG TRÌNH THỬ NGHIỆM 53 3.1 Bài toán .53 3.2 Phân tích toán 53 3.3 Chương trình thử nghiệm 54 PHẦN KẾT LUẬN 62 TÀI LIỆU THAM KHẢO 64 v DANH MỤC HÌNH ẢNH Hình 1.1: Quá trình xử lý ảnh Hình 1.1: Các bước xử lý ảnh Hình 1.3: Ví dụ lược đồ xám Hình 1.4: Lân cận điểm ảnh toạ độ (x,y) Hình 1.5 Ảnh gốc Hình 1.6 Ảnh giảm độ sáng Hình 1.7 Ảnh tăng cường độ sáng Hình 1.8 Ảnh gốc Hình 1.9 Ảnh giảm độ tương phản Hình 1.10 Ảnh tăng độ tương phản Hình 1.11 Mô thuật toán lọc trung vị để loại bỏ nhiễu Hình 1.12 Mô tả phép quay ảnh Hình 1.13: Tổng quan trình tạo ảnh tài liệu Hình 1.14 Mẫu phiếu điểm thu nhận từ máy quét Hình 1.15 Bức ảnh trước điều chỉnh kích thước Hình 1.16 Bức ảnh sau điều chỉnh kích thước thành 7x5 Hình 2.1: Ảnh gốc ảnh thu qua lọc tuyến tính Hình 2.2: Ví dụ lọc giữ biên Hình 2.3: Các toán tử gờ sai phân Hình 2.4: Sơ đồ lọc thông cao Hình 2.5: Một số nhân chập lọc thông cao vi Hình 2.6: Ảnh qua lọc thông cao (ảnh gốc 2.1) Hình 2.7 Mô hình histogram dọc phiếu điểm mẫu Hình 2.8 Mô hình histogram dọc phiếu điểm cần nhận dạng Hình 2.9 Mô hình histogram phiếu điểm mẫu phiếu điểm cần nhận dạng xếp trục tọa độ Hình 2.10 (a) ảnh mẫu (b) ảnh cần nhận dạng Hình 2.11 Mô hình histogram dọc phiếu điểm mẫu Hình 2.12 Mô hình histogram dọc phiếu điểm cần nhận dạng Hình 2.13 Mô hình histogram phiếu điểm mẫu phiếu điểm cần nhận dạng xếp trục tọa độ Hình 2.14 Xây dựng lưới tựa hình chữ nhật Hình 3.1: Giao diện chương trình thử nghiệm Hình 3.2: Menu File Hình 3.3: Menu Basic Hình 3.4: Menu Filter Hình 3.5: Menu Skew Detection Hình 3.6: Một mẫu phiếu điểm sau scan chưa xử lý Hình 3.7: Phiếu điểm sau chỉnh độ nghiêng bị dịch chuyển Hình 3.8: Kết sau hiệu chỉnh MỞ ĐẦU Hiện nay, việc quản lý, thu nhận xử lý thông tin với khối lượng ngày lớn, nhiều lúc với phần mềm thủ công không đem lại hiệu mong muốn, tốn nhiều thời gian công sức Nhằm đem lại xác nhanh chóng, đỡ tốn công sức người Trong năm gần nhiều nhà nghiên cứu phát triển mạnh mẽ toán nhập liệu tự động Nhập liệu tự động việc nạp thông tin vào máy thông qua tác động thủ công người.Tuy nhiên thực tế để cài hệ nhập liệu tự động cụ thể gặp nhiều khó khăn Trong hầu hết sở giáo dục đào tạo nước ta trang bị phần mềm quản lý đào tạo nhằm nâng cao chất lượng giảng dạy quản lý học sinh, sinh viên, giúp giảm bớt phần lớn công việc đội ngũ cán quản lý giáo dục Tuy nhiên việc lưu trữ, cập nhật vào hệ thống phần mềm quản lý giáo dục thủ công, làm tốn nhiều công sức đội ngũ giáo vụ mà có nhiều sai sót đặc biệt với trường có số lượng môn học số sinh viên lớn Từ lý trên, để khắc phục phần nhược điểm em chọn đề tài “PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM” với mong muốn phần giải phần khó khăn Thay phải nhập thủ công, việc nhập trở nên dễ dàng, thuận tiện Các công đoạn bao gồm: - Phiếu điểm viết tay giảng viên qua máy quét thu hình ảnh đưa vào máy tính - Áp dụng kỹ thuật tiền xử lý ảnh (nâng cao chất lượng ảnh, chuyển sang ảnh nhị phân, loại bỏ nhiễu, ) - Nhận dạng với mẫu thu thập - Cập nhật vào Cơ sở liệu Việc cập nhật tự động rõ ràng giải khó khăn bất tiện quản lý điểm thông thường để lại Nội dung luận văn tốt nghiệp gồm có chương: Chương Khái quát xử lý ảnh nhận dạng biểu mẫu Chương Kỹ thuật phát độ dịch chuyển phiếu điểm Chương Chương trình thử nghiệm 51 Lưới tựa hình chữ nhật tương ứng Lưới xây dựng kết hợp từ lưới tựa vùng chữ nhật văn mẫu 52 Khi đó, giá trị độ lệch văn mẫu so với ô lưới tính theo công thức N M Grid (i, j) là: 0 1/8 1/8 1/4 1/4 1/8 1/8 1/4 1/4 1/8 1/8 1/4 1/4 1/8 1/8 1/4 1/4 1/8 1/8 0 0 1/8 1/8 0 0 1/8 1/8 1/2 0 1/8 1/8 1/2 1/2 0 1/2 1/3 1/3 1/3 1/2 1/2 đó, độ lệch văn so với mẫu tính theo công thức là: S *1 /  /  /  /   0,3125 44 16 53 Chương CHƯƠNG TRÌNH THỬ NGHIỆM 3.1 Bài toán Yêu cầu đặt chương trình thử nghiệm đầu vào đọc form tài liệu dạng ảnh ( phiếu điểm với góc nghiêng ảnh không 150) Thực thao tác phóng to, thu nhỏ … phát độ dịch chuyển phiếu điểm Đầu chương trình xuất file ảnh xử lý 3.2 Phân tích toán Ta vẽ sơ đồ sau: Chương Trình Chức Lọc nhiễu Hiệu chỉnh độ lệch Đầu vào: đọc file ảnh (bảng điểm) Xử lí: lọc nhiễu, hiệu chỉnh độ lệch Đầu ra: xuất file ảnh hiệu chỉnh 54 3.3 Chương trình thử nghiệm Chương trình cài đặt bàng công cụ Visual C# Chương trình có giao diện hình sau: Hình 3.1: Giao diện chương trình thử nghiệm 3.2.1 Menu File Menu File, chương trình chứa chức Open (mở tệp ảnh), Save (lưu tệp ảnh), Exit (thoát khỏi chương trình) 55 Hình 3.2: Menu File 3.2.2 Menu Basic Menu Basic gồm có chức To Gray (chuyển sang ảnh xám) To Binary (chuyển sang ảnh nhị phân) Hình 3.3: Menu Basic 56 3.2.3 Menu Filter Menu Filter người dùng lọc nhiễu ba lọc lọc trung bình không gian (Space medium Filter), lọc thông thấp (Spacial Low- Pass) lọc đồng hình (Homomorphic Filter) Hình 3.4: Menu Filter 3.2.4 Menu Skew Detection Với chức phát độ dịch chuyển, người dùng tìm độ dịch chuyển phiếu điểm sau scan hiệu chỉnh lại ảnh cho xác với độ dịch chuyển phát hiện, điều khiển độ dịch chuyển phiếu điểm để kiểm tra độ xác thuật toán với độ dịch chuyển khác 57 Hình 3.5: Menu Skew Detection Sau chọn file ảnh (định dạng bmp, jpg, png ) click chuột chọn chức Skew Detection, chương trình hiển thị độ dịch chuyển ảnh bị dịch chuyển thông báo không xác định độ dịch chuyển cho văn với trường hợp đặc biệt Chương trình gồm có menu File, Basic, Filter Skew Detection chủ yếu có hai chức chương trình lọc ảnh phát độ dịch chuyển phiếu điểm theo số kỹ thuật nghiên cứu chương Ngoài ra, công cụ có chức thao tác ảnh Rotate Image (quay ảnh), Zoom In (phóng to) Zoom Out (thu nhỏ), Undo (quay trở lại ảnh gốc) Save (lưu ảnh thành file ổ cứng) Chức quay ảnh cho phép người dùng quay lại ảnh cho xác sau phát độ dịch chuyển, điều khiển độ dịch chuyển văn để kiểm tra độ xác thuật toán với độ dịch khác nhau, người dùng nhập góc quay sử dụng chức dò độ lệch để kiểm tra tính xác thuật toán, chương trình cài đặt thuật 58 toán phát độ dịch chuyển ảnh văn thuật toán phát độ dịch chuyển dựa vào Histogram Các chức phóng to, thu nhỏ cho phép người dùng tăng giảm kích thước ảnh trước sau thao tác cho phù hợp với tầm quan sát Chức Save ảnh cho phép lưu lại ảnh sau lọc ảnh hay hiệu chỉnh độ dịch chuyển từ ảnh đầu vào Áp dụng chương trình thử nghiệm hiệu chỉnh độ nghiêng Kết thu sau: Thuật toán Phát độ dịch chyển theo dựa vào Histogram Số lượng bảng điểm Kết Tỷ lệ 30 29 97% 30 24 80% Phát độ dịch chuyển lưới hình chữ nhật vàn mẫu Với kết thực nghiệm trên, ta thấy với tập liệu mẫu phương pháp phát độ dịch chuyển dựa vào Histogram cho kết cao Các hình hình giao diện chương trình trước sau hiệu chỉnh độ dịch chuyển 59 Hình 3.6: Một mẫu phiếu điểm sau scan chưa xử lý 60 Hình 3.7: Phiếu điểm sau chỉnh độ nghiêng bị dịch chuyển 61 Hình 3.8: Kết sau hiệu chỉnh 62 PHẦN KẾT LUẬN Ngày nay, phát triển nhu cầu đòi hỏi xã hội, lượng lớn thông tin cần phải nhập vào máy để xử lý Trong số thông tin cần nhập phiếu điểm dạng viết tay sngày có chiều hướng gia tăng sở giáo dục muốn lưu trữ phiếu điểm để giảm tải phải lưu trữ văn giấy cho phù hợp với thực tế đạt hiệu kinh tế Hơn nữa, phát triển nhanh chóng công nghệ thông tin hai lĩnh vực: Phần cứng phần mềm cho phép kỹ thuật nhập liệu tự động phát triển theo nhiều phương hướng khác đạt thành công định Chẳng hạn, ngày mua scanner quét nhiều trang (ADF) với tốc độ cao giá lại rẻ chẳng khác scanner quét trang so với trước Kỹ thuật nhập liệu tự động liên quan chặt chẽ với đồ hoạ, nhận dạng thuật xử lý ảnh Trong hệ thống nhập liệu tự động, chất lượng phiếu điểm thu nhận trình quét liên quan mật thiết chất lượng nhận dạng phiếu Những vấn đề thường gặp phải trình thu nhận là: Độ lệch, độ dịch chuyển, xoay, biến dạng v.v phiếu điểm, đối tượng hình học dùng để đánh dấu phiếu Xuất phát từ thực tế đó, luận văn nhằm nghiên cứu số kỹ thuật xử lý ảnh giúp nâng cáo chất lượng ảnh đầu vào nhằm nâng cao chất lượng hệ thống nhận dạng phiếu điểm đạt số kết cụ thể sau:  Trình bày khái quát xử lý ảnh xử lý form tài liệu (phiếu điểm)  Hệ thống hóa số kỹ thuật nâng cao chất lượng nhận dạng phiếu điểm liên qua đến việc khử nhiễu hiệu chỉnh độ dịch chuyển  Cài đặt thử nghiệm chương trình hiệu chỉnh độ dịch chuyển phiếu điểm 63 Luận văn đáp ứng yêu cầu thực tiễn: nâng cao chất lượng ảnh phiếu điểm đầu vào nhằm nâng cao chất lượng hệ thống nhận dạng phiếu điểm mẫu, từ áp dụng vào lĩnh vực tự động thu thập liệu từ mẫu đơn/báo biểu, tự động xử lý hoá đơn, tự động phục hồi copy tài liệu từ ảnh quét, … Do thời gian có hạn khả nhiều hạn chế nên luận văn khó tránh khỏi sai sót định, mong góp ý thầy cô bạn bè để luận văn hoàn thiện 64 TÀI LIỆU THAM KHẢO Tiếng Việt Đỗ Năng Toàn, Phạm Việt Bình (2007), Giáo trình xử lý ảnh, NXB KH kỹ thuật Đỗ Năng Toàn, Phạm Văn Dũng, Phạm Việt Bình (2005), “Ứng dụng chu tuyến phát góc nghiêng văn bản”, Kỷ yếu Hội thảo Quốc gia lần thứ - Một số vấn đề chọn lọc Công nghệ Thông tin Truyền thông, Đà Nẵng 18-20/08 /2004, Nxb KH&KT, Hà Nội 2005, 432-441 Đỗ Năng Toàn, Ngô Quốc Tạo, Một số phương pháp nâng cao hiệu nhận dạng phiếu điều tra dạng dấu phục vụ cho thiết kế hệ nhập liệu tự động markread, Tạp chí Tin học Điều khiển học, Tập 15, số 4, năm 1999 Lương Mạnh Bá, Nguyễn Thanh Thuỷ (2008), Nhập môn xử lý ảnh số, NXB Khoa học kỹ thuật Tiếng Anh Pelin Corgel, Oguzhan Oztas, Handwritten character recognition system using artificial Neural Networks, Computer Engineering Department, Engineering Faculty, Istanbul University, Avcilar, Istanbul, TURKEY Marti and H Bunke, Text Line Segmentation and word recognition in a system for general writer Independent Handwriting Recognition, IEEE (February 5, 2001) Wojciech Kacalak, New methods for handwriting recognition using artificial neural networks, Technical university of Koszalin, Department of Mechanical Engineering, Raclawicka 15-17, 75-620 Koszalin,Poland Adrian Low (1991), Introductory Computer Vision and Image Processing, Copyright (c) 1991 by McGrow Hill Book Company (UK) Limited 65 A.K Das, B.Chada A fast algorithm for skew detection of document images using morphological Proc of International Journal on Document Analysis and Recognition, vol.4, 2001 10 H F Jiang, C.C Han, C.K Fan A fast Aproach to the Detecion and Correction of Skew Document Pattern Reconigtion Letter, vol.18, 1997 11 N Liolios, N Fakotkis and G Kokkinakis Improved Document Dkew Detection based on text line connection component clustering Proc of International Conference on Image Processing, Thessaloniki, vol.1, 2001 12 X, Jaing, H, Bunke, D, Widmer-Kljajo Skew detection of document image by focused nearest-neighbour-clustering Proc Of the 5th International Conference on Document Analysis and Recognition, 1999 ... thấp, thông cao lọc dải thông 39 2.2 PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM DỰA VÀO HISTOGRAM 41 2.3 PHÁT HIỆN ĐỘ DỊCH CHUYỂN PHIẾU ĐIỂM THEO VĂN BẢN MẪU 48 Chương : CHƯƠNG... nhược điểm em chọn đề tài “PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM” với mong muốn phần giải phần khó khăn Thay phải nhập thủ công, việc nhập trở nên dễ dàng, thuận tiện Các công đoạn bao gồm: - Phiếu. .. hình histogram dọc phiếu điểm mẫu Hình 2.12 Mô hình histogram dọc phiếu điểm cần nhận dạng Hình 2.13 Mô hình histogram phiếu điểm mẫu phiếu điểm cần nhận dạng xếp trục tọa độ Hình 2.14 Xây dựng

Ngày đăng: 15/04/2017, 20:59

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w