1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phát hiện độ dịch chuyển của phiếu điểm

75 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

i ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG ĐÀO SƠN PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2015 ĐẠI HỌC THÁI NGUYÊN Số hóa Trung tâm Học liệu - ĐHTN Tai ngay!!! Ban co the xoa dong chu nay!!! http://www.lrc-tnu.edu.vn/ ii ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG ĐÀO SƠN PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Ngƣời hƣớng dẫn khoa học: PGS.TS ĐỖ NĂNG TỒN Thái Ngun - 2015 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ i LỜI CAM ĐOAN Tôi xin cam đoan kết luận văn sản phẩm riêng cá nhân Trong toàn nội dung luận văn, điều đƣợc trình bày cá nhân đƣợc tổng hợp từ nhiều nguồn tài liệu Tất tài liệu tham khảo có xuất xứ rõ ràng đƣợc trích dẫn hợp pháp Tơi xin hồn tồn chịu trách nhiệm theo quy định cho lời cam đoan Ngƣời cam đoan Đào Sơn Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ ii LỜI CẢM ƠN Trƣớc hết em xin gửi lời cảm ơn sâu sắc đến thầy hƣớng dẫn khoa học PGS.TS Đỗ Năng Toàn dẫn khoa học, định hƣớng nghiên cứu tận tình hƣớng dẫn tơi suốt q trình làm luận văn Em xin cảm ơn Thầy viện Công Nghệ Thông Tin, Thầy Cô trƣờng Đại học Công Nghệ Thông Tin Truyền Thông - Đại học Thái Nguyên quan tâm bảo trực tiếp giảng dạy, giúp đỡ suốt q trình học tập nghiên cứu Tơi xin chân cảm ơn lãnh đạo phòng, ban trƣờng Cao đẳng Cơ khí – Luyện kim tạo điều kiện cho học tập nghiên cứu đề tài Cuối cùng, tơi xin cảm ơn gia đình bạn bè, ngƣời ủng hộ động viên để yên tâm nghiên cứu luận văn Đào Sơn Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC HÌNH ẢNH .v MỞ ĐẦU Chƣơng : KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NHẬN DẠNG BIỂU MẪU 1.1 KHÁI QUÁT VỀ XỬ LÝ ẢNH 1.1.1 Xử lý ảnh 1.1.2 Mô tả ảnh 1.1.2.1 Picture Element: phần tử ảnh 1.1.2.2 Grey level: mức xám 1.1.2.3 Quan hệ điểm ảnh 1.1.3 Các vấn đề xử lý ảnh 11 1.1.3.1 Kỹ thuật tăng, giảm độ sáng 12 1.1.3.2 Kỹ thuật tăng, giảm độ tƣơng phản 13 1.1.3.3 Tách ngƣỡng 14 1.1.3.4 Chuyển đổi sang ảnh nhị phân 14 1.1.3.5 Loại bỏ nhiễu 17 1.2 NHẬN DẠNG PHIẾU ĐIỂM 21 1.2.1 Biểu diễn phiếu điểm 21 1.2.1.1 Cấu trúc vật lý 22 1.2.1.2 Cấu trúc logic 23 1.2.2 Phân tách vùng chứa liệu 24 1.2.3 Tách dịng tách kí tự 27 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ iv 1.2.3.1 Giải thuật Horizontal Projection 27 1.2.3.2.Giải thuật Vertical Projection 27 1.2.4 Trích rút đặc trƣng 28 Chƣơng : KỸ THUẬT PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM 29 2.1 KHỬ NHIỄU 29 2.1.1 Nhiễu ảnh 29 2.1.2 Khử nhiễu 30 2.1.2.1 Lọc tuyến tính (Linear Filter) 30 2.1.2.2 Lọc phi tuyến (NonLinear Filter) 36 2.1.2.3 Mặt nạ gờ sai phân làm nhăn (Unharp Masking and Crispering) 40 2.1.2.4 Lọc thông thấp, thông cao lọc dải thông 40 2.2 PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM DỰA VÀO HISTOGRAM 42 2.3 PHÁT HIỆN ĐỘ DỊCH CHUYỂN PHIẾU ĐIỂM THEO VĂN BẢN MẪU 50 Chƣơng : CHƢƠNG TRÌNH THỬ NGHIỆM 55 3.1 Bài toán 55 3.2 Phân tích tốn 55 3.3 Chƣơng trình thử nghiệm 56 PHẦN KẾT LUẬN 64 TÀI LIỆU THAM KHẢO 66 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ v DANH MỤC HÌNH ẢNH Hình 1.1: Q trình xử lý ảnh Hình 1.1: Các bƣớc xử lý ảnh Hình 1.3: Ví dụ lƣợc đồ xám Hình 1.4: Lân cận điểm ảnh toạ độ (x,y) Hình 1.5 Ảnh gốc Hình 1.6 Ảnh giảm độ sáng Hình 1.7 Ảnh đƣợc tăng cƣờng độ sáng Hình 1.8 Ảnh gốc Hình 1.9 Ảnh giảm độ tƣơng phản Hình 1.10 Ảnh đƣợc tăng độ tƣơng phản Hình 1.11 Mơ thuật tốn lọc trung vị để loại bỏ nhiễu Hình 1.12 Mơ tả phép quay ảnh Hình 1.13: Tổng quan trình tạo ảnh tài liệu Hình 1.14 Mẫu phiếu điểm thu nhận từ máy quét Hình 1.15 Bức ảnh trƣớc điều chỉnh kích thƣớc Hình 1.16 Bức ảnh sau điều chỉnh kích thƣớc thành 7x5 Hình 2.1: Ảnh gốc ảnh thu đƣợc qua lọc tuyến tính Hình 2.2: Ví dụ lọc giữ biên Hình 2.3: Các tốn tử gờ sai phân Hình 2.4: Sơ đồ lọc thơng cao Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ vi Hình 2.5: Một số nhân chập lọc thơng cao Hình 2.6: Ảnh qua lọc thơng cao (ảnh gốc 2.1) Hình 2.7 Mơ hình histogram dọc phiếu điểm mẫu Hình 2.8 Mơ hình histogram dọc phiếu điểm cần nhận dạng Hình 2.9 Mơ hình histogram phiếu điểm mẫu phiếu điểm cần nhận dạng đƣợc xếp trục tọa độ Hình 2.10 (a) ảnh mẫu (b) ảnh cần nhận dạng Hình 2.11 Mơ hình histogram dọc phiếu điểm mẫu Hình 2.12 Mơ hình histogram dọc phiếu điểm cần nhận dạng Hình 2.13 Mơ hình histogram phiếu điểm mẫu phiếu điểm cần nhận dạng đƣợc xếp trục tọa độ Hình 2.14 Xây dựng lƣới tựa hình chữ nhật Hình 3.1: Giao diện chƣơng trình thử nghiệm Hình 3.2: Menu File Hình 3.3: Menu Basic Hình 3.4: Menu Filter Hình 3.5: Menu Skew Detection Hình 3.6: Một mẫu phiếu điểm sau scan chƣa đƣợc xử lý Hình 3.7: Phiếu điểm sau đƣợc chỉnh độ nghiêng bị dịch chuyển Hình 3.8: Kết sau hiệu chỉnh Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ MỞ ĐẦU Hiện nay, việc quản lý, thu nhận xử lý thông tin với khối lƣợng ngày lớn, nhiều lúc với phần mềm thủ công không đem lại hiệu mong muốn, tốn nhiều thời gian cơng sức Nhằm đem lại xác nhanh chóng, đỡ tốn cơng sức ngƣời Trong năm gần nhiều nhà nghiên cứu phát triển mạnh mẽ toán nhập liệu tự động Nhập liệu tự động việc nạp thông tin vào máy thông qua tác động thủ công ngƣời.Tuy nhiên thực tế để cài hệ nhập liệu tự động cụ thể gặp nhiều khó khăn Trong hầu hết sở giáo dục đào tạo nƣớc ta đƣợc trang bị phần mềm quản lý đào tạo nhằm nâng cao chất lƣợng giảng dạy quản lý học sinh, sinh viên, giúp giảm bớt phần lớn công việc đội ngũ cán quản lý giáo dục Tuy nhiên việc lƣu trữ, cập nhật vào hệ thống phần mềm quản lý giáo dục cịn thủ cơng, khơng làm tốn nhiều cơng sức đội ngũ giáo vụ mà cịn có nhiều sai sót đặc biệt với trƣờng có số lƣợng mơn học số sinh viên lớn Từ lý trên, để khắc phục phần nhƣợc điểm em chọn đề tài “PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM” với mong muốn phần giải đƣợc phần khó khăn Thay phải nhập thủ công, việc nhập trở nên dễ dàng, thuận tiện Các cơng đoạn bao gồm: - Phiếu điểm viết tay giảng viên qua máy quét thu đƣợc hình ảnh đƣa vào máy tính - Áp dụng kỹ thuật tiền xử lý ảnh (nâng cao chất lƣợng ảnh, chuyển sang ảnh nhị phân, loại bỏ nhiễu, ) Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ - Nhận dạng với mẫu thu thập đƣợc - Cập nhật vào Cơ sở liệu Việc cập nhật tự động rõ ràng giải đƣợc khó khăn bất tiện quản lý điểm thông thƣờng để lại Nội dung luận văn tốt nghiệp gồm có chƣơng: Chương Khái quát xử lý ảnh nhận dạng biểu mẫu Chương Kỹ thuật phát độ dịch chuyển phiếu điểm Chương Chƣơng trình thử nghiệm Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 53 Lƣới tựa hình chữ nhật tƣơng ứng Lƣới xây dựng kết hợp từ lƣới tựa vùng chữ nhật văn mẫu Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 54 Khi đó, giá trị độ lệch văn mẫu so với ô lƣới đƣợc tính theo cơng thức N (i, j) M Grid là: 0 1/8 1/8 1/4 1/4 1/8 1/8 1/4 1/4 1/8 1/8 1/4 1/4 1/8 1/8 1/4 1/4 1/8 1/8 0 0 1/8 1/8 0 0 1/8 1/8 1/2 0 1/8 1/8 1/2 1/2 0 1/2 1/3 1/3 1/3 1/2 1/2 đó, độ lệch văn so với mẫu đƣợc tính theo cơng thức là: S 4* 1/  1/  1/  /   0,3125 4 16 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 55 Chƣơng CHƢƠNG TRÌNH THỬ NGHIỆM 3.1 Bài tốn u cầu đƣợc đặt chƣơng trình thử nghiệm đầu vào đọc đƣợc form tài liệu dạng ảnh ( phiếu điểm với góc nghiêng ảnh khơng q 150) Thực thao tác phóng to, thu nhỏ … phát độ dịch chuyển phiếu điểm Đầu chƣơng trình xuất file ảnh đƣợc xử lý 3.2 Phân tích tốn Ta vẽ sơ đồ sau: Chƣơng Trình Chức Hiệu chỉnh độ lệch Lọc nhiễu Đầu vào: đọc file ảnh (bảng điểm) Xử lí: lọc nhiễu, hiệu chỉnh độ lệch Đầu ra: xuất file ảnh đƣợc hiệu chỉnh Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 56 3.3 Chƣơng trình thử nghiệm Chƣơng trình đƣợc cài đặt bàng cơng cụ Visual C# Chƣơng trình có giao diện nhƣ hình sau: Hình 3.1: Giao diện chƣơng trình thử nghiệm 3.2.1 Menu File Menu File, chƣơng trình chứa chức Open (mở tệp ảnh), Save (lƣu tệp ảnh), Exit (thốt khỏi chƣơng trình) Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 57 Hình 3.2: Menu File 3.2.2 Menu Basic Menu Basic gồm có chức To Gray (chuyển sang ảnh xám) To Binary (chuyển sang ảnh nhị phân) Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 58 Hình 3.3: Menu Basic 3.2.3 Menu Filter Menu Filter ngƣời dùng lọc nhiễu ba lọc lọc trung bình khơng gian (Space medium Filter), lọc thơng thấp (Spacial Low- Pass) lọc đồng hình (Homomorphic Filter) Hình 3.4: Menu Filter 3.2.4 Menu Skew Detection Với chức phát độ dịch chuyển, ngƣời dùng tìm độ dịch chuyển phiếu điểm sau scan hiệu chỉnh lại ảnh cho xác với độ dịch chuyển đƣợc phát hiện, điều khiển độ dịch chuyển phiếu điểm để kiểm tra độ xác thuật tốn với độ dịch chuyển khác Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 59 Hình 3.5: Menu Skew Detection Sau chọn file ảnh (định dạng bmp, jpg, png ) click chuột chọn chức Skew Detection, chƣơng trình hiển thị độ dịch chuyển ảnh bị dịch chuyển thông báo không xác định đƣợc độ dịch chuyển cho văn với trƣờng hợp đặc biệt Chƣơng trình gồm có menu File, Basic, Filter Skew Detection nhƣng chủ yếu có hai chức chƣơng trình lọc ảnh phát độ dịch chuyển phiếu điểm theo số kỹ thuật nghiên cứu chƣơng Ngoài ra, cơng cụ cịn có chức thao tác ảnh nhƣ Rotate Image (quay ảnh), Zoom In (phóng to) Zoom Out (thu nhỏ), Undo (quay trở lại ảnh gốc) Save (lƣu ảnh thành file ổ cứng) Chức quay ảnh cho phép ngƣời dùng quay lại ảnh cho xác sau phát độ dịch chuyển, điều khiển độ dịch chuyển văn để kiểm tra độ xác thuật toán với độ dịch khác nhau, ngƣời dùng đƣợc nhập góc quay sử dụng chức dị Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 60 độ lệch để kiểm tra tính xác thuật tốn, chƣơng trình cài đặt thuật toán phát độ dịch chuyển ảnh văn thuật toán phát độ dịch chuyển dựa vào Histogram Các chức phóng to, thu nhỏ cho phép ngƣời dùng tăng giảm kích thƣớc ảnh trƣớc sau thao tác cho phù hợp với tầm quan sát Chức Save ảnh cho phép lƣu lại ảnh sau lọc ảnh hay hiệu chỉnh độ dịch chuyển từ ảnh đầu vào Áp dụng chƣơng trình thử nghiệm hiệu chỉnh độ nghiêng Kết thu đƣợc nhƣ sau: Thuật toán Số lƣợng bảng điểm Kết Tỷ lệ 30 29 97% 30 24 80% Phát độ dịch chyển theo dựa vào Histogram Phát độ dịch chuyển lƣới hình chữ nhật vàn mẫu Với kết thực nghiệm nhƣ trên, ta thấy với tập liệu mẫu phƣơng pháp phát độ dịch chuyển dựa vào Histogram cho kết cao Các hình dƣới hình giao diện chƣơng trình trƣớc sau hiệu chỉnh độ dịch chuyển Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 61 Hình 3.6: Một mẫu phiếu điểm sau scan chƣa đƣợc xử lý Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 62 Hình 3.7: Phiếu điểm sau đƣợc chỉnh độ nghiêng bị dịch chuyển Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 63 Hình 3.8: Kết sau hiệu chỉnh Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 64 PHẦN KẾT LUẬN Ngày nay, phát triển nhu cầu đòi hỏi xã hội, lƣợng lớn thông tin cần phải đƣợc nhập vào máy để xử lý Trong số thông tin cần nhập phiếu điểm dƣới dạng viết tay sngày có chiều hƣớng gia tăng sở giáo dục muốn lƣu trữ phiếu điểm để giảm tải phải lƣu trữ văn giấy cho phù hợp với thực tế đạt đƣợc hiệu kinh tế Hơn nữa, phát triển nhanh chóng cơng nghệ thông tin hai lĩnh vực: Phần cứng phần mềm cho phép kỹ thuật nhập liệu tự động phát triển theo nhiều phƣơng hƣớng khác đạt đƣợc thành công định Chẳng hạn, ngày mua đƣợc scanner quét nhiều trang (ADF) với tốc độ cao nhƣng giá lại rẻ chẳng khác scanner quét trang so với trƣớc Kỹ thuật nhập liệu tự động liên quan chặt chẽ với đồ hoạ, nhận dạng thuật xử lý ảnh Trong hệ thống nhập liệu tự động, chất lƣợng phiếu điểm thu nhận trình quét liên quan mật thiết chất lƣợng nhận dạng phiếu Những vấn đề thƣờng gặp phải q trình thu nhận là: Độ lệch, độ dịch chuyển, xoay, biến dạng v.v phiếu điểm, nhƣ đối tƣợng hình học đƣợc dùng để đánh dấu phiếu Xuất phát từ thực tế đó, luận văn nhằm nghiên cứu số kỹ thuật xử lý ảnh giúp nâng cáo chất lƣợng ảnh đầu vào nhằm nâng cao chất lƣợng hệ thống nhận dạng phiếu điểm đạt đƣợc số kết cụ thể sau:  Trình bày khái quát xử lý ảnh xử lý form tài liệu (phiếu điểm)  Hệ thống hóa số kỹ thuật nâng cao chất lƣợng nhận dạng phiếu điểm liên qua đến việc khử nhiễu hiệu chỉnh độ dịch chuyển Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 65  Cài đặt thử nghiệm chƣơng trình hiệu chỉnh độ dịch chuyển phiếu điểm Luận văn đáp ứng yêu cầu thực tiễn: nâng cao chất lƣợng ảnh phiếu điểm đầu vào nhằm nâng cao chất lƣợng hệ thống nhận dạng phiếu điểm mẫu, từ áp dụng vào lĩnh vực nhƣ tự động thu thập liệu từ mẫu đơn/báo biểu, tự động xử lý hoá đơn, tự động phục hồi copy tài liệu từ ảnh quét, … Do thời gian có hạn khả nhiều hạn chế nên luận văn khó tránh khỏi sai sót định, mong đƣợc góp ý thầy bạn bè để luận văn đƣợc hồn thiện Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 66 TÀI LIỆU THAM KHẢO Tiếng Việt Đỗ Năng Toàn, Phạm Việt Bình (2007), Giáo trình xử lý ảnh, NXB KH kỹ thuật Đỗ Năng Toàn, Phạm Văn Dũng, Phạm Việt Bình (2005), “Ứng dụng chu tuyến phát góc nghiêng văn bản”, Kỷ yếu Hội thảo Quốc gia lần thứ - Một số vấn đề chọn lọc Công nghệ Thông tin Truyền thông, Đà Nẵng 18-20/08 /2004, Nxb KH&KT, Hà Nội 2005, 432-441 Đỗ Năng Tồn, Ngơ Quốc Tạo, Một số phương pháp nâng cao hiệu nhận dạng phiếu điều tra dạng dấu phục vụ cho thiết kế hệ nhập liệu tự động markread, Tạp chí Tin học Điều khiển học, Tập 15, số 4, năm 1999 Lƣơng Mạnh Bá, Nguyễn Thanh Thuỷ (2008), Nhập môn xử lý ảnh số, NXB Khoa học kỹ thuật Tiếng Anh Pelin Corgel, Oguzhan Oztas, Handwritten character recognition system using artificial Neural Networks, Computer Engineering Department, Engineering Faculty, Istanbul University, Avcilar, Istanbul, TURKEY Marti and H Bunke, Text Line Segmentation and word recognition in a system for general writer Independent Handwriting Recognition, IEEE (February 5, 2001) Wojciech Kacalak, New methods for handwriting recognition using artificial neural networks, Technical university of Koszalin, Department of Mechanical Engineering, Raclawicka 15-17, 75-620 Koszalin,Poland Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 67 Adrian Low (1991), Introductory Computer Vision and Image Processing, Copyright (c) 1991 by McGrow Hill Book Company (UK) Limited A.K Das, B.Chada A fast algorithm for skew detection of document images using morphological Proc of International Journal on Document Analysis and Recognition, vol.4, 2001 10 H F Jiang, C.C Han, C.K Fan A fast Aproach to the Detecion and Correction of Skew Document Pattern Reconigtion Letter, vol.18, 1997 11 N Liolios, N Fakotkis and G Kokkinakis Improved Document Dkew Detection based on text line connection component clustering Proc of International Conference on Image Processing, Thessaloniki, vol.1, 2001 12 X, Jaing, H, Bunke, D, Widmer-Kljajo Skew detection of document image by focused nearest-neighbour-clustering Proc Of the 5th International Conference on Document Analysis and Recognition, 1999 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

Ngày đăng: 11/10/2023, 19:34

Xem thêm:

w