Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 67 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
67
Dung lượng
2,44 MB
Nội dung
ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THƠNG Phạm Đức Tồn NGHIÊN CỨU KỸ THUẬT ĐỊNH VỊ, TÁCH VÀ NHẬN DẠNG VÙNG TÔ TRONG PHIẾU TRẮC NGHIỆM LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH Thái ngun, 2014 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên Tai ngay!!! Ban co the xoa dong chu nay!!! http://www.lrc-tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG Phạm Đức Toàn NGHIÊN CỨU KỸ THUẬT ĐỊNH VỊ, TÁCH VÀ NHẬN DẠNG VÙNG TƠ TRONG PHIẾU TRẮC NGHIỆM Ngành: Cơng nghệ thơng tin Chun ngành: Khoa học máy tính Mã số: 60.48.01 LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS ĐỖ NĂNG TOÀN Thái nguyên, 2014 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ i LỜI CAM ĐOAN Tơi xin cam đoan, tồn nội dung liên quan tới đề tài trình bày luận văn thân tơi tự tìm hiểu nghiên cứu, hướng dẫn khoa học Thày giáo PGS TS Đỗ Năng Toàn Các tài liệu, số liệu tham khảo trích dẫn đầy đủ nguồn gốc Tơi xin chịu trách nhiệm trước pháp luật lời cam đoan Thái Nguyên, ngày 10 tháng năm 2014 Học viên thực Phạm Đức Tồn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ ii LỜI CẢM ƠN Tôi xin gửi lời cảm ơn tới Khoa Công nghệ thông tin Trường Đại học Công nghệ thông tin Truyền thông - Đại học Thái Nguyên, nơi thày tận tình truyền đạt kiến thức q báu cho tơi suốt q trình học tập Xin cảm ơn Ban chủ nhiệm khoa cán tạo điều kiện tốt cho chúng tơi học tập hồn thành đề tài tốt nghiệp Đặc biệt, tơi xin gửi tới thày giáo, PGS TS Đỗ Năng Tồn, thày tận tình bảo tơi suốt q trình thực đề tài lời cảm ơn biết ơn sâu sắc Bên cạnh kiến thức khoa học, thày giúp nhận học phong cách học tập, làm việc kinh nghiệm sống quý báu Tôi xin bày tỏ lịng biết ơn tới gia đình, bạn bè, đồng nghiệp người thân động viên khích lệ tinh thần giúp đỡ để tơi hồn thành luận văn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC HÌNH v MỞ ĐẦU Chƣơng 1: KHÁI QUÁT VỀ NHẬP DỮ LIỆU TỰ ĐỘNG VÀ BÀI TOÁN NHẬN DẠNG PHIẾU TRẮC NGHIỆM 1.1 Khái quát nhập liệu tự động 1.2 Bài toán nhận dạng thi trắc nghiệm 1.2.1 Ảnh số 1.2.1.1 Phần tử ảnh 1.2.1.2 Mức xám 1.2.1.3 Ảnh 1.2.1.4 Phân loại ảnh 1.2.1.5 Biểu diễn ảnh máy tính 1.2.2 Một số vấn đề nhận dạng 1.2.2.1 Không gian biểu diễn đối tượng, không gian diễn dịch 1.2.2.2 Mơ hình chất q trình nhận dạng 10 Chƣơng 2: MỘT SỐ KỸ THUẬT TRONG NHẬN DẠNG PHIẾU TRẮC NGHIỆM 15 2.1 Giới thiệu chung 15 2.2 Các kỹ thuật tiền xử lý 16 2.2.1 Tăng giảm độ sáng 16 2.2.2 Tăng giảm độ tương phản 16 2.2.3 Tách kênh màu đỏ 17 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ iv 2.2.4 Chuyển xám ảnh 18 2.2.5 Phân ngưỡng ảnh 19 2.2.6 Nhiễu ảnh số phương pháp lọc nhiễu 23 2.2.7 Xoay ảnh 27 2.2.8 Làm trơn ảnh, tách biên đối tượng 28 2.2.9 Chỉnh góc nghiêng ảnh 29 2.3 Các kỹ thuật phân vùng ảnh 32 2.3.1 Phân vùng ảnh dựa phương pháp phân lớp 33 2.3.2 Phân vùng ảnh dựa cấu trúc 35 2.3.3 Phân vùng dựa vào đường biên 38 2.4 Kỹ thuật nhận dạng vùng tô phiếu trả lời trắc nghiệm 42 2.4.1 Nhận dạng điểm định vị 42 2.4.2 Tách vùng tô 43 2.4.3 Nhận dạng vùng tô 44 Chƣơng 3: XÂY DƢNG HỆ THỐNG CHẤM THI TRẮC NGHIỆM 49 3.1 Quá trình xử lý thi trắc nghiệm 49 3.2 Tiền xử lý ảnh quét 50 3.2.1 Tách kênh màu đỏ ảnh quét 50 3.2.2 Phân ngưỡng ảnh quét 52 3.2.3 Lọc nhiễu ảnh quét 52 3.2.4 Căn chỉnh độ lệch trang ảnh sau quét 53 3.3 Xác định điểm định vị 54 3.4 Khoanh vùng tô 54 3.5 Nhận dạng ô tô 54 3.6 Kết thử nghiệm 57 KẾT LUẬN 58 TÀI LIỆU THAM KHẢO 59 Số hóa Trung tâm Học liệu – Đại học Thái Ngun http://www.lrc-tnu.edu.vn/ v DANH MỤC CÁC HÌNH Hình 1.1 Mơ hình màu RGB Hình 1.2 Mơ hình màu CMY Hình 1.3 Mơ hình cấu trúc đối tượng nhà 13 Hình 1.4 Sơ đồ tổng quát hệ nhận dạng 14 Hình 2.1 Ảnh trước chuyển xám 19 Hình 2.2 Ảnh thực chuyển xám 19 Hình 2.3 Chọn ngưỡng theo Zack 21 Hình 2.4 Phương pháp lấy ngưỡng 22 Hình 2.5 Phân ngưỡng theo thuật toán SIS 23 Hình 2.6 Ảnh thu qua lọc Mean 25 Hình 2.7 Ảnh sau qua lọc Median 26 Hình 2.8 Ảnh thu sau xử lý qua lọc Gauss 27 Hình 2.9 Hệ tọa độ xoay ảnh 28 Hình 2.10 Phương pháp Postl 32 Hình 2.11 Lược đồ xám ảnh 34 Hình 2.12 Thuật tốn tam giác 34 Hình 2.13 Các điểm lân cận gradient 39 Hình 2.14 Căn chỉnh đường biên 41 Hình 2.15 Các điểm định vị phiếu trả lời câu hỏi trắc nghiệm 42 Hình 2.16 Vùng số báo danh mã đề qua xử lý 44 Hình 2.17 Vùng đáp án qua xử lý 44 Hình 2.18 Các dạng tô phiếu trả lời trắc nghiệm 45 Hình 2.19 Ơ bị tơ trùng 45 Hình 2.20 Ơ bị tơ lệch, tơ tràn lan 45 Hình 2.21 Ảnh cần kiểm tra tô chia thành vùng 46 Hình 3.1 Quá trình xử lý thi trắc nghiệm 50 Hình 3.2 Ảnh trước thực tách kênh màu đỏ 51 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ vi Hình 3.3 Ảnh sau thực tách kênh màu đỏ 51 Hình 3.4 Ảnh sau thực phân ngưỡng lọc nhiễu 52 Hình 3.5 Ảnh thực chỉnh độ lệch 53 Hình 3.6 Xác định điểm định vị 54 Hình 3.7 Vùng chứa số báo danh 55 Hình 3.8 Vùng chứa mã đề 55 Hình 3.9 Vùng tơ chứa đáp án 55 Hình 3.10 Nhận dạng vùng tơ 56 Hình 3.11 Kết nhận dạng phiếu trả lời trắc nghiệm 56 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ MỞ ĐẦU Lĩnh vực nhận dạng đối tượng ảnh số quan tâm từ lâu có thành công đáng kể như: nhận dạng vân tay, nhận dạng mặt người, nhận dạng biển số xe máy, Ngày nay, với xã hội thông tin phát triển vũ bão, việc thu thập thông tin gặp nhiều trở ngại lượng thông tin cần thu thập lớn Nhận dạng đối tượng, vùng tô phiếu trả lời trắc nghiệm, thăm dị ý kiến nói chung nhận nhiều quan tâm Trên sở toán học, phân tích đặc trưng thơng tin cần thu thập việc thiết kế mẫu biểu để thu thập thông tin, vận dụng kỹ thuật nhận dạng để thu thập, cập nhật thông tin thực tế tốn khó, phát triển để đưa vào đời sống xã hội Ở nước ta vài năm gần đây, Bộ Giáo dục Đào tạo ứng dụng hình thức thi trắc nghiệm vào thi đại học, làm giảm bớt thời gian chấm thi cách đáng kể Việc chấm thi trắc nghiệm nhận dạng, xử lý qua máy tính, không cần giáo viên chuyên gia lĩnh vực có mặt trực tiếp chấm thi trước Việc chấm thi trắc nghiệm thực thông qua giải pháp sử dụng hệ thống máy chấm thi tự động Người dùng cần đưa phiếu trả lời câu hỏi trắc nghiệm vào máy quét chuyên dụng, hệ thống tự động thực tất công việc xử lý số hóa phiếu trả lời, so khớp đáp án trả lại kết Tuy nhiên, hệ thống thường có chi phí lớn, mặc tốc độ xử lý cao độ xác lại khơng cao, dẫn đến việc phải chấm lại thi gây tốn thời gian tiền bạc Việc xử lý chấm thi trắc nghiệm thực cách áp dụng kỹ thuật định vị, tách nhận dạng vùng tô phiếu trắc Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ nghiệm, từ đưa thơng tin câu trả lời thí sinh, mã đề thi số báo danh thí sinh Phương pháp cần sử dụng máy quét chuyên dụng để chuyển phiếu trả lời trắc nghiệm thành ảnh đưa vào máy tính Một phần mềm nhận dạng xử lý ảnh trả lại kết sau so khớp với đáp án cung cấp Phương pháp có tốc độ không cao cách sử dụng máy nhận dạng thi trắc nghiệm chuyên dụng (máy quang học), lại giúp tăng độ xác q trình nhận dạng thi Xuất phát từ lý trên, chọn đề tài “Nghiên cứu kỹ thuật định vị, tách nhận dạng vùng tô phiếu trắc nghiệm”, nhằm trợ giúp cho việc xử lý thi, nhận dạng thi trắc nghiệm có độ xác cao, đảm bảo thời gian xử lý Nội dung luận văn không kể phần mở đầu, kết luận, tài liệu tham khảo bao gồm chương: Chƣơng 1: Khái quát nhập liệu tự động toán nhận dạng phiếu trắc nghiệm Chƣơng 2: Một số kỹ thuật nhận dạng phiếu trắc nghiệm Chƣơng 3: Xây dựng hệ thống chấm thi trắc nghiệm Tôi xin chân thành cảm ơn giúp đỡ thày, cô giáo khoa Công nghệ thông tin, Trường Đại học Công nghệ Thông tin Truyền thông – Đại học Thái Nguyên, đặc biệt xin trân trọng gửi lời cảm ơn tới thày giáo, Phó giáo sư, Tiến sĩ Đỗ Năng Tồn – Viện Tốn Tin Viện Khoa học Cơng nghệ Việt Nam trực tiếp giúp đỡ hướng dẫn tơi hồn thành đề tài Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 45 Để truy xuất thông tin ảnh chứa đối tượng bị tô, trước hết cần xác định xem đối tượng bị tô hay không bị tô Tuy nhiên, q trình làm bài, thí sinh có dạng tơ khác Có ô tô đậm, nằm gọn ơ, có bị tơ lấn ngồi vùng trịn hay tơ thiếu khơng tơ Hình 2.18 Các dạng tô phiếu trả lời trắc nghiệm Ngoài trường hợp trên, phải xét đến trường hợp thí sinh tơ câu trả lời có hai đáp án hay tơ lệch tơ tràn lan thi Trong trường hợp đó, phải có hàm kiểm tra tính tơ Hình 2.19 Ơ bị tơ trùng Hình 2.20 Ô bị tô lệch, tô tràn lan Do vùng tô cần xét vòng tròn nhỏ ảnh bitmap, xem xét ảnh bitmap ảnh ln hình chữ nhật Cho nên đầu vào Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 46 vùng tô cần kiểm tra hình vng (được lấy từ ảnh thi) có đường trịn nội tiếp trịn xét Để thực nhận dạng vùng tô ảnh, cụ thể ảnh phiếu trả lời câu hỏi trắc nghiệm, ta sử dụng hai cách sau: Cách 1: Ta quét từ tâm hình vng (cũng tâm vịng trịn) dần lan đến cạnh hình vng theo đường trịn đồng tâm tâm hình vng Ta phân vòng tròn thành loại: - vòng tròn nhỏ bên (quy định vịng trịn có đường kính nửa cạnh hình vng trở xuống) gọi T1 - vòng tròn lớn bên (ta quy định vịng trịn có đuờng kính lớn cạnh hình vng đến cạnh hình vng) gọi T2 - vịng trịn bên ngịai (có đường kính lớn cạnh hình vng) gọi T3 Hình 2.21 Ảnh cần kiểm tra tơ chia thành vùng Trong điều kiện tối ưu, vùng ảnh vng đầu vào có vịng trịn cần xét tơ nội tiếp với ảnh vng Nhưng thực tế vịng trịn tơ vùng ảnh vng đầu vào bị lệch, vịng trịn nhỏ T1 có khả nằm vùng cần tơ nhiều T2, vòng tròn T2 lại có khả nhiều T3 Do đó, pixel thuộc vịng trịn T1 góp phần nhiều so với pixel thuộc T2 vào việc định xem vùng tơ có tơ hay Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 47 không Điều tương tự cho pixel thuộc vòng trịn T2 so với T3 Vì vậy, độ ưu tiên pixel thuộc vòng tròn quy định theo thứ tự sau: T1, T2, T3 Ta có cơng thức sau: Giá trị vùng tô = (Tổng số pixel T1 đen * độ ưu tiên T1) + (Tổng số pixel T2 đen * độ ưu tiên T2) + (Tổng số pixel T3 đen * độ ưu tiên T3) (*) Như vậy, vùng tơ tơ hồn tồn điều kiện tối ưu (tức ảnh đầu vào hình vng chứa trịn cần tơ nội tiếp ảnh), ta có: Giá trị cho thấy vùng tơ tơ hồn tồn = ( Tổng số pixel T1 * độ ưu tiên T1 ) + ( Tổng số pixel T2 * độ ưu tiên T2) Do đó, gần đúng, ta đưa thuật tốn cho phép định xem vùng tơ có tơ hay khơng cách: o Tính giá trị vùng tô áp dụng công thức (*) o Nếu giá trị vùng tô > (60% * Giá trị vùng tơ tơ hồn tồn) trịn tơ đen o ngược lại trịn chưa đựơc tơ Phương pháp có độ xác cao trường hợp ảnh vng đầu vào có vùng tô bị lệch, nhiên cài đặt phức tạp, xử lý tính tốn nhiều (phải tính từ tâm hình trịn lan dần sang xung quanh) làm ảnh hưởng đến tốc độ chung chương trình Cách 2: Dựa phân tích thực tế thống kê mẫu phiếu trả lời trắc nghiệm, ta đếm số điểm đen xung quanh tâm hình vng có cạnh 2r, với r bán kính Gọi (x, y) tâm hình vng, ta xét: Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 48 - Nếu diện tích số điểm đen lớn 1/4 diện tích hình vng (S>r2/4) bao quanh điểm có tọa độ (x, y) gán giá trị trả - Ngược lại, trả (khơng tơ) Để xét trường hợp thí sinh tơ bị lệch khỏi vịng trịn đáp án nhiều, ta thực sau: - Đếm số điểm đen xung quanh tâm hình vng có cạnh 4r - Lấy tổng số điểm đen xung quanh tâm hình vng trừ tổng số điểm đen xung quanh hình vng có cạnh 2r tính Nếu số điểm đen lớn 1/8 diện tích hình vng cạnh 2r trả (trường hợp thí sinh tơ lỗi) Cách kiểm tra có độ xác khơng cao cách thứ nhất, lại cho tốc độ thực nhanh hơn, cài đặt dễ dàng dễ xử lý Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 49 Chƣơng XÂY DƢNG HỆ THỐNG CHẤM THI TRẮC NGHIỆM 3.1 Quá trình xử lý thi trắc nghiệm Bài toán nhận dạng phiếu trả lời trắc nghiệm chất đưa việc nhận dạng ô tô sau phân đoạn ảnh tách vị trí đánh dấu mẫu phiếu Có thể phát biểu tốn sau: Input: Ảnh phiếu trả lời thu nhận qua trình quét ảnh Output: Trả lại giá trị ô đánh dấu phiếu thi Trên thực tế, thi trắc nghiệm sau thí sinh thực điểm chấm cuối trải qua số bước sau: Bƣớc 1: Quét ảnh - Phiếu trả lời câu hỏi trắc nghiệm nhân viên xử lý quét đưa vào máy quét ảnh để tạo file ảnh giám sát thành viên Hội đồng coi chấm thi Mỗi phiếu trả lời tương ứng file ảnh lưu vào thư mục có xác định, thường tên điểm thi tên môn thi Bƣớc 2: Thực thao tác tiền xử lý ảnh để nâng cao chất lượng ảnh đầu vào, giúp cho trình nhận dạng hiệu Trong bước này, chất lượng ảnh đầu vào phiếu điểm không tốt, mẫu quét bị lệch, phiếu bị mờ, sử dụng kỹ thuật tiền xử lý ảnh tăng giảm độ tương phản, tăng giảm độ sáng để nâng cao chất lượng ảnh, sau thực xám hóa ảnh Trong trình xám hóa qt ảnh, ảnh bị bị nhiễu nên cần có bước lọc nhiễu cho ảnh Nếu ảnh bị lệch, sử dụng kỹ thuật xoay ảnh để xoay ảnh lại cho Tiếp theo phân ngưỡng nhị phân hóa ảnh số Bƣớc 3: Ảnh sau qua bước tiền xử lý phân vùng, mục đích xác định vùng có chứa thơng tin cần thiết sau thực cắt vùng thành ảnh nhỏ, lưu vào thư mục riêng Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 50 Bƣớc 4: Sử dụng module nhận dạng ảnh để nhận dạng giá trị vùng tô cần thiết, sau đưa kết lưu vào sở liệu, file text file liệu có cấu trúc Bƣớc 5: Từ file liệu có được, module chấm thi so sánh với liệu chứa mã đề đáp án có sở liệu, tính tốn đưa kết đánh giá số câu trả lời thi, chuyển thành điểm theo khung chuẩn Tóm lại, q trình xử lý thi trắc nghiệm biểu diễn mơ hình sau: Máy qt Phiếu trả lời trắc nghiệm Thu nhận lưu trữ ảnh Kết Tiền xử lý ảnh Nhận dạng vùng tơ Phân vùng đối tượng Hình 3.1 Q trình xử lý thi trắc nghiệm 3.2 Tiền xử lý ảnh quét Phiếu trả lời câu hỏi trắc nghiệm sau đưa qua máy quét để chuyển hóa thành ảnh thường gặp số tình trạng bị lệch góc hay bị nhiễu Vì vậy, trước thực nhận dạng, cần thực số thao tác tiền xử lý ảnh để ảnh có chất lượng tốt 3.2.1 Tách kênh màu đỏ ảnh quét Trong trình xử lý ảnh, ta dùng lọc Extract Channel để lọc lấy kênh màu đỏ, điểm ảnh màu đỏ ảnh gốc ban đầu có giá trị 255 Khi thực chuyển ảnh xám phân ngưỡng ảnh ảnh nhị phân, điểm ảnh có giá trị điểm ảnh trắng, chúng không ảnh hưởng đến điểm ảnh cần thiết phải nhận dạng Bộ lọc Extract Channel gồm có liệu ảnh đầu vào liệu ảnh đầu ra, ảnh đầu kết ảnh đầu vào với kênh màu lựa chọn Ảnh đầu vào: Ảnh màu 24 bits (Mỗi điểm ảnh mã hóa bytes) Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 51 Ảnh đầu ra: Ảnh xám bits (Mỗi điểm ảnh mã hóa byte) Hình 3.2 Ảnh trước thực tách kênh màu đỏ Hình 3.3 Ảnh sau thực tách kênh màu đỏ Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 52 3.2.2 Phân ngưỡng ảnh quét Sau thực tách kênh màu đỏ, ta thu ảnh cấp xám bits Ta thực phân ngưỡng ảnh xám để thu ảnh đen trắng Trong phạm vi đề tài này, trình bày Chương 2, ta sử dụng thuật toán SIS để thực phân ngưỡng cho ảnh xám Kết thực nghiệm cho thấy, thuật toán SIS cho hiệu tốt chương trình Hình 3.4 Ảnh sau thực phân ngưỡng lọc nhiễu 3.2.3 Lọc nhiễu ảnh quét Để lọc nhiễu ảnh, ta sử dụng lọc Median Để thực lọc Median lân cận pixel xếp giá trị pixel lân cận, xác định trung vị Median định giá trị pixel Ví dụ lân cận 3x3 có giá trị: 10, 20, 20, 20, 15, 20, 20, 25, 100 Các giá trị xếp lại theo thứ tự từ thấp đến cao: 10, 15, 20, 20, 20, 20, 20, 25, 100 Giá trị median 20 Do ngun lý mạch median tách điểm có cường độ sáng lớn nhiễu xung lọc điểm có cường độ sáng tức (xung) hay cịn gọi nhiễu muối tiêu Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 53 Trong chương trình thử nghiệm, xử lý lọc Median áp dụng cho ảnh sau thực phân ngưỡng 3.2.4 Căn chỉnh độ lệch trang ảnh sau quét Để xác định độ lệch ảnh phiếu thi sau quét qua máy quét, ta dựa vào ba vị trí đánh dấu góc bên trái, góc bên phải góc bên phải ảnh thi đưa vào Tuy nhiên, phiếu thi có khổ giấy A4 trình quét ảnh đầu vào quét theo chiều dọc phiếu thi, nên để xác định độ lệch ảnh ta cần dựa tọa độ điểm đánh dấu góc bên phải góc bên phải Ta tính góc nghiêng ảnh quét góc đường thằng nối điểm đánh dấu góc bên phải góc bên phải với trục tọa độ OY theo cơng thức: Góc lệch = 90o – arctan(Y2-Y1, X2-X1)*180/π Trong đó, (X1, Y1) tọa độ góc bên phải, (X2, Y2) tọa độ góc bên phải Để thực quay ảnh với góc lệch vừa nhận được, sử dụng hàm Rotate thư viện EmguCV.DLL sử dụng phương thức RotateNearestNeighbor thư viện AForge.NET Góc lệch ảnh quét Hình 3.5 Ảnh thực chỉnh độ lệch Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 54 3.3 Xác định điểm định vị Tọa độ điểm định vị phát (trái-trên, phải-trên phải-dưới) Hình 3.6 Xác định điểm định vị Trên thi trắc nghiệm quét có điểm định vị cố định góc thi, nhiên ta cần xác định điểm định vị, điểm góc trái-trên, phải-trên phải-dưới Xác định điểm định vị quan trọng việc khoanh vùng tô nhận dạng vùng tô 3.4 Khoanh vùng đƣợc tơ Do kích thước vùng ảnh cần tách xác định, khoảng cách từ điểm định vị tới vùng xác định, ta sử dụng hàm cắt ảnh cropimage thư viện AForge.Imaging.dll để thực cắt ảnh Các ảnh sau cắt số hóa để thực nhận dạng ô kiểm tra xem liệu ô có tô hay không 3.5 Nhận dạng ô đƣợc tơ Trong ảnh phiếu trả lời trắc nghiệm, có vùng cần phải xử lý, bao gồm: Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 55 Vùng tô chứa thông tin số báo danh: Vùng tơ chứa thơng tin mã đề: Hình 3.7 Vùng chứa số báo danh Hình 3.8 Vùng chứa mã đề Vùng tô chứa đáp án: vùng bao hai đường kẻ dài phía phía dưới, khoảng cách trịn xác định Số câu trả lời tối đa lên đến 100 câu Tuy nhiên, theo đề Bộ Giáo dục đào tạo năm gần với đề thi mơn Lý mơn Hóa, phần trả lời câu hỏi, thí sinh phải trả lời 40 câu kiến thức chung 10 câu nhiệm ý Ở câu hỏi, thí sinh lựa chọn bốn đáp án A, B, C, D không bôi đen nhiều ô câu hỏi Nếu câu có từ ô tô trở lên coi bị trùng khơng tính điểm câu Hình 3.9 Vùng tơ chứa đáp án Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 56 Trong chương trình thử nghiệm, ta sử dụng cách thứ trình bày chương để nhận dạng ô tô ảnh Hình 3.10 Nhận dạng vùng tô Kết nhận dạng số báo danh, mã đề đáp án trả lời Hình 3.11 Kết nhận dạng phiếu trả lời trắc nghiệm Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 57 3.6 Kết thử nghiệm Chương trình thử nghiệm viết ngôn ngữ Visual C# công cụ Visual Studio 2010, chạy hệ điều hành XP Windows Trong chương trình có sử dụng thư viện ảnh nguồn mở EmguCV AForge.NET Quá trình chạy chương trình thử nghiệm với 50 ảnh đầu vào độ phân giải 300dpi, kích thước 2471 x 3494 pixel với độ lệch mẫu không độ cho kết tốt Có thể thấy chất lượng máy quét đóng vai trị quan trọng q trình nhận dạng sau Nếu chất lượng máy quét tốt tốc độ quét nhanh, chất lượng ảnh đầu vào cao độ lệch mẫu bé giúp giảm thời gian xử lý, tăng độ xác nhận dạng phiếu thi So sánh chương trình với phần mềm nhận dạng thi trắc nghiệm nhiều trường sử dụng – McSCANNER (Cơng ty Phần mềm Anh Qn), chương trình tác giả có số ưu điểm sau: McSCANNER Chƣơng trình tác giả - Khơng sử dụng điểm định vị - Có sử dụng 3/4 điểm định vị trong q trình nhận dạng vùng tơ q trình nhận dạng vùng tơ - Khơng điều chỉnh, xoay thi trước - Có điều chỉnh, xoay thi trước khi nhận dạng nhận dạng, giúp cho việc nhận dạng vùng tơ xác - Khơng phân ngưỡng, lọc nhiễu ảnh - Có phân ngưỡng, lọc nhiễu ảnh trước nhận dạng, dẫn tới việc trước nhận dạng, giúp cho việc nhận dạng vùng tô thiếu xác nhận dạng vùng tơ xác số trường hợp Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 58 KẾT LUẬN Trong thời gian nghiên cứu thực đề tài, tác giả đạt số kết sau: - Tìm hiểu khái niệm số thuật toán nhận dạng xử lý ảnh, ứng dụng vào thực tiễn - Tìm hiểu quy trình làm việc hệ thống nhận dạng phiếu thi trắc nghiệm giai đoạn xử lý phiếu trả lời câu hỏi trắc nghiệm - Phát triển thêm ứng dụng nhận dạng chấm thi trắc nghiệm dựa máy quét Đây mô hình áp dụng lại quan làm việc tại, góp phần giảm chi phí q trình tuyển sinh Trong tương lai, phát triển đề tài này, giảm chi phí mua phần mềm từ bên cho nhà trường Ngoài kết đạt được, số thiếu sót tồn tại: - Việc xử lý ảnh đầu vào chưa ý, chất lượng ảnh yêu cầu cao, ảnh đầu vào bị nhăn góc chưa nhận dạng Hướng phát triển tiếp theo: - Tiếp tục nghiên cứu nhận dạng phiếu thi trắc nghiệm cách tổng quát hơn, cho phép xử lý nhiều dạng phiếu thi khác với độ xác cao - Chuẩn hóa sở liệu, xây dựng ứng dụng chấm điểm đồng với hệ thống nhận dạng - Tiếp tục nghiên cứu, ứng dụng nhận dạng cho mẫu phiếu khác phiếu khảo sát, đánh giá, thăm dò ý kiến, bầu cử - Tác giả mong muốn tiếp tục phát triển để đưa kết nghiên cứu vào ứng dụng thực tế Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 59 TÀI LIỆU THAM KHẢO Tài liệu Tiếng Việt [1] Hoàng Kiếm (chủ biên) – Dương Anh Đức – Lê Đình Duy – Vũ Hải Quân, Cơ Sở Đồ Họa Máy Tính, tái lần thứ 3, Nhà xuất Giáo dục, 2000 [2] Phạm Việt Bình, Đỗ Năng Tồn, Giáo trình xử lý ảnh, Khoa Công nghệ thông tin - Đại học Thái Nguyên, 2007 [3] Đỗ Năng Toàn, Nghiên cứu số phương pháp biểu diễn hình dạng ứng dụng nhận dạng ảnh, Luận án tiến sĩ, 2001 [4] Phạm Việt Bình, Phát triển kỹ thuật dị biên, phát biên ứng dụng, Luận án tiến sĩ khoa học, 2006 Tài liệu Tiếng Anh [5] Bryan S Morse, Lecture 15: Segmentation (Edge Based, Hough Transform), Brigham Young University, 1998–2000 [6] Charles Petzold, Programming Windows With C#, Microsoft Press, Redmond, Washington, 2001 Cộng đồng mạng [7] The Source Forge, www.sourceforge.net [8] The Code Project, www.codeproject.com [9] The Expert Exchange, www.expert-exchange.com… Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/