Trong ảnh phiếu trắc nghiệm, các ô dùng để tô đều có hình dạng là hình tròn, để đảm bảo khả năng khi tô sẽ có tỷ lệ bôi đen cao hơn so với hình vuông hay hình chữ nhật, vì khi tô, thí sinh bao giờ cũng có xu hướng xoay tròn bút chì quanh một điểm và loang dần ra ngoài.
45
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/
Để truy xuất được các thông tin trong các ảnh con chứa các đối tượng bị tô, trước hết cần xác định xem đối tượng nào bị tô hay không bị tô.
Tuy nhiên, trong quá trình làm bài, mỗi thí sinh có thể có những dạng tô khác nhau. Có những ô sẽ được tô đậm, đều và nằm gọn trong ô, cũng có những ô bị tô lấn ra ngoài vùng tròn hay tô thiếu hoặc không được tô.
Hình 2.18. Các dạng tô trong phiếu trả lời trắc nghiệm
Ngoài những trường hợp trên, cũng phải xét đến cả trường hợp thí sinh tô cũng một câu trả lời nhưng có hai đáp án hay tô lệch hoặc tô tràn lan trong bài thi. Trong các trường hợp đó, phải có hàm kiểm tra tính duy nhất của ô được tô.
Hình 2.19. Ô bị tô trùng
Hình 2.20. Ô bị tô lệch, tô tràn lan
Do vùng tô cần xét chỉ là một vòng tròn nhỏ trong ảnh bitmap, và khi xem xét một ảnh bitmap thì ảnh đó luôn là hình chữ nhật. Cho nên đầu vào
46
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/
của vùng tô cần kiểm tra là một hình vuông (được lấy ra từ ảnh bài thi) có đường tròn nội tiếp chính là ô tròn đang xét.
Để thực hiện nhận dạng vùng được tô trong ảnh, cụ thể ở đây là ảnh phiếu trả lời câu hỏi trắc nghiệm, ta có thể sử dụng một trong hai cách sau:
Cách 1:
Ta quét từ tâm hình vuông (cũng là tâm của vòng tròn) dần lan ra đến cạnh của hình vuông theo các đường tròn đồng tâm là tâm hình vuông.
Ta sẽ phân các vòng tròn thành 3 loại:
- các vòng tròn nhỏ bên trong (quy định là các vòng tròn có đường kính bằng nửa cạnh hình vuông trở xuống) gọi là T1.
- các vòng tròn lớn bên trong (ta quy định là các vòng tròn có đuờng kính lớn hơn nữa cạnh hình vuông đến bằng cạnh hình vuông) gọi là T2.
- các vòng tròn bên ngòai (có đường kính lớn hơn cả cạnh hình vuông) gọi là T3.
Hình 2.21. Ảnh cần kiểm tra tô được chia thành 3 vùng
Trong một điều kiện tối ưu, vùng ảnh vuông đầu vào sẽ có vòng tròn cần xét tô nội tiếp với ảnh vuông đó. Nhưng trong thực tế thì vòng tròn tô trong vùng ảnh vuông đầu vào sẽ bị lệch, do đó các vòng tròn nhỏ T1 sẽ có khả năng nằm trong vùng cần tô nhiều hơn là T2, và các vòng tròn T2 lại có khả năng nhiều hơn T3. Do đó, pixel thuộc vòng tròn T1 sẽ góp phần nhiều hơn so với các pixel thuộc T2 vào việc quyết định xem vùng tô có được tô hay
47
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/
không. Điều này cũng tương tự cho các pixel thuộc vòng tròn T2 so với T3. Vì vậy, độ ưu tiên của các pixel thuộc các vòng tròn sẽ được quy định theo thứ tự lần lượt như sau: T1, T2, T3.
Ta có công thức sau:
Giá trị của vùng tô = (Tổng số pixel T1 đen * độ ưu tiên của T1) +
(Tổng số pixel T2 đen * độ ưu tiên của T2) + (Tổng số pixel T3 đen * độ ưu
tiên T3) (*)
Như vậy, khi vùng tô được tô hoàn toàn trong điều kiện tối ưu (tức ảnh đầu vào hình vuông chứa ô tròn cần tô nội tiếp ảnh), ta có:
Giá trị cho thấy vùng tô được tô hoàn toàn = ( Tổng số pixel T1 * độ ưu tiên của T1 ) + ( Tổng số pixel T2 * độ ưu tiên của T2)
Do đó, chỉ gần đúng, ta đưa ra được thuật toán cho phép quyết định xem vùng tô có được tô hay không bằng cách:
o Tính giá trị vùng tô áp dụng công thức (*).
o Nếu giá trị vùng tô > (60% * Giá trị vùng tô được tô hoàn toàn) thì
ô tròn đã được tô đen
o ngược lại
ô tròn chưa đựơc tô.
Phương pháp này có độ chính xác cao hơn trong các trường hợp ảnh vuông đầu vào có vùng tô bị lệch, tuy nhiên do cài đặt phức tạp, xử lý tính toán nhiều hơn (phải tính từ tâm của hình tròn rồi lan dần sang xung quanh) có thể làm ảnh hưởng đến tốc độ chung của chương trình
Cách 2:
Dựa trên phân tích thực tế và thống kê trên các mẫu phiếu trả lời trắc nghiệm, ta đếm số điểm đen xung quanh tâm của hình vuông có cạnh là 2r, với r là bán kính. Gọi (x, y) là tâm của hình vuông, ta xét:
48
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/
- Nếu diện tích số điểm đen lớn hơn 1/4 diện tích hình vuông
(S>r2/4) bao quanh điểm có tọa độ (x, y) thì gán giá trị trả về là 1
- Ngược lại, trả về 0 (không tô).
Để xét các trường hợp thí sinh tô bị lệch ra khỏi vòng tròn đáp án quá nhiều, ta thực hiện như sau:
- Đếm số điểm đen xung quanh tâm của hình vuông có cạnh là 4r. - Lấy tổng số điểm đen xung quanh tâm hình vuông này trừ đi tổng
số điểm đen xung quanh hình vuông có cạnh là 2r đã tính ở trên. Nếu số điểm đen này lớn hơn 1/8 diện tích hình vuông cạnh 2r thì trả về 0 (trường hợp thí sinh tô lỗi)
Cách kiểm tra này có độ chính xác không cao bằng cách thứ nhất, nhưng lại cho tốc độ thực hiện nhanh hơn, cài đặt dễ dàng và dễ xử lý.
49
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/
Chƣơng 3
XÂY DƢNG HỆ THỐNG CHẤM THI TRẮC NGHIỆM 3.1. Quá trình xử lý bài thi trắc nghiệm
Bài toán nhận dạng phiếu trả lời trắc nghiệm về bản chất chính là đưa về việc nhận dạng các ô đã được tô sau khi đã phân đoạn ảnh và tách được các vị trí ô đánh dấu trên mẫu phiếu. Có thể phát biểu bài toán như sau:
Input: Ảnh phiếu trả lời được thu nhận qua quá trình quét ảnh Output: Trả lại giá trị của các ô đánh dấu trên phiếu thi
Trên thực tế, một bài thi trắc nghiệm sau khi đã được thí sinh thực hiện để có thể cho ra điểm chấm cuối cùng sẽ trải qua một số bước như sau:
Bƣớc 1: Quét ảnh - Phiếu trả lời câu hỏi trắc nghiệm được nhân viên xử
lý quét đưa vào máy quét ảnh để tạo file ảnh dưới sự giám sát của các thành viên trong Hội đồng coi và chấm thi. Mỗi phiếu trả lời tương ứng là một file ảnh được lưu vào trong một thư mục có xác định, thường là tên của điểm thi hoặc tên môn thi đó.
Bƣớc 2: Thực hiện các thao tác tiền xử lý ảnh để nâng cao chất lượng
ảnh đầu vào, giúp cho quá trình nhận dạng hiệu quả hơn. Trong bước này, nếu chất lượng ảnh đầu vào của phiếu điểm không tốt, như mẫu quét bị lệch, nền phiếu bị mờ,.. thì có thể sử dụng các kỹ thuật tiền xử lý ảnh như tăng giảm độ tương phản, tăng giảm độ sáng để nâng cao chất lượng ảnh, sau đó thực hiện xám hóa ảnh. Trong quá trình xám hóa cũng như quét ảnh, ảnh có thể bị bị nhiễu nên cần có bước lọc nhiễu cho ảnh. Nếu ảnh bị lệch, có thể sử dụng kỹ thuật xoay ảnh để xoay ảnh lại cho đúng. Tiếp theo là phân ngưỡng và nhị phân hóa ảnh số.
Bƣớc 3: Ảnh sau khi qua các bước tiền xử lý sẽ được phân vùng, mục
đích là xác định các vùng có chứa thông tin cần thiết sau đó thực hiện cắt các vùng đó thành các ảnh nhỏ, lưu vào một thư mục riêng.
50
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/
Bƣớc 4: Sử dụng module nhận dạng trên các ảnh này để nhận dạng các
giá trị vùng tô cần thiết, sau đó đưa ra kết quả và lưu vào cơ sở dữ liệu, có thể là file text hoặc file dữ liệu có cấu trúc.
Bƣớc 5: Từ các file dữ liệu có được, module chấm thi sẽ so sánh với dữ
liệu chứa mã đề và đáp án có trong cơ sở dữ liệu, tính toán và đưa ra kết quả đánh giá số câu trả lời đúng của bài thi, chuyển thành điểm theo khung chuẩn.
Tóm lại, quá trình xử lý bài thi trắc nghiệm có thể được biểu diễn bằng mô hình sau: