4. Kết quả đạt được
2.3.2. Tìm vùng chứa thông tin trên phiếu thi
43
Hình 2.5 Lưu đồ thuật toán tìm các vùng thông tin trên phiếu thi
(1) Tiền xử lý: chuyển ảnh phiếu thi đã xử lý từ bước tìm phiếu thi sang ảnh xám. Để nâng cao chất lượng ảnh, ta tiếp tục thực hiện lọc trung vị, lọc nhiễu Guassian cho ảnh xám.
(2) Cân bằng độ sáng của ảnh: việc bố trí nguồn sáng trong hệ thống tời giấy tích hợp camera có vai trò rất quan trọng trong việc lấy mẫu. Để có thể nhận dạng phiếu thi, các vùng chứa thông tin trên phiếu thi thì mẫu cần phải đảm bảo:
Phiếu thi và nền phải có độ tương phản cao Cân bằng độ sáng của ảnh Lấy ngưỡng tự động Ảnh các vùng phiếu thi Kết thúc Bắt đầu Ảnh phiếu thi Tiền xử lý Tìm các vùng chứa thông tin
Biến đổi phối cảnh
(1)
(2)
(3)
(4)
44
Nguồn sáng phải đặt ở vị trí thích hợp. Vì các vùng thí sinh tô bằng chì rất dễ bị phản xạ ánh sáng, nếu ánh sáng đến các vùng này phản xạ vào camera thì ảnh thu được tại các điểm này sẽ có màu trắng, việc nhận dạng sẽ không còn chính xác nữa.
Với hệ thống tời giấy đơn giản, ánh sáng phân bố trên ảnh thường không đồng đều, do đó nếu lấy ngưỡng tự động thì sẽ gây ra sai lệch thông tin, dẫn đến việc nhận dạng các vùng chứa thông tin không chính xác, các vùng tối do thiếu ánh sáng có thể bị hiểu nhầm là vùng thí sinh tô đen.
Vì vậy việc áp dụng thuật toán cân bằng độ sáng của phiếu thi có vai trò rất quan trọng để thực hiện các bước tiếp theo. Thuật toán này được thực hiện bằng cách:
Chia ảnh gốc cho ảnh của phép đóng (closing operator) của ảnh đó. Kết quả của phép chia này là một ảnh với giá trị các điểm ảnh có giá trị thực.
Chuẩn hóa (normalize) ma trận ảnh thực trên.Để hiển thị và xử lý ảnh ở các bước tiếp theo, ta cần phải lượng tử hóa giá trị của các điểm ảnh về mức 0 – 255 (mức 0 tương ứng với giá trị nhỏ nhất, 255 ứng với giá trị lớn nhất).
(3) Lấy ngưỡng tự động: lấy ngưỡng tự động bằng thuật toán Otsu từ ảnh thu được từ bước xử lý trên.
(4) Tìm các vùng chứa thông tin trên phiếu thi: các vùng chứa thông tin trên phiếu thi là mã đề, số báo danh, trả lời có đặc điểm chung là nằm trong các khung hình chữ nhật. Với kích thước phiếu thi chuẩn hóa ở độ phân giải 840x1188, các vùng này phải cách biên trên của phiếu thi ít nhất là 150 pixel và diện tích các vùng này phải lớn hơn 6000. Từ đó, ta sẽ áp dụng các bước xử lý tiếp theo:
Áp dụng thuật toán tìm biên Canny, sau đó tìm 4 góc của các hình chữ nhật trong phiếu thi. Sắp xếp 4 góc này theo đúng thứ tự: trên trái, dưới trái, dưới phải, trên phải như thuật toán trình bày ở bước 2, phần 2.2.1.
Vùng chứa thông tin sẽ là vùng có tọa độ y của góc trên trái >150. Lần lượt nhận dạng cụ thể các vùng mã đề, số báo danh, trả lời 1 (từ câu 1 - 25), trả
45
lời 2 (câu 26 - 50), trả lời 3 (câu 51 - 75), trả lời 4 (câu 76 - 100) dựa vào tọa độ của góc trên trái:
o Vùng số báo danh: x<680, y<240
o Vùng mã đề: x>680, y<240
o Vùng trả lời 1: x<130, y>240
o Vùng trả lời 2: 200<x<330, y>240
o Vùng trả lời 3: 330<x<530, y>240
o Vùng trả lời 4: x>530, y>240
Hình 2.6 Đặc điểm của các vùng chứa thông tin trên phiếu thi
(5) Biến đổi phối cảnh: nội dung trên phiếu thi rất dễ bị lệch so với các cạnh của phiếu thi do in ấn bằng các loại máy in thông dụng hoặc phiếu thi bị nhàu, cong. Để hiệu chỉnh việc nghiêng, lệch của các vùng chứa thông tin trên phiếu thi, thuật toán biến đổi phối cảnh sẽ được thực hiện để chuẩn hóa các vùng phiếu thi, tạo tiền
46
đề cho bước xử lý tiếp theo được chính xác. Kích thước chuẩn hóa của các vùng cụ thể như sau:
Vùng số báo danh: 180x270 Vùng mã đề: 90x270
Các vùng trả lời: 180x625
Ảnh đầu ra của bước xử lý này là ảnh nhị phân của các vùng phiếu thi với kích thước chuẩn.