Hinh 3. 2 Vùng thông tin cần tách ở mặt trước CMND
Các trường thông tin cần tách ở mặt trước bao gồm: Số CMND, Họ tên, Ngày sinh, Nguyên quán, Nơi thường trú (Hinh 3. 2). Các trường này được đặt tuần tự từ trên
xuống, ở bên phải của CMND, ngay dưới dòng “Giấy chứng minh nhân dân” (GCMND), có đặc điểm được mô tả trong Bảng 3. 1.
Bảng 3. 1 Đặc trưng các trường thông tin ở mặt trước CMND
Tên trường Số dòng Đặc trưng
Số CMND 1 Mầu đỏ dập/in trên đường
lượn sóng mầu đỏ
Họ tên 2 Mầu đen
Ngày sinh 1 Mầu đen
Nguyên quán 2 Mầu đen
Nơi thường trú 2 Mầu đen
Dễ thấy rằng, trường Số CMND có mầu đỏ nổi bật so với các trường khác nên có thể dựa vào đó để tách trường Số CMND trước, sau mới đó tách các trường còn lại dựa vào vị trí tương đối của nó so với trường Số CMND. Mặt khác, do ở mặt trước CMND có các hoa văn nền (mầu xanh – green) khá rõ nét nên cần các thao tác tiền xử lý ảnh hiệu quả để khử đi các thành phần nền phức tạp này. Cụ thể, thuật toán bao gồm các bước sau:
Tiền xử lý ảnh: Chuyển ảnh mầu về ảnh đen trắng sao cho vừa khử được nền mà
vẫn giữ được các đặc trưng của nét chữ, đồng thời cũng thực hiện căn chỉnh độ nghiêng của ảnh.
Tách trường Số CMND: Dựa vào đặc điểm nổi bật riêng để tách, tiếp theo là
loại bỏ các đường lượn sóng xong vẫn phải giữ lại các đặc trưng của nét chữ. Tách các trường còn lại: Tách lấy các dòng thông tin sau đó loại bỏ đi phần tiêu
đề của các trường.