Tìm và tách trường Số CCCD

Một phần của tài liệu Luận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân (Trang 55 - 57)

Input:

Các vùng có thể là Số CCCD: L = {bi}, với bi = (xbi, ybi, wbi, hbi) Ảnh màu thu được từ bước tiền xử lý: IColor

Output: Ảnh màu vùng Số CCCD: INumber

Process:

Bước 1. Tìm dịng “CCCD”: bTitle = {bi | xbi →max} Bước 2. Tìm vùng Số CCCD: bNumber

a. Nếu hbTitle > hbMaxTitle →tách bNumber từ bTitle b. Ngược lại, Tìm bNumber trong L (nằm ngay dưới bTitle)

56 Trong đó, hbMaxTitle là chiều cao lớn nhất có thể của dịng “CCCD”, được xác định dựa vào chiều cao trung bình của các ký tự. Với trường hợp hai dịng dính nhau, dịng Số CCCD có chiều dài ngắn hơn dịng “CCCD”, dựa vào hình chiếu dọc và ngang để tách riêng hai dịng này. Cịn trường hợp khơng tìm thấy vùng nào nằm ngay dưới vùng có kích thước lớn nhất, có nghĩa là vùng Số CCCD đã bị mờ mất. Sau khi xác định được vùng Số CCCD, tách lấy vùng ảnh tương ứng trên ảnh màu đầu vào (đã được căn chỉnh độ nghiêng) để chuyển sang bước tiếp theo.

3.2.4. Tách các trường thơng tin cịn lại

Các trường thơng tin cịn lại (bao gồm 7 trường: Họ và tên, Ngày tháng năm sinh, Giới tính, Quốc tịch, Quê quán, Nơi thường trú, Ngày hết hạn) được phân bố trên 9 dịng, hình 3.3. Các dịng này cách đều nhau và nằm bên dưới dòng “CCCD” và Số CCCD, việc tách các trường thơng tin cịn lại thực chất là việc tách lấy 9 dịng thơng tin này.

Hình 3.3. Xác định vị trí thơng tin mặt trước thẻ CCCD

Để tách các dòng này, từ ảnh nhị phân thu được ở bước tiền xử lý và vị trí của dịng “CCCD” đã xác định ở bước trên, xác định cửa sổ “mặt nạ” của các dịng sau đó cố gắng lọc lấy các đối tượng (ký tự) thuộc mặt nạ dòng. Cụ thể bước bao gồm các bước chúng tơi đề xuất trong thuật tốn 3.6

57

Một phần của tài liệu Luận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân (Trang 55 - 57)

Tải bản đầy đủ (PDF)

(82 trang)