Tiền xử lý ảnh mặt trước CCCD

Một phần của tài liệu Luận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân (Trang 50 - 53)

(a) Ảnh đầu vào; (b) Ảnh đa cấp xám; (c) Ảnh nhị phân

3.1.2. Làm trơn ảnh

Ảnh đa cấp xám thu được ở bước trên thường không được “mịn” (vẫn còn“ráp”) do một số thành phần nền quá rõ nét, để làm mịn ảnh và loại bỏ các nhiễu ta cần áp dụng một phép lọc để làm trơn ảnh, áp dụng phương pháp làm trơn thích ứng.

3.1.3. Nhị phân hóa ảnh

Bước tiếp theo là tìm ngưỡng để phân đoạn ảnh đa cấp xám ở trên về ảnh nhị phân (phân biệt rõ đâu là nền đâu là đối tượng). Các phương pháp trình bầy ở trên, trong một số trường hợp này thì cho kết quả tốt, trong một số trường hợp

Thuật tốn 3.1. Nhị phân hóa ảnh CCCD

Input: Ảnh CCCD màu

Ouput: Ảnh CCCD nhị phân hóa tách ngưỡng tự động 1.For T= (0 to 255) / 2 xác định giá triT 2 div T1 and T2 tính T1 và T2 3.If Type 1 <= T.

4. If Type 2 x > T. (iAverage) for Type1 (iAverage1) and Type2 (iAverage2).

tính giá tri cường độ sáng tb

6.T2 = (iAverage1 + iAverage2) / 2. Tính giá trị T2 7. Compare T1 and T2. so sánh T1 và T2

8. If T1 and T2 <= Delta then T2 Giá trị chênh lệch T1 và T2 9. If between T1 and T2> Delta, then go back to Step 1.

51 khác lại cho kết quả không tốt. Phương pháp Otsu: Khử nền của ảnh khá tốt theo thuật toán 3.1.

3.1.4. Căn chỉnh độ nghiêng

Mặc dù công đoạn thu nhận ảnh được thực hiện bằng thiết bị chuyên dụng nhưng không thể trách khỏi việc ảnh thu nhận được bị nghiêng. Do đó, để cho bước phân tích ảnh được chính xác thì ảnh sau khi phân đoạn phải được căn chỉnh độ nghiêng. Phương pháp dựa vào biến đổi Hough có thời gian tính tốn lâu, nhất là khi áp dụng cho ảnh có kích thước lớn do phải tính tốn cho từng điểm ảnh một; Phương pháp láng giềng gần nhất khơng phù hợp đối với ảnh có chứa các ký tự Tiếng Việt có dấu. Do đó phương pháp được áp dụng ở đây là phương pháp sử dụng chiếu nghiêng. Phương pháp này cho kết quả tốt và thời gian thực hiện tương đối nhanh. Ảnh màu đầu vào còn được sử dụng để tách trường Số CCCD, do đó việc hiệu chỉnh độ nghiêng được thực hiện trên cả ảnh nhị phân và ảnh màu dựa vào góc nghiêng xác định được trên ảnh nhị phân. Các bước hiệu chỉnh độ nghiêng của ảnh được mơ tả trong thuật tốn 3.2.

Thuật toán 3.2. Hiệu chỉnh độ nghiêng của ảnh tài liệu Input: Ảnh (nhị phân) bị nghiêng Input: Ảnh (nhị phân) bị nghiêng

Output: Ảnh đã chỉnh độ nghiêng

Bước 1. Xác định góc nghiêng α Bước 2. Xoay ảnh với góc nghiêng α

52

3.2. Phân đoạn các vùng

3.2.1 Phân tích các trường thơng tin ở mặt trước

Chuyển ảnh màu về ảnh xám, nhị phân ảnh để xóa nền ảnh, dùng thuật toán Ostu để tách ngưỡng phân vùng để xử lý dựa vào tỉ lệ tương đối của tửng vùng, các đặc trưng các trường thông tin ở mặt trước CCCD. Ảnh chân dung: bên trái thẻ là ảnh màu kích thước 2x3 cm, dưới quốc huy. Số CCCD chứa thông tin trên 1 dòng dưới vùng CĂN CƯỚC CÔNG DÂN. Họ và tên chứa thông tin trên 2 dòng dưới vùng SỐ CCCD. Ngày tháng năm sinh chứa thông tin trên 1 dịng dưới vùng chữ họ và tên. Giới tính chứa thơng tin trên 1 dịng bên phải dưới vùng chữ họ và tên. Quốc tịch chứa thơng tin trên 1 dịng bên trái dưới vùng chữ họ và tên. Quê qn chứa thơng tin trên 2 dịng dưới vùng chữ giới tính và quốc tịch. Nơi thường trú chứa thơng tin trên 2 dịng dưới vùng chữ quê quán. Ngày hết hạn chứa thơng tin trên 1 dịng dưới vùng hình thẻ.

3.2.2. Xác định các vùng có ký tự ở mặt trước

Nhận dạng các vùng thông tin cụ thể của mặt trước thẻ CCCD, mặt trước gồm có 9 trường thơng tin có các đặc điểm riêng từng vùng. Ảnhchân dung chỉ chứa ảnh màu của người được cấp thẻ không chứa ký tự. Số CCCD chỉ chứa thông tin là số, màu đỏ. Họ và tên chứa chữ in hoa màu đen in đậm, màu đen. Ngày tháng năm sinh chứa thông tin định dạng ngày tháng dd/mm/yy. Giới tính chữ in hoa đầu từ, in thường màu đen. Quốc tịch, chữ in hoa đầu từ, in thường màu đen. Quê quán, chữ in hoa đầu từ mỗi ký tự, in thường màu đen. Nơi thường trú, vừa chứa chữ in hoa, chữ in thường, có chữ in hoa đầu từ, vừa có số in thường vừa có chứa các ký tự đặ biệt, màu đen. Ngày hết hạn chứa thông tin định dạng ngày tháng dd/mm/yy, hình 3.2.

53

Một phần của tài liệu Luận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân (Trang 50 - 53)

Tải bản đầy đủ (PDF)

(82 trang)