Xây dựng bộ dữ liệu

Một phần của tài liệu (Luận văn thạc sĩ) Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân (Trang 70)

Chúng tôi xây dựng tập dữ liệu A có 100 ảnh CCCD được chụp hoặc quét hai mặt trước sau với độ phân giải 1024 dpi, kiểu ảnh màu. Các mẫu CCCD được lấy từ nhiều tỉnh thành khác nhau.Trong tập dữ liệu 100 ảnh CCCD gồm có 29 ảnh thẻ CCCD là nữ, 71 ảnh thẻ CCCD là nam, số ảnh thẻ CCCD được chụp từ máy chụp ảnh là 15 ảnh, số ảnh thẻ CCCD chụp từ điện thoại di động là 20 ảnh, số ảnh thẻ CCCD được quét từ máy quét là 65 ảnh.

Trong tập dữ liệu A gồm có 100 ảnh thẻ CCCD được chia thành hai tâp dữ liệu nhỏ tập gồm có tập A1 là 74 ảnh chuẩn, chụp, hoặc quét đúng kích thước, dữ liệu trong các ảnh đầy đủ. Tập A2 gồm có 26 ảnh là những ảnh chụp, quét không đúng chuẩn, không đúng kích thước, bị lem mực, mất màu sắc, bị mờ...vv.

Trong tập dữ liệu A1 (74 ảnh) chúng tôi chia ra gồm có 10 ảnh chụp bằng

máy ảnh, 15 ảnh chụp bằng diện thoại di động, 49 ảnh quét bằng máy. Trong tập A1 chúng tôi tiếp tục phân ra làm hai tập dữ liệu nhỏ là tập dữ liệu ảnh CCCD nam là 50 ảnh và tập dữ liệu ảnh CCCD nữ là 24 ảnh. Trong 50 ảnh CCCD nam gồm có 10 ảnh chụp bằng máy ảnh, 15 ảnh chụp bằng diện thoại di động, 20 ảnh quét bằng máy, trong 24 ảnh nữ có có 4 ảnh chụp bằng máy ảnh, 5 ảnh chụp bằng diện thoại di động, 15 ảnh quét bằng máy.

Trong tập dữ liệu A2 (26 ảnh) chúng tôi tiếp tục phân ra làm hai tập dữ liệu

Một phần của tài liệu (Luận văn thạc sĩ) Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân (Trang 70)

Tải bản đầy đủ (PDF)

(82 trang)