Bộ dữ liệu thử nghiệm này có chất lƣợng tốt, độ nhiễu loạn gần nhƣ không có, sau khi thành công với bộ dữ liệu này chúng tôi sẽ tiếp tục xây
dựng những bộ dữ liệu với mức độ nhiễu khác nhau nhằm cải tiến khả năng nhận dạng của chƣơng trình ở những điều kiện chữ nhiễu loạn khác nhau.
4.3.3 Tiến hành thực nghiệm
4.3.3.1 Phương pháp kiểm chứng
K-fold cross validation [14] là một phƣơng pháp iểm chứng chéo, bộ dữ liệu kiểm chứng đƣợc chia ra làm K tập. Lần lƣợt thực hiện K lần kiểm chứng quay vòng, mỗi lần dùng 1 tập mẫu để thử nghiệm và K-1 tập còn lại để huấn luyện. Lỗi xuất hiện qua K lần kiểm chứng đƣợc tính trung bình.
Để thực nghiệm với K-fold cross validation thì việc lấy mẫu thử và mẫu huấn luyện phải lấy ngẫu nhiên, tuy nhiên để kiểm tra tính suy đoán của phƣơng pháp, chúng tôi thực nghiệm theo phƣơng pháp tựa K-fold cross validation, nghĩa là với bộ dữ liệu thực nghiệm trên chúng tôi quyết định lựa chọn 5 tập mẫu thuộc 5 bộ chữ hác nhau để huấn luyện, 1 bộ mẫu thuộc tập còn lại để thực nghiệm. Nhƣ vậy tập huấn luyện và tập nhận dạng thử nghiệm không giao nhau về kiểu chữ và font chữ, khả năng suy diễn của phƣơng pháp nhận dạng đƣợc kiểm tra, chƣơng trình sẽ sử dụng bộ tri thức của kiểu font này nhận dạng bộ ảnh chữ của font ia đƣợc thử nghiệm đánh giá. Từ đó có thể đánh hả năng ứng dụng thực tế của phƣơng pháp.
4.3.3.2 Thực nghiệm
Chƣơng trình đƣợc thực nghiệm trên máy tính Lenovo X220, có bộ vi xử lý Intel(R) Core(TM) i5-2520M CPU @2.5GHz 2.5GHz, Ram 2GB và đƣợc cài đặt hệ điều hành indows 7.
Chƣơng trình đƣợc thiết kế với giao diện nhƣ trong các hình 4.4, 4.5, 4.6.