Kiểm tra (testing) và kết quả thực nghiệm

Một phần của tài liệu báo cáo tìm hiểu mạng nơ tron ứng dụng trong nhận dạng chữ viết (Trang 28 - 29)

- Tách từ riêng biệt ra khỏi dòng ký tự.

6.Kiểm tra (testing) và kết quả thực nghiệm

Các giai đoạn thử nghiệm thực hiện rất đơn giản và dễ hiểu. Chương trình được diễn giải thành phần mô đun cùng các phương thức đã được sử dụng để tải, phân tích và tính tốn các thơng số mạng của các vector đầu vào trong giai đoạn đào tạo có thể được tái sử dụng trong giai đoạn thử nghiệm. Việc kiểm tra đầu vào cho các ký tự có thể được tóm tắt như sau :

 Tải tập tin ảnh

 Phân tích hình ảnh cho dòng ký tự

 Cho mỗi dòng ký tự phát hiện các biểu tượng ký tự liên tiếp

 Phân tích và xử lý hình ảnh biểu tượng cho bản đồ thành một vector đầu vào và tính tốn đầu ra

 Chuyển đổi kết xuất Unicode nhị phân thành ký tự tương ứng và làm cho một hộp văn bản Các bước chuẩn bị cần thiết cho việc thử nghiệm là chuỗi hình ảnh ký hiệu đầu vào trong một tập tin hình ảnh duy nhất (*. bmp mở rộng [bitmap]), nhập các ký tự tương ứng trong một tập tin văn bản (*.cts [ký tự huấn luyện đặt] mở rộng ) và lưu hai cùng một thư mục (cả hai đềuphải có tên file cùng một ngoại trừ phần mở rộng của họ). Các ứng dụng sẽ cung cấp một dialog (hộp thoại) mở tập tin cho người sử dụng để xác định vị trí file *. cts văn bản và sẽtải các tập tin hình ảnh tương ứng của chính nó. Mặc dù các kết quả liệt kê trong các bảng tiếp theo là từ việc huấn luyện, quá trình thử nghiệm hình ảnh biểu tượng tạo ra với một 72pt. kích thước phông chữ sử dụng bất kỳ kích thước khác cũng chuyển thẳng bằng cách chuẩn bị đầu vào / đầu ra mong muốn thiết lập như là giải thích. Demo này có thể hoạt động với hình ảnh biểu tượng nhỏ kích thước font 20pt. Do việc khởi tạo giá trị ngẫu nhiên của các giá trị trọng lượng kết quả được liệt kê chỉ tiêu biểu đại diện cho mạng hoạt động và sinh sản có thể khơng được chính xác thu được với các thử nghiệm khác.

Quá trình thử nghiệm việc huấn luyện mạng được tiến hành với tập mẫu của 3 loại font: Latinh Arial, Latinh Tahoma, Latinh Times Roman.

29

Một phần của tài liệu báo cáo tìm hiểu mạng nơ tron ứng dụng trong nhận dạng chữ viết (Trang 28 - 29)