Sử dụng các kỹ thuật xử lý ảnh để vẽ các nội dung lên một bức ảnh, nhưng quá trình này do muốn tạo sự đa dạng của dữ liệu đào tạo nên sử dụng thêm các kỹ thuật xử lý ảnh để tạo mẫu sao giống với dữ liệu thực tế nhất
Tổng số dữ liệu thật là 1000 ảnh
Dữ liệu sinh ra tự động trong lúc đào tạo với tỉ lệ xác suất dùng ảnh thật để đào tạo là 0.7, và tỉ lệ xác suất dùng ảnh sinh để đào tạo là 0.3, quá trình sinh tự động này tránh việc chiếm nhiều bộ nhớ, vì sinh ra bao nhiêu thì bấy nhiêu được đưa vào đào tạo.
50 Bên cạnh nhưng điểm lợi thế của quá trình đào tạo cũng như dự đoán dự vào đầu vào là ảnh, nhưng bên cạnh đó mô hình gặp một số hạn chế nhất định như các bài toán với các phông chữ khác nhau phải đào tạo dưới các phông tương ứng hoặc gần giống, nhưng lỗi thường gặp như dự đoán sai các kí tự có phân phối gần giống nhau như các cặp sau:
• Chữ cái “l” và số “1” • Số “3” và số “8” • Chữ “p” và chữ “q”
Những chữ cái trong các phông khác nhau có phân phối gần nhau cũng thường bị nhầm, và chuỗi càng dài thì xác suất đúng toàn bộ chữ cái trong chuỗi đó bị hạn chế, nên đối với một số bài toán thực tế ứng thì sau bước này cần phải chỉnh sửa thông tin để kết quả đạt được tốt hơn.
4.8 Kết luận chương
Trong chương 4 luận văn nghiên cứu về mạng nơ ron hồi quy xoắn, Convolution recurren neural network(CRNN) đây là mạng nơ ron sử dụng học sâu với sự kết hợp của DCNN và RNN tạo nên cấu trúc CRNN với các lợi thế hơn các cấu trúc khác:
- Có thể học trực tiếp chuỗi mà không cần chính xác vị trí của các phần tử trong chuỗi.
- Có thể trích xuất trực tiếp các đặc trưng từ ảnh không yêu cầu xử lý thủ công cũng như tiền xử lý.
- Có tính chất RNN có thể sinh ra một chuỗi của các đối tượng.
- Không bị ràng buộc bởi độ dài của chuỗi, chỉ yêu cầu chuẩn hóa về chiều cao trong cả hai quá trình đào tạo và kiểm tra.