6 Ứng dụng
6.2 Demo trên nhiều dòng
CHƯƠNG 7 TỔNG KẾT 7.1 Kết quả đạt được
Thông qua việc làm Luận văn tốt nghiệp, chúng tơi đã được học hỏi và tích lũy rất nhiều kiến thức liên quan đến lĩnh vực Thị giác máy tính nói riêng và Khoa học máy tính nói chung. Cùng với đó chúng tơi đã đạt được một số kết quả đáng kể như sau:
• Đóng góp tập dữ liệu gồm 2742 hình ảnh chữ viết tay tiếng Việt thu được từ 251 biểu mẫu Viettel post.
• Xây dựng mơ hình mạng học sâu cho bài tốn nhận dạng chữ viết tay tiếng Việt với mơ hình nhận dạng từ mức độ từ đơn đến mức độ câu.
• Kế thừa mơ hình CNN–Attention-LSTM từ cơng trình liên quan và xây dựng mơ hình cho bài tốn nhận dạng chữ viết tay tiếng Việt.
• Kế thừa mơ hình Transformer (ý tưởng từ sử dụng mơ hình Transformer giải quyết bài tốn dịch máy đa ngữ), áp dụng bài toán nhận dạng chữ viết tay tiếng Việt, đây là điểm mới so với mơ hình cơ sở. Mục đích nhằm khai thác sự tương quan của các ký tự đã tiên đốn ở các vị trí trước ký tự đang tiên đốn.
• Đề xuất mơ hình CNN-Transformer để giải quyết bài tốn nhận dạng chữ viết tay tiếng Việt.
• Thực hiện hậu xử lý để khắc phục các nhược điểm của mơ hình học sâu giúp làm tăng độ chính xác cuối cùng cho hệ thống nhận dạng chữ viết tay.
Tổng kết 67
7.2 Hạn chế
• Số lượng dữ liệu cho chữ viết tay tiếng Việt cịn hạn chế, khơng đủ cho quá trình huấn luyện mơ hình cũng như khơng đủ để đánh giá kết quả một cách khách quan nhất.
• Hiện tại chỉ tập trung xây dựng mơ hình cho bài tốn nhận diện ký tự quang học, chưa thực hiện các module nhận diện biểu mẫu và nhận phát hiện vùng chữ viết tay.
• Thời gian inference của mơ hình khá cao chưa phù hợp nếu áp dụng trực tiếp trong mơi trường cơng nghiệp địi hỏi tốc độ xử lý nhanh.
7.3 Hướng phát triển trong tương lai
Từ những gì đang có và những hạn chế hiện tại, chúng tơi có một số kế hoạch tiếp theo để cải thiện như sau:
• Thu thập thêm dữ liệu ở các loại biểu mẫu khác, nghiên cứu tạo sinh dữ liệu để tạo được tập dữ liệu chữ viết tay tiếng Việt lớn và đa dạng.
• Nghiên cứu và hiện thực một hệ thống hoàn chỉnh, từ bước nhận diện biểu mẫu đến nhận diện vùng chữ viết tay và sau cùng là nhận dạng ký tự quang học.
• Xây dựng một ứng dụng điện thoại hoặc một ứng dụng máy tính hồn chỉnh để tạo thành một sản phẩm thực tế hoàn thiện phục vụ cho người dùng.
• Tiếp tục cải thiện mơ hình chữ viết tay cùng các phương pháp hậu xử lý để làm tăng độ chính xác của mơ hình và giảm thời gian inference.
PHỤ LỤC A
KẾ HOẠCH LUẬN VĂN
Ngay từ giai đoạn làm đề cương đến lúc làm luận văn chúng tôi luôn vạch ra một kế hoạch để đảm bảo tiến độ của mình. Trong q trình thực hiện luận văn có thể có nhiều ảnh hưởng khác nhưng chúng tơi vẫn linh hoạt và cố gắng bám sát mục tiêu để hoàn thành một cách tốt nhất có thể. Kế hoạch chi tiết được chúng tơi trình bày trong hình A.1.
Giai đoạn luận văn - Học kỳ 202 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Thu thập và gán nhãn dữ liệu Huấn luyện các mơ hình OCR Đánh giá mơ hình Hậu xử lý Xây dựng ứng dụng máy tính Viết báo cáo và bài thuyết trình