Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

83 21 0
Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Ngày đăng: 12/05/2022, 12:34

Hình ảnh liên quan

Về nguyên tắc, nhận dạng văn bản viết tay khác với nhận dạng đối tượng từ hình ảnh hay nhận dạng hành động từ video: - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

nguy.

ên tắc, nhận dạng văn bản viết tay khác với nhận dạng đối tượng từ hình ảnh hay nhận dạng hành động từ video: Xem tại trang 16 của tài liệu.
Hình 1.4: Minh họa nhận dạng ở mức độ dòng - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 1.4.

Minh họa nhận dạng ở mức độ dòng Xem tại trang 19 của tài liệu.
Hình 1.6: Từ “người” bằng chữ viết tay (trái) và chữ in (phải) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 1.6.

Từ “người” bằng chữ viết tay (trái) và chữ in (phải) Xem tại trang 20 của tài liệu.
Hình 2.1: Cấu tạo của một neuron thần kinh1 - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 2.1.

Cấu tạo của một neuron thần kinh1 Xem tại trang 25 của tài liệu.
Hình 2.4: Các hàm kích hoạt thông dụng (nguồn [2]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 2.4.

Các hàm kích hoạt thông dụng (nguồn [2]) Xem tại trang 28 của tài liệu.
Hình 2.6: Mô hình tổng quát của mạng neuron tích chập (CNN)4 - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 2.6.

Mô hình tổng quát của mạng neuron tích chập (CNN)4 Xem tại trang 30 của tài liệu.
Hình 2.7: Trực quan hóa phép toán tích chập - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 2.7.

Trực quan hóa phép toán tích chập Xem tại trang 31 của tài liệu.
Hình 2.9: Ví dụ minh họa gộp cực đại và gộp trung bình5 - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 2.9.

Ví dụ minh họa gộp cực đại và gộp trung bình5 Xem tại trang 32 của tài liệu.
Hình 2.13: Một cell LSTM - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 2.13.

Một cell LSTM Xem tại trang 37 của tài liệu.
Hình 3.1: Mô hình Markov ẩn (nguồn [3]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 3.1.

Mô hình Markov ẩn (nguồn [3]) Xem tại trang 41 của tài liệu.
Hình 3.4: Diagonal-wise MDRNN (nguồn [17]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 3.4.

Diagonal-wise MDRNN (nguồn [17]) Xem tại trang 44 của tài liệu.
Hình 3.7: (a) Cấu trúc của một đơn vị LSTM cơ bản. (b) Cấu trúc của deep birectional LSTM được tác giả sử dụng - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 3.7.

(a) Cấu trúc của một đơn vị LSTM cơ bản. (b) Cấu trúc của deep birectional LSTM được tác giả sử dụng Xem tại trang 46 của tài liệu.
Mô hình chuỗi sang chuỗi (Sequence to Sequence- Seq2Seq) là một mô hình học sâu với mục đích tạo ra một chuỗi đầu ra từ một chuỗi đầu vào mà độ dài của hai chuỗi này không cần phải giống nhau - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

h.

ình chuỗi sang chuỗi (Sequence to Sequence- Seq2Seq) là một mô hình học sâu với mục đích tạo ra một chuỗi đầu ra từ một chuỗi đầu vào mà độ dài của hai chuỗi này không cần phải giống nhau Xem tại trang 48 của tài liệu.
Hình 3.9: Kiến trúc chung của mô hình Attention-based Seq2Seq (nguồn [11]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 3.9.

Kiến trúc chung của mô hình Attention-based Seq2Seq (nguồn [11]) Xem tại trang 50 của tài liệu.
Hình 4.1: So sánh mô hình Transformer và LSTM. - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 4.1.

So sánh mô hình Transformer và LSTM Xem tại trang 54 của tài liệu.
Hình 4.3: Biểu diễn toán học của cơ chế Self-attention (nguồn [18]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 4.3.

Biểu diễn toán học của cơ chế Self-attention (nguồn [18]) Xem tại trang 56 của tài liệu.
Hình 4.5: Minh họa một multi-head self-attention gồm có hai đầu1 - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 4.5.

Minh họa một multi-head self-attention gồm có hai đầu1 Xem tại trang 57 của tài liệu.
Hình 4.4: Scaled Dot-Product Attention (trái). Multi-Head Attention gồm nhiều lớp tập trung chạy song song (phải) (nguồn [16]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 4.4.

Scaled Dot-Product Attention (trái). Multi-Head Attention gồm nhiều lớp tập trung chạy song song (phải) (nguồn [16]) Xem tại trang 57 của tài liệu.
Hình 4.7: So sánh self-attention với masked self-attention2 - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 4.7.

So sánh self-attention với masked self-attention2 Xem tại trang 58 của tài liệu.
4.2 Chi tiết kiến trúc mô hình tổng quát 4.2.1 CNN Embedding - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

4.2.

Chi tiết kiến trúc mô hình tổng quát 4.2.1 CNN Embedding Xem tại trang 60 của tài liệu.
4.3 Quá trình huấn luyện và kiểm tra mô hình - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

4.3.

Quá trình huấn luyện và kiểm tra mô hình Xem tại trang 63 của tài liệu.
Trong quá trình huấn luyện, hệ thống sẽ lần lượt nhận vào từng cặp gồm hình và nhãn tương ứng của nó (Hình 4.11). - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

rong.

quá trình huấn luyện, hệ thống sẽ lần lượt nhận vào từng cặp gồm hình và nhãn tương ứng của nó (Hình 4.11) Xem tại trang 63 của tài liệu.
Bảng 5.2: Thống kê trên tập dữ liệu VNOnDB-word [12] - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Bảng 5.2.

Thống kê trên tập dữ liệu VNOnDB-word [12] Xem tại trang 68 của tài liệu.
Hình 5.2: Ví dụ về mẫu dự liệu Cinnamon trong tập huấn luyện - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 5.2.

Ví dụ về mẫu dự liệu Cinnamon trong tập huấn luyện Xem tại trang 69 của tài liệu.
Hình 5.4: Mẫu gán nhãn phiếu gửi Viettel post - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 5.4.

Mẫu gán nhãn phiếu gửi Viettel post Xem tại trang 70 của tài liệu.
Hình 5.5: Các textline sau khi được cắt từ mẫu tài liệu ban đầu - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 5.5.

Các textline sau khi được cắt từ mẫu tài liệu ban đầu Xem tại trang 72 của tài liệu.
Bảng 5.8: Một số thử nghiệm được thực hiện trên tập dữ liệu VNONDB-line - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Bảng 5.8.

Một số thử nghiệm được thực hiện trên tập dữ liệu VNONDB-line Xem tại trang 74 của tài liệu.
Hình 5.8: Một số trường hợp đúng của mô hình Transformer - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 5.8.

Một số trường hợp đúng của mô hình Transformer Xem tại trang 76 của tài liệu.
Hình 6.1: Demo trên một dòng - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

Hình 6.1.

Demo trên một dòng Xem tại trang 78 của tài liệu.
PHỤ LỤ CA - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
PHỤ LỤ CA Xem tại trang 81 của tài liệu.

Tài liệu cùng người dùng

Tài liệu liên quan