1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

83 27 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây Dựng Mô Hình Nhận Dạng Chữ Viết Tay Trong Các Biểu Mẫu Có Bố Cục Cố Định
Tác giả Nguyễn Thị Trúc Ly
Người hướng dẫn TS. Trần Tuấn Anh, ThS. Trần Văn Nhàn, KS. Phạm Văn Lĩnh
Trường học Đại Học Bách Khoa
Chuyên ngành Khoa Học Máy Tính
Thể loại Luận Văn Tốt Nghiệp
Năm xuất bản 2021
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 83
Dung lượng 2,9 MB

Nội dung

Ngày đăng: 12/05/2022, 12:34

HÌNH ẢNH LIÊN QUAN

Về nguyên tắc, nhận dạng văn bản viết tay khác với nhận dạng đối tượng từ hình ảnh hay nhận dạng hành động từ video: - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
nguy ên tắc, nhận dạng văn bản viết tay khác với nhận dạng đối tượng từ hình ảnh hay nhận dạng hành động từ video: (Trang 16)
Hình 1.4: Minh họa nhận dạng ở mức độ dòng - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 1.4 Minh họa nhận dạng ở mức độ dòng (Trang 19)
Hình 1.6: Từ “người” bằng chữ viết tay (trái) và chữ in (phải) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 1.6 Từ “người” bằng chữ viết tay (trái) và chữ in (phải) (Trang 20)
Hình 2.1: Cấu tạo của một neuron thần kinh1 - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 2.1 Cấu tạo của một neuron thần kinh1 (Trang 25)
Hình 2.4: Các hàm kích hoạt thông dụng (nguồn [2]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 2.4 Các hàm kích hoạt thông dụng (nguồn [2]) (Trang 28)
Hình 2.6: Mô hình tổng quát của mạng neuron tích chập (CNN)4 - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 2.6 Mô hình tổng quát của mạng neuron tích chập (CNN)4 (Trang 30)
Hình 2.7: Trực quan hóa phép toán tích chập - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 2.7 Trực quan hóa phép toán tích chập (Trang 31)
Hình 2.9: Ví dụ minh họa gộp cực đại và gộp trung bình5 - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 2.9 Ví dụ minh họa gộp cực đại và gộp trung bình5 (Trang 32)
Hình 2.13: Một cell LSTM - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 2.13 Một cell LSTM (Trang 37)
Hình 3.1: Mô hình Markov ẩn (nguồn [3]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 3.1 Mô hình Markov ẩn (nguồn [3]) (Trang 41)
Hình 3.4: Diagonal-wise MDRNN (nguồn [17]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 3.4 Diagonal-wise MDRNN (nguồn [17]) (Trang 44)
Hình 3.7: (a) Cấu trúc của một đơn vị LSTM cơ bản. (b) Cấu trúc của deep birectional LSTM được tác giả sử dụng - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 3.7 (a) Cấu trúc của một đơn vị LSTM cơ bản. (b) Cấu trúc của deep birectional LSTM được tác giả sử dụng (Trang 46)
Mô hình chuỗi sang chuỗi (Sequence to Sequence- Seq2Seq) là một mô hình học sâu với mục đích tạo ra một chuỗi đầu ra từ một chuỗi đầu vào mà độ dài của hai chuỗi này không cần phải giống nhau - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
h ình chuỗi sang chuỗi (Sequence to Sequence- Seq2Seq) là một mô hình học sâu với mục đích tạo ra một chuỗi đầu ra từ một chuỗi đầu vào mà độ dài của hai chuỗi này không cần phải giống nhau (Trang 48)
Hình 3.9: Kiến trúc chung của mô hình Attention-based Seq2Seq (nguồn [11]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 3.9 Kiến trúc chung của mô hình Attention-based Seq2Seq (nguồn [11]) (Trang 50)
Hình 4.1: So sánh mô hình Transformer và LSTM. - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 4.1 So sánh mô hình Transformer và LSTM (Trang 54)
Hình 4.3: Biểu diễn toán học của cơ chế Self-attention (nguồn [18]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 4.3 Biểu diễn toán học của cơ chế Self-attention (nguồn [18]) (Trang 56)
Hình 4.5: Minh họa một multi-head self-attention gồm có hai đầu1 - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 4.5 Minh họa một multi-head self-attention gồm có hai đầu1 (Trang 57)
Hình 4.4: Scaled Dot-Product Attention (trái). Multi-Head Attention gồm nhiều lớp tập trung chạy song song (phải) (nguồn [16]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 4.4 Scaled Dot-Product Attention (trái). Multi-Head Attention gồm nhiều lớp tập trung chạy song song (phải) (nguồn [16]) (Trang 57)
Hình 4.7: So sánh self-attention với masked self-attention2 - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 4.7 So sánh self-attention với masked self-attention2 (Trang 58)
4.2 Chi tiết kiến trúc mô hình tổng quát 4.2.1 CNN Embedding - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
4.2 Chi tiết kiến trúc mô hình tổng quát 4.2.1 CNN Embedding (Trang 60)
4.3 Quá trình huấn luyện và kiểm tra mô hình - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
4.3 Quá trình huấn luyện và kiểm tra mô hình (Trang 63)
Trong quá trình huấn luyện, hệ thống sẽ lần lượt nhận vào từng cặp gồm hình và nhãn tương ứng của nó (Hình 4.11). - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
rong quá trình huấn luyện, hệ thống sẽ lần lượt nhận vào từng cặp gồm hình và nhãn tương ứng của nó (Hình 4.11) (Trang 63)
Bảng 5.2: Thống kê trên tập dữ liệu VNOnDB-word [12] - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Bảng 5.2 Thống kê trên tập dữ liệu VNOnDB-word [12] (Trang 68)
Hình 5.2: Ví dụ về mẫu dự liệu Cinnamon trong tập huấn luyện - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 5.2 Ví dụ về mẫu dự liệu Cinnamon trong tập huấn luyện (Trang 69)
Hình 5.4: Mẫu gán nhãn phiếu gửi Viettel post - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 5.4 Mẫu gán nhãn phiếu gửi Viettel post (Trang 70)
Hình 5.5: Các textline sau khi được cắt từ mẫu tài liệu ban đầu - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 5.5 Các textline sau khi được cắt từ mẫu tài liệu ban đầu (Trang 72)
Bảng 5.8: Một số thử nghiệm được thực hiện trên tập dữ liệu VNONDB-line - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Bảng 5.8 Một số thử nghiệm được thực hiện trên tập dữ liệu VNONDB-line (Trang 74)
Hình 5.8: Một số trường hợp đúng của mô hình Transformer - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 5.8 Một số trường hợp đúng của mô hình Transformer (Trang 76)
Hình 6.1: Demo trên một dòng - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 6.1 Demo trên một dòng (Trang 78)
PHỤ LỤ CA - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
PHỤ LỤ CA (Trang 81)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w