1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nhận diện chữ viết tay tiếng việt

57 44 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nhận diện chữ viết tay tiếng Việt
Tác giả Cao Đức Hựng
Người hướng dẫn PGS.TS. Quản Thành Thơ
Trường học Đại học Quốc gia TP.HCM
Chuyên ngành Khoa học máy tính
Thể loại luận án tốt nghiệp
Năm xuất bản 2015
Thành phố TP.HCM
Định dạng
Số trang 57
Dung lượng 2,38 MB

Nội dung

Ngày đăng: 12/05/2022, 12:34

HÌNH ẢNH LIÊN QUAN

Cấu tạo của một neuron được minh họa bằng hình 2.1. Một neuron sẽ nhận các tín hiệu điện (mức độ mạnh yếu khác nhau) có chứa thông tin từ các khớp thần kinh(synapse) của một hay nhiều neuron khác thông qua các đuôi gai(dendrit) - Nhận diện chữ viết tay tiếng việt
u tạo của một neuron được minh họa bằng hình 2.1. Một neuron sẽ nhận các tín hiệu điện (mức độ mạnh yếu khác nhau) có chứa thông tin từ các khớp thần kinh(synapse) của một hay nhiều neuron khác thông qua các đuôi gai(dendrit) (Trang 22)
Một neuron nhân tạo (perceptron) được cấu tạo bao gồm các thành phần như hình 2.2: - Nhận diện chữ viết tay tiếng việt
t neuron nhân tạo (perceptron) được cấu tạo bao gồm các thành phần như hình 2.2: (Trang 23)
Một mạng neuron đa tầng điển hình thường bao gồm: - Nhận diện chữ viết tay tiếng việt
t mạng neuron đa tầng điển hình thường bao gồm: (Trang 24)
Hình 2.4: Cách thức lấy feature map bằng kernel - Nhận diện chữ viết tay tiếng việt
Hình 2.4 Cách thức lấy feature map bằng kernel (Trang 25)
Hình 2.6: Max pooling với filte r= 2x2 và stride 2 - Nhận diện chữ viết tay tiếng việt
Hình 2.6 Max pooling với filte r= 2x2 và stride 2 (Trang 26)
Hình 2.5: Ví dụ lấy feature map với padding =1 - Nhận diện chữ viết tay tiếng việt
Hình 2.5 Ví dụ lấy feature map với padding =1 (Trang 26)
Hình 2.8: Cấu trúc của mạng neuron hồi quy 2.3.2 Các kiểu hoạt động của mạng neuron hồi quy - Nhận diện chữ viết tay tiếng việt
Hình 2.8 Cấu trúc của mạng neuron hồi quy 2.3.2 Các kiểu hoạt động của mạng neuron hồi quy (Trang 27)
Hình 2.10: Bên trong một module RNN - Nhận diện chữ viết tay tiếng việt
Hình 2.10 Bên trong một module RNN (Trang 28)
Hình 2.11: Bên trong một module LSTM - Nhận diện chữ viết tay tiếng việt
Hình 2.11 Bên trong một module LSTM (Trang 29)
Hình 2.14: Cổng quyết định đầu ra - Nhận diện chữ viết tay tiếng việt
Hình 2.14 Cổng quyết định đầu ra (Trang 30)
Mô hình Sequence to Sequence (seq2seq) [SVL14], hay còn được gọi là mô hình Encoder-Decoder, là một trong những ứng dụng của RNN được trình bày ở trên - Nhận diện chữ viết tay tiếng việt
h ình Sequence to Sequence (seq2seq) [SVL14], hay còn được gọi là mô hình Encoder-Decoder, là một trong những ứng dụng của RNN được trình bày ở trên (Trang 30)
Mục đích của mô hình này là tính xấp xỉ xác suất: p(y 1, ..., ym|x1 , ..., x n ) - Nhận diện chữ viết tay tiếng việt
c đích của mô hình này là tính xấp xỉ xác suất: p(y 1, ..., ym|x1 , ..., x n ) (Trang 31)
Trong một mô hình seq2seq, tại bước decode, vector đầu ra của RNN/LSTM sẽ được đưa qua một hàm Softmax để tìm kiếm token có xác suất lớn nhất - Nhận diện chữ viết tay tiếng việt
rong một mô hình seq2seq, tại bước decode, vector đầu ra của RNN/LSTM sẽ được đưa qua một hàm Softmax để tìm kiếm token có xác suất lớn nhất (Trang 32)
Hình 3.1: Mô hình dự đoán trong bài báo của Alex Graves - Nhận diện chữ viết tay tiếng việt
Hình 3.1 Mô hình dự đoán trong bài báo của Alex Graves (Trang 33)
Bước đầu tiên, là sử dụng mô hình dự đoán và tiên đoán vị trí đặt bút kế tiếp, khi đã biết các nét chữ trước đó - Nhận diện chữ viết tay tiếng việt
c đầu tiên, là sử dụng mô hình dự đoán và tiên đoán vị trí đặt bút kế tiếp, khi đã biết các nét chữ trước đó (Trang 34)
3.2 Mô hình CRNN 3.2.1 Giới thiệu - Nhận diện chữ viết tay tiếng việt
3.2 Mô hình CRNN 3.2.1 Giới thiệu (Trang 35)
Tác giả sử dụng một mô hình CNN phổ biến là VGG16 để lấy features, với 4 tầng pooling kích thước 2x2, đồng thời bỏ hết tầng fully connected cuối cùng - Nhận diện chữ viết tay tiếng việt
c giả sử dụng một mô hình CNN phổ biến là VGG16 để lấy features, với 4 tầng pooling kích thước 2x2, đồng thời bỏ hết tầng fully connected cuối cùng (Trang 36)
Đây là mô hình tự động thêm dấu tiếng Việt vào câu [AIv]. Mô hình này đã tham gia vào cuộc thi của AIviVN về tự động thêm dấu tiếng Việt và đạt giải nhất. - Nhận diện chữ viết tay tiếng việt
y là mô hình tự động thêm dấu tiếng Việt vào câu [AIv]. Mô hình này đã tham gia vào cuộc thi của AIviVN về tự động thêm dấu tiếng Việt và đạt giải nhất (Trang 37)
Một n-gram language model truyền thống được sử dụng để rank candidate trong beam search (hình 3.7): - Nhận diện chữ viết tay tiếng việt
t n-gram language model truyền thống được sử dụng để rank candidate trong beam search (hình 3.7): (Trang 38)
Mô hình Image-to-markup [Den+17] được xây dựng với mục tiêu là để chuyển các công thức toán học về dạng LaTEX - Nhận diện chữ viết tay tiếng việt
h ình Image-to-markup [Den+17] được xây dựng với mục tiêu là để chuyển các công thức toán học về dạng LaTEX (Trang 39)
Hình 4.3: Ví dụ sử dụng elastic transform để làm méo bức ảnh - Nhận diện chữ viết tay tiếng việt
Hình 4.3 Ví dụ sử dụng elastic transform để làm méo bức ảnh (Trang 41)
Hình 4.6: Mô hình nhận diện chữ viết tay - Nhận diện chữ viết tay tiếng việt
Hình 4.6 Mô hình nhận diện chữ viết tay (Trang 43)
Đánh giá mô hình 5.1 Đánh giá - Nhận diện chữ viết tay tiếng việt
nh giá mô hình 5.1 Đánh giá (Trang 46)
Hình 5.2: Minh họa kết quả - Nhận diện chữ viết tay tiếng việt
Hình 5.2 Minh họa kết quả (Trang 47)
Bảng 5.1: Thông số huấn luyện - Nhận diện chữ viết tay tiếng việt
Bảng 5.1 Thông số huấn luyện (Trang 48)
Hình 6.1: Deployment diagram - Nhận diện chữ viết tay tiếng việt
Hình 6.1 Deployment diagram (Trang 51)
Hình 6.2: Activity diagram: Vẽ khung chứa chữ viết tay - Nhận diện chữ viết tay tiếng việt
Hình 6.2 Activity diagram: Vẽ khung chứa chữ viết tay (Trang 52)
Hình 6.3: Activity diagram: Nhận diện chữ viết tay - Nhận diện chữ viết tay tiếng việt
Hình 6.3 Activity diagram: Nhận diện chữ viết tay (Trang 53)
• Phần hiển thị PDF, bên dưới là phần zoom lên từ hình gốc để hiển thị rõ hơn. •Phần lưu các nhãn đã nhập và tọa độ các khung. - Nhận diện chữ viết tay tiếng việt
h ần hiển thị PDF, bên dưới là phần zoom lên từ hình gốc để hiển thị rõ hơn. •Phần lưu các nhãn đã nhập và tọa độ các khung (Trang 54)
Hình 6.5: Nhận diện chữ viết tay - Nhận diện chữ viết tay tiếng việt
Hình 6.5 Nhận diện chữ viết tay (Trang 55)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w