Nghiên cứu bài toán bóc tác thông tin trong chứng minh thư sử dụng học sâu.

74 43 3
Nghiên cứu bài toán bóc tác thông tin trong chứng minh thư sử dụng học sâu.

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nghiên cứu bài toán bóc tác thông tin trong chứng minh thư sử dụng học sâu.Nghiên cứu bài toán bóc tác thông tin trong chứng minh thư sử dụng học sâu.Nghiên cứu bài toán bóc tác thông tin trong chứng minh thư sử dụng học sâu.Nghiên cứu bài toán bóc tác thông tin trong chứng minh thư sử dụng học sâu.Nghiên cứu bài toán bóc tác thông tin trong chứng minh thư sử dụng học sâu.Nghiên cứu bài toán bóc tác thông tin trong chứng minh thư sử dụng học sâu.

BỘ GIÁO DỤC VIỆN HÀN LÂM VÀ ĐÀO TẠO KHOA HỌC VÀ CÔNG NGHỆ VN PHẠM VĂN DƯƠNG HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Phạm Văn Dương NGHIÊN CỨU BÀI TỐN BĨC TÁCH THƠNG TIN HỆ THỐNG THƠNG TIN TRONG CHỨNG MINH THƯ SỬ DỤNG HỌC SÂU LUẬN VĂN THẠC SĨ NGÀNH MÁY TÍNH 2021 Hà Nội – 2021 BỘ GIÁO DỤC VIỆN HÀN LÂM VÀ ĐÀO TẠO KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Phạm Văn Dương NGHIÊN CỨU BÀI TỐN BĨC TÁCH THƠNG TIN TRONG CHỨNG MINH THƯ SỬ DỤNG HỌC SÂU Chuyên ngành : Hệ thống thông tin Mã số: 8480104 LUẬN VĂN THẠC SĨ NGÀNH MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC : PGS.TS NGÔ QUỐC TẠO Hà Nội – 2021 LỜI CAM ĐOAN Tôi Phạm Văn Dương, học viên khóa 2019B, ngành Máy tính, chun ngành Hệ thống thông tin Tôi xin cam đoan luận văn “Nghiên cứu tốn bóc tách thơng tin chứng minh thư sử dụng học sâu” nghiên cứu, tìm hiểu phát triển hướng dẫn PGS.TS Ngô Quốc Tạo, chép từ tài liệu, cơng trình nghiên cứu người khác mà không ghi rõ tài liệu tham khảo Tôi xin chịu trách nhiệm lời cam đoan Hà Nội, ngày tháng năm 2021 Tác giả Phạm Văn Dương LỜI CẢM ƠN Lời cảm ơn trân trọng Tôi muốn dành tới thầy cô Học viện khoa học công nghệ Việt Nam, Viện công nghệ thông tin, Viện Hàn lâm khoa học công nghệ Việt Nam nói chung thầy môn Hệ thống thông tin khoa Công nghệ thơng tin nói riêng tận tình giảng dạy truyền đạt kiến thức quý báu suốt khố cao học vừa qua, giúp tơi có kiến thức chuyên môn tảng để làm sở lý luận khoa học cho luận văn Đặc biệt Tôi xin chân thành cảm ơn thầy PGS.TS Ngô Quốc Tạo dìu dắt hướng dẫn tơi suốt q trình làm luận văn, bảo định hướng thầy giúp tự tin nghiên cứu vấn đề giải toán cách khoa học Tôi xin trân trọng cảm ơn Ban giám hiệu Học viện khoa học công nghệ Việt Nam - Viện Hàn lâm khoa học công nghệ Việt Nam tạo điều kiện cho học tập làm luận văn cách thuận lợi Tôi xin cảm ơn hỗ trợ nhiệm vụ: “Hỗ trợ hoạt động nghiên cứu khoa học cho nghiên cứu viên cao cấp năm 2021” mã số: nvcc02.01/21-21 Viện Hàn lâm Khoa học Công nghệ Việt Nam (VAST), Hà Nội, Việt Nam Mặc dù cố gắng nhiều, chắn trình học tập luận văn khơng khỏi thiết sót Tơi mong thơng cảm bảo tận tình thầy cô bạn Hà Nội, ngày tháng năm 2021 Tác giả Phạm Văn Dương MỤC LỤC DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ MỞ ĐẦU 10 CHƯƠNG TỔNG QUAN VỀ PHÁT HIỆN, NHẬN DẠNG KÝ TỰ, SỰ PHÁT TRIỂN CỦA HỌC MÁY VÀ HỌC SÂU 12 1.1 Tổng quan phát nhận dạng ký tự 12 1.2 Sự phát triển học máy học sâu 13 1.3 Kết luận chương 17 CHƯƠNG GIỚI THIỆU VỀ MẠNG CONVOLUTION NEURAL NETWORK .18 2.1 Giới thiệu sơ lược CNN 18 2.2 Convolution Layer – Tầng Tích Chập 18 2.3 Strides – Bước nhảy 20 2.4 Padding – Đệm 21 2.5 Non Linearity (ReLU) – Phi tuyến tính 21 2.6 Pooling Layer – Tầng gộp 22 2.7 Full Connected Layer – Tầng kết nối đầy đủ 23 2.8 Kết luận chương 23 CHƯƠNG MƠ HÌNH MẠNG PIXELLINK CHO PHÁT HIỆN VĂN BẢN 24 3.1 Cấu trúc mạng 24 3.2 Kết nối điểm ảnh 27 3.3 Tối ưu 27 3.3.1 Tính tốn vùng xác 27 3.3.2 Hàm mát 28 3.4 Chuẩn bị liệu đào tạo 30 3.4.1 Chuẩn bị liệu 30 3.4.2 Dữ liệu thật: 31 3.4.3 Dữ liệu sinh 32 3.4.4 Tiền xử lý liệu 33 3.4.5 Quá trình đào tạo 34 3.4.6 Tối ưu: 34 3.4.7 Kết đạt được: 35 3.4.8 Hạn chế mơ hình 35 3.5 Kết luận chương 36 3.5.1 C HƯƠNG GIỚI THIỆU VỀ CONVOLUTION RECURRENT NEURAL NETWORK 37 4.1 Giới thiệu toán lợi CRNN 37 4.2 Cấu trúc 38 4.3 Tầng trích xuất đặc trưng chuỗi 39 4.4 Gán nhãn trình tự 39 4.5 Tầng Transcription 45 4.6 Hàm mát 47 4.7 Tóm tắt cấu trúc mơ hình 48 4.7.1 Cách tạo liệu đào tạo 49 4.7.2 Dữ liệu thật 49 4.7.3 Dữ liệu sinh 49 4.7.4 Hạn chế mơ hình 49 4.8 Kết luận chương 50 3.5.2 CHƯƠ NG 5: CÀI ĐẶT THỬ NGHIỆM VÀ KẾT QUẢ 51 5.1 Bài toán 51 5.2 Mơ hình giải tốn 51 5.3 Môi trường cài đặt 52 5.4 Dữ liệu kiểm thử 52 5.5 Kết thực nghiệm 53 3.5.3 KẾT LUẬN 55 3.5.4 TÀI LIỆU THAM KHẢO 57 3.5.5 DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT 3.5.6 3.5.7 Từ Từ chuẩn 3.5.8 viết tắt 3.5.10 3.5.13 CNN RNN Convolutional Neural Network 3.5.11 3.5.14 Recurrent Neural Nework 3.5.16 CRNN 3.5.17 3.5.9 Diễn giải 3.5.12 Mạng nơ-ron tích chập 3.5.15 Mạng nơ-ron hồi quy Convolutional Recurrent Neural Nework 3.5.18 Mạng nơ-ron hồi quy xoắn LSTM 3.5.20 Memory Long Short-term 3.5.22 AI 3.5.23 Artifical Intelligence 3.5.24 tạo Trí tuệ nhân 3.5.25 ML 3.5.26 Machine Learning 3.5.27 Học máy 3.5.28 DL 3.5.29 Deep Learning 3.5.30 Học sâu 3.5.31 NN 3.5.32 Neural Network 3.5.33 Mạng nơ-ron 3.5.34 OCR 3.5.35 3.5.36 Nhận dạng 3.5.19 3.5.21 Bộ nhớ ngắn hạn dài Optical Character Recognition ký tự quang học 3.5.37 DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ 3.5.38 Hình 1.0.1 Quá trình nhận dạng10 3.5.39 Hình 1.0.2 Mối quan hệ giưa AI, ML, DL 11 3.5.40 Hình 1.0.3 Các giai đoạn AI 12 3.5.41 .Hình 2.0.1 Mơ hình CNN sử dụng cho toán phân loại 14 3.5.42 Hình 2.0.2 Nhân ma trận ảnh với lọc 15 3.5.43 Hình 2.0.3 Ma trận lọc 15 3.5.44 Hình 2.0.4 Kết thực phép nhân 15 3.5.45 Hình 2.0.5 Đầu ma trận có bước nhảy hai 16 3.5.46 Hình 2.0.6 Hoạt động hàm ReLU 17 3.5.47 Hình 2.0.7 Max Pooling 17 3.5.48 Hình 2.0.8 Mơ tả tầng kết nối đầy đủ 18 3.5.49 Hình 3.0.1 Mơ hình mạng VGG16 20 3.5.50 Hình 3.0.2 Quá trình Pixellink 21 3.5.51 Hình 3.0.3 Các hộp với diện tích khác 23 3.5.52 Hình 3.0.4 Hình minh họa trình xác định hộp 25 3.5.53 Hình 3.0.5 Dữ liệu sinh 27 3.5.54 Hình 3.0.6 Nhãn liệu sinh 28 3.5.55 Hình 3.0.7 Hàm mát phân loại điểm ảnh 29 3.5.56 Hình 3.8 hàm mát liên kết 29 3.5.57 Hình 3.0.9 Hình kết mơ hình Pixellink 29 3.5.58 Hình 3.0.10 Hình miêu tả hạn chế30 3.5.59 Hình 4.0.1 Cấu trúc mạng CRNN 32 3.5.60 Hình 4.0.2 Mơ hình RNN 33 3.5.61 Hình 4.0.3 Cấu trúc mạng LSTM 34 3.5.62 Hình 4.0.4 Hình minh họa thơng tin truyền 35 3.5.63 Hình 4.0.5 Tầng mạng phép nhân35 3.5.64 Hình 4.0.6 Hình minh họa cổng quên36 3.5.65 Hình 4.0.7 Hình mơ tả cập nhật khối37 3.5.66 .Hình 4.0.8 Hình mơ tả q trình cập nhật trạng thái mới37 3.5.67 Hình 4.0.9 Hình mơ tả qúa trình xác định đầu ra45 3.5.68 Hình 4.0.10 Hình họa chọn giá trị có xác suất cao 47 3.5.69 Hình 4.0.11 Hình họa chọn giá trị có xác suất cao 49 3.5.70 Hình 5.0.1 Giao diện chương trình truy cập 52 3.5.71 Hình 5.0.2 Giao diện chương trình tải ảnh CMT thành cơng 52 3.5.72 Hình 5.0.3 Giao diện chương trình sau kết 53 3.5.73 MỞ ĐẦU 3.5.74 3.5.75 Nhận dạng mẫu ngành khoa học học máy (hay trí tuệ nhân tạo) nhằm phân loại liệu (các mẫu) vào số lớp Mẫu thực thể cần nhận ra, ví dụ: chữ in, chữ viết tay, vân tay, khn mặt, tiếng nói, hình dạng,… Cùng với phát triển khoa học kỹ thuật, ứng dụng nhận dạng mẫu ngày mở rộng, từ việc tự động hoá số quy trình sản xuất cơng nghiệp dự báo thời tiết, dự báo cháy rừng phần quan trọng hệ thống máy tính thơng minh… 3.5.76 Một ứng dụng phổ biến nhận dạng mẫu phân tích nhận dạng ảnh tài liệu (có nguồn gốc từ hệ thống nhận dạng ký tự quang học), nhằm số hoá trang tài liệu giấy sách, báo, tạp chí,… Cho đến nay, tốn phân tích nhận dạng ảnh tài liệu giải gần trọn vẹn có sản phẩm thương mại, VnDOCR Viện công nghệ thông tin hay FineReader hãng ABBYY,… 3.5.77 Bên cạnh lớp tốn phân tích nhận dạng ảnh tài liệu cách tổng quát cịn có lớp tốn riêng biệt cho ngành, lĩnh vực cụ thể, như: phân tích nhận dạng bảng biểu, phiếu điều tra, mẫu điền thông tin, danh thiếp, hộ chiếu,… Đối với lớp tốn việc phân tích cấu trúc ảnh tài liệu đặc biệt quan trọng, định đến việc tách nhận dạng xác trường thông tin cần thiết cho ứng dụng cụ thể 3.5.78 Trên giới có nhiều sản phẩm phần mềm phân tích nhận dạng ảnh thẻ chứa thông tin cá nhân (như hộ chiếu, danh thiếp,…) ứng dụng nhiều lĩnh vực, như: làm thủ tục hải quan, giao dịch cửa hàng, khách sạn,… Ở Việt Nam loại thẻ chứa thông tin nhân sử dụng nhiểu Giấy chứng minh nhân dân (CMND) Do đó, luận văn này, xin đề xuất phương pháp phân tích ảnh CMND dựa việc phân tích nhận dạng biểu mẫu với kỹ thuật xử lý hình ảnh thơng minh 10 4.6 Tầng transcription q trình chuyển kết dự đoán RNN sang chuỗi dự đốn Ở đây, transcription tìm nhãn với xác suất lớn dự đoán frame Trong thực tế tồn hai mơ hình để thực việc chuyển đổi từ xác suất dự đoán sang nhãn tương ứng, lexicon-free lexicon-based Trong lexicon tập chuỗi có nhãn cố định Người ta sử dụng CTC cho trình đào đạo trình dự đốn, phương pháp đề xuất Graves Sau trình bày phương pháp Phương pháp bao gồm hai trình mã hóa giải mã văn bản, q trình từ chuỗi xác suất đưa chuỗi văn gọi q trình giải mã, khơng giống q trình đào tạo sử dụng mã hóa, biết nhãn chuỗi trước Q trình giả mã khác trình đào tạo chỗ có mơ hình đào tạo sử dụng để nhận dạng văn khơng nhìn thấy trước đó, nghĩa chúng dựa vào ma trận đầu mạng để xác định chuỗi Nhưng chưa biết nhãn thực tế nó, mà mong muốn mơ hình xác định nhãn Nếu thử tất trường hợp có vài chuỗi cố định, thực tế sử dụng cách Sử dụng thuật tốn đơn giản cho kết tốt với thực tế, gồm hai bước sau • Tìm chuỗi tốt cách lấy kí tự có xác suất cao tầng frame • Xóa bỏ tất “blank” từ chuỗi Ví dụ: Các kí tự “a”, “b” “-”(blank) Nhìn vào hình dưới, giả sử có đặc trưng chuỗi, áp dụng đường mã hóa tốt từ ma trận, to kí tự phù hợp “a” tương tự với t1 , t2 blank có điểm số cao t3 , cuối t4 “b” Như kết nhận “aaa-b”, sau xóa bỏ kí tự lặp lại gần kết đạt “a-b”, sau xóa bỏ blank kết thu “ab” Vậy đầu nhận dạng chuỗi “ab” Hình 4.0.10 Hình họa chọn giá trị có xác suất cao Nhưng kết cách xấp xỉ, dễ dàng nhận kết từ cách trên, nhiên thuật toán xấp xỉ thường cho kết tốt với thực tế 4.7 Hàm mát Định nghĩa tập đào tạo {= { �� , �} �� ảnh cho đào tạo, �� nhãn ảnh tương ứng, hàm tối ưu � = −∑ ( � | ��) ��,� � �� PT 5.7 Trong chuỗi sinh recunrrent convolution từ �� Nhận thấy đầu vào hàm mát mạng ảnh nhãn nội dung ảnh 4.8Tóm tắt cấu trúc mơ hình Kiểu Cấu hình Transcription - Bidirectional-LSTM hidden units:256 Bidirectional-LSTM hidden units:256 Map-to-Sequence - Convolution maps:512, k:2 × 2, s:1, p:0 MaxPooling Window:1 × 2, s:2 BatchNormalization - Convolution maps:512, k:3 × 3, s:1, p:1 BatchNormalization - Convolution maps:512, k:3 × 3, s:1, p:1 MaxPooling Window:1 × 2, s:2 Convolution maps:256, k:3 × 3, s:1, p:1 Convolution maps:256, k:3 × 3, s:1, p:1 MaxPooling Window:2 × 2, s:2 Convolution maps:128, k:3 × 3, s:1, p:1 MaxPooling Window:2 × 2, s:2 Convolution maps:64, k:3 × 3, s:1, p:1 Input W × 32 gray-scale image Bảng 4.2 Bảng thành phần mô hình CRNN 4.7.1 Cách tạo liệu đào tạo Như đề cập từ trước thành công mô hình học máy hay học sâu phụ thuộc nhiều vào liệu chất lượng liệu Đầu vào mạng ảnh với độ cao cố định 512, nội dung vùng ảnh Do hạn chế liệu thời gian làm đa dạng liệu, liệu chia thành hai phần liệu thật liệu sinh 4.7.2 Dữ liệu thật Tận dụng liệu gán nhãn việc đào tạo mơ hình pixellink, có chút thay đổi, đầu vào mạng ảnh có chiều cao 512 vùng nhãn nội dung vùng ảnh đó, nên sau cắt vùng ảnh từ ảnh gốc cần thay đổi kích thước vùng ảnh phù hợp với kích thước đầu vào Ví dụ ảnh đầu vào nhãn của vùng Ảnh đầu vào: Hình 4.0.11 Hình ví dụ ảnh đầu vào Nhãn là: 459709241360 4.7.3 Dữ liệu sinh Sử dụng kỹ thuật xử lý ảnh để vẽ nội dung lên ảnh, trình muốn tạo đa dạng liệu đào tạo nên sử dụng thêm kỹ thuật xử lý ảnh để tạo mẫu giống với liệu thực tế Tổng số liệu thật 1000 ảnh Dữ liệu sinh tự động lúc đào tạo với tỉ lệ xác suất dùng ảnh thật để đào tạo 0.7, tỉ lệ xác suất dùng ảnh sinh để đào tạo 0.3, trình sinh tự động tránh việc chiếm nhiều nhớ, sinh nhiêu đưa vào đào tạo 4.7.4 Hạn chế mơ hình 4.7.5 Bên cạnh điểm lợi trình đào tạo dự đoán dự vào đầu vào ảnh, bên cạnh mơ hình gặp số hạn chế định tốn với phơng chữ khác phải đào tạo phông tương ứng gần giống, lỗi thường gặp dự đoán sai kí tự có phân phối gần giống cặp sau: • Chữ “l” số “1” • Số “3” số “8” • Chữ “p” chữ “q” Những chữ phông khác có phân phối gần thường bị nhầm, chuỗi dài xác suất tồn chữ chuỗi bị hạn chế, nên số tốn thực tế ứng sau bước cần phải chỉnh sửa thông tin để kết đạt tốt 4.9 Kết luận chương Trong chương luận văn nghiên cứu mạng nơ ron hồi quy xoắn, Convolution recurren neural network(CRNN) mạng nơ ron sử dụng học sâu với kết hợp DCNN RNN tạo nên cấu trúc CRNN với lợi cấu trúc khác: - Có thể học trực tiếp chuỗi mà khơng cần xác vị trí phần tử chuỗi - Có thể trích xuất trực tiếp đặc trưng từ ảnh không yêu cầu xử lý thủ công tiền xử lý - Có tính chất RNN sinh chuỗi đối tượng - Không bị ràng buộc độ dài chuỗi, yêu cầu chuẩn hóa chiều cao hai q trình đào tạo kiểm tra - Cần tham số mạng DCNN tiêu chuẩn, tiêu tốn nhớ - CHƯƠNG 5: CÀI ĐẶT THỬ NGHIỆM VÀ KẾT QUẢ - Trong chương luận văn mơ tả cách q trình cài đặt thử nghiệm thuật toán, kết đạt liệu khác 5.1 Bài toán - Xây dựng chương trình cài đặt thử nghiệm, chương trình cho phép người dùng tải lên hình ảnh mặt trước chứng minh thư nhân dân Chương trình bóc tách thông tin chứng minh thư sử dụng học sâu với thông tin: - Số Chứng minh thư nhân dân - Họ tên - Ngày sinh - Địa thường trú - Mục đích chương trình hỗ trợ việc số hóa thơng tin chứng minh thư nhân dân sử dụng thuật tốn học sâu 5.2Mơ hình giải tốn - - - Bước 1: Tiền xử lý - Giai đoạn tiền xử lý nhằm tăng độ xác hệ thống nhận dạng Vì quét ảnh thường gặp loại nhiễu, kích thước ảnh khơng đồng nhất, hình ảnh không chụp trực diện Nên bước tiến hành chuẩn hóa lại kích thước hình ảnh đầu vào, khử nhiễu để tăng độ xác cho thuật tốn - Bước Trích chọn đặc trưng - Để thực trích chọn đặc trưng, hệ thống sử dụng thuật toán Pixel Link để thực việc chọn đặc trưng hình ảnh đưa vào vào phần mềm - Vì đối tượng có đặc điểm riêng nên bước giúp ta trích chọn đặc tính riêng để phục vụ cho bước nhận dạng phía sau - Bước Nhận dạng - Để nhận dạng phần mềm sử dụng học sâu với CRNN để thực nhận dạng ký tự ảnh đặc trưng - Sau mẫu liệu qua bước tiền xử lý trích chọn đặc trưng, dựa vào giá trị tham số thu huấn luyện ta sử dụng thuật toán CRNN để thực việc việc xác định nhận dạng ký tự - 5.3Mơi trường cài đặt - Thuật tốn thử nghiệm cài đặt ngơn ngữ lập trình Python [10] [11] [12] (Microsoft Visual Studio), sử dụng thư viện xử lý ảnh Opencv cho việc - đọc/ghi ảnh thao tác xử lý ảnh - Chương trình thử nghiệm máy laptop Geforce GTX 1060, core i5, nhớ RAM 8,0 GB 5.4Dữ liệu kiểm thử - Chương trình thử nghiệm tập 100 ảnh CMND quét với độ phân giải 300dpi, kiểu ảnh mầu Các mẫu CMND lấy từ nhiều tỉnh thành khác qua mạng internet, đơn vị cấp CMND khác Mặc dù CMND in theo mẫu chung có khác đơn vị cấp kích thước kiểu - chữ, vị trí tương đối trường thơng tin, … 5.5 Kết thực nghiệm - Phần mềm cài đặt chạy thử nghiệm với kết quả: - - Hình 5.0.1 Giao diện chương trình truy cập - Hình 5.0.2 Giao diện chương trình tải ảnh CMT thành cơng - Hình 5.0.3 Giao diện chương trình sau kết - KẾT LUẬN - Q trình hồn thành luận văn, tơi nghiên cứu nhiều kiến thức trình xây dựng mơ hình học sâu, từ q trình tạo thu thập liệu, đến q trình đào tạo mơ hình đánh giá mơ hình Học sâu lĩnh vực phát triển mạnh mẽ với đầu tư nghiên cứu nhà khoa học, báo liên đến kỹ thuật OCR ý nhiều, qua giúp tơi học cách tiếp cận cập nhật kiến thức cách nhanh chóng liên tục - Qua q trình nghiên cứu tơi thí nghiệm bóc tách thơng tin từ chứng minh thư sử dụng mơ hình học sâu, tơi nhận thấy đạt số kết sau: + Nắm bắt bước hệ thống xử lý ảnh, hiểu khái niệm xử lý ảnh với thuật toán học sâu Thấy vai trò quan trọng học sâu xử lý ảnh hệ nhận dạng, bước tiền xử lý nhằm nâng cao chất lượng nhận dạng + Tìm hiểu tổng qt hố phương pháp phân tích ảnh tài liệu, nắm ưu nhược điểm phương pháp Từ đưa giải pháp cho toán đặt luận văn + Đã áp dụng thành công kiến thức tìm hiểu vào cài đặt thử nghiệm chương trình phân tích ảnh CMND Kết chương trình đạt tốt áp dụng vào thực tế - Tuy nhiên, thời gian làm luận văn hạn chế, khối lượng công việc lớn nên nhiều vấn đề tồn chưa giải quyết: + Một số trường hợp bị phần thông tin coi nhiễu phần thơng tin trường Thuật tốn thất bại trường hợp trường thông tin in/dập vào CMND bị lệch góc đánh kể so với dịng in sẵn CMND + Chương trình dừng lại bước thử nghiệm, chưa phải chương trình hồn chỉnh, đầy đủ tính + Thuật tốn dừng lại việc phân tích ảnh CMND, chưa khái hoá cho ảnh thẻ + Hướng phát triển là, tiếp tục nghiên cứu hồn thiện chương trình để áp dụng vào thực tế Mở rộng tính chương trình (như thêm phần nhận dạng, kiểm lỗi tả) để thành chương trình hồn chỉnh Khái qt hố thuật tốn để xử lý ảnh thẻ khác + TÀI LIỆU THAM KHẢO [1] Youngmin Baek, Bado Lee, Dongyoon Han, Sangdoo Yun, Hwalsuk Lee Character Region Awareness for Text Detection 2019 [2] Zhi Tian, Weilin Huang, Tong He, Pan He, Yu Qiao Detecting Text in Natural Image with Connectionist Text Proposal Network 2016 [3] Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C Berg SSD: Single Shot MultiBox Detector 2015 [4] Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi You Only Look Once: Unified, Real-Time Object Detection 2015 [5] Dan Deng, Haifeng Liu, Xuelong Li, Deng Cai PixelLink: Detecting Scene Text via Instance Segmentation 2018 [6] Chengquan, Zhang Multi-oriented Text Detection with Fully Convolutional Networks 2016 [7] Abhinav Shrivastava, Abhinav Gupta, Ross Girshick Raining Regionbased Object Detectors with Online Hard Example Mining 2016 [8] Benteng Ma, Yong Xia Autonomous Deep Learning: A Genetic DCNN Designer for Image Classification 2018 [9] Baoguang Shi, Xiang Bai, Cong Yao An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 2015 [10] Machine Learning in Python, https://scikit-learn.org/stable/ + [11] Satya Mallick Support Vector Machines (SVM) https://www.learnopencv.com/support-vector-machines-svm [12] Kushashwa Ravi Shrimali SVM using Scikit-Learn in Python https://www.learnopencv.com/svm-using-scikit-learn-in-python ... đề tài: “ Nghiên cứu tốn bóc tách thơng tin chứng minh thư sử dụng học sâu.? ?? Mục đích đề tài 3.5.80 3.5.81 3.5.82 Với đề tài: “ Nghiên cứu tốn bóc tách thơng tin chứng minh thư sử dụng học sâu.. . TẠO KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CƠNG NGHỆ Phạm Văn Dương NGHIÊN CỨU BÀI TỐN BĨC TÁCH THƠNG TIN TRONG CHỨNG MINH THƯ SỬ DỤNG HỌC SÂU Chuyên ngành : Hệ thống thông tin Mã... ? ?Nghiên cứu tốn bóc tách thơng tin chứng minh thư sử dụng học sâu” nghiên cứu, tìm hiểu phát triển hướng dẫn PGS.TS Ngô Quốc Tạo, chép từ tài liệu, cơng trình nghiên cứu người khác mà không ghi

Ngày đăng: 06/02/2022, 07:07

Mục lục

    3.5.5 DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT

    3.5.83 Nội dung của luận văn thạc sĩ gồm các chương, mục chính :

    3.5.90 CHƯƠNG 1. TỔNG QUAN VỀ PHÁT HIỆN, NHẬN DẠNG KÝ TỰ, SỰ PHÁT TRIỂN CỦA HỌC MÁY VÀ HỌC SÂU

    1.2 Sự phát triển của học máy và học sâu

    3.5.139 CHƯƠNG 2. GIỚI THIỆU VỀ MẠNG CONVOLUTION NEURAL NETWORK

    3.5.147 Sau đây ta sẽ đi chi tiết về CNN

    2.112 Non Linearity (ReLU) – Phi tuyến tính

    CHƯƠNG 3. MÔ HÌNH MẠNG PIXELLINK CHO PHÁT HIỆN VĂN BẢN

    3.3 Kết nối các điểm ảnh

    3.3.2.1 Mất mát trên điểm ảnh

Tài liệu cùng người dùng

Tài liệu liên quan