Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 91 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
91
Dung lượng
3,24 MB
Nội dung
ĐAI HOC QUOC GIA HÀ N®I TRƯèNG ĐAI HOC KHOA HOC TU NHIấN Hong Vn ỳc NHắN DANG TU đNG ÁNH TÀI LI›U TI€NG VI›T LU¾N VĂN THAC SĨ KHOA HOC Hà N®i – 2021 ĐAI HOC QUOC GIA HÀ N®I TRƯèNG ĐAI HOC KHOA HOC TU NHIÊN Hồng Văn ỳc NHắN DANG TU đNG NH TI LIU TING VIT Chuyên ngành: Khoa HQC du li¾u Mã so: 8904468.01QTD LU¾N VĂN THAC SĨ KHOA HOC NGƯèI HƯéNG DAN KHOA HOC: TS Đő Thanh Hà Hà N®i – 2021 LèI CÁM ƠN Đau tiên, xin bày tõ lài cãm ơn chân thành sâu sac đen TS Đő Thanh Hà, ngưài dành nhieu thài gian tâm huyet hưáng dan tơi q trình lna CHQN hưáng tiep c¾n thnc hi¾n đe tài, đieu hő tra tơi rat nhieu vi¾c hồn thành bãn lu¾n văn Tôi gui lài cãm ơn trân TRQNG tái cán b® Nhà trưàng, Khoa Tốn - Cơ - Tin HQC tao MQI đieu ki¾n thu¾n lai nhat cho tơi suot q trình HQC t¾p nghiên cúu Đong thài, muon gui lài cãm ơn chân thành đen cán b®, giãng viên anh ch% HQC VIÊN láp Khoa HQC du li¾u niên khóa 2018-2020 đ®ng viên, hő tra, giúp tơi rat nhieu q trình HQC t¾p thài gian thnc hi¾n lu¾n văn Vái sn co gang cua bãn thân sn giúp hi¾u quã cua giãng viên hưáng dan, thay, cô anh ch% HQC VIÊN, lu¾n văn cua tơi đưac hồn thành, đat đưac mnc tiêu ve thài gian ket quã mà tơi đe Tuy nhiên, m®t so han che ve kien thúc chun mơn kinh nghi¾m thnc tien lĩnh vnc khoa HQC du li¾u chưa nhieu nờn nđi dung cua luắn khú trỏnh ac m®t so thieu sót Vái sn cau th% mong muon đưac HQC hõi, tơi rat mong nh¾n đưac góp ý, phãn bi¾n cua q thay, anh ch% HQC viên đe tơi có the tích lũy thêm kien thúc áp dnng đưac nhieu cơng vi¾c Tơi xin chân thành cãm ơn! HQC VIÊN thnc hi¾n Hồng Văn Đúc iii MUC LUC MUC LUC ii DANH MUC BÁNG BI€U iv DANH MUC HÌNH V€ Danh mnc ký hi¾u tốn HQC v viii Danh mnc thu¾t ngu tù viet tat ix Giái thi¾u tốn 1 Mơ hình nhieu phương pháp khú nhieu ánh 1.1 Các mơ hình nhieu ãnh tài li¾u .5 1.1.1 Mơ hình nhieu Gaussian 1.1.2 Mơ hình nhieu Impulse 1.1.3 Mô hình nhieu Kanungo 1.1.4 Mơ hình nhieu Noise Spread 11 1.2 Các phương pháp khu nhieu 12 1.2.1 Cua ső trưat tích ch¾p 12 1.2.2 Phương pháp LQC truyen thong 15 Phương pháp nh¾n dang ánh tài li¾u 25 2.1 Cơ sã lý thuyet .25 2.1.1 Phép tốn hình thái 25 2.1.2 Các phép tốn hình thái phő bien 27 2.1.3 Toán tu Sobel 30 2.2 M®t so h¾ thong nh¾n dang 31 2.2.1 Google Docs OCR .32 2.2.2 Tesseract .33 2.2.3 ABBYY FineReader 34 2.2.4 VnDOCR 34 2.2.5 VietOCR 35 2.3 Phương pháp su dnng lu¾n văn 36 2.3.1 Khoanh vùng tù 36 2.3.2 Khoanh vùng ký tn 39 2.3.3 Mang neural tích ch¾p 40 2.3.4 Nh¾n dang ãnh ký tn .50 Ket thnc nghi¾m 52 3.1 Du li¾u thnc nghi¾m 52 3.2 Quá trình thnc nghi¾m .55 3.2.1 Mơi trưàng, cơng cn l¾p trình .55 3.2.2 Tham so mơ hình 56 3.2.3 Đ® đo 57 3.2.4 Huan luy¾n mơ hình 58 3.3 Ket quã thnc nghi¾m 58 3.4 Ket lu¾n hưáng phát trien 60 Tài li¾u tham kháo 61 DANH MUC BÁNG BI€U Danh mnc ký hi¾u tốn HQC viii Danh mnc thu¾t ngu x Danh mnc tù viet tat x 3.1 Mơ tã b® du li¾u thnc nghi¾m .53 3.2 Danh mnc tham so mơ hình .56 3.3 Ket quã thnc nghiắm trờn mụ hỡnh v mđt so cụng cn OCR khác 59 DANH MUC HÌNH V€ Các bưác nh¾n dang ãnh văn bãn .2 1.1 1.2 Ví dn minh HQA ve ãnh b% nhieu Hàm phân bo đo th% bieu dien mơ hình nhieu Gaussian, đó: (a) Hàm phân bo nhieu Gaussian; (b) Đo th% bieu dien phân bo nhieu Gaussian Ví dn minh HQA ve nhieu Gaussian, đó: (a) Ãnh goc, (b) Ãnh nhieu, (c) Histogram cua ãnh goc, (d) Histogram cua ãnh nhieu Hàm phân bo đo th% bieu dien mơ hình nhieu Impulse, đó: (a) Hàm phân bo nhieu Impulse; (b) Đo th% bieu dien phân bo nhieu Impulse Ví dn minh HQA ve nhieu Impulse, đó: (a) Ãnh goc, (b) Ãnh nhieu, (c) Histogram cua ãnh goc, (d) Histogram cua ãnh nhieu 1.6 Ví dn minh HQA ve nhieu Kanungo [35], đó: (a) Ãnh goc, (b) - (g) múc đ® nhieu Kanungo đưac sap xep theo chieu tăng dan .10 Minh HQA ve cua ső trưat 13 Ví dn ve tính tích ch¾p 14 1.9 Ví dn minh HQA ve ARM, đó: (a) Ãnh goc, (b) Ãnh nhieu, (c) Ãnh ket quã, (d) Histogram cua ãnh goc, (e) Histogram cua 1.3 1.4 1.5 1.7 1.8 ãnh nhieu, (f) Histogram cua ãnh ket quã 17 1.10 Ví dn minh HQA ve GEM, đó: (a) Ãnh goc, (b) Ãnh nhieu, (c) Ãnh ket quã (d) Histogram cua ãnh goc, (e) Histogram cua ãnh nhieu, (f) Histogram cua ãnh ket quã 18 1.11 Ví dn minh HQA ve COM, đó: (a) Ãnh goc, (b) Ãnh nhieu, (c) Ãnh ket quã, (d) Histogram cua ãnh goc, (e) Histogram cua ãnh nhieu, (f) Histogram cua ãnh ket quã .20 1.12 Minh HQA b® LQC thong kê thú tn 21 1.13 Ví dn minh HQA ve MEF, đó: (a) Ãnh goc, (b) Ãnh nhieu, (c) Ãnh ket quã, (d) Histogram cua ãnh goc, (e) Histogram cua ãnh nhieu, (f) Histogram cua ãnh ket quã .22 1.14 Ví dn minh HQA ve MAX, đó: (a) Ãnh goc, (b) Ãnh nhieu, (c) Ãnh ket quã, (d) Histogram cua ãnh goc, (e) Histogram cua ãnh nhieu, (f) Histogram cua ãnh ket quã .24 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12 2.13 2.14 2.15 2.16 2.17 2.18 2.19 2.20 2.21 Ví dn minh HQA ve hình dang cua phan tu cau trúc 26 Ví dn minh HQA ve phép giãn nã .27 Ví dn minh HQA ve phép co .28 Ví dn minh HQA ve phép mã 29 Ví dn minh HQA ve phép đóng 30 Ví dn minh HQA ve tốn tu Sobel 31 Minh HQA ve OCR .32 Minh HQA ve trình xu lý ãnh tài li¾u cua Google Docs OCR 33 Các bưác OCR vái Tesseract 33 Giao di¾n cơng cn ABBYY FineReader (phiên bãn 12) 34 Giao di¾n cơng cn VietOCR .35 Ket quã thnc nghi¾m phép tốn Sobel ãnh tài li¾u, đó: (a) ãnh goc, (b) ãnh ket quã 37 Ket q thnc nghi¾m phép đóng ãnh tài li¾u, đó: (a) ãnh phát hi¾n biên, (b) ãnh ket quã 38 Ket quã bien đői ký tn qua tốn tu Sobel phép đóng hình thái38 Ket q thnc nghi¾m khoanh vùng tù, đó: (a) ãnh thnc hi¾n liên thơng nét chu, (b) ãnh ket quã .39 Ket quã thnc nghi¾m khoanh vùng ký tn, đó: (a) Ãnh goc, (b) Áp dnng phép đóng, (c) Khoanh vùng .40 Ket quã thnc nghi¾m cat ký tn 40 Kien trúc mang CNN[10] 42 Minh HQA ve ma tr¾n LQC phát hi¾n biên[10] 44 Minh HQA ve bưác nhãy[10] 44 Minh HQA ve đưàng vien[10] 45 2.22 Minh HQA ve bưác tính tai tang tớch chắp[10] .46 2.23 Mđt so hm kích hoat phő bien, đó: (a) Sigmoid, (b) ReLU, (c) Tanh .48 2.24 Ví dn minh HQA ve phép lay mau cnc đai[10] 49 2.25 Ví dn minh HQA ve láp liên ket đay đu[10] .50 3.1 3.2 3.3 3.4 3.5 Danh sách phân láp ký tn 54 M®t phan b® du li¾u HQC đưac lu¾n văn xây dnng 54 Mđt ónh bón bđ du liắu kiem đ%nh [24] 55 Đo th% bieu dien q trình huan luy¾n mơ hình nh¾n dang ký tn 58 Đo th% so sánh ket quã thnc nghi¾m giua phương pháp .59 dáng chu khác Tiep theo, sau mơ hình đưac xây dnng xong, t¾p ãnh ký tn cua tài li¾u đưac tách ã phan trưác se lan lưat đưac đưac đưa vào đe mơ hình dn đốn thu®c nhãn (tương nng vái chđ cái) so 190 hình thái cua mđt ký tn tieng Viắt (xem hỡnh 3.1) Khi đó, vái mői ãnh ký tn đưac phân láp xong se đưac lưu lai thơng tin ve v% trí văn bãn vái giá tr% phân láp tương úng Cuoi cùng, cú thông tin phân láp đưac lưu lai ã bưác trưác, ký tn đưac nh¾n dang se đưac ghép lai theo thú tn tương úng vái v% trí ãnh ký tn mà gan vái đe trã thành m®t văn bãn so hồn chinh e chương này, m®t so van đe lý thuyet ve phép tốn hình thái tốn tu Sobel cách áp dnng vào toán khoanh vùng văn bãn đưac lu¾n văn trình bày Cùng vái đó, cơng cn nh¾n dang ãnh phő bien đưac lu¾n văn giái thi¾u ã chương Cùng vái đó, đ¾c điem hưáng áp dnng cua mang neural tích ch¾p vi¾c nh¾n dang ãnh đưac lu¾n văn đưa trỡnh by Cỏc thụng tin ve bđ du liắu, phương pháp ket quã thnc nghi¾m se đưac giái thi¾u đen ã chương tiep theo CHƯƠNG 3:K€T Q THUC NGHI›M Trên tồn b® phan sã lý thuyet thu¾t tốn liên quan đen van đe nh¾n dang ãnh đưac lu¾n văn lan lưat trình bày Đieu đưac the hi¾n thơng qua ba chương tương úng vái ba bưác thnc hi¾n nham giãi quyet tốn đưac đ¾t ã đau lu¾n văn Đó van đe tù tien xu lý ãnh (LQC bõ nhieu) đen vi¾c khoanh vùng, phân đoan ký tn cuoi bưác su dnng mô hình HQC máy đe tien hành nh¾n dang ký tn Song song vái vi¾c tìm hieu lý thuyet q trỡnh thnc nghiắm cng ó ac thnc hiắn vỏi bđ du li¾u đa dang Cùng vái đó, vi¾c thnc nghi¾m cng ac thnc hiắn vỏi mđt so cụng cn OCR khác đe đánh giá hi¾u q mơ hình Sau đây, cỏc nđi dung ve du liắu thnc nghiắm, phng phỏp thnc hi¾n ket quã đánh giá se đưac lu¾n văn giái thi¾u 3.1 Du li¾u thnc nghi¾m Đe huan luyắn v kiem %nh mụ hỡnh, mđt bđ du li¾u gom ãnh chnp văn bãn tieng Vi¾t đưac thu th¾p tù nhieu nguon khác tài li¾u [24], sách báo [4], tap chí [39], v.v Các văn bãn đeu chúa thông tin công khai, đưac cơng bo r®ng rãi cho đ®c giã nhà nghiên cúu Vái ãnh chnp 200 trang văn bãn vái nhieu đ%nh dang n®i dung phong phú, đưac chuan hóa ve ãnh đen trang có cựng kớch thỏc, bđ du liắu ny cú the ỏp úng đưac q trình thnc nghi¾m tốn mà lu¾n văn đ¾t Du li¾u HQC Du li¾u kiem đ%nh So trang 140 60 Ty l¾ (%) 70 30 Đưac lu¾n văn xây dnng bang cách cat ãnh thành ãnh ký tn tieng Vi¾t CHQN ngau nhiên 30% Mô tã đơn gom đay đu 29 chu 10 ónh bđ du liắu sau chu so vỏi nhieu font chu, kieu dáng thêm nhieu vào m®t khác nhau, vái trưàng hap có nua so dau dau câu kèm So ãnh 10.000 60 Kích thưác 28×28 1000×936 Báng 3.1: Mơ tó bđ du liắu thnc nghiắm Mđt so thụng tin c bón ve bđ du liắu su dnng thnc nghiắm lu¾n văn đưac trình bày bãng 3.1 Trong ú, bđ ny ac chia lm hai phan riờng biắt du li¾u HQC (train data) du li¾u dùng đe kiem đ%nh mơ hình (test data) vái ty l¾ lan lưat 70% 30% Trong b® du li¾u HQC đưac lu¾n văn su dnng đe tien hành huan luy¾n mơ hình nh¾n dang ãnh ký tn vi¾c đánh giá hi¾u q cua mơ hình se đưac thnc hiắn vỏi bđ du liắu kiem %nh Ve du liắu HQC, cha tiep cắn ac bđ du liắu văn bãn tieng Vi¾t mau đe huan luy¾n nên luắn ó tien hnh tn xõy dnng bđ du li¾u sã ãnh chnp văn bãn thu th¾p đưac trưác Bang cách CHQN ký leónh cú70% kớch (28 ì 28luyắn ) v gỏn ó cú bđ ngau nhiờn sothỏc ónhlỏn trờn du liắu thnc nghiắm catbđ thnh tựng ónhtn duriờng liắu ký tn u ebđ huan mụnhón, hỡnh.luắn Cnv the, du ac liắu bao gom t¾p hap ãnh ký tn tieng Vi¾t đơn thu®c 29 chu 10 chu so vái m®t so font chu phő bien vái kieu dáng chu IN HOA, chu thưàng, in nghiêng bơi đ¾m Cùng vái đó, vái trưàng hap ký tn chu có dau (sac, huyen, hõi, ngã, n¾ng) hay dau câu (, ? ! : ; ) đưac bő sung vào b® du liắu Tng cđng cú 10.000 ónh mau ký tn ac sap xep ngau nhiên gán nhãn thu®c m®t 190 phân láp (xem hình 3.1) có b® du li¾u Đieu đãm bão mơ hình se HQC đưac đay đu trưàng hap văn bãn tieng Vi¾t, ve cã kieu dáng, âm dau câu Hỡnh 3.2 the hiắn mđt phan cua bđ du liắu huan luy¾n Hình 3.1: Danh sách phân láp ký tn Hỡnh 3.2: Mđt phan bđ du liắu HQC ac luắn xõy dnng Cựng vỏi ú, bđ du liắu kiem đ%nh đưac tao bang cách lay ngau nhiên 30% tng ỳng vỏi 60 ónh bđ du liắu thnc nghi¾m đưac su dnng đe kiem đ%nh mơ hình nh¾n dang Sau đó, nhieu loai nhieu khác se đưac thêm vào m®t nua so ãnh (tương nng vái 30 ónh) bđ du liắu ny Viắc thờm nhieu vào ãnh nham thnc nghi¾m khã khu nhieu cua mđt so bđ LQC CNG nh so sỏnh hiắu suat nh¾n dangcua mơ hình ãnh nhieu ãnh sach Hình 3.3 ví dn ve m®t ãnh văn bãn chúa nhieu Gaussian se đưac dùng đe kiem đ%nh Khi đó, vi¾c thu nghi¾m đưac thnc hi¾n vái mơ hình ac luắn xõy dnng cng nh trờn mđt so cụng cn nhắn dang ph bien khỏc Hỡnh 3.3: Mđt ónh bón bđ du liắu kiem %nh [24] 3.2 Q trình thnc nghi¾m 3.2.1 Mơi trưàng, cơng cn l¾p trình Các thu¾t tốn đưac cài đ¾t mơi trưàng ngơn ngu l¾p trình Python 3.7 [26] vái cơng cn Spyder IDE 4.1 [34] tai máy tính cá nhân su dnng h¾ đieu hành Windows 10 Cùng vái đó, mđt so th viắn xu lý ónh trờn Python nh OpenCV [25], Tensorflow [41], v.v đưac lu¾n văn úng dnng Trong OpenCV đưac dùng thu¾t tốn tien xu lý nh% phân ãnh, phép tốn hình thái, tốn tu Sobel hay tìm phan tu liên thơng đe phân đoan ký tn thư vi¾n Tensortflow lai hő tra hi¾u quã vi¾c cài đ¾t mơ hình nh¾n dang 3.2.2 Tham so mơ hình Sau ó chuan b% ac bđ du liắu thnc nghiắm lna CHQN mơi trưàng l¾p trình vái sn hő tra cua thư vi¾n Tensorflow, vi¾c cau hình tham so cài đ¾t mơ hình đưac lu¾n văn thnc hi¾n Dna kinh nghi¾m cua nhà khoa HQC nhieu nghiên cúu trưác [30], vái nhung ưu điem ve toc đ® h®i tn sn de dàng tính tốn, hàm ReLU (xem mnc 2.3.3) đưac lu¾n văn lna CHQN đe kích hoat TRQNG so nút mang mơ hình Bãng 3.2 trình bày tồn b® tham so giá tr% đưac cau hình cài đ¾t mơ hình đưac lu¾n văn su dnng Láp INPUT Kích thưác Ma tr¾n LQC Bưác nháy Đưàng vien (28, 28, 1) CONV1 (3, 3, 32, 32) POOL1 (2, 2) CONV2 (3, 3, 32, 64) POOL2 (2, 2) CONV3 (3, 3, 64, 128) POOL3 (2, 2) (1, 1) "SAME" (1, 1) "SAME" (1, 1) "SAME" FC1 FC2 (625, 190) Báng 3.2: Danh mnc tham so mơ hình Trong đó, ãnh đau vào (INPUT) có thơng ( ITai ,lưat )2láp ((IW × Ih wđưac w = 28chắp ì3 28 )ónh l kớch thỏc ónh vma bđtrắn ónh huan dnng luắn l đen trang nên có so màu là, (cnW1luy¾n = tích ch¾p (CONV13), tr%kích cau hình cua tr¾n LQCLQC ,n1 W ,, nIh1các , cnsu )vái vái w × W × 3giá ) thưác cua madãi ,wso so phép tích h = đưac su hlan dnng ã tang thú nhat tang thú hai cua láp So phép tích ch¾p đưac cau hình tăng dan ã láp tích ch¾p sau (CONV2-3) đe tăng cưàng trích CHQN đ¾c trưng phúc tap cua mau Cùng vái đó, bưác nhãy (S1, S2) tai tang tích ch¾p thú nhat thú hai có giá tr% Giá tr% đưàng biên "SAME" có nghĩa đưàng biên se đưac tn đ®ng thêm vào đe phù hap vái kích thưác ma tr¾n LQC Ngồi ra, tai láp tőng hap (POOL1-3), ma tr¾n LQC CĨ kích thưác (2 × 2) phép lay mau cnc đai đưac su dnng đe giãm so chieu cua ma tr¾n thơng tin Cuoi cùng, tai láp liên ket đay đu (FC), lu¾n văn su dnng 625 neural 190 nhãn (tương nng vái 190 phân láp, xem hình 3.1) 3.2.3 Đ® đo Cùng vái vi¾c tao l¾p mơi trưàng l¾p trình cau hình tham so cho mơ hình nh¾n dang thỡ viắc xỏc %nh đ o e so sỏnh hiắu q giua mơ hình xây dnng cơng cn nh¾n dang tham chieu đưac lu¾n văn thnc hi¾n Trong thnc te có nhieu phương pháp đe đo lưàng ket q mơ hình thong kê nói chung [40] mơ hình nh¾n dang ãnh nói riêng [16] Trong pham vi cua lu¾n văn cỳ sn phự hap vỏi bi toỏn ra, mđt phương pháp đo lưàng dna theo ty l¾ nh¾n dang trùng kháp giua ket q cua mơ hình văn bãn mau đưac đe xuat đe đánh giá hi¾u q nh¾n dang Trong đó, vi¾c đo lưàng đưac tính toỏn trờn hai cap đ l ty lắ chớnh xỏc trờn tựng ónh v ty lắ trờn ton bđ du liắu kiem %nh Ri = Ti Ni ì 100(%) (3.1) tai ty công 3.1 mau kiem thú so li¾u Ri(so % )lưang , Ttrình Ni i, ký lan Vi¾c tính tốn hi¾u suat dang tùngtham ãnhgoc tài đưac bàytailưat l¾ thúc xác,Trên so ký tn nh¾n trùng thu kháp váii, văn bãn tn ãnh tài li¾u Trong đó, vi¾c đo lưàng ton bđ du liắu kiem %nh ac giỏi thi¾u cơng thúc 3.2 Giá tr% ty l¾ mau thu trùng kháp R(%) đưac tính bang cách lay tőng giá tr% xác tùng mau ∑ Ti chia cho tőng so lưang mau thu N R= ∑ Ti × 100(%) N (3.2) 3.2.4 Huan luy¾n mơ hình Sau thnc hi¾n xong vi¾c chuan b% mơi trưàng l¾p trình xác đ%nh đưac giá tr% cho tùng tham so mơ hình, mơ hình se đưac đưa vo huan luyắn vỏi bđ du liắu HQC ó ac chuan b% ã phan 3.1 Q trình huan luy¾n qua 40 bưác duy¾t (epoch) cho ket quã rat khã quan, đieu đưac the hi¾n ã hình 3.4 sau đây: Hình 3.4: Đo th% bieu dien trình huan luy¾n mơ hình nh¾n dang ký tn Qua hình 3.4, có the thay hàm chi phí (cost function) giãm giá tr% qua tùng bưác l¾p thơng qua vi¾c huan luy¾n vái t¾p du li¾u ký tn Tai bưác duy¾t thú 40, giá tr% chi phí (0.26496) nhõ giá tr% dùng đưac cau hình 0.3 có múc giãm < 0.01 ã ba lan liên tiep nên đãm bão đưac tính dùng 3.3 Ket thnc nghi¾m e phan này, mơ hình huan luy¾n ã phan trưác se đưac su dnng đe kiem đ%nh vỏi bđ du liắu ó thu thắp ong thi, bđ du liắu ny cng ac thu nghiắm trờn mđt so công cn OCR phő bien Google Docs OCR, Tesseract ABBYY FineReader vái hai công cn ngưài Vi¾t phát trien VnDOCR VietOCR nham so sánh, đánh giá hi¾u q giua cơng cn vái mơ hình mà lu¾n văn xây dnng Qua q trình thnc nghi¾m tính tốn hi¾u suat nh¾n dang, ket quã đưac the hi¾n bãng 3.3 sau đây: Ánh thưàng Ánh nhieu 95.8% 90.2% VnDOCR 97% 92.9% VietOCR 97.2% 92.5% Google Docs OCR 95.3% 87.4% Tesseract 96.0% 90.5% ABBYY FineReader 96.6% 89.2% Mơ hình đưac đe xuat Báng 3.3: Ket quó thnc nghiắm trờn mụ hỡnh v mđt so cơng cn OCR khác Theo đó, qua ket q nh¾n dang ãnh tài li¾u tieng Vi¾t mơ hình đưac lu¾n văn đe xuat dna CNN có the thay mơ hình cho ket q nh¾n dang tương đương vái ba cơng cn OCR đưac lu¾n văn tham chieu Vái nhóm ãnh sach, đ® xác tính tốn đưac 95.8% so vái văn bãn goc, khơng có sn chênh l¾ch đáng ke so vái ket quã 96% cua Tesseract hay 96.6% su dnng ABBYY FineReader nhinh m®t chút so vái Google Docs OCR vái 95.3% Trong đó, hai cơng cn cua Vi¾t Nam VnDOCR VietOCR cho ket quã tot vái ty l¾ lan lưat 97% 97.2% Tuy nhiên, ket quã nh¾n dang ãnh nhieu có sn giãm sút đen tù cã sáu phương pháp OCR mà lu¾n văn tien hành thnc nghi¾m Cn the, mơ hình đưac đe xuat nh¾n dang vái ty l¾ 90.2%, cao so vái Google Docs OCR (87.4%) ABBYY FineReader (89.2%) thap VnDOCR (97%), VietOCR (97.2%) Tesseract vái 90.6% Hình 3.5 sau the hiắn mđt cỏch trnc quan ket quó m luắn thnc nghi¾m Hình 3.5: Đo th% so sánh ket quã thnc nghi¾m giua phương pháp 3.4 Ket lu¾n hưáng phát trien Trên tồn b® n®i dung tù lý thuyet đen phương pháp trình thnc nghi¾m đe giãi quyet tốn mà lu¾n văn đ¾t ã phan đau tiên, nhắn dang tn đng ónh ti liắu tieng Viắt Trong đó, vi¾c nêu van đe, mơ tã tốn đưac trình bày nham nêu lên sn can thiet cua đe tài nhung mnc tiêu can đat đưac thnc hi¾n Tiep theo, lu¾n văn t¾p trung trình bày m®t so van đe ve lý thuyet can thiet hưáng tiep c¾n đe giãi quyet tốn đưac đe xuat e phan cuoi cùng, vi¾c thnc nghiắm vỏi mđt bđ du liắu thu thắp cựng sn tham chieu ket q giua mơ hình đe xuat vái m®t so cơng cn OCR khác giúp đưa đưac đánh giá, nh¾n xét ve mơ hình mà lu¾n văn xây dnng Trong q trình tìm hieu, lna CHQN hưáng tiep c¾n áp dnng lý thuyet vào tốn thnc te, lu¾n văn giái thi¾u đe xuat phương pháp giúp giãi quyet nhieu van đe toán xu lý ãnh Đau tiên, van đe ve nhieu ãnh giãi pháp giúp mơ hình hóa loai bõ nhieu đe nâng cao chat lưang hình ãnh Tiep theo, m®t so phép toán bãn đưac áp dnng nhieu đe bien đői, phát hi¾n cau trúc ãnh phép tốn hình thái, tốn tu Sobel đưac lu¾n văn giái thi¾u áp dnng van đe cn the khoanh vùng ký tn Ngoài ra, kien trúc tham so mang CNN hưáng áp dnng tốn nh¾n dang ký tn đưac lu¾n trỡnh by Cuoi cựng, mđt bđ du liắu tieng Vi¾t đưac chuan b%, vi¾c phân đoan gán nhón trờn bđ du liắu HQC hay quỏ trỡnh chuan hóa thêm nhieu b® kiem đ%nh đưac thnc hi¾n sau Thơng qua vi¾c thnc nghi¾m nhieu lan vái tham so đau vào khác giúp tìm đưac hưáng tiep c¾n tot trien khai hi¾u quã du li¾u tieng Vi¾t Các ket quã đat van có the đưac làm tot nua, lu¾n văn đe xuat hưáng tiep c¾n su dnng CNN đe nh¾n dang tieng Vi¾t đat đưac ket quã rat khã quan pham vi thnc nghi¾m cua lu¾n văn Tuy nhiên, vái ãnh chúa nhieu ket q có sn snt giãm đ® xác đáng ke Do đó, van đe tien xu lý rat quan TRQNG, giúp ãnh giu lai đưac nhieu thơng tin, đ¾c trưng huu ích trưác đưa vào mơ hình Ngồi ra, vái du li¾u tieng Viắt, so lang cỏc bđ du liắu cú chat lưang van chưa nhieu vi¾c tiep c¾n cịn khó khăn Do đó, van đe ve xây dnng v thu thắp du liắu cng l mđt viắc can nh¾n đưac nhieu sn quan tâm TÀI LI›U THAM KHÁO [1] Saad Albawi, Tareq Abed Mohammed, and Saad Al-Zawi “Understanding of a convolutional neural network” In: 2017 International Conference on Engineering and Technology (ICET) Ieee 2017, pp 1–6 [2] Henry S Baird, Horst Bunke, and Kazuhiko Yamamoto Structured document image analysis Springer Science & Business Media, 2012 [3] Carlo Migel Bautista et al “Convolutional neural network for vehicle detection in low resolution traffic videos” In: 2016 IEEE Region 10 Symposium (TENSYMP) IEEE 2016, pp 277–281 [4] dantri.com.vn Báo đi¾n tu Dân trí https://dantri.com.vn/ Accessed: 2020-08-15 [5] TK Das, Asis Kumar Tripathy, and Alekha Kumar Mishra “Optical character recognition using artificial neural network” In: 2017 International Conference on Computer Communication and Informatics (ICCCI) IEEE 2017, pp 1–4 [6] docs.google.com Google docs http://docs.google.com/ Accessed: 2020-11-05 [7] Valveny P Dosch P “Report on the second symbol recognition contest” In: Springer 3926 (2005), pp 381–397 [8] Edward Dougherty Mathematical morphology in image processing CRC press, 2018 [9] Barney E “Modeling image degradations for improving OCR” In: Proceedings of the 16th European signal processing conference (EUSIPCO) (2008), pp 1–5 Eloquent Arduino Blog Convolutional Neural Network https://eloquentarduino.github.io/ [10] 2020/11/tinyml-on-arduino-and-stm32-cnn-convolutional-neural-network-example/ [Online; accessed 13-January-2021] [11] finereaderonline.com ABBYY OCR online https://finereaderonline.com/en- us/Tasks/ Create/ Accessed: 2020-11-23 [12] model Kunihiko Fukushima and Sei Miyake “Neocognitron: A self-organizing neural network for a mechanism of visual pattern recognition” In: Competition and cooperation in neural nets Springer, 1982, pp 267–285 [13] Tabbone S Hoang TV Smith EHB “Sparsity-based edge noise removal from bilevel graphical document images” In: IJDAR 17.2 (2014), pp 161–179 [14] David H Hubel and Torsten N Wiesel “Receptive fields of single neurones in the cat’s striate cortex” In: The Journal of physiology 148.3 (1959), p 574 Haidi Ibrahim et al “Impulse [15] noise model and its variations” In: International Journal of Computer and Electrical Engineering 4.5 (2012), p 647 Junichi Kanai et al [16] “Automated evaluation of OCR zoning” In: IEEE Transactions on Pattern Analysis and Machine Intelligence 17.1 (1995), pp 86–90 [17] Phillips IT Kanungo T Haralick RM “Global and local document degradation models” In: Proceedings of the second international conference on document analysis and recognition (1993), pp 730– 734 Andrej Karpathy “Lecture [18] 5: Convolutional Neural Networks” In: CS231n: Convolutional Neural Networks for Visual Recognition (2021) [19] VC Kieu et al “A character degradation model for grayscale ancient document images” In: Proceedings of the 21st International Conference on Pattern Recognition (ICPR2012) IEEE 2012, pp 685–688 [20] Alex Krizhevsky, Ilya Sutskever, and Geoffrey E Hinton “Imagenet classification with deep convolutional neural networks” In: Communications of the ACM 60.6 (2017), pp 84–90 Yann LeCun, Yoshua [21] Bengio, and Geoffrey Hinton “Deep learning” In: nature 521.7553 (2015), pp 436–444 [22] Licheng Liu et al “A new weighted mean filter with a two-phase detector for removing impulse noise” In: Information Sciences 315 (2015), pp 1–16 [23]Y M EmreCelebi Hassan A Kingravi “Alp Aslandogan Nonlinear vector filtering for impulsive noise removal from color images” In: Journal of Electronic Imaging (2007), pp 1–21 [24] ngsp.gov.vn NGSPDOCS - Ket noi san sàng https://ngsp.gov.vn/docs/ketnoisansang html Accessed: 2020-11-30 [25] pypi.org OpenCV with Python — pypi https://pypi.org/project/opencv-python/ [Online; accessed 13-January-2021] [26] python.org Welcome to Python.org — python https :// www python org/ [Online; accessed 13-January-2021] [27] Wei-Mao Qian et al “Sharp bounds for Neuman means in terms of two-parameter contraharmonic and arithmetic mean” In: Journal of Inequalities and Applications 2019.1 (2019), pp 1–13 [28] Tanzila Saba et al “Evaluation of current documents image denoising techniques: a comparative study” In: Applied Artificial Intelligence 28.9 (2014), pp 879–887 [29] Parul Shah et al “OCR-based chassis-number recognition using artificial neural networks” In: 2009 IEEE International Conference on Vehicular Electronics and Safety (ICVES) IEEE 2009, pp 31– 34 [30]P Sibi, S Allwyn Jones, and P Siddarth “Analysis of different activation functions using back propagation neural networks” In: Journal of theoretical and applied information technology 47.3 (2013), pp 1264–1268 [31]Kh Manglem Singh “Fuzzy rule based median filter for gray-scale images” In: Journal of information Hiding and Multimedia signal processing 2.2 (2011), pp 108–122 [32]R Smith “An Overview of the Tesseract OCR Engine” In: Ninth International Conference on Document Analysis and Recognition (ICDAR 2007) Vol 2007, pp 629–633 DOI : 10 1109 / ICDAR.2007.4376991 [33] Irwin Sobel “An Isotropic 3x3 Image Gradient Operator” In: Presentation at Stanford A.I Project 1968 (Feb 2014) [34] spyder-ide.org Spyder IDE for Python https://www.spyder-ide.org/ Accessed: 2020-12-30 [35]S Tabbone T H Do O Ramos Terrades “DSD: document sparse-based denoising algorithm” In: Springer (2018) [36] Ahmad P Tafti et al “OCR as a service: an experimental evaluation of Google Docs OCR, Tesseract, ABBYY FineReader, and Transym” In: International Symposium on Visual Computing Springer 2016, pp 735–746 [37] Sagar B Tambe et al “Image processing (IP) through erosion and dilation methods” In: (2013) [38]Li Tao et al “Analysis of noise spread in optical DFT-S OFDM systems” In: Journal of Lightwave Technology 30.20 (2012), pp 3219–3225 [39] tapchinganhang.com.vn Tap chí ngân hàng http://tapchinganhang.com.vn/ Accessed: 2021- 01-05 [40] Jonathan Templin and Laine Bradshaw “Measuring the reliability of diagnostic classification model examinee estimates” In: Journal of Classification 30.2 (2013), pp 251–275 [41] tensorflow.org Tensorflow for Python https://www.tensorflow.org/ Accessed: 2021-01-12 [42] Mr.Rohit Verma and Dr.Jahid Ali “A comparative study of various types of image noise and efficient noise removal techniques” In: International Journal of Advanced Research in Computer Science and Software Engineering (2013) [43] Wikipedia contributors Gaussian noise — Wikipedia, The Free Encyclopedia https://en.wikipedia org/w/index.php?title=Gaussian_noise&oldid=973378598 [Online; accessed 9-January2021] 2020 [44] Luiz Zaniolo and Oge Marques “On the use of variable stride in convolutional neural networks” In: Multimedia Tools and Applications 79.19 (2020), pp 13581–13598 ... đien bưác tien xu lý (chuan hóa, LQC nhieu, v.v); khoanh vùng, phân đoan ký tn nh¾n dang Do ú, pham vi cng nh nđi dung cua luắn "Nh¾n dang ãnh tài li¾u tieng Vi¾t" có đu cã tính lý thuyet tính úng... nhắn dang phn thuđc nhieu vo lưang nhieu có ãnh Do đó, khu nhieu ãnh bưác can thiet, giúp nâng cao chat lưang hình ãnh trưác áp dnng bat kỳ phương pháp xu lý tiep theo [35] Bãi v¾y, có nhieu nghiên. .. khác, hình dang mong muon cua m®t phan tu cau trúc phn thu®c vào hình dang cua đoi tưang đưac quan tâm hình ãnh Ví dn, m®t hình ãnh y te đien hình chúa rat đưàng thang ho¾c v¾t the, phan tu cau