H˜Óng ti∏p c™n th˘ hai

Một phần của tài liệu Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản (Trang 30 - 31)

2 Các nghiên c˘u liên quan

3.9 H˜Óng ti∏p c™n th˘ hai

H˜Óng ti∏p c™n th˘ hai cÙng có 3 b˜Óc nh˜ng th˘t¸x˚l˛ khác vÓi h˜Óng ti∏p c™n th˘nhßt. Cˆth∫, h˜Óng ti∏p c™n này s≥làm phØng toàn bÎph¶n v´n b£n trong

£nh chˆp tr˜Óc. Tôi ã ˘ng dˆng k∏t qu£ cıa các nghiên c˘u có sÆn v∑ làm phØng

£nh v´n b£n ( ã ∑c™p trong ph¶n 2.2) trong b˜Óc này. Sau khi toàn bÎv´n b£n ã

˜Òc làm phØng, ta có th∫ coi ph¶n b£ng trong v´n b£n cÙng ã ˜Òc làm phØng.

Énh ã làm phØng cıa v´n b£n ˜Òc ˜a qua b˜Óc phát hiªn b£ng (t˜Ïng t¸h˜Óng ti∏p c™n th˘nhßt). D¸a trên k∏t qu£ phát hiªn b£ng, t¯ng b£ng s≥ ˜Òc tách ra và thu ˜Òc các £nh b£ng ã làm phØng.

3.2.1 Các kin trúc hÂc sâu cho viªc phát hiªn b£ng

Trong các nghiên c˘u liên quan ∏n chı ∑t˜Ïng t¸, các ki∏n trúc hÂc sâu phát hiªn Ëi t˜Òng, phân o§n ng˙nghæa và phân o§n cá th∫ ã ˜Òc s˚dˆng. Trong

£nh chˆp v´n b£n b‡ bi∏n d§ng, c§nh cıa b£ng s≥ b‡ bi∏n d§ng. N∏u chø s˚ dˆng các ki∏n trúc phát hiªn Ëi t˜Òng (k∏t qu£ ˜Òc th∫ hiªn b¨ng các hình hÎp ch˙

nh™t thØng ˘ng) thì s≥ không th∫ bi∫u diπn chính xác ˜Òc b£ng. Tuy nghiên, c§nh cıa b£ng là mÎt ∞c tr˜ng quan trÂng khi làm phØng b∑m∞t b£ng. Vì v™y, tôi s≥ hußn luyªn các ki∏n trúc phân o§n ng˙ nghæa và phân o§n cá th∫ cho nhiªm vˆ phát hiªn b£ng.

Ki∏n trúc hÂc sâu phân o§n ng˙nghæa

Phân o§n ng˙ nghæa là nhiªm vˆ ánh nhãn cho t¯ng i∫m £nh trong £nh. Trong bài toán phát hiªn b£ng, tôi s≥ hußn luyªn mô hình vÓi hai nhãn là b£ng và n∑n. Trên th∏giÓi ã có nhi∑u ki∏n trúc trong hÂc sâu ˜Òc công bË cho nhiªm vˆ

phân o§n ng˙nghæa. Trong sË ó, tôi quy∏t ‡nh th˚hai ki∏n trúc là DeepLabv3+ [5] và UperNet [29].

DeepLabv3+

DeepLabv3+ ˜Òc giÓi thiªu vào n´m 2018 bi Google trên cÏsc£i ti∏n phiên b£n DeepLabv3. ây là mÎt ki∏n trúc khá truy∑n thËng và ˜Òc hÈtrÒnhi∑u phiên b£n vÓi nhi∑u lo§i m§ng cÏ b£n khác nhau cho nhiªm vˆ phân o§n ng˙ nghæa. Ki∏n trúc tÍng quan cıa DeepLabv3+ ˜Òc mô t£trong hình 3.10.

Một phần của tài liệu Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản (Trang 30 - 31)