2 Các nghiên c˘u liên quan
3.9 H˜Óng ti∏p c™n th˘ hai
H˜Óng ti∏p c™n th˘ hai cÙng có 3 b˜Óc nh˜ng th˘t¸x˚l˛ khác vÓi h˜Óng ti∏p c™n th˘nhßt. Cˆth∫, h˜Óng ti∏p c™n này s≥làm phØng toàn bÎph¶n v´n b£n trong
£nh chˆp tr˜Óc. Tôi ã ˘ng dˆng k∏t qu£ cıa các nghiên c˘u có sÆn v∑ làm phØng
£nh v´n b£n ( ã ∑c™p trong ph¶n 2.2) trong b˜Óc này. Sau khi toàn bÎv´n b£n ã
˜Òc làm phØng, ta có th∫ coi ph¶n b£ng trong v´n b£n cÙng ã ˜Òc làm phØng.
Énh ã làm phØng cıa v´n b£n ˜Òc ˜a qua b˜Óc phát hiªn b£ng (t˜Ïng t¸h˜Óng ti∏p c™n th˘nhßt). D¸a trên k∏t qu£ phát hiªn b£ng, t¯ng b£ng s≥ ˜Òc tách ra và thu ˜Òc các £nh b£ng ã làm phØng.
3.2.1 Các ki∏n trúc hÂc sâu cho viªc phát hiªn b£ng
Trong các nghiên c˘u liên quan ∏n chı ∑t˜Ïng t¸, các ki∏n trúc hÂc sâu phát hiªn Ëi t˜Òng, phân o§n ng˙nghæa và phân o§n cá th∫ ã ˜Òc s˚dˆng. Trong
£nh chˆp v´n b£n b‡ bi∏n d§ng, c§nh cıa b£ng s≥ b‡ bi∏n d§ng. N∏u chø s˚ dˆng các ki∏n trúc phát hiªn Ëi t˜Òng (k∏t qu£ ˜Òc th∫ hiªn b¨ng các hình hÎp ch˙
nh™t thØng ˘ng) thì s≥ không th∫ bi∫u diπn chính xác ˜Òc b£ng. Tuy nghiên, c§nh cıa b£ng là mÎt ∞c tr˜ng quan trÂng khi làm phØng b∑m∞t b£ng. Vì v™y, tôi s≥ hußn luyªn các ki∏n trúc phân o§n ng˙ nghæa và phân o§n cá th∫ cho nhiªm vˆ phát hiªn b£ng.
Ki∏n trúc hÂc sâu phân o§n ng˙nghæa
Phân o§n ng˙ nghæa là nhiªm vˆ ánh nhãn cho t¯ng i∫m £nh trong £nh. Trong bài toán phát hiªn b£ng, tôi s≥ hußn luyªn mô hình vÓi hai nhãn là b£ng và n∑n. Trên th∏giÓi ã có nhi∑u ki∏n trúc trong hÂc sâu ˜Òc công bË cho nhiªm vˆ
phân o§n ng˙nghæa. Trong sË ó, tôi quy∏t ‡nh th˚hai ki∏n trúc là DeepLabv3+ [5] và UperNet [29].
DeepLabv3+
DeepLabv3+ ˜Òc giÓi thiªu vào n´m 2018 bi Google trên cÏsc£i ti∏n phiên b£n DeepLabv3. ây là mÎt ki∏n trúc khá truy∑n thËng và ˜Òc hÈtrÒnhi∑u phiên b£n vÓi nhi∑u lo§i m§ng cÏ b£n khác nhau cho nhiªm vˆ phân o§n ng˙ nghæa. Ki∏n trúc tÍng quan cıa DeepLabv3+ ˜Òc mô t£trong hình 3.10.