2 Các nghiên c˘u liên quan
3.11 So sánh tích ch™p thông th˜Ìng (trái) và tích ch™p m rÎng (ph£i)
mÎt l¶n tÍng hÒp. Nh˜ng vÓi tích ch™p mrÎng, các i∫m ∞c tr˜ng cách xa nhau có th∫ ˜Òc tÍng hÒp trong mÎt l¶n (trong hình 3.11 minh hÂa kho£ng cách mÎt ô và và kho£ng cách này có th∫ t´ng lên). i∑u này có ˛nghæa rßt lÓn trong m§ng phân o§n ng˙nghæa. ∫có th∫ phát hiªn chính xác các v™t th∫trong m§ng phân o§n ng˙ nghæa ( ∞c biªt là các v™t th∫ to), thông tin v∑ Ëi t˜Òng c¶n ph£i tÍng hÒp t¯ nhi∑u i∫m £nh cách xa nhau. VÓi tích ch™p thông th˜Ìng, chúng ta ph£i t´ng b˜Óc nh£y mÈi l¶n tính toán và qua nhi∑u lÓp tích ch™p, các thông tin cách xa nhau mÓi ˜Òc tÍng hÒp. Nh˜ng sau khi qua nhi∑u lÓp tích ch™p, ∞c tr˜ng cıa
£nh th˜Ìng b‡ thu bé và làm mßt thông tin cıa các chi ti∏t nh‰ trong £nh. Tích ch™p m rÎng kh≠c phˆc vßn ∑ này b¨ng cách cho phép tÍng hÒp các thông tin
xa nhau ngay t¯ sÓm mà không c¶n ph£i thông qua nhi∑u l¶n tích ch™p. i∑u này giúp cho ∞c tr˜ng cıa £nh v®n gi˙ ˜Òc các thông tin nh‰ nh˜ng Áng thÌi l§i tÍng hÒp ˜Òc các thông tin xa nhau. ∞c tr˜ng th˘hai mang l§i ˜u th∏ cho DeepLabv3+ là viªc s˚dˆng tích ch™p phân tách theo chi∑u sâu. Hãy tham kh£o hình 3.12.
Hình 3.12: Minh hÂa cho tích ch™p phân tách theo chi∑u sâu.
Hi∫u Ïn gi£n, mÎt b£n Á ∞c tr˜ng cıa hình£nh s≥ gÁm nhi∑u lÓp ∞c tr˜ng. VÓi tích ch™p thông th˜Ìng, toàn bÎ các lÓp ∞c tr˜ng này s≥ ˜Òc hÂc vÓi cùng mÎt ki∫u tích ch™p (kích th˜Óc nhân, b˜Óc nh£y). i∑u này h§n ch∏ kh£n´ng hÂc t™p cıa tích ch™p vì mÈi lÓp ∞c tr˜ng mang theo nh˙ng ∞c tr˜ng khác nhau. Kh≠c phˆc i∑u này, tích ch™p phân tách theo chi∑u sâu s≥ tách riêng các lÓp ∞c tr˜ng và dùng các lo§i tích ch™p khác nhau ∫ tÍng hÒp. S¸ a d§ng này giúp cho mô hình có kh£n´ng hÂc tÍng quát tËt hÏn.
UperNet
UperNet là mÎt ki∏n trúc ˜Òc công bËcùng n´m 2018 vÓi DeepLabv3+. Uper- Net ˜Òc xây d¸ng theo h˜Óng hÂc a nhiªm. Mˆc tiêu cıa tác gi£ là hÂc bi∫u diπn phân o§n ng˙ nghæa cıa £nh và Áng hÒp hÂc ˜Òc ˛ nghæa cıa c£nh v™t. Ki∏n trúc cıa UperNet ˜Òc th∫hiªn trong hình 3.13.