So sánh tích ch™p thông th˜Ìng (trái) và tích ch™p m rÎng (ph£i)

Một phần của tài liệu Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản (Trang 32 - 34)

2 Các nghiên c˘u liên quan

3.11 So sánh tích ch™p thông th˜Ìng (trái) và tích ch™p m rÎng (ph£i)

mÎt l¶n tÍng hÒp. Nh˜ng vÓi tích ch™p mrÎng, các i∫m ∞c tr˜ng cách xa nhau có th∫ ˜Òc tÍng hÒp trong mÎt l¶n (trong hình 3.11 minh hÂa kho£ng cách mÎt ô và và kho£ng cách này có th∫ t´ng lên). i∑u này có ˛nghæa rßt lÓn trong m§ng phân o§n ng˙nghæa. ∫có th∫ phát hiªn chính xác các v™t th∫trong m§ng phân o§n ng˙ nghæa ( ∞c biªt là các v™t th∫ to), thông tin v∑ Ëi t˜Òng c¶n ph£i tÍng hÒp t¯ nhi∑u i∫m £nh cách xa nhau. VÓi tích ch™p thông th˜Ìng, chúng ta ph£i t´ng b˜Óc nh£y mÈi l¶n tính toán và qua nhi∑u lÓp tích ch™p, các thông tin cách xa nhau mÓi ˜Òc tÍng hÒp. Nh˜ng sau khi qua nhi∑u lÓp tích ch™p, ∞c tr˜ng cıa

£nh th˜Ìng b‡ thu bé và làm mßt thông tin cıa các chi ti∏t nh‰ trong £nh. Tích ch™p m rÎng kh≠c phˆc vßn ∑ này b¨ng cách cho phép tÍng hÒp các thông tin

 xa nhau ngay t¯ sÓm mà không c¶n ph£i thông qua nhi∑u l¶n tích ch™p. i∑u này giúp cho ∞c tr˜ng cıa £nh v®n gi˙ ˜Òc các thông tin nh‰ nh˜ng Áng thÌi l§i tÍng hÒp ˜Òc các thông tin xa nhau. ∞c tr˜ng th˘hai mang l§i ˜u th∏ cho DeepLabv3+ là viªc s˚dˆng tích ch™p phân tách theo chi∑u sâu. Hãy tham kh£o hình 3.12.

Hình 3.12: Minh hÂa cho tích ch™p phân tách theo chi∑u sâu.

Hi∫u Ïn gi£n, mÎt b£n Á ∞c tr˜ng cıa hình£nh s≥ gÁm nhi∑u lÓp ∞c tr˜ng. VÓi tích ch™p thông th˜Ìng, toàn bÎ các lÓp ∞c tr˜ng này s≥ ˜Òc hÂc vÓi cùng mÎt ki∫u tích ch™p (kích th˜Óc nhân, b˜Óc nh£y). i∑u này h§n ch∏ kh£n´ng hÂc t™p cıa tích ch™p vì mÈi lÓp ∞c tr˜ng mang theo nh˙ng ∞c tr˜ng khác nhau. Kh≠c phˆc i∑u này, tích ch™p phân tách theo chi∑u sâu s≥ tách riêng các lÓp ∞c tr˜ng và dùng các lo§i tích ch™p khác nhau ∫ tÍng hÒp. S¸ a d§ng này giúp cho mô hình có kh£n´ng hÂc tÍng quát tËt hÏn.

UperNet

UperNet là mÎt ki∏n trúc ˜Òc công bËcùng n´m 2018 vÓi DeepLabv3+. Uper- Net ˜Òc xây d¸ng theo h˜Óng hÂc a nhiªm. Mˆc tiêu cıa tác gi£ là hÂc bi∫u diπn phân o§n ng˙ nghæa cıa £nh và Áng hÒp hÂc ˜Òc ˛ nghæa cıa c£nh v™t. Ki∏n trúc cıa UperNet ˜Òc th∫hiªn trong hình 3.13.

Một phần của tài liệu Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản (Trang 32 - 34)