MÎt sË hình £nh trong bÎ d˙ liªu TableBank

Một phần của tài liệu Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản (Trang 25 - 26)

2 Các nghiên c˘u liên quan

3.2 MÎt sË hình £nh trong bÎ d˙ liªu TableBank

Chßt l˜Òng cıa d˙liªu ã t§o s≥ ˜Òc ánh giá b¨ng cách quan sát và ánh giá chıquan ∫ £nh giËng th™t nhßt có th∫. MÎt sË thông tin quan trÂng tôi d¸a vào ∫

ánh giá có th∫k∫ ∏n nh˜ Înét cıa hình£nh, m˘c Îbi∏n d§ng cıa v´n b£n sau khi t§o, c˜Ìng Î bóng (không quá tËi ∫ v®n nhìn ˜Òc ph¶n ch˙b‡bóng che)... Các chøsË trên nh¨m £m b£o các b£ng trong £nh v´n b£n v®n có th∫ ˜Òc nhìn thßy ¶y ı sau khi bi∏n Íi.

3.1.1 Ph˜Ïng pháp t§o bóng trên £nh v´n b£n

Bóng là vùng £nh có ánh sáng thßp hÏn các vùng khác do ánh sáng chi∏u ∏n b∑m∞t v´n b£n b‡che khußt. Trong th¸c t∏, bóng có th∫ có rßt nhi∑u hình d§ng và c˜Ìng Î khác nhau. ∫ t§o bóng trên £nh v´n b£n, tôi s≥ x˚ l˛ £nh d˜Ói hª màu HSV (hình 3.3). Hª màu này bao gÁm 3 kênh là:

• H - Hue: Th∫hiªn màu s≠c trong£nh.

• S - Saturation: Th∫ hiªn Îbão hòa cıa màu s≠c.

• V - Value: Th∫hiªn c˜Ìng Îsáng.

N∏u hª màu RGB cıa £nh s˚ dˆng c£ 3 kênh ∫ th∫ hiªn màu s≠c thì hª màu HSV l§i tách riêng ch˘c n´ng cıa t¯ng kênh nên s≥ dπ dàng x˚ l˛ hÏn. Trong tr˜Ìng hÒp này, tôi muËn t§o bóng b¨ng cách gi£m ánh sáng mÎt khu v¸c cıa£nh. Vì v™y, tôi chø c¶n th¸c hiªn gi£m giá tr‡ kênh V cıa £nh. Hình d§ng cıa bóng

˜Òc t§o ra b¨ng các chÂn ng®u nhiên các i∫m trên c§nh cıa v´n b£n và nËi l§i. K∏t qu£ là bóng t§o ra s≥ có hình d§ng tam giác ho∞c t˘ giác. Tølª diªn tích cıa bóng cÙng ˜Òc giÓi h§n theo mÎt tø lª nhßt ‡nh. Gi£ s˚ giá tr‡ gËc trên kênh V cıa i∫m £nh trong khu v¸c c¶n t§o bóng là V(x,y) thì giá tr‡ i∫m £nh sau khi

Một phần của tài liệu Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản (Trang 25 - 26)