Thông tin v∑ bÎ d˙ liªu IIT-AR-13K

Một phần của tài liệu NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP (Trang 40 - 43)

Tên lÓp IIIT-AR-13k

Hußn luyªn ánh giá Ki∫m tra TÍng SË l˜Òng v´n b£n 9333 1955 2120 13408 B£ng 11163 2222 2596 15981 Énh minh ho§ 2004 481 463 2948 Énh th™t 1987 438 455 2880 Bi∫u t˜Òng 379 67 135 581 Ch˙ k˛ 420 108 92 620

BÎd˙liªu gËc ˜Òc s˚dˆng trong các th¸c nghiªm là bÎIIT-AR-13K chi ti∏t v∑

sË l˜Òng các hÎp giÓi h§n và nhãn cıa chúng ˜Òc chú thích trong B£ng 4.1. Trong bài toán nh™n d§ng Ëi t˜Òng Á hÂa Ïn nhãn chúng tôi coi r¨ng các lo§i Ëi t˜Òng s≥ ∑u ˜Òc coi là “ Ëi t˜Òng ÁhÂa” nh˜v™y tÍng sËhÎp giÓi h§n và nhãn cıa chúng chú thích trong B£ng 4.2. Phân bËchi∑u rÎng chi∑u dài và tÂa Îcıa các Ëi t˜Òng

B£ng 4.2: Thông tin v∑ bÎd˙ liªu IIT-AR-13K

Tên lÓp IIIT-AR-13k Ïn nhãn

Hußn luyªn ánh giá Ki∫m tra TÍng SË l˜Òng v´n b£n 9333 1955 2120 13408 SË l˜Òng Ëi t˜Òng Á ho§ 15953 3316 3741 23010

Hình 4.1: Phân bËv∑ sËl˜Òng và Îdài các chi∑u cıa các Ëi t˜Òng ÁhÂa trong bÎ

d˙ liªu

4.2 Ph˜Ïng pháp ánh giá

Các chø sË dùng ∫ ánh giá hiªu qu£ mô hình nh™n d§ng Ëi t˜Òng Á hÂa bao gÁm:

– Îchính xác (precision): là tø lª (true positive) trong sËnh˙ng i∫m ˜Òc phân lo§i là (positive) (TP / TP + FP).

– Î hÁi t˜ng (recall) : là tø lª (true positive) trong sË nh˙ng i∫m th¸c s¸ là (positive) (TP / TP + FN).

– Intersection Over Union - (IoU) là tø lª gi˙a m˘c Î trùng khÓp gi˙a hai ˜Ìng bao ( ˜Ìng bao d¸ oán và ˜Ìng bao th¸c t∏) ∫ xác ‡nh hai khung hình có

Hình 4.2: Ví dˆ v∑ Î chính xác và Î hÁi t˜ng

b‡ è chÁng lên nhau không. T lª này ˜Òc tính d¸a trên ph¶n diªn tích giao nhau gi˙a 2 ˜Ìng bao vÓi ph¶n tÍng diªn tích giao nhau và không giao nhau gi˙a chúng.

Hình 4.3: Ví dˆ v∑ Î IoU

– mAP@.5: Ta s≥ ∞t ng˜Ông IoU > 0.5 có nghæa là Ëi t˜Òng ˜Òc nh™n d§ng úng vÓi tø lª IoU> 0.5 (True positive : TP). Ëi t˜Òng ˜Òc nh™n d§ng sai vÓi

tø lª IoU < 0.5 (False positive : FP). Ëi t˜Òng không ˜Òc nh™n d§ng (False negative: FN).

Ngoài ra ∫ ánh giá hiªu qu£ hª thËng tìm ki∏m hình £nh chúng tôi s˚ dˆng Î o Recall top k. Trong ó k là sËl˜Òng £nh ˜Òc tr£ v∑ có cùng nhãn vÓi £nh ˜Òc tìm ki∏m. Trong bài toán hª thËng tìm ki∏m Ëi t˜Òng ÁhÂa trong v´n b£n các £nh ¶u vào là các Ëi t˜Òng Á hÂa ˜Òc c≠t t¯ các v´n b£n. Gi£s˚k b¨ng 5 thì k∏t qu£ tr£

v∑ ˜Òc coi là úng n∏u trong 5 k∏t qu£ ¶u tiên tr£ v∑ có tÁn t§i v´n b£n gËc ch˘a

£nh ¶u vào.

4.3 K∏t qu£ th¸c nghiªm

4.3.1 K∏t qu£ nh™n d§ng Ëi t˜Òng a nhãn

Một phần của tài liệu NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP (Trang 40 - 43)