Chi ti∏t so sánh YOLOv3 YOLOv4 YOLOv5 và DETR

Một phần của tài liệu NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP (Trang 45 - 47)

Th˚ nghiªm vÓi các bÎ d˙ liªu khác. Chúng tôi s˚ dˆng thêm 2 bÎ d˙ liªu khác là ICDAR-19 [16] và ICDAR-2017 [15], hai bÎ d˙ liªu này chø bao gÁm các b£ng. S˚

B£ng 4.5: K∏t qu£ nh™n d§ng b£ng khi so sánh vÓi các bÎ d˙ liªu khác

Tên bÎ

d˙liªu

Mask R-CNN YOLOv3 YOLOv4

R P F mAP R P F mAP R P F mAP ICDAR-19 (test) - - - - 0.7760 0.9100 0.8380 0.8100 0.6870 0.9240 0.7880 0.8260 ICDAR-19 (train) - - - - 0.8030 0.9220 0.8580 0.8620 0.6600 0.9150 0.7670 0.8390 ICDAR-19 (all) 0.8097 0.8224 0.8161 0.7478 0.7940 0.9180 0.8520 0.8450 0.6680 0.9180 0.7730 0.8390 ICDAR-17 (train) 0.8675 0.6311 0.7493 0.7509 0.8830 0.8490 0.8650 0.9070 0.8970 0.7140 0.7950 0.8890

ánh giá, k∏t qu£ ˜Òc mô t£ trong B£ng 4.5

4.3.2 K∏t qu£ nh™n d§ng Ëi t˜Òng Ïn nhãn

Qua các k∏t qu£ ˜Òc th˚ nghiªm trong bài toán nh™n d§ng Ëi t˜Òng a nhãn 

ph¶n trên chúng tôi thßy r¨ng mô hình YOLOv3 hiªu qu£ trong các bài toán nh™n d§ng Ëi t˜Òng Á hÂa. Áp dˆng mô hình YOLOv3 vào bài toán chính ó là nh™n d§ng Ëi t˜Òng Ïn nhãn trong ph¶n này chúng tôi coi tßt c£ các lÓp Ëi t˜Òng ∑u chø là mÎt lo§i duy nhßt là “ Ëi t˜Òng Á hÂa”.

Mô hình khi ˜Òc hußn luyªn vÓi bÎd˙ liªu IIT-AR-13k (training) sau 150 vòng và ˜Òc th˚ nghiªm trên 2 t™p d˙ liªu IIT-AR-13k (validation) và IIT-AR-13k (test) chi ti∏t quá trình hußn luyªn ˜Òc mô t£ trong B£ng 4.6 và Hình 4.5 . Î o dùng trong thí nghiªm là Î hÁi t˜ng (Recall), Î chính xác (Precision), mAP@.5 và mAP@.5:.95 thu ˜Òc Î chính xác khi nh™n d§ng §t xßp xø 97,7%.

Một phần của tài liệu NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP (Trang 45 - 47)