Kết quả mạng học sâu chuyển giao YOLOv3-spp-uav được so sánh với các mạng YOLOv3 và RetinaNet-101 tron hình 3.35 dưới đây. Kết quả thu được chạy trên máy tính của em với bộ xử lý hình ảnh GTX 1650 4Gb, kết quả so sánh được thử với từng kích thước đầu vào lần lượt 352x352, 416x416 và 640x640.
HÌNH 3.29. Độ chính xác và thời gian chạy của các mạng học sâu.
Đồ thị trên cho thấy cả độ chính xác và thời gian chạy đều tỉ lệ thuận với kích thước ảnh đầu vào, kết quả cho thấy đổi lại thời gian chạy chậm hơn so với YOLOv3 ban đầu thì YOLOv3-spp-uav sau khi học chuyển giao đã được cải thiện đáng kể độ chính xác tốt hơn, đặc biệt là độ chính xác trong việc phát hiện người từ xa. Dưới đây là một số hình ảnh kết quả chạy YOLOv3-spp-uav, tất cả hình ảnh này đều không nằm trong tập huấn luyện.
SVTH: Nguyễn Nhật Anh Lớp: KTDT & THCN K56
(b)
(c)
HÌNH 3.30. Một số kết quả phát hiện người của mạng YOLOv3-spp-uav.
Hình 3.30 (b) cho thấy trong một khung hình tỷ lệ phát hiện nhầm chiếm khá ít, trong 9 ô thì có 1 ô xác định nhầm chiếc xe máy là người, vấn đề này xảy ra có thể do khi dán nhãn tập huấn luyện thì đã dán nhãn nhầm cả xe máy. Còn ở hình 3.30 (c) cho thấy với đám đông đứng tụ tập chen chúc nhau, mạng không thể nhận ra hết các đối tượng bị che lấp, bởi theo như yêu cầu dán nhãn đặt ra thì các vật bị che khuất 60% đều được bỏ qua nên mạng YOLOv3-spp-uav chỉ nhìn thấy được những người xuất hiện rõ ràng ở ngoài đám đông. Nhìn chung qua các kết quả ở các hình 3.30 trên cho thấy kết quả phát hiện người từ trên cao có thể chấp nhận được cho ứng dụng thực tế.