Nghiên cứu tổng quan về công nghệ yolo v4

Một phần của tài liệu HỆ THỐNG PHÁT HIỆN VI PHẠM KHOẢNG CÁCH 2m và ĐEO KHẨU TRANG (Trang 34 - 36)

CHƯƠNG 2 : CƠ SỞ LÝ THUYẾT

2.4. Nghiên cứu tổng quan về công nghệ yolo v4

2.4.1. Sơ lược về Yolo

Hình 2.12. Kí hiệu Yolo

YOLO là viết tắt của You Only Look Once, thuật toán này được sử dụng để Phát hiện đối tượng cũng như Theo dõi Đối tượng, đồ án này sử dụng YOLO để tính toán khoảng cách xã hội & nhận dạng mặt nạ trên khuôn mặt của mọi người với sự trợ giúp của Phát hiện Đối tượng, trong khi theo dõi khuôn mặt và con người trong khung để đếm các đối tượng và giữ một bản ghi của đối tượng đó trong khung tiếp theo được thực hiện bởi Theo dõi đối tượng. Khoảng cách tối thiểu an toàn trong việc tuân thủ khoảng cách xã hội là 6 Feet, giữ đây là cơ sở để tính toán khoảng cách, mô hình đã được đào tạo và sử dụng để phát hiện đối tượng cũng như theo dõi đối tượng. Có nhiều loại thuật toán khác nhau có sẵn, YOLO nổi bật hơn tất cả các loại thuật toán khác hiện có. Các tập dữ liệu tùy chỉnh được sử dụng để nhận biết khẩu trang và được đào tạo về các tập dữ liệu đó để phát hiện và theo dõi. Để đánh giá mô hình được đào tạo, mAP (Độ chính xác trung bình trung bình) được tính toán cho cả hai trường hợp sử dụng (Phát hiện khoảng cách xã hội và khẩu trang), nó hoạt động bằng cách so sánh khung hình giới hạn thực với khung hình được phát hiện và cuối cùng, trả về điểm

số. Tổng điểm cao hơn số điểm bản đồ sẽ là mô hình tốt hơn trong việc phát hiện các đối tượng.

2.4.2. Yolov4

Yolo là một trong những mô hình phát hiện vật tốt nhất ở thời điểm hiện tại. Dù đều được gọi là Yolo nhưng các phiên bản sau của mô hình này đều có những cải tiến rất đáng kể so với các phiên bản trước đó. Sau 3 phiên bản của tác giả chính Joseph Redmon là Yolov1 đến v3. Phiên bản Yolov4 được sử dụng trong đồ án này là của Alexey Bochkovskiy.

Yolov4 là một loạt các cải tiến về tốc độ so với Yolov3 và được cài đặt từ một bản fork của Darknet. Kiến trúc của Yolov4 đã đưa bài toán phát hiện đối tượng dễ tiếp cận hơn với những người không có tài nguyên tính toán mạnh. Chúng ta hoàn toàn có thể huấn luyện một mạng phát hiện vật với độ chính xác rất cao bằng Yolov4 chỉ với GPU 1080Ti hoặc 2080Ti. Trong tương lai, việc tối ưu lại các mạng hiện tại để phù hợp với tài nguyên tính toán yếu hoặc tạo ra sự song song hóa cao ở các server chắc chắn phải được thực hiện để có thể đưa các ứng dụng thị giác máy vào thực tế.

Trên đây là kết qủa so sánh của Yolov4 với các thuật toán state-of-the-art tại thời điểm hiện tại. Nhìn vào biểu đồ, ta dễ dàng thấy được sự hiệu quả của Yolov4 so với các mạng tốt nhất hiện nay. Cụ thể hơn Yolov4 đạt 43.5% AP trên tập dữ liệu MS COCO ở tốc độ 65 FPS, trên GPU Tesla V100. Để tạo ra kết quả này, tác giả sử dụng một loạt các kĩ thuật mới: Weighted-Residual-Connections (WRC), Cross-Stage- Partial-connections (CSP), Cross mini -Batch Normalization (CmBN), Self- adversarial-training (SAT) and Mish-activation, Mosaic data augmentation, DropBlock regularization, và CIoU loss.

Với những tính năng và ưu điểm vượt trội của Yolov4 so với các mạng hiện nay chính là nguyên nhân em lựa chọn Yolov4 để thực hiện đề tài phát hiện khoảng cách và khẩu trang này.

Hình 2.13. Kết quả so sánh Yolov4 với các SOTA ở thời điểm hiện tại. Yolov4 chạy nhanh gấp đôi EfficientDet và tăng AP và FPS so với Yolov3 lần lượt là 10% và 12%.

Một phần của tài liệu HỆ THỐNG PHÁT HIỆN VI PHẠM KHOẢNG CÁCH 2m và ĐEO KHẨU TRANG (Trang 34 - 36)

Tải bản đầy đủ (DOCX)

(68 trang)
w