Phân loại thuật toán phát hiện đối tượng

Một phần của tài liệu Phát hiện đối tượng trong không ảnh chứa sương mờ dựa trên học sâu (khóa luận tốt nghiệp) (Trang 28 - 30)

11

Hình 2.2: So sánh sự mô hình two-stage (a) và one-stage (b) [4].

Two-stage: bao gồm các phương pháp thuộc họ R-CNN (Region-Based Convolutional Neural Networks) như Fast R-CNN, Faster R-CNN, Mask R-CNN… Các mô hình two-stage bao gồm có 2 giai đoạn bắt đầu bằng việc trích chọn (extract) các vùng trên ảnh có khả năng chứa đối tượng dựa vào các anchor box. Sau đó, ở giai đoạn 2, mô hình thực hiện phân loại đối tượng và xác định vị trí bằng cách chia làm 2 nhánh gồm hồi quy Bounding box (Bounding box Regression) và hồi quy phân loại (Classifier Regression) tại phần cuối trong kiến trúc của mô hình. Với khả năng dự đoán có độ chính xác cao, các mô hình two-stage thường được sử dụng trong các bài toán định vị và nhận diện vật thể tĩnh (hình ảnh) có yêu cầu không quá cao về tốc độ xử lý.

One-stage (hay còn gọi là single-stage): Bao gồm các mô hình thuộc họ YOLO, SSD (Single Shot Detection), Retina... Các mô hình one-stage không có phần trích chọn các vùng đặc trưng như two-stage. Thay vào đó, các mô hình này sẽ coi việc Phát hiện đối tượng như một bài toán regression và dựa trên pre-defined box hay còn gọi là anchor box để phát hiện đối tượng. Mặc dù sở hữu tốc độ nhanh hơn các mô hình two-stage, độ chính xác của mô hình single-stage thường kém hơn và chúng được sử

12

dụng trong các trường hợp nhận dạng đối tượng, đặc biệt là các đối tượng real-time – tác vụ vốn yêu cầu cao về tốc độ xử lý hơn là độ chính xác.

Phát hiện đối tượng đã được ứng dụng rộng rãi để phát hiện khuôn mặt, phát hiện xe, đếm số người đi bộ, hệ thống bảo mật và xe không người lái. Sự phát triển của các phương pháp phát hiện đối tượng không chỉ đem lại lợi ích cho ngành Công nghệ thông tin mà còn cho rất nhiều ngành nghề lĩnh vực khác như quân sự, y tế, hàng không, …

Một phần của tài liệu Phát hiện đối tượng trong không ảnh chứa sương mờ dựa trên học sâu (khóa luận tốt nghiệp) (Trang 28 - 30)

Tải bản đầy đủ (PDF)

(105 trang)