Các tính năng áp dụng kỹ thuật phát hiện đối tượng

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu kỹ thuật phân tích đám đông trong giám sát tự động dựa vào thị giác máy (Trang 44 - 46)

6. Cấu trúc luận văn

2.2.2. Các tính năng áp dụng kỹ thuật phát hiện đối tượng

2.2.2.1. Integral Image:

Hình 2.6. Phát hiện đối tƣợng bằng Integral Image

Các đối tượng hình chữ nhật có thể được tính toán rất nhanh chóng bằng cách sử dụng đại diện trung gian cho hình ảnh được gọi là hình tích phân. Hình ảnh tích phân tại vị trí chứa đựng tổng các pixel ở trên và bên trái, bao gồm:

trong đó ii(x,y) là ảnh tích phân và i(x,y) là ảnh gốc. Sử dụng cặp lặp lại sau:

Trong đó s(x,y) là là tổng hàng tích lũy, s(x,-1) = 0, và ii(-1,y) = 0 hình ảnh tích phân có thể được tính bằng một lần vượt qua hình ảnh gốc.

(2.4)

35

Sử dụng hình ảnh tích phân bất kỳ tổng các pixel trong hình chữ nhật D có thể là được tính toán với bốn tham chiếu mảng. Giá trị của hình ảnh tại vị trí 1 là tổng các pixel trong hình chữ nhật A . Giá trị ở vị trí 2 là A + B , ở vị trí 3 là A + C , và tại vị trí 4 là A + B + C + D. Tổng trong D có thể được tính là 4 + 1- 2 + 3.

2.2.2.2.Yolo:

Yolo là một cách tiếp cận mới để phát hiện đối tượng. Yolo xử lý hình ảnh trong thời gian thực ở 45 khung hình mỗi giây.

Yolo cho phép đào tạo từ đầu đến cuối và tốc độ thời gian thực trong khi vẫn duy trì độ chính xác cao. Hệ thống của chúng ta chia hình ảnh đầu vào thành một lưới S * S. Nếu tâm của một đối tượng rơi vào một ô lưới, ô lưới đó có trách nhiệm phát hiện đối tượng đó.

Mỗi ô lưới dự đoán hộp giới hạn B và độ tin cậy điểm cho các ô đó. Những điểm số tin cậy này phản ánh cách chắc chắn rằng mô hình là hộp chứa một đối tượng và cũng như mức độ chính xác mà nó cho rằng hộp dự đoán. Chính thức chúng ta tự tin định nghĩa là Pr (Object) ∗ IOUtruthpred. Nếu không có đối tượng tồn tại trong ô đó, điểm tin cậy phải là số không. Nếu không, chúng tôi muốn điểm tin cậy bằng với giao nhau qua liên hiệp (IOU) giữa hộp dự đoán và sự thật cơ bản.

Mỗi hộp giới hạn bao gồm 5 dự đoán: x, y, w, h, và sự tự tin. Các tọa độ (x,y) đại diện cho tâm của hộp so với giới hạn của ô lưới. Chiều rộng và chiều cao được dự đoán so với toàn bộ hình ảnh. Cuối cùng dự đoán độ tin cậy đại diện cho IOU giữa hộp dự đoán và bất kỳ hộp sự thật cơ bản nào.

Mỗi ô lưới cũng dự đoán xác suất lớp có điều kiện C, Pr(Classi │Object). Những xác suất này là điều kiện được đánh dấu trên ô lưới có chứa một đối tượng. Chúng tôi chỉ dự đoán một bộ xác suất lớp cho mỗi ô lưới, bất kể số

36

hộp B. Tại thời điểm kiểm tra, chúng ta nhân các xác suất lớp có điều kiện với các dự đoán độ tin cậy của hộp riêng lẻ, cung cấp cho chúng tôi điểm tin cậy theo lớp cụ thể cho mỗi cái hộp. Những điểm số này mã hóa cả xác suất của lớp đó xuất hiện trong hộp và hộp dự đoán phù hợp với đối tượng.

Pr(Classi │Object) * Pr(Object) * IOUtruthpred = Pr(Classi) * IOUtruthpred

Hệ thống của chúng ta phát hiện mô hình như một hồi quy. Nó phân chia hình ảnh thành một lưới S * S ảnh cho mỗi ô lưới đứng trước các ô giới hạn B, độ tin cậy cho các ô đó và xác suất lớp C. Những dự đoán này được mã hóa dưới dạng tensor S x S x (B * 5 + C)

Hình 2.7. Phát hiện đối tƣợng bằng Yolo.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu kỹ thuật phân tích đám đông trong giám sát tự động dựa vào thị giác máy (Trang 44 - 46)

Tải bản đầy đủ (PDF)

(69 trang)