Minh họa biểu diễn cơng thức tính IOU

Một phần của tài liệu Nghiên cứu phát triển các giải pháp thị giác máy công nghiệp kết hợp AI cho nền tảng robot thông minh (Trang 27 - 28)

Hình 2 .11 Minh họa cách xác định bounding box trong YOLO

Hình 2.12 Minh họa biểu diễn cơng thức tính IOU

Nếu khơng có object nào tồn tại thì confidence bằng 0. Trong thực tế, ta khơng có đƣợc groundtruth của đối tƣợng cho nên trong quá trình kiểm thử chỉ số confidence sẽ chỉ còn là xác suất Pr(Object). Ta thấy mỗi bounding box dự đốn có 5 thành phần tham số, mỗi ô tạo ra B box dự đốn, vì vậy sẽ có tổng số SxSxB*5 đầu ra liên quan đến các box dự đoán. Thuật toán YOLO chỉ dự đốn một tập xác suất của class trên mỗi ơ nên tổng xác suất của class là SxSxC (C là số lƣợng class của bài toán). Tổng kết lại chúng ta nhận đƣợc một ma trận khối 3 chiều (tensor) có SxSx(B*5+C) giá trị làm đầu ra (output).

Sau khi có đƣợc output này, ta nhận đƣợc rất nhiều bounding boxes đƣợc dự đốn ra bởi mỗi ơ, nhƣng phần lớn trong số chúng đều có chỉ số confidence thấp hoặc bao phủ cùng một đối tƣợng trong ảnh. Vì vậy chúng ta cần phải loại bỏ hết những bounding boxes “dƣ thừa” để xác định chính xác và chỉ còn lại 1 bounding box tốt nhất cho 1 đối tƣợng tìm đƣợc. YOLO sử dụng Non-Max Suppresstion (NMS) để có thể loại bỏ đƣợc hầu hết các bounding box bị trùng một đối tƣợng và những box có confidence thấp hơn một ngƣỡng nhất định, giữ lại những bounding box có chỉ số cao.

Non-max suppression: Do thuật toán YOLO dự báo ra rất nhiều bounding box trên một bức ảnh nên đối với những ơ có vị trí gần nhau, khả năng các khung hình bị overlap là rất cao. Trong trƣờng hợp đó YOLO sẽ cần đến non-max suppression - NMS để giảm bớt số lƣợng các khung hình

20

đƣợc sinh ra một cách đáng kể. Các bƣớc của NMS:

• Bƣớc 1: Đầu tiên chúng ta sẽ tìm cách giảm bớt số lƣợng các bounding box bằng cách lọc bỏ toàn bộ những bounding box có xác suất chứa vật thể nhỏ hơn một ngƣỡng confidence nào đó, thƣờng là 0.5.

• Bƣớc 2: Đối với các bouding box giao nhau, non-max suppression sẽ lựa chọn ra một bounding box có xác xuất chứa vật thể là lớn nhất. Sau đó tính tốn chỉ số giao thoa IoU với các bounding box còn lại.

Một phần của tài liệu Nghiên cứu phát triển các giải pháp thị giác máy công nghiệp kết hợp AI cho nền tảng robot thông minh (Trang 27 - 28)

Tải bản đầy đủ (PDF)

(56 trang)