- 1: nhận dạng hình ảnh thuộc lớp ly lỗi (0) hay ly hoàn thiện (1) - 0.594044, 0.509799: toạ độ của vật trong hình
- 0.487053, 0.348694: chiều dài và rộng của vật thể
● Train mơ hình
Cấu hình của Raspberry Pi 3 khá thấp nên nhóm đã chọn mạng tiny-YOLOv3 để train mơ hình vì tính chất mạng này nhẹ, tốc độ FPS cao, độ chính xác vừa phải, phù hợp với máy tính có cấu hình thấp.
Dưạ trên tài liệu [21] của tác giả Dong Xiao, nhóm đã tìm hiểu được cơ bản về mơ hình mạng tiny-YOLOv3 với thuật tốn K-Means để tính tốn dữ liệu mẫu YOLO:
Thuật tốn K-Means là một thuật tốn khơng giám sát các mẫu khơng tập hợp, mang tính chất dễ sử dụng với khả năng tập hợp mẫu với năng suất cao, nên thuật toán này đang được sử dụng rất rộng rãi. Thuật toán này sẽ dùng các khoảng cách (distance) như dữ liệu mẫu để tính tốn sự tương đồng giữa các vật thể. Các vật thể có khoảng cách tương đồng càng thấp, sự tương đồng càng cao, thì càng có khả năng cao vật mẫu của các dữ liệu lấy mẫu là một. Các bước thực hiện tầng tính tốn của thuật toán K-Means là:
71 (2) Gán các mẫu thành một tập hợp theo các mẫu tương đồng dựa trên nguyên tắc độ tương đồng thấp (minimum distance) như đã nói ở trên.
(3) Thực hiện các tính tốn theo dữ liệu mẫu trung tâm bằng phương pháp xét độ tương đồng cho từng mẫu.
(4) Lặp lại bước (2) và (3) cho đến khi dữ liệu mẫu trung tâm khơng cịn thay đổi nữa. (5) Xuất ra dữ liệu mẫu trung tâm hoàn chỉnh và hệ số k cho từng mẫu.
Thuật toán K-Means thường dùng giải thuật Euclidean Distance để tính tốn độ tương đồng cho từng mẫu dữ liệu. Intersection over Union (IOU) là một tiêu chuẩn dùng để tính tốn độ chuẩn xác của việc nhận diện các vật thể tương tác trong một tập hợp dữ liệu mẫu nhất định:
IOU = 𝑇𝑃 𝐹𝑃+𝑇𝑃+𝐹𝑁
Mà TP, FP, FN lần lượt là các thông số lượt true positive, false positive và false negative. [21]