Nâng cao hiệu năng phát hiện đám cháy sử dụng thị giác máy dựa trên mạng nơ-ron YOLOV5

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	6
Dung lượng	917,22 KB

Nội dung

Bài viết Nâng cao hiệu năng phát hiện đám cháy sử dụng thị giác máy dựa trên mạng nơ-ron YOLOV5 trình bày quá trình xây dựng ứng dụng phát hiện đám cháy sử dụng mạng nơ-ron tích chập YOLOv5. Ứng dụng sử dụng mô hình mạng nơ-ron YOLOv5 để phát hiện đám cháy đã cho kết quả thử nghiệm đạt độ chính xác cao và tốc độ xử lý nhanh có khả năng nhận dạng theo thời gian thực.

KHOA HỌC CÔNG NGHỆ P-ISSN 1859-3585 E-ISSN 2615-9619 NÂNG CAO HIỆU NĂNG PHÁT HIỆN ĐÁM CHÁY SỬ DỤNG THỊ GIÁC MÁY DỰA TRÊN MẠNG NƠ-RON YOLOV5 IMPROVEMENT THE FIRE DETECTION PERFORMANCE USING COMPUTER VISION BASED ON YOLOV5 NEURAL NETWORK Đỗ Thị Ngọc Ánh1, Hoàng Mạnh Kha1, Lê Anh Tuấn1,*, Nguyễn Ngọc Anh1 DOI: https://doi.org/10.57001/huih5804.37 TÓM TẮT Phát đám cháy sớm xác yêu cầu cấp thiết đặt hệ thống cảnh báo cháy Để góp phần giải tốn này, báo trình bày trình xây dựng ứng dụng phát đám cháy sử dụng mạng nơ-ron tích chập YOLOv5 Ứng dụng sử dụng mơ hình mạng nơ-ron YOLOv5 để phát đám cháy cho kết thử nghiệm đạt độ xác cao tốc độ xử lý nhanh có khả nhận dạng theo thời gian thực Với thực trạng cháy nổ đồng thời qua phân tích hệ thống cảnh báo cháy có thị trường, hệ thống nhận dạng lửa sử dụng mạng nơ-ron kết hợp với hệ thống camera an ninh hứa hẹn cải thiện nhiều thiếu sót hệ thống báo cháy thơng thường gặp phải, giúp giảm thiểu thiệt hại người sở vật chất xảy hỏa hoạn Từ khóa: Phát lửa, báo cháy, mạng nơ ron tích chập, YOLOv5 ABSTRACT Early and accurate in fire detection is an urgent requirement for fire alarm systems To contribute to solving this problem, this paper presents a fire detection model based on YOLOv5 convolutional neural network (CNNs) Using YOLOv5 convolution neural network to fire detection has given high accuracy upper 90% and real time detection The current fire and explosion situation combine analysis of the operation of fire alarm systems be used, a fire detection based on YOLOv5 convolutiona l neural network when combine a sercurity camera systerm improve the performance of the fire alarm system Keywords: Fire detection, CNN-convolution neural network, YOLOv5 Trường Đại học Công nghiệp Hà Nội Email: anhtuandt04k2@gmail.com Ngày nhận bài: 02/6/2022 Ngày nhận sửa sau phản biện: 15/7/2022 Ngày chấp nhận đăng: 27/10/2022 * GIỚI THIỆU Xuất phát từ thực tế nay, tình hình cháy nổ nước ngày tăng cao kéo theo nhiều hệ lụy, thiệt hại nghiêm trọng người tài sản Với tốc độ xây dựng sở hạ tầng vô mạnh mẽ, nhà cao tầng, trung tâm thương mại, trụ sở văn phịng ln địa điểm tiềm ẩn nguy hỏa hoạn Chính vậy, việc phát cháy sớm ngăn chặn hiệu trường hợp gây cháy 48 Tạp chí KHOA HỌC & CƠNG NGHỆ ● Tập 58 - Số (10/2022) diện rộng Để phát lửa hệ thống báo cháy thông thường sử dụng cảm biến nhiệt độ, nhiên phương pháp có nhược điểm không phát lửa nhỏ phát lửa lan rộng làm nhiệt độ tăng cao Phương pháp sử dụng kỹ thuật nhận dạng hình ảnh từ camera giúp khắc phục nhược điểm trên, với phương pháp cần sử dụng máy quay camera tận dụng hệ thống camera có sẵn giám sát khơng gian rộng Hệ thống phát cháy sử dụng camera thông thường sử dụng trực tiếp liệu hình ảnh, video từ hệ thống camera giám sát, sau đưa qua thuật tốn xử lý hình ảnh, thuật tốn nhận dạng AI, từ đưa cảnh báo phát đám cháy Ưu điểm hệ thống tận dụng liệu từ hệ thống camera giám sát có sẵn, nhiên độ xác hệ thống phụ thuộc phần lớn vào thuật toán xử lý, yêu cầu cấu hình phần cứng mạnh Trong kỹ thuật nhận dạng hình ảnh, giải pháp áp dụng mơ hình mạng nơ ron học sâu đánh giá đạt hiệu tốt Kỹ thuật nhận dạng đối tượng (Object Detection) sử dụng rộng rãi để phát khuôn mặt, phát xe, đếm số người bộ, hệ thống bảo mật xe không người lái hệ thống phục vụ cho mục đích cảnh báo sớm từ xa Các thuật tốn nhận diện đối tượng sử dụng phương pháp cổ điển phân vùng theo ngưỡng màu sắc, kỹ thuật luồng quang hay sử dụng thuật toán hỗ trợ OpenCV không đạt hiệu suất đủ tốt để làm việc nhiều điều kiện khác Việc áp dụng đột phá nhanh chóng kỹ thuật học sâu năm 2012 dẫn đến đời thuật toán phương pháp phát đối tượng đại xác cao R-CNN [9], Fast-RCNN [10], Faster-RCNN [11] nhanh xác SSD [12] YOLO [1] Nhận dạng đối tượng thị giác máy bao gồm nhiệm vụ là: - Phân loại hình ảnh (Image Classification): Dự đốn nhãn đối tượng hình ảnh - Định vị đối tượng (Object Localization): Xác định vị trí đối tượng ảnh khung chữ nhật bao quanh Website: https://jst-haui.vn SCIENCE - TECHNOLOGY P-ISSN 1859-3585 E-ISSN 2615-9619 đối tượng (Bounding Box) Trong hình ảnh có nhiều đối tượng, đối tượng xuất nhiều vị trí khác với kích thước khác Trong báo trình bày sở lý thuyết mạng YOLO quy trình huấn luyện mơ hình mạng YOLOv5 để nhận dạng lửa Sử dụng mơ hình huấn luyện để xây dựng chương trình nhận dạng lửa, sau thực thực nghiệm nhận dạng từ đưa đánh giá hiệu mơ hình Dữ liệu đầu vào hình ảnh frame trích xuất từ Video Ảnh đầu vào sau chia thành mạng lưới có S x S ô (hay gọi grid size) Thông thường grid size x 3, x 7, x 9, … CƠ SỞ LÝ THUYẾT MẠNG YOLO 2.1 Giới thiệu mạng YOLO YOLO kiến trúc mạng CNN sử dụng phát hiện, nhận dạng phân loại đối tượng Đối toán phân loại (Classification) có khả phân loại đối tượng dự đốn nhãn YOLO giải tốn phát đối tượng (Object Detection), khơng phát nhiều đối tượng với nhiều nhãn khác mà cịn xác định vị trí cụ thể đối tượng hình ảnh khung bao quanh đối tượng hình chữ nhật (Bounding Box) YOLO viết tắt cụm từ “You only look once” nói nên khả tốc độ nhận dạng mơ hình này, YOLO đánh giá mơ hình cho tốc độ nhận dạng nhanh có khả nhận dạng theo thời gian thực Kiến trúc YOLO xây dựng từ lớp tích chập (Convolution layers) để trích xuất đặc trưng đối tượng lớp kết nối đầy đủ (full connected layer) để dự đốn nhãn vị trí đối tượng Dữ liệu đầu vào hình ảnh, mơ hình dự đốn vị trí, kích thước nhãn Bounding Box 2.2 Kiến trúc mạng YOLO YOLO có kiến trúc bao gồm phần trích xuất đặc trưng (Feature Extractor) phát đối tượng (Extra Layers) Phần trích xuất đặc trưng lớp convolution cho đầu đồ đặc trưng (Feature map) Phần phát vật thể bao gồm lớp kết nối đầy đủ (Fully connected layers) dùng để phát hiện, dự đoán nhãn tọa độ Bounding Box đối tượng đồ đặc trưng (Feature map) phần Feature Extractor Hình ảnh cần nhận dạng qua khâu trích xuất đặc trưng để có đầu ra đồ đặc trưng (Feature map) với kích thước khác Các đồ đặc trưng sau đưa qua khâu phát đối tượng (Extra Layers) để dự đốn thơng tinvề tên đối tượng, vị trí kích thước Bounding Box bao quanh đối tượng Hình Kiến trúc mạng YOLO [1] Website: https://jst-haui.vn Hình Mơ hình hoạt động mạng YOLO [1] 2.3 Nguyên lý hoạt động mạng YOLO YOLO phân chia hình ảnh thành vuông dạng lưới (grid) xác định xem ô vuông liệu có tâm vật thể cần xác định hay khơng Nếu có, mơ hình YOLO khoanh vùng đối tượng hộp mốc (Anchor Box), sau có kết lọc xác xuất bounding box Thuật toán sử dụng mạng nơ ron đơn với đặc trưng có từ feature map lớp tích chập để dự đốn bounding box ô xác suất loại đối tượng chứa bên Sau cùng, ta có nhiều bounding box thuật toán đưa với kích thước khác Sử dụng thuật tốn Non-Maxima Suppresstion (NMS) ta loại hầu hết bounding box miền bao đối tượng, có tỉ lệ thấp giữ lại bounding box có tỉ lệ khớp cao Đầu YOLO dự đoán Bounding Box vector gồm thành phần gồm: xác xuất dự báo có vật thể (P0) định nghĩa Pr(Object)∗IOU(pred,truth), tọa độ tâm kích thước chiều rộng, cao Bouding Box (x, y, w, h), vector phân phối xác xuất dự báo classes Kích thước vector đầu tính (5 + số classes) ví dụ ta huấn luyện nhận dạng 50 đối tượng(classes) kích thước vector đầu dự đốn cho mỗ Bounding Box có kích thước 55 Như đầu mơ hình ma trận chiều có kích thước S×S×B×(5+C) SxS kích thước Feature map phần trích xuất đặc trưng, B số lượng Bounding Box tương ứng số Anchor Box ô(cell) áp dụng Anchor Box B = 3, C số classes Mơ hình YOLO có phiên YOLOv1 [1], YOLOv2 [2], YOLOv3 [3] Joseph Redmon phát triển từ 2016, YOLOv4 [4] Alexey Bochkovskiy phát triển năm 2020 YOLOv5 Glenn Jocher phát hành năm 2020 [5] Khác với phiên trước, YOLOv5 phát triển dựa PyTorch thay DarkNet [5] Đây ưu điểm lớn YOLOv5 PyTorch phổ biến có nhiều tài liệu hướng dẫn để tham khảo mơ hình YOLOv5 đề xuất phiên sau: Vol 58 - No (Oct 2022) ● Journal of SCIENCE & TECHNOLOGY 49 KHOA HỌC CÔNG NGHỆ YOLOv5n - Nano version, YOLOv5s - Small version, YOLOv5m - Medium version, YOLOv5l - Large version, YOLOv5x - Extra-large version YOLOv5 công bố gần với so sánh ban đầu cho thấy độ xác tương đương YOLOv4 có tốc độ nhanh thực dự đoán Trong ứng dụng tác giả sử dụng mơ hình YOLOv5 với phiên YOLOv5s ỨNG DỤNG PHÁT HIỆN LỬA 3.1 Mơ hình hệ thống P-ISSN 1859-3585 E-ISSN 2615-9619 Cấu trúc tập liệu YOLOv5 yêu cầu bao gồm:  Một thư mục images chứa ảnh: có thư mục train val để chứa ảnh train ảnh validate  Một thư mục labels chứa nhãn (các file txt đó) có thư mục tương tự images Dữ liệu đầu vào ảnh YOLOv5 theo format darknet với file txt cho ảnh có chứa đối tượng label, cịn với ảnh khơng có đối tượng bỏ qua File txt có định dạng sau :  Mỗi hàng đối tượng  Mỗi hàng có format sau: class x_center y_center width height class x_center y_center tọa độ x, y tâm khung bao vật thể, width, height chiều rộng cao khung bao vật thể  Toạ độ box chuẩn hóa (từ 0-1) theo format xywh  Class Hình Định dạng File.txt gắn nhãn YOLOv5 Hình Mơ hình hệ thống Bộ liệu dataset chia thành tập liệu bao gồm tập huấn luyện(training) tập xác minh (validate), hình ảnh sau tiến hành gán nhãn xác định vị trí lửa Tiến hành cấu hình thơng số cho Model, sử dụng tập liệu huấn luyện tập validate để huấn luyện cho mơ hình Mơ hình sau huấn luyện thành cơng trọng số lưu định dạng “model.pt” Mơ hình huấn luyện sử dụng cho chương trình thực thi nhận dạng lửa với liệu đầu vào lấy từ hình ảnh, videos, camera Kết trình nhận dạng phần mềm hiển thị trực tiếp kết phân loại “fire” vị trí lửa hình đồng thời lưu lại hình ảnh video nhận dạng Tất hình ảnh sử dụng cho training phải gắn nhãn, tác giả sử dụng phần mềm LabelIMG để gắn nhãn cho hình ảnh 3.2 Chuẩn bị liệu Tập liệu sử dụng để huấn luyện mơ hình bao gồm 1403 ảnh có kích thước 224x224, xây dựng cachs chọn lọc từ liệu 10000 ảnh Durham University [6] Hình ảnh liệu có nhiều khung cảnh kích thước lửa khác Trong 1403 ảnh gồm có 1194 ảnh có lửa, 209 ảnh khơng có lửa Mỗi ảnh xuất xuất nhiều lửa với kích thước khác nhau, tất lửa phải gắn nhãn ảnh có nhiều nhãn Tổng số có 3129 lửa gắn nhãn, q trình gắn nhãn cho nhóm tác giả thực Bộ liệu phân chia 80% cho tập huấn luyện 20% cho tập xác minh (validate) 50 Tạp chí KHOA HỌC & CƠNG NGHỆ ● Tập 58 - Số (10/2022) Hình Gắn nhãn cho ảnh sử dụng phần mềm LabelIMG 3.3 Huấn luyện mơ hình Trong q trình huấn luyện mạng nơ ron tính tốn tất ảnh tệp liệu đầu vào sử dụng lặp lại ảnh nhiều lần, mục đích để tối ưu hàm mát Quá trình tối ưu giúp cho mạng nơ-ron tìm trọng số tốt nhất, giúp cho q trình nhận dạng xác Mơ hình sau huấn luyện thành cơng trọng số lưu trữ file kết có định dạng “.pt” Trong YOLOv5 việc bắt đầu trình huấn luyện từ đầu YOLOv5 cịn cho phép người dùng sử dụng trọng số có sẵn để tiếp tục trình huấn Website: https://jst-haui.vn SCIENCE - TECHNOLOGY P-ISSN 1859-3585 E-ISSN 2615-9619 luyện trình huấn luyện nhanh thay phải huấn luyện từ đầu Q trình huấn luyện mơ hình sử dụng lượng lớn tài ngun máy tính, máy tính có cấu hình khơng đủ mạnh thời gian huấn luyện diễn dài Ta huấn luyện Google Colab để giảm thời gian huấn luyện đồng thời đảm bảo hiệu chất lượng mơ hình Bảng Danh mục tham số cấu hình cho mạng Tên tham số Giá trị tham số img 224 Kích thước ảnh đầu vào Batch size 64 Số lượng ảnh sử dụng vòng huấn luyện epochs 1000 Số lượt huấn luyện toàn liệu data fire_dataset weight yolov5s device name defaut Bảng Danh mục cấu hình tham số nhận dạng Tên tham số Giá trị tham số img 640 source conf-thres 0.25 Thiết lập ngưỡng độ tin cậy dự đoán iou-thres 0.45 Thiết lập ngưỡng IoU weight best.pt Lựa chọn trọng số tốt kết training model yolov5s device Lựa chọn GPU training, chọn ‘cpu‘ khơng có GPU Ý nghĩa tham số File chứa đường dẫn tập liệu Lựa chọn phiên model yolov5s Lựa chọn GPU training, chọn ‘cpu‘ khơng có GPU Đường dẫn thư mục lưu model Ý nghĩa tham số Kích thước ảnh đầu vào theo pixcel Nguồn liệu đầu vào chọn ‘0‘ với liệu nhận dạng từ camera, đường dẫn tới hình ảnh, video có sẵn Phần mềm cho phép thực nhận dạng với tùy chọn liệu đầu vào bao gồm file ảnh, file video hình ảnh trực tiếp từ camera Với liệu đầu vào hình ảnh cần cung cấp đường dẫn tuyệt đối file ảnh, kết nhận dạng hình ảnh lưu lại vị trí lửa độ tin cậy dự đoán KẾT QUẢ THỰC NGHIỆM Số lượng ảnh tối đa batch phụ thuộc vào cấu hình phần cứng máy tính, nhóm tác giả sử dụng máy chủ google colab bacth sử dụng 64 hình ảnh Số lượt huấn luyện tồn liệu (epochs) q trình huấn luyện tác giả Glenn Jocher khuyến cáo sử dụng tối thiểu 300 epochs [7], thực nghiệm cho thấy tham số mơ hình bão hịa epochs đạt 1000 lần 3.4 Chương trình phát đám cháy sử dụng hình ảnh từ camera 4.1 Kết Kết thúc trình huấn luyện có trọng số mơ hình lưu lại bao gồm:  Bộ trọng số tốt nhất: best.pt  Bộ trọng số cuối trình huấn luyện: last.pt Trong trọng số best.pt sử dụng cho chương trình nhận dạng Thơng số chi tiết kết training thể hình Hình Biểu đồ kết trình training model Hình Giải thuật hệ thống Giải thuật hệ thống phát đám cháy sử dụng hình ảnh từ camera hình Thiết lập tham số cho trình nhận dạng bảng Website: https://jst-haui.vn Biểu đồ hình cho thấy, sau trình training 1000 epoch độ xác trung bình dự đốn training (precision) đạt 95,39% khi, độ mát (loss) 2,3%, kích thước mơ hình 13,6Mb Đối với q trình validate độ xác trung bình phát IoU = 0,5 (mAP_0.5) đạt 95,4% Ứng dụng nhận dạng cho phép thực nhận dạng với tùy chọn liệu đầu vào bao gồm file ảnh, file video Vol 58 - No (Oct 2022) ● Journal of SCIENCE & TECHNOLOGY 51 KHOA HỌC CÔNG NGHỆ P-ISSN 1859-3585 E-ISSN 2615-9619 hình ảnh trực tiếp từ camera Với liệu đầu vào hình ảnh cần cung cấp đường dẫn tuyệt đối file ảnh, kết nhận dạng hình ảnh lưu lại vị trí lửa độ xác dự đốn 4.2.1 Thực nghiệm với điều kiện nhà, thiếu ánh sáng Thực nghiệm thực lấy liệu từ camera nhà với điều kiện phòng thiếu ánh sáng Nhận dạng đám cháy khoảng thời gian 30s, trích xuất hình ảnh từ video kết thu 947 hình ảnh kích thước 480x854 Hình ảnh sau nhận dạng hình Hình Kết nhận dạng trực tiếp qua camera 4.2 Thực nghiệm đánh giá Để đánh giá hiệu mơ hình, nhóm tác giả đánh giá hai thông số bao gồm độ xác nhận dạng tốc độ nhận dạng Độ xác đánh giá điều kiện: Trong nhà thiếu sáng, nhà đủ ánh sáng, trời Đánh giá độ xác nhận dạng nhóm tác giả sử dụng hai thông số gồm: Precision: Biểu thị độ xác dự đốn tên vị trí đối tượng; Hình Ảnh nhận dạng lửa nhà thiếu sáng Kết nhận dạng sau trích xuất frame ảnh bảng Bảng Bảng kết so sánh dự đoán với điều kiện nhà, thiếu ánh sáng Ảnh có lửa Giải pháp Recall: Biểu thị khả phát đối tượng liệu đầu vào Trong hệ thống yêu cầu phát lửa nhiệm vụ quan trọng tham số Recall quan tâm Precision Recall cao khả phát lửa cao đồng nghĩa khả bỏ sót lửa thấp Độ xác dự đoán đối tượng: TP TP  FP Khả phát đối tượng: Pr ecision  TP TP  FN Trong đó: Recall  (1) Đề xuất-YOLOv5s YOLOv3 [8] Không phát (FN) 524 401 130 Phát (TP) Ảnh khơng có lửa Phát Khơng phát (FP) (TN) 11 405 416 Precision Recall 97,94% 98,68% 100% 75,52% Kết cho thấy hiệu giải pháp đề xuất tốt so với giải pháp sử dụng mơ hình YOLOv3 khả phát lửa thể qua tham số Recall Lưu ý ứng dụng phát cảnh báo cháy, tham số Recall cần ưu tiên cao 4.2.2 Thực nghiệm với điều kiện nhà đủ ánh sáng (2) TP - True Positive: Thực tế có đối tượng, dự đốn có đối tượng; Thực nghiệm thực lấy liệu từ camera nhà với điều kiện phòng đủ ánh sáng Nhận dạng đám cháy khoảng thời gian 28s Trích xuất hình ảnh từ video kết thu 844 hình ảnh 480x854 pixcel Ảnh nhận dạng lửa nhà đủ ánh sáng hình 10 FN - False Negative: Thực tế có đối tượng, dự đốn khơng có đối tượng; TN - True Negative: Thực tế khơng có đối tượng, dự đốn khơng có đối tượng; FP - False Positive: Thực tế khơng có đối tượng, dự đốn có đối tượng Bên cạnh tác giải thực so sánh kết với giải pháp công bố [8] sử dụng YOLOv3 Kết so sánh thực với điều kiện giống cho hai giải pháp như: sử dụng liệu huấn luyện, cài đặt tham số (IoU, image size), thực thi tảng phần cứng 52 Tạp chí KHOA HỌC & CÔNG NGHỆ ● Tập 58 - Số (10/2022) Hình 10 Ảnh nhận dạng lửa nhà đủ ánh sáng Kết nhận dạng sau trích xuất frame ảnh bảng Kết nhận dạng sử dụng giải pháp YOLOv5 đạt độ xác 95%, giải pháp sử dụng YOLOv3 đạt độ Website: https://jst-haui.vn SCIENCE - TECHNOLOGY P-ISSN 1859-3585 E-ISSN 2615-9619 xác thấp nhiều Thực nghiệm cho thấy giải pháp sử dụng YOLOv3 phát lửa kích thước nhỏ hơn, nhạy cảm với ánh sáng môi trường nhiều so với YOLOv5 Bảng Bảng kết so sánh dự đoán với điều kiện nhà đủ sáng Ảnh có lửa Phát Khơng Giải pháp phát (TP) (FN) Đề xuất-YOLOv5s 750 34 YOLOv3[8] 243 541 Ảnh khơng có lửa Phát Khơng Precision Recall phát (FP) (TN) 60 100% 95,66% 60 100% 30,99% 4.2.3 Thực nghiệm với điều kiện trời Thực nghiệm thực lấy liệu từ camera trời Nhận dạng đám cháy khoảng thời gian 34s Trích xuất hình ảnh từ video kết thu 1010 hình ảnh kích thước 480x854 Ảnh nhận dạng lửa ngồi trời hình 11 Hình 11 Ảnh nhận dạng lửa trời Kết nhận dạng sau trích xuất frame ảnh bảng Bảng Bảng kết so sánh dự đốn với điều kiện ngồi trời Ảnh có lửa Giải pháp Ảnh khơng có lửa Phát Khơng Phát Khơng Precision Recall phát hiện phát (TP) (FN) (FP) (TN) Đề xuất-YOLOv5s 560 101 349 100% 84,72% YOLOv3 [8] 262 399 349 100% 39,64% Ở thực nghiệm độ xác nhận dạng giảm mạnh giải pháp ảnh hưởng điều kiện ánh sáng môi trường, nhiên giải pháp sử dụng YOLOv5 đạt độ xác 80%, giải pháp sử dụng YOLOv3 đạt 40% Điều cho thấy giải pháp sử dụng YOLOv3 [8] ổn định với điều kiện ánh sáng môi trường so với YOLOv5 4.2.4 Thực nghiệm đánh giá tốc độ nhận dạng Thực nghiệm đánh giá tốc độ nhận dạng với đầu vào video đánh giá tảng phần cứng PC đạt kết bảng Bảng So sánh tốc độ nhận dạng PC Phần cứng FPS giải pháp đề xuất-YOLOv5s FPS giải pháp sử dụng YOLOv3 [8] CPU Intel Xeon(R) Bonze 31041.7GHz Website: https://jst-haui.vn RAM 16GB GPU NVIDIA Quadro P2200 Bảng cho thấy giải pháp sử dụng đề xuất sử dụng YOLOv5 cho tốc độ xử lý nhanh nhiều so với giải pháp sử dụng YOLOv3 [8] Thời gian nhận dạng cho thấy mơ hình sử dụng YOLOv5s hồn tồn ứng dụng hệ thống báo cháy dân dụng sử dụng phần cứng có cấu hình trung bình KẾT LUẬN Từ kết thực nghiệm cho thấy giải pháp đề xuất sử dụng YOLOv5 cho hiệu tốt nhiều so với giải pháp sử dụng YOLOv3 độ xác tốc độ nhận dạng điều kiện khác Hệ thống có khả phát hiện, nhận dạng tốt với điều kiện nhà trời, đặc biệt với kiện nhà hệ thống cho kết nhận dạng với độ xác lên tới Precision ≥ 95% Recall ≥ 95% Tốc độ nhận dạng nhanh 19ms/frame ảnh cho phép triển khai nhận dạng theo thời gian thực Bên cạnh kết xác precision recall phụ thuộc vào yếu tố điều kiện ánh sáng kích thước đối tượng ảnh, hệ thống hoạt động hiệu với đối tượng có kích thước lớn TÀI LIỆU THAM KHẢO [1] Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi, 2016 You Only Look Once: Unified, Real-Time Object Detection arXiv:1506.02640v5 [cs.CV [2] Joseph Redmon, Ali Farhadi, 2016 YOLO9000: Better, Faster, Stronger arXiv:1612.08242v1 [cs.CV] [3] Joseph Redmon, Ali Farhadi, 2018 YOLOv3: An Incremental Improvement arXiv:1804.02767v1 [4] Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao, 2020 YOLOv4: Optimal Speed and Accuracy of Object Detection arXiv:2004.10934v1, 2020 [5] Glenn Joche, 2020 https://github.com/ultralytics/yolov5 [6] https://collections.durham.ac.uk/files/r2d217qp536#.YjRZzlUza01 [7] Glenn Joche https://github.com/ultralytics/yolov5/wiki/Tips-for-BestTraining-Results [8] Pu Li, Wangda Zhao, 2020 Image fire detection algorithms based on convolutional neural networks Case Studies in Thermal Engineering - journals elsevier [9] Ross Girshick, Jeff Donahue, Trevor Darrell, Jitendra Malik, 2014 Rich feature hierarchies for accurate object detection and semantic segmentation Tech report (v5) arXiv:1311.2524v5 [10] Ross Girshick, 2015 Fast R-CNN arXiv:1504.08083v2 [11] Shaoqing Ren, Kaiming He, Ross Girshick, Jian Sun, 2016 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks arXiv:1506.01497v3 [12] Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C Berg, 2016 SSD: Single Shot MultiBox Detector arXiv:1512.02325v5 FPS 51,8 AUTHORS INFORMATION 31,6 Do Thi Ngoc Anh, Hoang Manh Kha, Le Anh Tuan, Nguyen Ngoc Anh Hanoi University of Industry Vol 58 - No (Oct 2022) ● Journal of SCIENCE & TECHNOLOGY 53 ... độ xử lý nhanh nhiều so với giải pháp sử dụng YOLOv3 [8] Thời gian nhận dạng cho thấy mơ hình sử dụng YOLOv5s hồn tồn ứng dụng hệ thống báo cháy dân dụng sử dụng phần cứng có cấu hình trung bình... thực dự đoán Trong ứng dụng tác giả sử dụng mơ hình YOLOv5 với phiên YOLOv5s ỨNG DỤNG PHÁT HIỆN LỬA 3.1 Mơ hình hệ thống P-ISSN 1859-3585 E-ISSN 2615-9619 Cấu trúc tập liệu YOLOv5 yêu cầu bao gồm:... chia thành mạng lưới có S x S ô (hay gọi grid size) Thông thường grid size x 3, x 7, x 9, … CƠ SỞ LÝ THUYẾT MẠNG YOLO 2.1 Giới thiệu mạng YOLO YOLO kiến trúc mạng CNN sử dụng phát hiện, nhận

Ngày đăng: 27/01/2023, 13:48