Bài viết Mô hình phân tán trong nhận dạng vũ khí nóng để xuất mô hình Edge AI – mô hình điện toán phân tán cho hệ thống nhận diện vũ khí nóng. Tập trung vào phân tích các giai đoạn xử lý trong mô hình, mô tả cách thức thực hiện trong từng quá trình xử lý trong hệ thống đã đề xuất. Mời các bạn cùng tham khảo!
Mơ Hình Phân Tán Nhận Dạng Vũ Khí Nóng TS Đồn Trung Sơn Khoa An ninh thơng tin, Học viện An ninh nhân dân Hà Nội, Việt Nam son.doantrung@gmail.com Nguyễn Thị Khánh Trâm Đại học Công nghệ, Đại học Quốc gia Hà Nội Hà Nội, Việt Nam Khanhtramt2k23@gmail.com Tóm tắt— Camera thông minh sử dụng rộng rãi năm gần để phục vụ cho việc giám sát, đặc biệt việc phát hiện, giám sát vũ khí nóng Thực tế, hầu hết mạng giám sát camera sử dụng mơ hình nén truyền liệu video từ camera máy chủ điện toán đám mây để lưu trữ xử lý, lý chưa tối ưu thuật tốn thơng minh thiết bị nhúng cấu hình thấp, giá rẻ Bên cạnh cịn nhiều khó khăn việc triển khai hệ thống AI Cloud theo mơ hình điện tốn đám mây xử lý hồn tồn máy chủ với số lượng camera lớn Để giải vấn đề, tác giả đề xuất áp dụng mơ hình điện tốn phân tán (Edge AI) cho toán cảnh báo vũ khí nóng từ camera giám sát mây trở nên dễ dàng Việc đưa AI (Trí tuệ nhân tạo) lên đám mây trở thành xu hướng với lợi ích như: Abstract— Smart cameras have been widely used in recent years to serve surveillance, especially for detecting and monitoring of hot weapons In fact, most camera surveillance networks use a compression model and transmit video data from the camera to a cloud server for storage or processing due to cheap price and low-configuration of camera devices Besides, there are many difficulties in deploying an AI Cloud system with a large number of cameras To solve the problem, the authors propose to apply a distributed computing model (Edge AI) to the problem of warning hot weapons from surveillance cameras - Thiết lập nhanh đơn giản: Bắt đầu dự án AI nhiều thời gian, cơng sức chi phí Các dịch vụ AI đám mây giảm đáng kể khó khăn bắt đầu - Hiệu chi phí: Bằng cách truy cập qua internet, phát triển ứng dụng đám mây giúp loại bỏ nhu cầu chi phí mua cài đặt phần cứng phần mềm chỗ Các ứng dụng AI thường u cầu máy tính có xử lý đồ họa (GPU) mạnh Khơng có điện tốn đám mây, cách cơng ty có nguồn lực lớn cần thiết để chạy phần mềm học máy với ngân sách lớn, nhiều không gian nhân để quản lý nhiều máy chủ Các hệ thống tốn chấp nhận nhiều tổ chức - Điện toán đám mây cung cấp tài ngun khơng giới hạn Trí thơng minh nhân tạo q trình học máy địi hỏi lượng tài nguyên điện toán đáng kể, đó, nói chung, việc chuyển sang đám mây hợp lý Tuy nhiên, có số yếu tố ngăn AI phát huy hết tiềm đám mây tập trung vấn đề liệu lớn, bảo mật, riêng tư, tốn băng thông mạng, hạn chế cho tốn địi hỏi xử lý thời gian thực… Keywords—Edge AI, AI Cloud, Hot Weapon, Smart Camera Đối với mơ hình cảnh báo tội phạm sử dụng vũ khí nóng tình nguy hiểm, trước tác giả có nghiên cứu liên quan [1] [2] để xuất mơ hình học YoloV3 (You Only Look Once – Version 3) cho tốn nhận dạng vũ khí nóng, sau cải tiến độ xác mơ hình với nghiên cứu [3][4] Tuy nhiên, bước đầu việc đề xuất mơ hình nhận diện tác giả đề xuất phương pháp nhận diện vật thể, chưa có cách thức xử lý với liệu lớn, số lượng lớn camera đưa vào hoạt động thực tiễn Thách thức cho toán đề cập là: I GIỚI THIỆU Hiện lắp đặt camera giám sát an ninh ngày trở nên phổ biến nhiều thành phố giới Số lượng camera giám sát gia tăng nhanh, điều đòi hỏi cần thiết phải quản lý chúng, giám sát đa phương tiện đám mây lĩnh vực nghiên cứu Trong hệ thống giám sát truyền thống, nhiều tài nguyên liên quan đến sở hạ tầng yêu cầu để thực hoạt động giám sát Karimaa[5] nghiên cứu đặc điểm độ tin cậy để mở rộng công nghệ giám sát video có sở hạ tầng đám mây Cụ thể, tác giả xem xét thuộc tính khả dụng, bảo mật, độ tin cậy khả bảo trì giải pháp giám sát video dựa đám mây xác định lợi tiềm công nghệ Neal Rahman [6] tiến hành phân tích chi tiết để khám phá liệu điện tốn đám mây có phù hợp với hệ thống quản lý giám sát video độ phân giải cao (VMS) hay không Các tác giả xác định điện toán đám mây giải pháp khả thi cho ứng dụng VMS, có vấn đề chi phí, vấn đề pháp lý mối đe dọa khác cần nghiên cứu thêm Giống tác giả [7] tiến hành phân tích phù hợp giải pháp giám sát đa phương tiện dựa đám mây báo cáo kinh nghiệm tích cực với số khía cạnh bảo mật quyền riêng tư - Triển khai mạng giám sát diện rộng, số lượng camera lớn đáp ứng thời gian thực - Đảm bảo an toàn thông tin riêng tư liệu - Một số yêu cầu xử lý cục thay truyền liệu trung tâm Trong báo này, tác giả để xuất mơ hình Edge AI – mơ hình điện toán phân tán cho hệ thống nhận diện vũ khí nóng Trong nghiên cứu này, tác giả tập trung vào phân tích giai đoạn xử lý mơ hình, mơ tả cách thức thực q trình xử lý hệ thống đề xuất II MƠ HÌNH PHÂN TÁN Do kỹ thuật tính tốn tiên tiến đòi hỏi kết hợp CPU (Central Processing Unit - xử lý trung tâm) GPU (Graphics Processing Unit - xử lý tác vụ liên quan đến đồ hoạ cho CPU), nhà cung cấp đám mây cung cấp cho máy ảo GPU mạnh mẽ Điều giúp cho việc triển khai thuật tốn trí tuệ nhân tạo đám A Đặt Vấn Đề với Mơ Hình Điện Tốn Đám Mây Hiện hầu hết mạng giám sát camera sử dụng mơ hình nén truyền liệu video từ camera máy chủ điện toán đám mây để lưu trữ xử lý, lý chưa tối ưu thuật tốn thơng minh thiết bị nhúng cấu 124 hình thấp, giá rẻ Mơ hình cung cấp tính linh hoạt mở rộng tương ứng với số lượng camera giám sát ngày tăng, giảm thiểu xử lý camera giảm giá thành camera Tuy nhiên, thực tế, có trở ngại đáng kể cho kiến trúc giám sát thông minh dựa đám mây từ xa: truyền liệu âm đến máy chủ từ xa nơi xử lý tồn yêu cầu - Yêu cầu hệ thống hạ tầng mạng tốt, với ứng dụng đòi hỏi camera độ phân giải cao (ví dụ 4K, 8K), khó khăn việc triển khai mở rộng; - Khơng thể cấu hình tinh chỉnh cấu hình camera phù hợp với toán khác nhau; - Nhiều ứng dụng giám sát thông minh yêu cầu tài nguyên lưu trữ tính tốn đáng kể Chỉ riêng chuỗi hình ảnh chuyển động diện rộng (WAMI) tốc độ khung hình thấp (1,25 Hz) tạo 100M liệu giây (400G giờ) Theo nghiên cứu gần đây, liệu video chiếm lượng lớn lưu lượng thời gian thực mạng truyền thơng Ví dụ: video trực tuyến chiếm 74% tổng lưu lượng truy cập trực tuyến năm 2017 78% lưu lượng truy cập di động liệu video vào năm 2021 Do đó, điều quan trọng phải xử lý việc truyền liệu khổng lồ theo cách mới; Hình Điện tốn phân tán (Edge Computing) Nói chung, Edge AI sở hữu lợi sau so với điện toán đám mây: - Phản hồi thời gian thực: ứng dụng dịch vụ thực trực tiếp chỗ gần địa điểm, độ trễ truyền thông giảm thiểu, điều cần thiết để trì hỗn nhiệm vụ quan trọng, nhạy cảm, giám sát thông minh; Hoạt động thời gian thực quan trọng với xe tự lái, robot nhiều lĩnh vực khác - Yêu cầu hệ thống máy chủ mạnh để xử lý nhiều camera lúc, điều dẫn đến giá thành máy chủ cao, để vừa tiếp nhận nhiều luồng video, vừa xử lý thuật tốn trí tuệ nhân tạo; - Một thiết bị Edge AI khơng cần kết nối mạng để hoạt động xác, xử lý liệu đưa định cách độc lập mà không cần kết nối internet - Băng thông mạng thấp hơn: liệu thơ tạo cảm biến hình xử lý thiết bị camera thay cloud từ xa Trong kết xử lý gửi tới cloud để phân tích tương lai, chi phí liên lạc thấp nhiều so với nhiệm vụ thực cloud; - Không thể xử lý tác vụ thời gian thực (ví dụ cảnh báo chỗ, mở cửa…); - Phải đảm bảo an tồn thơng tin cho liệu truyền máy chủ, liệu video chứa thông tin nhạy cảm - Tiêu thụ lượng thấp hơn: hầu hết thiết bị cạnh bị hạn chế lượng, chất nó, thuật toán triển khai cạnh nhẹ làm giảm mức tiêu thụ lượng cho toàn trình truyền liệu; - Bảo mật liệu: Dữ liệu gửi ít, đảm bảo tính bảo mật tính tồn vẹn liệu Ngồi dễ thực thi sách bảo mật quyền riêng tư mạng cục so với mạng Internet Việc lưu trữ liệu phần phân tán giúp đảm bảo riêng tư an tồn Từ phân tích trên, tác giả đề xuất mơ hình giám sát camera hình bên dưới: Hình Điện tốn đám mây (Cloud Computing) B Đề Xuất Hướng Giải Quyết với Mơ Hình Điện Tốn Phân Tán Qua phân tích thấy khó khăn việc triển khai hệ thống AI Cloud theo mơ hình điện tốn đám mây xử lý hoàn toàn máy chủ với số lượng camera lớn Để giảm bớt vấn đề này, thực thuật tốn học máy phức tạp máy chủ cục chí thiết bị - mơ hình điện tốn phân tán (Edge AI) Tiềm Edge AI lớn Theo báo cáo Tractica, lô hàng thiết bị Edge AI dự kiến tăng từ 161,4 triệu đơn vị năm 2018 lên 2,6 tỷ đơn vị vào năm 2025 Một ví dụ điển hình Edge AI loa thơng minh Một từ / cụm từ đánh thức (chẳng hạn Alexa) đào tạo mơ hình học máy lưu trữ cục loa Bất người nói thơng minh nghe thấy đánh thức từ / cụm từ, bắt đầu lắng nghe Nói cách khác, bắt đầu Hình Mơ hình giám sát camera đề xuất Mơ hình thực định thường xuyên quan trọng thời gian biên (edge) thiết bị Edge AI tham khảo đám mây nơi cần tính tốn chun sâu phân tích lịch sử Mơ hình mang lại ưu điểm sau: 125 - Khả thi triển khai diện rộng không phụ thuộc nhiều vào hạ tầng (mạng máy chủ) - Đáp ứng toán yêu cầu thời gian thực - Nâng cao bảo mật Cấu hình Cấu hình phần cứng thiết bị Edge AI cho hệ thống AI Cloud đề xuất sau: Hình Lượng tử hố mạng Bước – Biên dịch: Ánh xạ mơ hình AI tới tập lệnh luồng liệu hiệu cao Hình.7 Biên dịch tảng nhúng Kiến trúc AI Cloud cấu tạo năm khối chức mơ tả sau: Hình Cấu hình phần cứng thiết bị Edge AI Bộ xử lý CPU lõi, nhớ tối thiểu GB để cung cấp hiệu xử lý cao, kèm thành phần hỗ trợ xử lý AI GPU FPGA (Field Programmable Gate Array – Chuỗi cổng lập trình) đáp ứng tốc độ xử lý phân tích video thơng minh tối thiểu 15fps (frames-persecond- số khung hình hiển thị giây) với độ phân giải tối thiểu VGA 640x480 (Video Graphics Array – Độ phân giải khung hình) Chuẩn truyền thơng Ethernet 10/100 Base-Tx hay wifi để gửi liệu qua phân tích xử lý lên AI Cloud thông qua mạng internet Các chuẩn giao tiếp cổng USB, HDMI Hỗ trợ kết nối với thiết bị camera bên độ phân giải tối thiểu VGA 640x480 thông qua chuẩn RSTP/MJPEG (Motion Jpeg- định dạng video mà khung hình nén riêng biệt hình ảnh Jpeg) hay UVC Bộ nhớ lưu trữ liệu thẻ micro SD 128GB Vỏ tiêu chuẩn chống bụi, chống nước IP65 Nguồn cấp VDC 12 VDC (điện áp xoay chiều) - Mô-đun kiểm sốt truy cập: Vai trị mơ-đun thiết lập kết nối an toàn người dùng hệ thống Đây nơi hệ thống cấp quyền cụ thể xác định trước cho người dùng theo vai trị Nó đảm nhiệm nhiều nhiệm vụ liên quan đến an ninh mạng, quyền truy cập người dùng vào mạng dịch vụ, xác thực riêng tư từ người dùng đến thiết bị, quản lý hồ sơ người dùng - Mô-đun ngữ cảnh trung gian: Là trình quản lý thơng tin ngữ cảnh, đó, cho phép tạo, cập nhật xóa thực thể, cho phép ứng dụng khác (người tiêu dùng ngữ cảnh) truy xuất trạng thái cập nhật thực thể số kiện xảy Thành phần xem người điều hành thực trình giao tiếp môđun khác - Mô-đun lưu trữ kiện: Mô-đun lưu giữ liệu liên quan đến thơng tin ngữ cảnh, thơng tin báo động từ hệ thống thông báo đơn giản Bằng cách lưu thơng tin này, lấy để phân tích sau Thuật tốn Triển khai thuật tốn xử lý phân tích video thơng minh Edge AI: - Mô-đun lưu trữ video: Khối sử dụng để lưu trữ liệu video thơ, để người dùng có quyền truy cập vào video liên quan đến kiện phát / lưu trữ theo môđun xử lý Bước 1- Nén mạng: Khi loại bỏ noron xếp hạng thấp khỏi mạng, dẫn đến mạng nhỏ nhanh Sau nén, độ xác giảm mạng thường đào tạo nhiều để phục hồi Bước quan trọng để chạy mạng học sâu thiết bị nhúng - Mô-đun xử lý: Thực chức giao tiếp với mạng camera kết hợp Edge AI phân tích video thơng minh Hình Nén mạng Bước - Lượng tử hoá: : Bằng cách chuyển đổi trọng số từ 32-bit floating-point (dấu phẩy động) thành INT8/INT16 fixed-point (điểm cố định), giảm độ phức tạp tính tốn mà khơng làm độ xác dự đốn Mơ hình mạng fixed-point u cầu băng thơng nhớ hơn, cung cấp tốc độ nhanh hiệu suất lượng cao so với mơ hình floating-point Hình Kiến trúc tổng thể hệ thống giám sát video thơng minh điện tốn đám mây 126 III ỨNG DỤNG TRONG CẢNH BÁO VŨ KHÍ NĨNG Ứng dụng phát phát vũ khí nóng bao gồm: Súng cầm tay, dao găm, kiếm, lưỡi le, đao, mã tấu, Mơ hình hoạt động với điều kiện thông số cụ thể sau: A Thông Số Hoạt Động - Mơi trường hoạt động: Ngồi trời - Tồn xử lý phát mang vũ khí xử lý biên thiết bị Edge AI Dữ liệu gửi lên hệ thống AI Cloud bao gồm thông tin camera (Camera ID), loại vũ khí ảnh/ video ghi nhận lại kiện phục vụ lưu trữ tìm kiếm hiệu Hình.9 Các giai đoạn giám sát camera thông minh Bước “Video Capture” thu thập liệu, hình ảnh từ camera để truyền vào hệ thống xử lý Ở Bước “Image Enhace” để nâng cao chất lượng hình ảnh, sử dụng mơ hình trí tuệ nhân tạo nhằm tăng độ phân giải, làm rõ nét khung ảnh, tăng độ xác cho mơ hình nhận diện, xử lý hình ảnh đầu vào bị mờ, nhiễu, out-net Bước “Oject Detection” sử dụng mơ hình YOLO-V3 cho tốn nhận diện vật thể súng cầm tay Bước “Material Detection” nhận diện chất liệu vũ khí đầu vào từ chất liệu Bước “Retrieval” để kiểm tra, đánh giá lại mơ hình - Độ xác tối thiểu 95% từ sở liệu thu thập - Độ xác tối thiểu 80% với độ trễ tối đa giây B Nguyên Lý Hoạt Động Bước 1: Hệ thống lấy nguồn video đầu vào file video offline (Tập video trực tiếp) từ hệ thống AI Cloud Bước 2: Tách biệt đối tượng: Hệ thống đưa thuật toán xử lý để tách biệt đối tượng di chuyển tĩnh xác định đối tượng khác có liên quan đến Bước 3: Thêm siêu liệu: Những đối tượng bị tách khỏi từ bước đặt vào sở liệu, với siêu liệu, màu sắc, kích thước, ngày, thời gian Cùng với hệ thống tự động đính kèm đối tượng để thuận tiện cho việc báo cáo trả lời truy vấn từ người dùng Bước 4: Thêm tính năng: Hệ thống xử lý nhận diện đối tượng máy chủ xử lý tìm kiếm, hỗ trợ cho việc truy vấn Hình 10 Các giai đoạn phân tích video mơ hình Bước 5: Đưa kết quả: Hệ thống đưa kết đối tượng di chuyển vận động ngày khung hình Các kết hiển thị hệ thống máy trạm khai thác Mơ hình u cầu thiết bị Edge AI tảng nhúng có khả xử lý AI hiệu cao, hoạt động ổn định, lâu dài độc lập Thiết bị Edge AI kết nối với camera có sẵn (IP camera/USB camera) có khả phân tích video từ camera, chẳng hạn phát chuyển động, khuôn mặt, đối tượng chí nhận diện vài hành vi đơn giản, phân tích liệu hình ảnh điểm chụp giảm thiểu nhu cầu truyền liệu đến đám mây (các bước 1, 2, 3, 4, 5) Điều cho phép sử dụng hiệu băng thông truyền ghi, liệu gửi lên server siêu liệu (metadata), vector đặc trưng liệu đa phương tiện tham khảo chất lượng thấp, loại bỏ 90% liệu liệu vơ ích Một số camera thiết lập để quay video độ phân giải / tốc độ khung hình thấp hơn, sau tự động tăng độ phân giải tốc độ khung hình để quay video chất lượng cao kích hoạt kiện Phần xử lý thông minh mức cao (high-end) chạy đám mây (các bước 4, 5, 6) Tuỳ thuộc vào độ phức tạp thuật tốn nhận dạng mà bước 4, thực thiết bị Edge AI Cloud Các tính bản: - Tự động trích xuất đối tượng từ video gốc xây dựng lại hiệu xếp chồng chúng trở lại cảnh gốc Đồng thời hiển thị thời gian đối tượng khứ Kết phân đoạn video ngắn đáng kể giúp bảo toàn khả phân tích người xem - Độ xác tối thiểu 95% từ sở liệu thu thập độ xác tối thiểu 80% với độ trễ tối đa giây - Lựa chọn camera: tuỳ thuộc vào u cầu tốn mà thơng số camera khác Để đáp ứng ứng dụng trên, camera cần hoạt động trời cócác thơng số sau:Độ phân giải tối thiểu megapixel; Hỗ trợ WDR (Wide Dynamic Range); Hỗ trợ ánh sáng IR (Infrared Radiation - tia hồng ngoại) khoảng cách tối thiểu 20 mét; Hỗ trợ nén H264 H265; Hỗ trợ ống kính 2.8-12 mm; Chống bụi, chống nước IP67 (Ingress Protection – tiêu chuẩn chống nước) C Chi Tiết Mơ Hình Ứng dụng mơ hình phân tán tốn phát vũ khí nóng với bước chi tiết sau: 127 Hình 11 Luồng xử lý liệu thành phần hệ thống Tự động phân tích, cảnh báo kịp thời cho việc phát súng cầm tay từ camera giám sát Ứng dụng phát vũ khí: súng cầm tay chất liệu súng + Môi trường hoạt động: Ngoài trời + Toàn xử lý phát mang vũ khí xử lý biên thiết bị Edge AI Dữ liệu gửi lên hệ thống AI Cloud bao gồm thông tin camera (Camera ID), loại vũ khí ảnh/video ghi nhận lại kiện phục vụ lưu trữ tìm kiếm hiệu Hình 13 Layer mạng darknet-53 Các ảnh đưa vào mơ hình chuẩn hóa để chung kích thước phù hợp với input shape mơ hình sau gom lại thành batch đưa vào huấn luyện + Độ xác tối thiểu 95% từ CSDL thu thập Hiện YOLO hỗ trợ đầu vào 416x416 608x608 Mỗi đầu vào có thiết kế layers riêng phù hợp với shape input Sau qua layer convolutional hình dạng giảm dần theo cấp số nhân Cuối ta thu đồ đặc điểm có kích thước tương đối nhỏ để dự báo vật thể ô đồ thuộc tính + Độ xác tối thiểu 80% với độ trễ tối đa giây + Dự đoán chất liệu cấu tạo vật thể để đưa cảnh báo với độ xác 70%, thời gian chấp nhận tối đa giây Kích thước đồ thuộc tính phụ thuộc vào đầu vào Đối với đầu vào 416x416 đồ thuộc tính có kích thước 13x13, 26x26 52x52 Và đầu vào 608x608 tạo đồ thuộc tính 19x19, 38x38, 72x72 Hình 12 Sơ đồ kiến trúc mạng YOLO Hình 12 mơ tả sơ đồ kiến trúc mạng YOLO tác giả ứng dụng việc phân tích, xử lý, nhận diện hình ảnh vũ khí nóng (bước Object Detection hình 9) Kiến trúc YOLO bao gồm: Base Network (mạng sở) mạng tích chập làm nhiệm vụ trích xuất đặc trưng Phần phía sau Extra Layers (lớp bổ sung) áp dụng để phát vật thể đồ thuộc tính base network Base Network YOLO sử dụng chủ yếu lớp tích chập lớp kết nối đầy đủ (Fully-conntected Layer) Các kiến trúc YOLO đa dạng tùy biến thành phiên cho nhiều hình dáng đầu vào khác Thành phần Darknet Architechture (Kiến trúc mạng Darket) gọi base network có tác dụng trích suất đặc trưng Output base network đồ thuộc tính có kích thước 7x7x1024 sử dụng làm input cho Extra layers có tác dụng dự đốn nhãn tọa độ bao quanh vật thể Trong YOLO version tác giả áp dụng mạng trích chọn đặc trưng darknet-53 Mạng gồm 53 lớp tích chập kết nối liên tiếp, lớp theo sau Batch Normalization (kỹ thuật để đào tạo mạng nơ ron sâu, chuẩn hóa đầu vào thành layer cho mini-batch) Activation Leaky Relu (hàm kích hoạt) Để giảm kích thước đầu sau tầng tính chập, tác giả giảm kích thước mẫu lọc với kích thước Mẹo có tác dụng giảm thiểu số lượng tham số cho mơ hình Hình 14 Kiến trúc Output model YOLO Hình ảnh gốc đồ thuộc tính kích thước 13x13 Trên đồ thuộc tính lựa chọn hộp biên sở với kích thước khác Box 1, Box 2, Box cho tâm hộp biên sở trùng với Khi đầu YOLO vector tập trung bounding boxes Các thuộc tính bao quanh (bounding box) mơ tả dịng cuối hình 128 19 layers (mơ tả hình 16) với lớp Conv 3*3 1*1, sau tiến hành trích chọn đặc trưng đưa dự đoán KẾT LUẬN Bài báo đề xuất mơ hình phân tán xử lý liệu cho vấn đề sử dụng trí tuệ nhân tạo nói chung với liệu từ camera giám sát nói riêng Nhận diện đối tượng vũ khí nóng mơ hình điện tốn phân tán nâng cao hiệu q trình nhận dạng tối ưu hóa hệ thống, giúp bảo vệ riêng tư an toàn liệu thu thập qua camera giám sát, đặc biệt tạo khả giám sát với số lượng lớn camera với chi phí đầu tư ban đầu thấp, hạ tầng đầu tư với thiết bị cấu hình thấp giá rẻ triển khai trước Hình.15 Non-max Suppression Thuật tốn YOLO dự báo nhiều ô bao quanh ảnh nên có vị trí gần nhau, khả khung hình bị chồng lên cao Trong trường hợp YOLO cần đến Non-max Suppression để giảm bớt số lượng khung hình sinh cách đáng kể Từ ô bao quan ban đầu bao quanh xe oto giảm xuống cịn bao quanh cuối LỜI CẢM ƠN Trong báo này, tác giả xin gửi lời cảm ơn đến quỹ VINIF (Vingroup Inovation Foundation) đồng hành cấp học bổng cho tác giả thực nghiên cứu thời gian học thạc sỹ đại học công nghệ, đại học Quốc gia Hà Nội Các bước Non-max Suppression: B1: Đầu tiên tìm cách giảm bớt số lượng bao quanh cách lọc bỏ tồn bao quanh bcó xác suất chứa vật thể nhỏ ngưỡng threshold đó, thường 0.5 TÀI LIỆU THAM KHẢO [1] B2: Đối với ô bao quanh giao nhau, Non-max Suppression lựa chọn ô bao quanh có xác xuất chứa vật thể lớn Sau tính tốn số giao thoa IoU với bao quanh cịn lại Nếu số lớn ngưỡng threshold điều chứng tỏ ô bao quanh đè lên cao Ta xóa bao quanh có có xác xuất thấp giữ lại bao quanh có xác xuất cao Cuối cùng, ta thu ô bao quanh cho vật thể [2] [3] [4] [5] [6] [7] Hình 16 Cấu trúc mơ hình đề xuất để nhận diện chất liệu Ở bước nhận dạng chất liệu hình 9, tác giả đề xuất cấu trúc mơ hình đề xuất để nhận diện chất liệu sử dụng VGG- 129 TS Doan Trung Son, Nguyen Thi Khanh Tram, Ứng dụng mơ hình YOLO phát súng cầm tay, Hội thảo công nghệ thông tin ứng dụng lần thứ (CITA2020), isbn: 978-604-84-5517-0, trang152157, Nhà xuất Danang, 2020 Nguyễn Thị Khánh Trâm, Đoàn Trung Sơn, Nhận diện dao sử dụng mơ hình YOLO-V3, Hội thảo công nghệ thông tin ứng dụng lần thứ 10, 2021, isbn: Nguyễn Thị Khánh Trâm, Đoàn Trung Sơn, Tiền xử lý liệu huấn luyện mô hình học YOLO-V3 tốn nhận diện dao, The Information and Communication Technology Conference (ICT), 2021 Nguyễn Thị Khánh Trâm, TS Đoàn Trung Sơn, GS Nguyễn Thanh Thuỷ, Transfer Learning in Hot Weapon Detection, Hội thảo công nghệ thông tin ứng dụng lần thứ 11, 2022 Karimaa, A Video surveillance in the cloud: Dependability analysisProceedings of the the 4th International Conference on Dependability (DEPEND '11)20119295 Neal, D., Rahman, S.Video surveillance in the cloud?The International Journal of Cryptography and Information Security201223 Anwar Hossain, M Analyzing the suitability of cloudbased multimedia surveillance systemsProceedings of the 15th IEEE International Conference on High Performance Computing and Communications (HPCC '13)2013 ... 38x38, 72x72 Hình 12 Sơ đồ kiến trúc mạng YOLO Hình 12 mô tả sơ đồ kiến trúc mạng YOLO tác giả ứng dụng việc phân tích, xử lý, nhận diện hình ảnh vũ khí nóng (bước Object Detection hình 9) Kiến... chuẩn chống nước) C Chi Tiết Mơ Hình Ứng dụng mơ hình phân tán tốn phát vũ khí nóng với bước chi tiết sau: 127 Hình 11 Luồng xử lý liệu thành phần hệ thống Tự động phân tích, cảnh báo kịp thời cho... nhân tạo nói chung với liệu từ camera giám sát nói riêng Nhận diện đối tượng vũ khí nóng mơ hình điện tốn phân tán nâng cao hiệu trình nhận dạng tối ưu hóa hệ thống, giúp bảo vệ riêng tư an toàn