1. Trang chủ
  2. » Công Nghệ Thông Tin

Truy vấn video dựa vào nội dung bằng phương pháp Deep Neural Networks

9 8 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 9
Dung lượng 1,04 MB

Nội dung

Bài viết đề xuất sử dụng DNN biểu diễn các thuộc tính thuộc về nội dung cho các hình ảnh trong video. Những thuộc tính rút trích được sẽ làm tiền đề cho việc lập chỉ mục và tìm kiếm cho các hệ thống truy vấn video.

Ngày đăng: 26/05/2022, 09:13

HÌNH ẢNH LIÊN QUAN

Hình 1. Mô hình Deep Neural Network [5] - Truy vấn video dựa vào nội dung bằng phương pháp Deep Neural Networks
Hình 1. Mô hình Deep Neural Network [5] (Trang 2)
Đây là kiến trúc mô hình cải thiện về cả tốc độ huấn luyện và phát hiện được đề xuất bởi Shaoqing Ren và các cộng  sự  tại  Microsoft  Research  trong  bài  báo  năm  2016  có  tiêu  đề  Faster  R-CNN: Towards Real-Time Object  Detection with Region Propo - Truy vấn video dựa vào nội dung bằng phương pháp Deep Neural Networks
y là kiến trúc mô hình cải thiện về cả tốc độ huấn luyện và phát hiện được đề xuất bởi Shaoqing Ren và các cộng sự tại Microsoft Research trong bài báo năm 2016 có tiêu đề Faster R-CNN: Towards Real-Time Object Detection with Region Propo (Trang 2)
Hình 3. Mô hình tổng quát phương pháp đề xuất - Truy vấn video dựa vào nội dung bằng phương pháp Deep Neural Networks
Hình 3. Mô hình tổng quát phương pháp đề xuất (Trang 3)
III. MÔ HÌNH ĐỀ XUẤT - Truy vấn video dựa vào nội dung bằng phương pháp Deep Neural Networks
III. MÔ HÌNH ĐỀ XUẤT (Trang 3)
c) Huấn luyện mô hình: Tập dữ liệu sau khi rút trích đặc trưng sẽ được huấn luyện trên ba mô hình mạng SSD - Truy vấn video dựa vào nội dung bằng phương pháp Deep Neural Networks
c Huấn luyện mô hình: Tập dữ liệu sau khi rút trích đặc trưng sẽ được huấn luyện trên ba mô hình mạng SSD (Trang 4)
Mô hình mạng rate size classes Scales - Truy vấn video dựa vào nội dung bằng phương pháp Deep Neural Networks
h ình mạng rate size classes Scales (Trang 5)
• Kịch bản 2: Chúng tôi sử dụng cho ba mô hình Faster R-CNN Resnet, Faster R-CNN InceptionResnet v2 và SSD MobileNet v2 nhưng thay đổi max pooling từ kích thước mặc định 3×3 sang kích thước 2×2 với số bước  học là 100.000 bước - Truy vấn video dựa vào nội dung bằng phương pháp Deep Neural Networks
ch bản 2: Chúng tôi sử dụng cho ba mô hình Faster R-CNN Resnet, Faster R-CNN InceptionResnet v2 và SSD MobileNet v2 nhưng thay đổi max pooling từ kích thước mặc định 3×3 sang kích thước 2×2 với số bước học là 100.000 bước (Trang 5)
Hình 10. Biểu đồ so sánh độ chính xác Hình 11. Biểu đồ so sánh thời gian huấn luyện - Truy vấn video dựa vào nội dung bằng phương pháp Deep Neural Networks
Hình 10. Biểu đồ so sánh độ chính xác Hình 11. Biểu đồ so sánh thời gian huấn luyện (Trang 8)
nhưng có độ chính xác chấp nhận được. Sau khi tăng số bước học thì độ đo mAP của mô hình Faster R-CNN Inception Resnet v2 cũng đã tăng lên và đạt cao nhất trong 3 mô hình - Truy vấn video dựa vào nội dung bằng phương pháp Deep Neural Networks
nh ưng có độ chính xác chấp nhận được. Sau khi tăng số bước học thì độ đo mAP của mô hình Faster R-CNN Inception Resnet v2 cũng đã tăng lên và đạt cao nhất trong 3 mô hình (Trang 8)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w