Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

45 534 12
Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Trong thời đại hiện nay, xã hội chúng ta bước vào cuộc cách mạng công nghiệp 4.0, có cốt lõi là công nghệ thông tin và các thiết bị máy móc thông minh để phục vụ nhu cầu đời sống con người và tăng năng suất lao động. Để các thiết bị máy móc này trở nên thật sự thông minh thì con người chúng ta cần phải dạy cho chúng biết nhận biết và xử lí các sự vật, sự việc trong thực tế để đạt được mục đích trong công việc. Từ đó, chúng ta cần phát triển các chương trình có thể giúp máy tính nhận diện được đối tượng ngoài xã hội đời thực. Thị giác máy tính (Computer Vision) là một trong những lĩnh vực hot nhất của khoa học máy tính và nghiên cứu trí tuệ. Mang lại rất nhiều ứng dụng trong đời sống : xử lí hình ảnh, trình đọc tự động, phát hiện các đối tượng, nhận diện khuôn mặt, xe tự lái…. Trong đó, Nhận diện đối tượng (Object Detection) là một đề tài rất được quan tâm hiện nay bởi khả năng ứng dụng cao,dữ liệu dễ chuẩn bị và kết quả ứng dụng thì cực kì nhiều. Vì vậy,em quyết định làm đồ án về Object Detection là “ Ứng dụng YOLO trong nhận diện đối tượng từ hinh ảnh ”.Em chọn sử dụng mô hình của Object detection ở đây là YOLO-“You only look once” tốc độ thực thi rất nhanh, đạt được việc nhận diện đối tượng trong thời gian thực.

Ngày đăng: 21/11/2021, 09:03

Hình ảnh liên quan

Khi con người nhìn vào những hình ảnh sẽ nhận thấy các sự vật, sự việc trong bức ảnh như: con người, tòa nhà, các hành động … nhìn vào nhiều chi tiết khác nhau sẽ suy ra nhiều thông tin hơn từ hình ảnh.Nhưng đối với máy tính, tất cả hình ảnh đều được coi  - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

hi.

con người nhìn vào những hình ảnh sẽ nhận thấy các sự vật, sự việc trong bức ảnh như: con người, tòa nhà, các hành động … nhìn vào nhiều chi tiết khác nhau sẽ suy ra nhiều thông tin hơn từ hình ảnh.Nhưng đối với máy tính, tất cả hình ảnh đều được coi Xem tại trang 5 của tài liệu.
Để khám phá khái niệm Object Detection, chúng ta bắt đầu với phân loại hình ảnh qua các mức độ tăng dần: - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

kh.

ám phá khái niệm Object Detection, chúng ta bắt đầu với phân loại hình ảnh qua các mức độ tăng dần: Xem tại trang 6 của tài liệu.
Mô hình tổng quát Neural Netword - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

h.

ình tổng quát Neural Netword Xem tại trang 9 của tài liệu.
Mô hình ANN (trái) và CNN (phải) - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

h.

ình ANN (trái) và CNN (phải) Xem tại trang 15 của tài liệu.
Tích chập là lớp đầu tiên để trích xuất các tính năng từ hình ảnh đầu vào. Tích chập  duy trì mối quan  hệ giữa các  pixel bằng  cách  tìm  hiểu các  tính - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

ch.

chập là lớp đầu tiên để trích xuất các tính năng từ hình ảnh đầu vào. Tích chập duy trì mối quan hệ giữa các pixel bằng cách tìm hiểu các tính Xem tại trang 16 của tài liệu.
V D: Xét ma trận hình ảnh đầu vào 5x5 có giá trị pixel là và 1.Ma trận filter 3x3 như hình sau đây : - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

t.

ma trận hình ảnh đầu vào 5x5 có giá trị pixel là và 1.Ma trận filter 3x3 như hình sau đây : Xem tại trang 17 của tài liệu.
năng hình ảnh bằng cách sử dụng cá cô vương nhỏ của dữ liệu đầu vào. Nó là 1 phép toán có 2 đầu vào như ma trận hình ảnh và 1 bộ lọc hoặc hạt nhân. - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

n.

ăng hình ảnh bằng cách sử dụng cá cô vương nhỏ của dữ liệu đầu vào. Nó là 1 phép toán có 2 đầu vào như ma trận hình ảnh và 1 bộ lọc hoặc hạt nhân Xem tại trang 17 của tài liệu.
Pooling layer sẽ giảm bớt số lượng tham số khi hình ảnh quá lớn, thường được dùng giữa các convolutional layer, để giảm kích thước dữ liệu nhưng vẫn giữ được các thuộc tính quan trọng - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

ooling.

layer sẽ giảm bớt số lượng tham số khi hình ảnh quá lớn, thường được dùng giữa các convolutional layer, để giảm kích thước dữ liệu nhưng vẫn giữ được các thuộc tính quan trọng Xem tại trang 19 của tài liệu.
Trong mô hình CNN có 2 điều cần quan tâm là: tính bất biến (Location Invariance) và tính kết hợp (Compositionality).Với cùng một đối tượng,nếu được chiếu theo các góc độ khác nhau (translation,rotation,sacling) thì độ chính xác sẽ bị ảnh hưởng đáng kể - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

rong.

mô hình CNN có 2 điều cần quan tâm là: tính bất biến (Location Invariance) và tính kết hợp (Compositionality).Với cùng một đối tượng,nếu được chiếu theo các góc độ khác nhau (translation,rotation,sacling) thì độ chính xác sẽ bị ảnh hưởng đáng kể Xem tại trang 22 của tài liệu.
Được tạo ra bởi Yann Lecun,để nhận diện chữ viết tay. Mô hình này là cơ sở thiết kế cho các mạng sau này. - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

c.

tạo ra bởi Yann Lecun,để nhận diện chữ viết tay. Mô hình này là cơ sở thiết kế cho các mạng sau này Xem tại trang 24 của tài liệu.
Kiến trúc các mạng CNN tiêu biểu - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

i.

ến trúc các mạng CNN tiêu biểu Xem tại trang 24 của tài liệu.
Hình thành xu hướng cải thiện độ chính xác của các mạng học sâu thông qua gia tăng độ sâu của chúng. - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

Hình th.

ành xu hướng cải thiện độ chính xác của các mạng học sâu thông qua gia tăng độ sâu của chúng Xem tại trang 25 của tài liệu.
Xét hình trê n: Thành phần DarkNet Architecture được gọi là base network gồm nhiều convolution layers có tác dụng trích xuất feature - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

t.

hình trê n: Thành phần DarkNet Architecture được gọi là base network gồm nhiều convolution layers có tác dụng trích xuất feature Xem tại trang 28 của tài liệu.
Đầu tiên, hình ảnh đầu vào sẽ được chia thành một lưới SxS ô (grid of cells). - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

u.

tiên, hình ảnh đầu vào sẽ được chia thành một lưới SxS ô (grid of cells) Xem tại trang 29 của tài liệu.
YOLO chia hình ảnh thành mạng lưới 7x7 ô - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

chia.

hình ảnh thành mạng lưới 7x7 ô Xem tại trang 29 của tài liệu.
cho mọi vị trí trong hình ảnh đầu vào để cho phép lấy mẫu ngược từ các lớp trước để có được thông tin chi tiết và thông tin ngữ nghĩa đầy đủ và cải thiện chất lượng đầu ra. - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

cho.

mọi vị trí trong hình ảnh đầu vào để cho phép lấy mẫu ngược từ các lớp trước để có được thông tin chi tiết và thông tin ngữ nghĩa đầy đủ và cải thiện chất lượng đầu ra Xem tại trang 39 của tài liệu.

Mục lục

  • TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC

    • Chuyên ngành: Toán Tin Chuyên sâu: Tin học

    • Hà Nội, 7-2021

      • NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN

      • LỜI NÓI ĐẦU

      • Chương 1: Kiến thức cơ sở

        • 1.1. Bài toán nhận diện đối tượng

        • 1.2. Nhận diện đối tượng

        • 1.3. Mạng Nơ-ron nhân tạo (Artificial Neural Network)

          • ANN là gì ?

          • Kiến trúc của Neural Network

          • Deep Learning

            • Deep Learning.

            • Feed Forward và Back Propagation

            • 1.4. Mạng Nơ-ron tích chập (Convolutional Neural Network)

              • CNN là gì ?

              • Tổng quan về kiến trúc của CNN

              • Feature

              • Convolutional là gì ?

              • Các layer cơ bản trong CNN

                • Convolutional Layer

                • ReLU Layer

                • Pooling Layer

                • Fully Connected Layer

                • Cấu trúc của CNN

                • Chọn tham số cho CNN

                • Kiến trúc các mạng CNN tiêu biểu

                  • LeNet-5 (1998)

Tài liệu cùng người dùng

Tài liệu liên quan