Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

45 591 13

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

1 / 45 trang

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề	Ứng Dụng YOLO Trong Nhận Diện Đối Tượng Từ Hình Ảnh
Tác giả	Phùng Văn Tuyên
Người hướng dẫn	TS. Ngô Thị Hiền
Trường học	Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành	Toán Tin
Thể loại	đồ án
Năm xuất bản	2021
Thành phố	Hà Nội

Định dạng
Số trang	45
Dung lượng	3,57 MB

Nội dung

Trong thời đại hiện nay, xã hội chúng ta bước vào cuộc cách mạng công nghiệp 4.0, có cốt lõi là công nghệ thông tin và các thiết bị máy móc thông minh để phục vụ nhu cầu đời sống con người và tăng năng suất lao động. Để các thiết bị máy móc này trở nên thật sự thông minh thì con người chúng ta cần phải dạy cho chúng biết nhận biết và xử lí các sự vật, sự việc trong thực tế để đạt được mục đích trong công việc. Từ đó, chúng ta cần phát triển các chương trình có thể giúp máy tính nhận diện được đối tượng ngoài xã hội đời thực. Thị giác máy tính (Computer Vision) là một trong những lĩnh vực hot nhất của khoa học máy tính và nghiên cứu trí tuệ. Mang lại rất nhiều ứng dụng trong đời sống : xử lí hình ảnh, trình đọc tự động, phát hiện các đối tượng, nhận diện khuôn mặt, xe tự lái…. Trong đó, Nhận diện đối tượng (Object Detection) là một đề tài rất được quan tâm hiện nay bởi khả năng ứng dụng cao,dữ liệu dễ chuẩn bị và kết quả ứng dụng thì cực kì nhiều. Vì vậy,em quyết định làm đồ án về Object Detection là “ Ứng dụng YOLO trong nhận diện đối tượng từ hinh ảnh ”.Em chọn sử dụng mô hình của Object detection ở đây là YOLO-“You only look once” tốc độ thực thi rất nhanh, đạt được việc nhận diện đối tượng trong thời gian thực.

Ngày đăng: 21/11/2021, 09:03

HÌNH ẢNH LIÊN QUAN

Khi con người nhìn vào những hình ảnh sẽ nhận thấy các sự vật, sự việc trong bức ảnh như: con người, tòa nhà, các hành động … nhìn vào nhiều chi tiết khác nhau sẽ suy ra nhiều thông tin hơn từ hình ảnh.Nhưng đối với máy tính, tất cả hình ảnh đều được coi - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — hi con người nhìn vào những hình ảnh sẽ nhận thấy các sự vật, sự việc trong bức ảnh như: con người, tòa nhà, các hành động … nhìn vào nhiều chi tiết khác nhau sẽ suy ra nhiều thông tin hơn từ hình ảnh.Nhưng đối với máy tính, tất cả hình ảnh đều được coi (Trang 5)

Để khám phá khái niệm Object Detection, chúng ta bắt đầu với phân loại hình ảnh qua các mức độ tăng dần: - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — kh ám phá khái niệm Object Detection, chúng ta bắt đầu với phân loại hình ảnh qua các mức độ tăng dần: (Trang 6)

Mô hình tổng quát Neural Netword - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — h ình tổng quát Neural Netword (Trang 9)

Mô hình ANN (trái) và CNN (phải) - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — h ình ANN (trái) và CNN (phải) (Trang 15)

Tích chập là lớp đầu tiên để trích xuất các tính năng từ hình ảnh đầu vào. Tích chập duy trì mối quan hệ giữa các pixel bằng cách tìm hiểu các tính - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — ch chập là lớp đầu tiên để trích xuất các tính năng từ hình ảnh đầu vào. Tích chập duy trì mối quan hệ giữa các pixel bằng cách tìm hiểu các tính (Trang 16)

V D: Xét ma trận hình ảnh đầu vào 5x5 có giá trị pixel là và 1.Ma trận filter 3x3 như hình sau đây : - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — t ma trận hình ảnh đầu vào 5x5 có giá trị pixel là và 1.Ma trận filter 3x3 như hình sau đây : (Trang 17)

năng hình ảnh bằng cách sử dụng cá cô vương nhỏ của dữ liệu đầu vào. Nó là 1 phép toán có 2 đầu vào như ma trận hình ảnh và 1 bộ lọc hoặc hạt nhân. - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — n ăng hình ảnh bằng cách sử dụng cá cô vương nhỏ của dữ liệu đầu vào. Nó là 1 phép toán có 2 đầu vào như ma trận hình ảnh và 1 bộ lọc hoặc hạt nhân (Trang 17)

Pooling layer sẽ giảm bớt số lượng tham số khi hình ảnh quá lớn, thường được dùng giữa các convolutional layer, để giảm kích thước dữ liệu nhưng vẫn giữ được các thuộc tính quan trọng - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — **ooling** layer sẽ giảm bớt số lượng tham số khi hình ảnh quá lớn, thường được dùng giữa các convolutional layer, để giảm kích thước dữ liệu nhưng vẫn giữ được các thuộc tính quan trọng (Trang 19)

Trong mô hình CNN có 2 điều cần quan tâm là: tính bất biến (Location Invariance) và tính kết hợp (Compositionality).Với cùng một đối tượng,nếu được chiếu theo các góc độ khác nhau (translation,rotation,sacling) thì độ chính xác sẽ bị ảnh hưởng đáng kể - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — **rong** mô hình CNN có 2 điều cần quan tâm là: tính bất biến (Location Invariance) và tính kết hợp (Compositionality).Với cùng một đối tượng,nếu được chiếu theo các góc độ khác nhau (translation,rotation,sacling) thì độ chính xác sẽ bị ảnh hưởng đáng kể (Trang 22)

Được tạo ra bởi Yann Lecun,để nhận diện chữ viết tay. Mô hình này là cơ sở thiết kế cho các mạng sau này. - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — c tạo ra bởi Yann Lecun,để nhận diện chữ viết tay. Mô hình này là cơ sở thiết kế cho các mạng sau này (Trang 24)

Kiến trúc các mạng CNN tiêu biểu - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — i ến trúc các mạng CNN tiêu biểu (Trang 24)

Hình thành xu hướng cải thiện độ chính xác của các mạng học sâu thông qua gia tăng độ sâu của chúng. - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — **Hình th** ành xu hướng cải thiện độ chính xác của các mạng học sâu thông qua gia tăng độ sâu của chúng (Trang 25)

Xét hình trê n: Thành phần DarkNet Architecture được gọi là base network gồm nhiều convolution layers có tác dụng trích xuất feature - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — t hình trê n: Thành phần DarkNet Architecture được gọi là base network gồm nhiều convolution layers có tác dụng trích xuất feature (Trang 28)

Đầu tiên, hình ảnh đầu vào sẽ được chia thành một lưới SxS ô (grid of cells). - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — u tiên, hình ảnh đầu vào sẽ được chia thành một lưới SxS ô (grid of cells) (Trang 29)

YOLO chia hình ảnh thành mạng lưới 7x7 ô - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — **chia** hình ảnh thành mạng lưới 7x7 ô (Trang 29)

cho mọi vị trí trong hình ảnh đầu vào để cho phép lấy mẫu ngược từ các lớp trước để có được thông tin chi tiết và thông tin ngữ nghĩa đầy đủ và cải thiện chất lượng đầu ra. - Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh — **cho** mọi vị trí trong hình ảnh đầu vào để cho phép lấy mẫu ngược từ các lớp trước để có được thông tin chi tiết và thông tin ngữ nghĩa đầy đủ và cải thiện chất lượng đầu ra (Trang 39)

TỪ KHÓA LIÊN QUAN

Ứng dụng YOLO trong nhận diện đối tượng từ hình ảnh

Cách hoạt động của YOLO