1. Trang chủ
  2. » Giáo Dục - Đào Tạo

đề tài nghiên cứu tổng quan về its và ứng dụng cho bài toán phát hiện biển số xe

39 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên Cứu Tổng Quan Về Its Và Ứng Dụng Cho Bài Toán Phát Hiện Biển Số Xe
Tác giả Nguyễn Thuỳ Linh, Nguyễn Đức Long, Nguyễn Trọng Giáp, Dương Thị Lan Phương, Lê Thị Nụ
Người hướng dẫn TS. Vũ Đình Minh
Trường học Trường Đại Học Công Nghiệp Hà Nội
Chuyên ngành Hệ Thống Thông Minh
Thể loại Tiểu Luận
Năm xuất bản 2024
Thành phố Hà Nội
Định dạng
Số trang 39
Dung lượng 1,65 MB

Cấu trúc

  • CHƯƠNG 1: TỔNG QUAN VỀ HỆ THỐNG THÔNG MINH (5)
    • 1.1. Hệ thống thông minh (5)
      • 1.1.1. Hệ thống thông minh là gì? (5)
      • 1.1.2. Phân loại hệ thống thông minh (5)
      • 1.1.3. Các thành phần của hệ chuyên gia (6)
    • 1.2. Khai phá dữ liệu (7)
      • 1.2.1. Khái niệm (7)
  • CHƯƠNG 2: NGHIÊN CỨU TỔNG QUAN VỀ ITS (HỆ THỐNG GIAO THÔNG THÔNG MINH) (8)
    • 2.1. Tổng quan về ITS (8)
      • 2.1.1. ITS là gì? (8)
      • 2.1.2. Tiêu thức phân loại cách tiếp cận hệ thống ITS (9)
    • 2.2. Cấu trúc của hệ thống giao thông thông minh (9)
      • 2.2.1. Hạ tầng giao thông thông minh (Intelligent infrastructure) (10)
      • 2.2.2. Phương tiện thông minh(Intelligent Vehicles) (15)
      • 2.2.3. Hệ thống quản lý làn đường (17)
  • CHƯƠNG 3: XÂY DỰNG HỆ THỐNG VÀ THỰC NGHIỆM (19)
    • 3.1. Sơ đồ hệ thống (19)
    • 3.2. Thuật toán được sử dụng (19)
      • 3.2.1. YOLO (19)
      • 3.2.2. KIẾN TRÚC MẠNG WPOD CHO BÀI TOÁN PHÁT HIỆN BIỂN SỐ XE (32)
      • 3.2.3. CRNN NHẬN DIỆN BIỂN SỐ (34)
    • 3.3. Kết quả thực nghiệm (37)
  • KẾT LUẬN (38)
  • TÀI LIỆU THAM KHẢO (39)

Nội dung

Phân loại hệ thống thông minh Hệ thống thông minh thường được chia thành 3 loại chính: Các hệ dựa trên tri thức: thường sử dụng các kĩ thuật như suy luận dựa trên luật, suy luận dựa trên

TỔNG QUAN VỀ HỆ THỐNG THÔNG MINH

Hệ thống thông minh

1.1.1 Hệ thống thông minh là gì?

Hệ thống thông minh là các hệ thống thông tin thuộc lĩnh vực trí tuệ nhân tạo

Hệ thống thông tin là hệ thống gồm nhiều thành phần, các thành phần tương tác với nhau để đạt được mục đích lưu trữ, xử lý, truyền thông tin Trí tuệ nhân tạo; là khoa học về sự bắt chước khả năng trí tuệ con người của máy tính

Như vậy có thể hiểu đơn giản Hệ thống thông minh là các phần mềm máy tính được xây dựng có khả năng bắt chước hoặc mở rộng được các khả năng trí tuệ của con người như: học tập, suy luận, nhận dạng hình ảnh, nhận thức, sáng tạo

1.1.2 Phân loại hệ thống thông minh

Hệ thống thông minh thường được chia thành 3 loại chính:

Các hệ dựa trên tri thức: thường sử dụng các kĩ thuật như suy luận dựa trên luật, suy luận dựa trên mô hình, suy luận dựa trên khung, suy luận dựa trên trường hợp

VD cho hệ dựa trên tri thức: Hệ thống chấm công bằng nhận dạng khuôn mặt, hệ thống nhận dạng biển số xe

Hệ tính toán thông minh: là giải pháp vượt qua khó khăn bằng cách cho máy tính tự xây dựng mô hình dựa trên quan sát và kinh nghiệm như hệ nơ ron nhân tạo, giải thuật tiến hoá, logic mờ VD: Hệ thống dự báo giả cổ phiếu, hệ thống dự báo thời tiết, Các hệ lai: là hệ tích hợp nhiều kỹ thuật AI khác nhau và có thể tích hợp với cả phần mềm truyền thống để tận dụng ưu điểm từ nhiều kỹ thuật giúp giải quyết bài toán hiệu quả nhất VD: Hệ thống điều khiển lái xe tự động

1.1.3 Các thành phần của hệ chuyên gia

Hệ chuyên gia là hệ thống thông tin với các chương trình máy tính sử dụng tri thức và các thủ tục suy luận để giải quyết các bài toán tương đối khó đòi hỏi sự trợ giúp của chuyên gia trong 1 lĩnh vực cụ thể Các thành phần hệ chuyên gia cơ bản:

Hình 1.1: Quá trình khai phá tri thức

Thành phần chính của Hệ chuyên gia

Cơ sở tri thức là nơi lưu trữ tri thức chuyên gia, những tri thức này được mã hoá và biểu diễn bằng ngôn ngữ, cấu trúc đặc thù mà chương trình máy tính có thể đọc hiểu

Mô tơ suy diễn thực hiện suy luận dựa trên tri thức chuyên gia lưu trữ trong Cơ sở tri thức và những sự kiện được cung cấp bởi người dùng thông qua hệ thống giao tiếp Từ đó nó đưa ra kết quả trả về cho người dùng qua hệ thống giao tiếp Đặc điểm quan trọng của các thành phần này đó là Cơ sở tri thức tách biệt độc lập với Mô tơ suy diễn nhằm tạo điều kiện cho biểu diễn tri thức tự nhiên hơn, có thể thử nghiệm nhiều chế độ điều khiển, áp dụng các phương pháp suy diễn trên cùng 1 tập tri thức để tìm phương pháp tối ưu, chính xác nhất

Ngoài các thành phần chính trên, 1 hệ chuyên gia thường có thêm các thành phần mở rộng gồm:

Mô đun tiếp nhận tri thức: giúp bổ sung, cập nhật tri thức cho cơ sở tri thức

Mô đun giải thích: Cung cấp cơ chế giải thích, nâng cao chất lượng phương pháp suy diễn

Khai phá dữ liệu

Khai phá dữ liệu (data mining) được định nghĩa như là một quá trình chắt lọc hay khai phá tri thức từ một lượng lớn dữ liệu Một ví dụ hay được sử dụng là là việc khai thác vàng từ đá và cát, Data Mining được ví như công việc "Đãi cát tìm vàng" trong một tập hợp lớn các dữ liệu cho trước Thuật ngữ Data Mining ám chỉ việc tìm kiếm một tập hợp nhỏ có giá trị từ một số lượng lớn các dữ liệu thô Có nhiều thuật ngữ hiện được dùng cũng có nghĩa tương tự với từ Datamining như Knowledge Mining (khai phá tri thức), knowledge extraction (chắt lọc tri thức), data/pattern analysis (phân tích dữ liệu/mẫu), data archaeology (khảo cổ dữ liệu), data dredging (nạo vét dữ liệu),

Định nghĩa: Khai phá dữ liệu (data mining) hay Khám phá tri thức từ dữ liệu (knowledge discovery from data) là việc trích rút ra được các mẫu hoặc tri thức quan trọng (không tầm thường, ẩn, chưa được biết đến và có thể hữu ích) thừ một lượng dữ liệu (rất) lớn

- Khám phá tri thức trong các cơ sở dữ liệu (Knowledge discovery in databases KDD)

- Trích rút tri thức (knowledge extraction)

- Phân tích mẫu/dữ liệu (data/pattern analysis)

NGHIÊN CỨU TỔNG QUAN VỀ ITS (HỆ THỐNG GIAO THÔNG THÔNG MINH)

Tổng quan về ITS

Hiện nay vẫn chưa có định nghĩa thống nhất về ITS, định nghĩa của Mỹ (Sổ tay ITS 2000) là: ITS do một loạt các công nghệ tiên tiến ứng dụng trong mạng giao thôngvà phương tiện vận hành mà hợp thành các dịch vụ cung cấp cho người tham gia giaothông, còn có tên “thông tin giao thông”, công nghệ ITS cơ sở dựa trên 3 hạt nhân đặctrưng lớn thông tin, truyền tin và tập hợp Hạt nhân của ITS là thu thập thô ng tin, xử lý, tập hợp cùng quá trình cung cấp thông tin Bất luận theo phương diện cung cấp thông tin tức thời của mạng giao thông hay theo phương diện qui hoạch truyền tin,công nghệ ITS đều giúp cho người quản lý, vận hành, tham gia giao thông có cácthông tin cần thiết trong quá trình vận hành, tăng tính nhịp nhàng và đưa ra các quyết sách thêm linh hoạt, hiệu quả

Hệ thống giao thông thông minh là hệ thống giao thông vận dụng và tổng hợp các thành quả khoa học, công nghệ tiên tiến vào giao thông vận tải đặc biệt là công nghệ điện tử, thông tin, truyền thông, khoa học quảnlý… tăng cường khả năng liên kết giữa 3 yếu tố: con người, phương tiện và đường xátạo thành một hệ thống giao thông có trí tuệ, hiệu quả, an toàn, chính xác và tức thời”

Có thể hiểu ITS là việc thông qua nghiên cứu mô hình lý luận cơ sở then chốt, từ đó đưa công nghệ thông tin, truyền tin, điều khiển điện tử và tổ hợp hệ thống…ứng dụng trong hệ thống giao thông vận tải, xây dựng hệ thống quản lý giao thông hiệu quả, chính xác, tức thời, phát huy tác dụng trong một phạm vi lớn ITS sử dụng khoa học kỹ thuật hiện đại trong việc thiết lập mối quan hệ thông minh giữa không gian người lái, xe và đường Nhờ sự hỗ trợ hệ thống thông minh, xe cộ sẽ an toàn khi vận hành, người lái thuận lợi, dựa vào biện pháp thông minh hóa, trạng thái vận hành xe được điều chỉnh tối ưu, bảo vệ người, xe, đường và tạo thành thể thống nhất Do đó nâng cao cực đại đồng thời hiệu suất vận tải, đảm bảo an toàn giao thông, cải thiện chất lượng môi trường, nâng cao hiệu quả sử dụng tài nguyên

Hệ thống giao thông thông minh (ITS) là hệ thống giao thông được áp dụng hoàn hảo công nghệ tiên tiến và phần mềm máy tính vào các thiết bị kiểm soát, chỉ dẫn, điều khiển, thông tin liên lạc để nâng cao năng lực giao thông trên các tuyến đường cũng như trong các loại hình vận tải Sự định nghĩa đơn giản này đã và đang có những thay đổi tốt trong công tác vận hành, quản lý hệ thống giao thông nói chung và giao thông đô thị nói riêng ở một số nước trên thế giới Những thành tựu và kinh nghiệm quý báu đó rất đáng để chúng ta nghiên cứu, học tập, tham quan, vận dụng phù hợp với điều kiện Việt Nam

2.1.2 Tiêu thức phân loại cách tiếp cận hệ thống ITS

Trong các tài liệu về ITS,có nhiều cách tiếp cận khác nhau.Điều này dễ gây khó khăn khi so sánh các hệ thống ITS quốc gia và người dùng khó hệ thống.Có nhiều cách tiếp cận,trong đó những tiêu thức chính là: a Phân theo dịch vụ mà ITS cung cấp; b Phân theo lĩnh vực ứng dụng; c Phân theo quan hệ giữa các bộ phận hợp thành của hệ thống giao thông;d Phân theo hệ thống thiết bị công nghệ

Cấu trúc của hệ thống giao thông thông minh

Hệ thống giao thông thông minh là 1 hệ thống lớn trong đó bao gồm hạ tầng giao thông và phương tiện được kết hợp chặt chẽ với nhau Cấu trúc hệ thống được minh họa như hình 2:

Hình 2.1: Hệ thống giao thông thông minh 2.2.1 Hạ tầng giao thông thông minh (Intelligent infrastructure)

- Hệ thống quản lý trục giao thông chính (Arterial Management)

Các hệ thống này bố trí dọc các trục đường chính, sử dụng đèn báo hiệu và sử dụng thông tin thu thập bởi các thiết bị giám sát lưu lượng để truyền những thông tin quan trọng về điều kiện đi lại cho người tham gia giao thông, thông qua công nghệ như những dấu hiệu thông báo động hoặc tin nhắn

Hình 2.2: Hệ thống quản lý trục giao thông chính

- Hệ thống quản lý đường cao tốc (Freeway Management)

Có 6 chức năng lớn của ITS tạo nên hệ thống quản lý đường cao tốc : hệ thống giám sát giao thông sử dụng thiết bị dò tìm và thiết bị video để hỗ trợ các ứng dụng quản lý cao tốc tiên tiến nhất Các biện pháp kiểm soát giao thông trên dốc đi vào cao tốc như đồng hồ đo dốc có thể sử dụng dữ liệu cảm biến để tối ưu hoá tốc độ và thời gian chờ đợi đồng hồ đo dốc

Hình 2.3: Hệ thống quản lý đường cao tốc

- Hệ thống an toàn và ngăn ngừa tai nạn (Crash Prevention and Safety)

Hệ thống này nhận diện những điều kiện không an toàn cung cấp cho người tham gia giao thông để tránh những sự cố, các đường cong nguy hiểm, đường cao tốc giao cắt đường sắt, nút giao thông lưu lượng cao, và cũng cung cấp các cảnh báo về sự hiện diện của người đi bộ và đi xe đạp, và thậm chí cả những động vật trên đường bộ Trong một số trường hợp, hệ thống hướng dẫn sử dụng được tuyển dụng, ví dụ: nơi người đi bộ hoặc đi xe đạp bằng tay thiết lập hệ thống để cung cấp các cảnh báo về sự hiện diện của họ cho du khách

Hình 2.4: Hệ thống an toàn và ngăn ngừa tai nạn

- Hệ thống quản lý đường trong các điều kiện thời tiết (Road Weather Management)

Hoạt động quản lý bao gồm hệ thống quản lý thông tin về thời tiết, công nghệ bảo trì con đường khi bị ảnh hưởng bởi thời tiết xấu, và điều phối các hoạt động, ứng dụng của nó giúp đỡ trong việc giám sát và dự báo của các con đường và điều kiện khí quyển

Hình 2.5: Hệ thống quản lý đường trong các điều kiện thời tiết

- Hệ thống vận hành và bảo trì đường bộ (Roadway Operation and Maintenance)

Những ứng dụng theo dõi, phân tích, và phổ biến các dữ liệu cơ sở hạ tầng cho các hoạt động, bảo trì, quản lý và sử dụng Nó có thể giúp bảo đảm sự an toàn của công nhân và người tham gia giao thông trong khu vực làm việc tạo điều kiện lưu lượng giao thông thông qua Điều này thường đạt được thông qua việc triển khai tạm thời của ITS các dịch vụ khác, chẳng hạn như các yếu tố của quản lý giao thông và các chương trình quản lý sự cố

Hình 2.6: Hệ thống vận hành và bảo trì đường bộ

- Hệ thống quản lý vận tải hành khách (Transit Management)

- Hệ thống quản lý sự cố giao thông (Traffic Inciddent Management)

- Hệ thống quản lý khẩn cấp (Emergency Management)

- Hệ thống trả tiền, thanh toán điện tử (Electronic Payment & Pricing)

- Hệ thống thông tin du lịch (Traveler Information)

- Hệ thống quản lý vận tải đa phương thức (Intermodal Freight)

- Hệ thống điều hành xe chở container (Commercial Vehicle Operations)

2.2.2 Phương tiện thông minh(Intelligent Vehicles)

- Hệ thống ngăn ngừa va chạm (Collision Avoidance) Để cải thiện khả năng điều khiển tránh những tai nạn, phương tiện được gắn hệ thống cảnh báo va chạm Những ứng dụng va chạm sử dụng một loạt các cảm biến để giảm sát môi trường xung quanh phương tiện và cánh báo lái xe về các điều kiện có thể dẫn đến va chạm

Hình 2.7: Hệ thống ngăn ngừa va chạm

- Hệ thống hỗ trợ người lái (Driver Assistance)

Nhiều công nghệ xe thông minh giúp đỡ người điều khiển vận hành xe an toàn Những hệ thống sẵn sàng giúp đỡ như dẫn đường, nâng cao tầm nhìn và những hệ thống điều khiển tốc độ, được dự định để tạo điều kiện thuận lợi cho người điều khiển

Hình 2.8: Hệ thống hỗ trợ người lái

- Hệ thống cảnh báo va chạm (Collision Notification)

Hệ thống cảnh báo va chạm đã được thiết kế để phát hiện và báo cáo vị trí, mức độ nghiêm trọng của vụ việc cho cơ quan có thẩm quyền giải quyết

Hình 2.9: Hệ thống cảnh báo va chạm

2.2.3 Hệ thống quản lý làn đường

Mục tiêu là phát triển Hệ thống quản lý làn đường (LMS) sẽ bao gồm các tính năng sau: Hệ thống giữ làn đường (LKS), Hệ thống cảnh báo chệch làn đường

(LDWS) và Hệ thống giữ làn đường, Hệ thống định tâm (LCS).

XÂY DỰNG HỆ THỐNG VÀ THỰC NGHIỆM

Sơ đồ hệ thống

Hình 3.1: Sơ đồ hệ thống

Bước 1: Frame được đưa qua YOLO để phát hiện vị trí đèn giao thông và xe Bước 2: Sau khi nhận được vị trí của đèn giao thông chúng ta sẽ crop vùng chứa đèn giao thông và đưa qua bộ phân loại đèn giao thông

Bước 3: Kiểm tra nếu đèn đỏ và xe vượt qua roi cho phép thì sẽ crop vùng chứa vị trí xe sẽ được đưa qua Wpod và CRNN để trích xuất biển số và lưu vào dữ liệu Ngược lại quay lại bước 1.

Thuật toán được sử dụng

Object Detection là một bài toán quan trọng trong lĩnh vực Computer Vision, thuật toán Object Detection được chia thành 2 nhóm chính:

Họ các mô hình RCNN ( Region-Based Convolutional Neural Networks) để giải quyết các bài toán về định vị và nhận diện vật thể

Họ các mô hình về YOLO (You Only Look Once) dùng để nhận dạng đối tượng được thiết kế để nhận diện các vật thể real-time

Yolo là một mô hình mạng CNN cho việc phát hiện, nhận dạng, phân loại đối tượng Yolo được tạo ra từ việc kết hợp giữa các convolutional layers và connected layers.Trong đóp các convolutional layers sẽ trích xuất ra các feature của ảnh, còn full-connected layers sẽ dự đoán ra xác suất đó và tọa độ của đối tượng

3.2.1.2 Mô hình YOLO V3 a, Giới thiệu mô hình Yolo V3

YOLO - You Only Look Once (tạm dịch Bạn Chỉ Nhìn Một Lần) là một trong những mô hình phát hiện đối tượng tốt nhất ở thời điểm hiện tại, phiên bản của mô hình này đều có những cải tiến rất đáng kể sau mỗi phiên bản Sau 3 phiên bản của tác giả chính Joseph Redmon là YOLOv1 đến v3, tính đến thời điểm hiện tại có thêm một paper

YOLOv4 của Alexey Bochkovskiy được dẫn link trực tiếp từ repository gốc của Joseph Redmon và YOLOv5 đang được phát triển Nhiều hệ thống phát hiện đối tượng cần phải “nhìn” qua ảnh nhiều hơn một lần để có thể phát hiện tất cả các đối tượng trong ảnh, hoặc nó phải trải qua hai giai đoạn để phát hiện đối tượng YOLO không cần phải trải qua những quy trình nhàm chán này Nó chỉ cần “nhìn” một lần vào hình ảnh để phát hiện tất cả các đối tượng và đó là lý do tại sao họ chọn tên You Only Look Once và đó thực sự là lý do tại sao YOLO là một mô hình rất nhanh Trong phạm vi đồ án này chỉ giới thiệu phiên bản YOLOv3.abb

YOLOv3 có thể gọi là thuật toán hay mô hình (nó là một mô hình Deep Learning hoàn chỉnh gồm nhiều thuật toán khác nhau), sử dụng một biến thể của Darknet, ban đầu là mạng 53 lớp được huấn luyện trên tập dữ liệu Imagenet Đối với nhiệm vụ phát hiện, 53 lớp khác được xếp chồng lên nó, tạo nên một kiến trúc mạng tích chập hoàn toàn (Fully Convolutional Network - FCN) gồm 106 lớp, với các residual block (khối phần dư), skip connection (bỏ qua kết nối) và các lớp upsampling, tương tự với mô hình FPN và ResNet Không có lớp tổng hợp nào được sử dụng và một lớp tích chập có bước nhảy bằng 2 được sử dụng để pass downsampling cho các biểu đồ đặc trưng (feature map) Điều này giúp ngăn ngừa mất các đặc trưng cấp thấp thường được cho là do các lớp tổng hợp YOLOv3 bỏ qua ba lớp cuối cùng của Darknet 53 (lớp avgpool, lớp full connected, lớp softmax) vì các lớp này chủ yếu được sử dụng để phân loại hình ảnh Trong nhiệm vụ phát hiện đối tượng, YOLOv3 sử dụng Darknet 53 chỉ để trích xuất các đặc trưng hình ảnh nên ba lớp này sẽ không cần thiết

Là một FCN, kích thước của hình ảnh đầu vào luôn bất biến và có thể chỉnh các giá trị này trong tệp cấu hình mạng Một vấn đề lớn là nếu chúng ta muốn xử lý hình ảnh theo batch (hình ảnh theo batch có thể được xử lý song song bởi GPU, tăng tốc độ xử lý), chúng ta cần có tất cả hình ảnh có chiều cao và chiều rộng cố định Điều này là cần thiết để nối nhiều hình ảnh thành một batch lớn (ghép nhiều PyTorch tensor thành một để thuận tiện cho quá trình triển khai)

Các lớp downsampling hình ảnh bằng một hệ số được gọi là bước nhảy (stride)

Tính năng nổi bật nhất của YOLOv3 là nó thực hiện phát hiện ở ba tỷ lệ kích thước khác nhau Trong YOLO v3, việc phát hiện được thực hiện bằng cách áp dụng các kernel phát hiện 1 x 1 lên các biểu đồ đặc trưng có ba kích thước khác nhau tại ba vị trí khác nhau trong mạng

Hình 3.2: So sánh tốc độ các mô hình phát hiện đối tượng tại thời điểm Yolo

Ta có thể thấy thì tốc độ của YOLOv3 vượt xa so với các phiên bản SSD, và độ chính xác (mAP) cũng cao hơn ở chế độ suy luận mô hình

YOLOv3 có FPN sử dụng các feature map nhiều thông tin hơn để cải thiện độ chính xác, có thể phát hiện đối tượng nhỏ với độ chính xác cao SSD có layer ở bottom không được sử dụng để phát hiện đối tượng Vì những layer này có độ phân giải cao nhưng giá trị ngữ nghĩa của chúng lại không đủ cao (thấp) nên những nhà nghiên cứu bỏ chúng đi để tăng tốc độ xử lý Cho nên, SSD chỉ sử dụng các layer ở lớp trên, và do đó sẽ không phát hiện được các đối tượng có kích thước nhỏ

YOLOv3 sử dụng batch normalization và gradient descent để chuẩn hoá và tối ưu dữ liệu

YOLOv3 sử dụng nhiều data augmentation trong quá trình training

YOLOv3 Sử dụng 9 anchors (điểm neo) để phát hiện đối tượng b, Kiến trúc mạng nơron Yolo V3

Hình 3.3: Mô hình mạng nơron Yolo V3

Các điểm thay đổi mới của mô hình Yolo V3 so với các mô hình trước đó:

− Logistic regression cho confidence score: predict độ tự tin của bounding box (có chứa vật hay không) sử dụng logistic regression

− Thay softmax bằng các logistic classifier rời rạc: sử dụng các logistic classifier thay vì softmax cho việc classify đối tượng Việc này cho hiệu quả tốt hơn nếu các label không "mutually exclusive", tức là có thể có đối tượng cùng thuộc 2 hay nhiều class khác nhau Ví dụ với bài toán cần phát hiện 2 đối tượng là "chó" và "chó Phú Quốc" Rõ ràng nếu đối tượng là "chó Phú Quốc" thì nó cũng thuộc class "chó", và việc sử dụng softmax là không phù hợp trong trường hợp này

− Backbone mới - Darknet-53: Backbone được thiết kế lại với việc thêm các residual blocks (kiến trúc sử dụng trong ResNet)

− Multi-scale prediction: sử dụng kiến trúc Feature Pyramid Networks

(FPN) để đưa ra các dự đoán từ nhiều scale khác nhau của feature map Việc này giúp tận dụng các feature map với độ thô - tinh khác nhau cho việc dự đoán

− Skip-layer concatenation: cũng thêm các liên kết giữa các lớp dự đoán Mô hình upsample các lớp dự đoán ở các tầng sau và sau đó concatenate với các lớp dự đoán ở các tầng trước đó Phương pháp này giúp tăng độ chính xác khi predict các object nhỏ

Hình 3.4: Cấu trúc nguyên thủy của Darknet 53

− YOLO v3 sử dụng một biến thể của Darknet thêm các residual blocks (kiến trúc sử dụng trong ResNet), ban đầu có mạng 53 lớp được đào tạo trên Imagenet Để có nhiệm vụ phát hiện, 53 lớp nữa được xếp chồng lên nhau, cho chúng ta một kiến trúc gồm 106 lớp convolutional cho YOLO v3 Đây là lý do đằng sau sự chậm chạp của YOLO v3 so với YOLO v2 c, Mô tả thuật toán

Hình 3.5: Cấu trúc mô hình Yolo V3 Để phát hiện được các vật thể nhỏ trên Images thì Yolo v3 đã xử lý bằng cách nhận dạng 3 lần trên 1 Image

Giả sử với kích thước ảnh đầu vào 416 x 416:

− Tại lớp chập thứ 82: Bức ảnh được chia thành các ô lưới với kích thước 13×13 ( bức ảnh đã được chia với 32) Tại đây, các ô lưới sẽ có trách nhiệm tìm các vật thể có kích thước lớn trong bức hình

− Tại lớp chập thứ 94: Bức ảnh được chia thành các ô lưới với kích thước

26 x 26 ( bức ảnh được chia với 16) Và có trách nhiệm tìm các vật thể có kích thước trung bình

− Tương tự, tại lớp chập 106, bức ảnh được chia thành các ô lưới với kích thước 52×52( ảnh được chia với 8) và có trách nhiệm tìm các vật thể có kích thước bé

− Bức ảnh sau khi được chia thành các ô lưới, thì được gọi là Downsample images( ảnh giảm mẫu)

− Lấy ví dụ bằng ảnh có kích thước 416 x 416 Lần phát hiện đầu tiên được thực hiện bởi lớp thứ 82 Đối với 81 lớp đầu tiên, hình ảnh được mạng downsampling sao cho lớp thứ 81 có stride là 32 Lúc này, biểu đồ đặc trưng sẽ có kích thước 13 x 13 Một lần phát hiện được tạo ở đây bằng cách sử dụng kernel phát hiện 1 x 1, tạo nên biểu đồ đặc trưng phát hiện có shape là 13 x 13 x 255

Kết quả thực nghiệm

Hình 3.13: Kết quả thực nghiệm

Do chất luợng ảnh thấp nên một số biển số sau khi crop bị nhận diện sai text

Ngày đăng: 27/07/2024, 10:06

HÌNH ẢNH LIÊN QUAN

Hình 3.1: Sơ đồ hệ thống - đề tài nghiên cứu tổng quan về its và ứng dụng cho bài toán phát hiện biển số xe
i ̀nh 3.1: Sơ đồ hệ thống (Trang 19)

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

w