Bài tập lớn machine learning Đề tài phát hiện và nhận diện biển số xe sử dụng yolov8

YOLOv§ là một mô hình mạng nơ-ron tích chập được sử dụng phô biến để phát hiện đối tượng trong ảnh.. « Linear regression: Thuật toán này được Sử dụng để dự đoán các gia tri số, dựa trên

ẮẺẼeaa

Machine learnindQ - nh Họ và 7 2° ` `

Machine learning là nhánh quan trọng của trí tuệ nhân tạo (AI) và khoa học máy tính, tập trung vào việc sử dụng dữ liệu và thuật toán để mô phỏng hành vi của con người, từ đó dần dần nâng cao độ chính xác của các dự đoán và quyết định.

Machine learning là một yếu tố quan trọng trong lĩnh vực khoa học dữ liệu đang phát triển Bằng cách áp dụng các phương pháp thống kê, các thuật toán được đào tạo để phân loại, dự đoán và khám phá thông tin chi tiết từ các dự án khai thác dữ liệu.

Thông qua các thông tin chi tiết, việc ra quyết định đối với ứng dụng và doanh nghiệp sẽ được thúc đẩy, ảnh hưởng tích cực đến các chỉ số tăng trưởng Khi dữ liệu lớn ngày càng phát triển, nhu cầu tuyển dụng các nhà khoa học dữ liệu sẽ gia tăng, vì họ có vai trò quan trọng trong việc xác định các câu hỏi kinh doanh cần thiết và tìm kiếm dữ liệu để trả lời chúng.

Trong lĩnh vực machine learning, các bài toán thường được phân thành hai loại chính: dự đoán và phân loại Bài toán dự đoán liên quan đến việc ước lượng giá trị, chẳng hạn như giá nhà hay giá xe, trong khi bài toán phân loại tập trung vào việc nhận diện, như nhận diện chữ viết tay hoặc các đối tượng khác.

Các thuật toán phổ biến trong machine learning bao gồm mạng nơ-ron, hồi quy tuyến tính và hồi quy logistic Mạng nơ-ron mô phỏng cách thức hoạt động của bộ não con người với nhiều nút xử lý liên kết, được ứng dụng trong nhận dạng mẫu, dịch ngôn ngữ tự nhiên, nhận dạng hình ảnh và giọng nói Hồi quy tuyến tính được sử dụng để dự đoán giá trị số dựa trên mối quan hệ tuyến tính giữa các biến Hồi quy logistic giúp dự đoán các biến phản hồi phân loại, như câu trả lời "có/không" cho các câu hỏi.

7 cho các ứng dụng như phân loại thư rác và kiếm soát chất lượng trên dây chuyền san xuất

Thuật toán phân cụm giúp xác định các mẫu trong dữ liệu để nhóm chúng lại, hỗ trợ các nhà khoa học dữ liệu nhận diện sự khác biệt mà con người có thể bỏ qua Decision trees là phương pháp dự đoán giá trị và phân loại dữ liệu thông qua một chuỗi quyết định, dễ dàng xác thực và kiểm tra hơn so với neural networks Trong khi đó, random forests kết hợp kết quả từ nhiều cây quyết định để dự đoán giá trị hoặc danh mục, mang lại độ chính xác cao hơn.

Mạng nơ-ron tích chập (CNN) là một trong những mô hình Deep Learning tiên tiến, cho phép xây dựng các hệ thống thông minh với độ chính xác cao.

Mạng CNN bao gồm nhiều lớp Convolution chồng lên nhau, sử dụng các hàm kích hoạt phi tuyến như ReLU và tanh để kích hoạt trọng số trong các nút Sau khi trải qua các hàm kích hoạt, mỗi lớp sẽ tạo ra thông tin trừu tượng hơn cho các lớp tiếp theo.

Mỗi lớp trong mạng nơ-ron sẽ tạo ra thông tin trừu tượng hơn thông qua các hàm kích hoạt, cung cấp dữ liệu cho các lớp tiếp theo Trong mô hình mạng truyền ngược (feedforward neural network), mỗi nút đầu vào (input node) kết nối trực tiếp với các nút đầu ra trong các lớp tiếp theo.

Mô hình mạng kết nối đầy đủ, hay còn gọi là lớp affine, là một phần quan trọng trong các mạng nơ-ron Trong khi đó, các lớp trong mô hình CNN (mạng nơ-ron tích chập) lại có cách kết nối khác biệt thông qua cơ chế convolution, cho phép xử lý dữ liệu hiệu quả hơn.

Lớp tiếp theo trong mạng nơ-ron tích chập là kết quả của phép tích chập từ lớp trước, cho phép tạo ra các kết nối cục bộ Mỗi nơ-ron ở lớp này được hình thành từ kết quả của bộ lọc áp dụng lên một vùng ảnh cục bộ của nơ-ron ở lớp trước.

Mỗi lớp trong mạng nơ-ron sử dụng các bộ lọc khác nhau, thường có hàng trăm nghìn bộ lọc, và kết hợp kết quả của chúng Ngoài ra, còn có các lớp khác như lớp pooling hoặc subsampling, giúp chắt lọc thông tin hữu ích và loại bỏ thông tin nhiễu.

Trong quá trình huấn luyện mạng nơ-ron tích chập (CNN), mạng tự động học các giá trị qua các lớp lọc (filter) dựa trên phương pháp thực hiện Chẳng hạn, trong tác vụ phân loại ảnh, CNN sẽ tìm ra các thông số tối ưu cho các filter theo thứ tự từ pixel thô, cạnh, hình dạng, đặc trưng khuôn mặt đến các đặc trưng cao cấp Lớp cuối cùng của mạng được sử dụng để phân loại ảnh.

Convolutions Subsampling Convolutions Subsampling Fully connected

Trong mô hình CNN, hai khía cạnh quan trọng cần chú ý là tính bất biến (Location Invariance) và tính kết hợp (Compositionality) Đối với cùng một đối tượng, việc chiếu theo các góc độ khác nhau như dịch chuyển, xoay và thay đổi kích thước có thể ảnh hưởng đáng kể đến độ chính xác của thuật toán.

Pooling layer cung cấp tính bất biến đối với phép dịch chuyển, quay và co giãn Tính kết hợp cục bộ giúp biểu diễn thông tin ở nhiều cấp độ, từ thấp đến cao và trừu tượng hơn thông qua convolution với các filter Đây là lý do CNNs đạt được độ chính xác cao trong việc nhận diện, tương tự như cách con người nhận biết các vật thể trong tự nhiên.

Mô hình chung YOLO HH nn ng kg kiệt 10 DĐ N(90no::::':ẦẢ

YOLO (You Only Look Once) là thuật toán phát hiện đối tượng, với mục tiêu không chỉ dự đoán nhãn cho vật thể mà còn xác định vị trí của chúng Nhờ vào khả năng này, YOLO có thể phát hiện nhiều vật thể với các nhãn khác nhau trong cùng một bức ảnh, thay vì chỉ phân loại một nhãn duy nhất.

Thuật toán YOLO sử dụng hình ảnh đầu vào và áp dụng mạng nơ-ron tích chập sâu để phát hiện các đối tượng trong ảnh Kiến trúc CNN là xương sống của YOLO, giúp tối ưu hóa quá trình nhận diện và phân loại đối tượng.

Mô hình YOLO sử dụng 20 lớp tích chập đầu tiên đã được đào tạo trước với ImageNet, sau đó áp dụng lớp tổng hợp trung bình tạm thời và lớp kết nối đầy đủ Mô hình này được chuyên dụng để phát hiện, với lớp kết nối đầy đủ cuối cùng dự đoán xác suất của các lớp và tọa độ hộp giới hạn.

YOLO chia hình ảnh đầu vào thành lưới S x S, trong đó mỗi ô lưới sẽ phát hiện đối tượng nếu tâm của nó rơi vào ô đó Mỗi ô lưới dự đoán B hộp giới hạn và điểm tin cậy cho các hộp này, phản ánh mức độ tin cậy của mô hình về khả năng chứa đối tượng và độ chính xác của dự đoán.

YOLO dự đoán nhiều hộp giới hạn trên mỗi ô lưới, nhưng tại thời điểm đào tạo, chỉ cần một bộ dự đoán hộp giới hạn cho từng đối tượng YOLO chỉ định bộ dự đoán dựa trên chỉ số IOU cao nhất với thực tế, dẫn đến sự chuyên môn hóa giữa các bộ dự đoán Kết quả là, mỗi công cụ dự đoán trở nên hiệu quả hơn trong việc xác định các đối tượng.

10 việc dự báo các kích thước, tý lệ khung hình hoặc loại đối tưrợng nhất định, cải thiện tông thê recall score

Một kỹ thuật quan trọng trong các mô hình YOLO là NMS (non-maximum suppression), được sử dụng như một bước hậu xử lý để nâng cao độ chính xác và hiệu quả trong phát hiện đối tượng Trong quá trình này, thường xuất hiện nhiều hộp giới hạn cho cùng một đối tượng trong một hình ảnh, có thể chồng chéo hoặc ở các vị trí khác nhau NMS giúp xác định và loại bỏ các hộp giới hạn dư thừa hoặc không chính xác, từ đó đề xuất một hộp giới hạn duy nhất cho mỗi đối tượng trong hình ảnh.

Kẻ từ lần đầu tiên được giới thiệu vào năm 2016 bởi Joseph Redmon và cộng sự,

YOLO đã được phát triển nhiều phiên bản khác nhau, với YOLOv8 hiện là phiên bản mới nhát

Trước đây, YOLOv7 gặp khó khăn trong việc phát hiện các đối tượng nhỏ ở các tỷ lệ khác nhau, đặc biệt dưới sự thay đổi ánh sáng và các điều kiện môi trường khác Với sự ra mắt của YOLOv8, câu hỏi đặt ra là liệu những hạn chế này có được khắc phục hay không.

YOLOv8 được phát triển dựa trên thành công của các phiên bản YOLO trước, mang đến các tính năng và cải tiến mới nhằm nâng cao hiệu suất và tính linh hoạt Phiên bản này đạt được hiệu suất tốt và tốc độ xuất sắc, với năm mô hình có kích thước khác nhau: nano, nhỏ, vừa, lớn và cực lớn.

YOLOv8 được chia thành ba phần chính: backbone, neck và head, với mục đích trích xuất đặc trưng, kết hợp nhiều đặc trưng và dự đoán kết quả đầu ra Thiết kế của mạng YOLOv8 thể hiện sự tối ưu trong việc xử lý và phân tích hình ảnh.

Mạng trích xuất đặc trưng chủ yếu tập trung vào việc lấy các đặc trưng từ ảnh thông qua các mô-đun C2f và SPPF Mô-đun C2f giúp giảm số lượng lớp tích chập bằng cách sử dụng mô-đun C3 góc, từ đó làm cho mô hình trở nên nhẹ hơn Đồng thời, nó kết hợp những ưu điểm của cấu trúc ELAN trong YOLOv7, cho phép mô hình hoạt động nhanh hơn và thu thập thông tin phong phú hơn nhờ vào các mô-đun bottleneck.

SPPF sử dụng lớp mạng dựa trên SPP (spatial pyramid pooling) nhằm giảm thiểu các hoạt động dư thừa, từ đó cải thiện tốc độ hợp nhất đặc trưng một cách hiệu quả hơn.

Module hợp nhất đa tỷ lệ kết hợp mạng FPN (feature pyramid network) và PAN (path aggregation network) nhằm cải thiện khả năng phát hiện mục tiêu Bằng cách kết hợp các đặc trưng ở mức thấp và mức cao, module này tăng cường các đặc trưng mức thấp với các lĩnh vực mẫu nhỏ hơn, giúp phát hiện các mục tiêu có quy mô khác nhau Lớp phát hiện sẽ dự đoán vị trí, loại, điểm tự tin và thông tin liên quan đến mục tiêu.

Phản Head của YOLOv8 chuyển từ phương pháp dựa trên anchor boxes sang phương pháp không dựa trên anchor boxes Nó từ bỏ việc khớp lưới và áp dụng bộ gán nhiệm vụ để khớp mẫu Cuối cùng, YOLOv8 thực hiện dự đoán đa tỷ lệ hiệu quả.

Sử dụng các đặc trưng giảm xuống 8x, 16x và 32x giúp đạt được độ chính xác cao trong việc dự đoán các mục tiêu nhỏ, trung bình và lớn Các mô-đun chi tiết trong mạng YOLOv8 được minh họa trong hình dưới đây.

6 e | © 35] —=— YOLOv8 6354 - —— YOLOv8 ° / Small YOLOv7 ° | F YOLOv7

Parameters (M) Latency A100 TensorRT FP16 (ms/img)

YOLOv8 sở hữu nhiều tham số hơn so với YOLOv5, nhưng lại ít hơn so với YOLOv6 Đặc biệt, nó cung cấp khoảng 33% mAP cao hơn cho các mô hình kích thước n và mAP tổng thể cũng lớn hơn.

Từ biêu đồ thứ hai, chúng ta có thê thấy YOLOv8 có thời gian suy luận nhanh hơn so với tat ca các phiên bản YOLO khác

3.1 Các phương pháp nhận diện biển số xe trong thực tế

Phương pháp nhận diện biển số xe trong đề tài ¿5-5522 Sc sec secececcxes 15 4 THU THẬP VÀ XỬ LÍ DỮ LIỆU . 22 S22 22t S223 121211112121 8211512111 crre 16

Nhóm em đặt mục tiêu xây dựng một mô hình có khả năng phát hiện biến số xe, sau đó nhận diện các ký tự trên biển số và cuối cùng trả về giá trị biển số xe dự đoán cho người dùng, nhằm phục vụ cho mục đích lưu trữ.

Đề tài này được chia thành hai phần chính: đầu tiên là huấn luyện mô hình để phát hiện và bắt được biên số xe trong hình ảnh Sau đó, thực hiện phân đoạn hoặc cắt lấy phần biên số xe đã phát hiện để phục vụ cho mục đích nhận diện Cuối cùng, tiến hành huấn luyện thêm một mô hình để nhận diện ký tự trên biển số.

Đã có 15 biên số xe, và cuối cùng, việc sắp xếp các ký tự cùng với lựa chọn cách trình bày số dòng của biên số xe sẽ được thực hiện để phù hợp với định dạng của biến số xe tại Việt Nam.

Nhóm đã lựa chọn két hợp 2 mô hình máy học YOLOv8 đề tiền hành xây dựng đề tài

4 THU THẬP VÀ XỬ LÍ DỮ LIỆU

Bộ dữ liệu đầu vào (Da†asel) - - c c n2 221 22111111181 181811181011121 11211 re 16

Đẻ thực hiện huần luyện mô hình sử dụng YOLOv8, trước hét cần chuan bị dữ liệu dầu vào là ảnh và nhãn dán tương ứng với ảnh đó

Mô hình của chúng tôi bao gồm hai phần chính: một mô hình được huấn luyện để phát hiện biển số xe máy với 8.259 hình ảnh và nhãn dán tương ứng, và một mô hình khác chuyên nhận diện các ký tự trên biển số xe, sử dụng 3.188 hình ảnh đã được tăng cường.

4.2 Tiền xử lí dữ liệu (Data preprocessing) Đề dữ liệu đáp ứng được yêu cầu về dữ liệu đầu vào của mô hình YOLOv8, tập dữ liệu đầu vào phải được chia thành 2 thư mục 1a train va val Đề thuận tiện cho việc

Để xử lý dữ liệu, chúng ta sử dụng thư viện split-folders, một thư viện Python hữu ích cho việc phân chia dữ liệu huấn luyện theo tỉ lệ mà người dùng mong muốn.

4 | Search projects Q split-folders 0.5.1 pip install split-folders @ Released: Feb 4, 2022

Navigation Project description Eee eet arial ob rolsers IS SESS EE) CEEECTESTES

‘D Release history z & Download files Split folders with files (e.g i

The input folder should have the following format:

To simplify the data splitting process, we utilize Google Colab's command line In this model, we designate 80% of the data for the training set and 20% for the validation set.

Usage: splitfolders [ output] [ ratio] [ fixed] [ seed] [ oversample] [ group_prefix] [ mc

output path to the output folder defaults to ‘output’ Get created if non-existe

ratio the ratio to split e.g for train/va\/test `.8 1 1 ` or for train/vat

fixed set the absolute number of items per validation/test set The remaining it the training set e.g for train/val/test °100 100° or for train/val ‘100°

Set 3 values, e.g ~300 100 100°, to Limit the number of training values

seed set seed value for shuffling the items defaults to 1337

~-oversample enable oversampling of imbalanced datasets, works only with fixed

~-group_prefix split files into equally-sized groups based on their prefix

~-move move the files instead of copying

Example: splitfolders ratio 8 1 1 folder_with_images

Because of some Python quirks you have to prepend afer using ratio

Instead of the command splitfolders you can also use split_folders or split-folders

Để huấn luyện mô hình, cần tạo thêm một file định dạng “.yaml” để mô tả cấu hình của tập dữ liệu File này bao gồm thông tin về đường dẫn tới tập dữ liệu, các lớp đối tượng cần phát hiện, số lượng hình ảnh trong từng tập train, validation, test và các thông tin liên quan khác Trong đề tài này, có hai hình ảnh tương ứng với hai file “.yaml”: file “license_plate_detection.yaml” cho mô hình phát hiện biển số xe chứa đường dẫn tới thư mục train, val, một lớp đối tượng (nc = 1) với tên lớp là “license plate”, và một file khác cho mô hình nhận diện ký tự trên biển số xe.

Tệp “license_plate_characters.yaml” bao gồm các đường dẫn tới thư mục train, vai trò và 36 lớp đối tượng (nc = 36), với tên các lớp đối tượng là các ký tự số từ 0-9 và các ký tự alphabet từ A-Z.

Huấn luyện mô hình (Model training) ¿-¿ cscsxccsxexssxereererrxea 18 5 KÉT QUÁ THỰC HIỆN VÀ ĐÁNH GIÁ - 22 S222 S22 ccrererrree 22

YOLOv8 đã cung cấp nhiều mô hình được đào tạo trên tập dữ liệu COCO với các kích thước khác nhau, bao gồm YOLOv8n (nano), YOLOv8s (small), YOLOv8m (medium), YOLOv8l (large) và YOLOv8x (extra) Sự khác biệt về kích thước và số lượng tham số của các mô hình ảnh hưởng đến độ chính xác (mAP) và tốc độ xử lý Mô hình lớn hơn thường cho kết quả dự đoán chính xác hơn, nhưng thời gian thực thi cũng sẽ tăng lên.

Detection (COCO) for usage examples with these models trained on which include 80 pre-trained classes

Co mApval Speed Speed params ge

Để huấn luyện các mô hình YOLOv8 với dữ liệu tùy chỉnh, chúng ta sử dụng mô hình pre-trained “YOLOv8n.pt”, một model kích thước nano giúp khởi tạo mô hình nhanh chóng với trọng số đã được tối ưu Việc này không chỉ tiết kiệm thời gian và tài nguyên tính toán mà còn cung cấp một điểm khởi đầu hiệu quả cho quá trình tối ưu trọng số trên dữ liệu mới, tránh tình trạng bị mắc kẹt ở điểm cực tiểu cục bộ Quá trình huấn luyện được thực hiện trên Google Colab thông qua command line.

Single-GPU and CPU Training Example

Device is determined automatically If a GPU is available then it will be used, otherwise training will start on CPU cu

Cả 2 mô hình sử dụng mô hình pre-trained YOLOv§n làm điểm khởi tạo, sau đó huấn luyện lại trên dữ liệu “.yaml” trong 20 epochs với kích thước ảnh 640x640 dé tối ưu hóa mô hình phù hợp với dữ liệu mới Đầu tiên, mô hình mới sẽ được transfer learning từ mô hình YOLO đã được pretrained nhằm tiết kiệm thời gian huán luyện và tăng hiệu suất

Ultralytics YOLOv8.0.203 is a powerful object detection model designed for Python 3.10.12 and utilizes torch 2.1 with CUDA support for Tesla T4 GPUs It allows users to train their models using the 'lov8n.pt' architecture and the 'license plate_characters.yaml' dataset The training process can be customized with parameters such as the number of epochs and patience settings Additionally, users can integrate custom fonts by linking to the Arial.ttf file stored in the Ultralytics configuration directory.

24.9MB/s] sorflow/compiler/x Ẻ cutor/cuda/cuda_dnn.cc:9342] Unable to re orflow/compiler/x1z r/cuda/cuda - 369] Unable to r orflow/compiler/xla/ ` F nc-36 gister cu Unable to register params module

LỘ làn: i -nn.modules conv CTP arguments

295424 cs.nn.modules conv K2 cs.nn.modules bloc

The article discusses the architecture and performance metrics of a neural network model, highlighting its 225 layers and a total of 3,017,868 parameters It reports that the model has 3,017,852 gradients and achieves a computational efficiency of 8.2 GFLOPs Additionally, it references various modules within the model, including upsampling and convolutional layers, which contribute to its functionality and effectiveness in analytics.

Transferred 319/355 items from pretrained weights

TensorBoard: Start with 'tensorboard logđir runs/detect/train3"

Freezing layer 'model.22.df1.conv.weight" running Automatic Mixed Precisi alas ne sa view at http://localhost:6996/ n (AMP) checks with YOLOv8

Sau khi transfer learning, mô hình sẽ được train trên tập dữ liệu người dùng với

Số epochs đã định từ trước Việc thực hiện huán luyện được tiền hành trong 20 epochs H bels to runs/detect/train3/1abe1s ]Ƒ

"optimizer-auto" found, oring 'lr0-0.01' and "momentum-@.937' and determining best "'optimizer', 'Irô' and "momentum' automatically 9.90025, momentum-0.9) with parameter groups 57 weight(decay-0.0), 6 ight (decay-@.0005), 63 bias(decay-@.0)

Per oa to runs/detect/train3 ining for 2@ epoc

GPU mem box loss dfl_loss Instances

2.536 100% 180/180 mAP5ỉ MAP59-95): 166% 23, 9.571 class Eyal oma) yee 100% 180/180 [01 00:0, class TU Ề TU R MAPS@ =mAPSO-95): ese

Cuối cùng, YOLOv8 sẽ tiến hành đánh giá mô hình mới này dựa trên tập dữ liệu validation mà ta đã cung câp

0ptimizer stripp from runs/detect/train3/weights/last.pt,

Optimiz stripped from runs/detect/train3/weights/best.pt,

Tesla T4, 15102MiB GFLOPS mAPS@ mAPS@-95): 100% 23/23 [90:

5 KÉT QUÁ THỰC HIỆN VÀ ĐÁNH GIÁ

5.1 Kết quả quá trình huấn luyện mô hình

Sau khi hoàn thành quá trình huấn luyện mô hình YOLOv8 với dữ liệu tùy chỉnh, mô hình sẽ cung cấp các tệp báo cáo kết quả cho từng epoch, được lưu trữ trong tệp "result.esv".

Kết quả của quá trình huấn luyện mô hình phát hiện biển số xe cho thấy các chỉ số quan trọng như loss cho box, class, và DFL Các thông số đo lường độ chính xác (precision), độ nhạy (recall) và mAP (mean Average Precision) được ghi nhận, với các giá trị mAP tại 50 và 50-95 Ngoài ra, các chỉ số loss trong quá trình kiểm tra cũng được báo cáo, bao gồm box loss, class loss và DFL loss, cùng với các thông số học (learning rate) cho các nhóm tham số khác nhau.

20 1.0089 0.44397 1.0282 0.78132 0.97254 0.90169 0.62872 1.0361 0.88344 1.0093 0.000218 0.000218 0.000218 train/box_loss train/cls_loss train/dfl_loss metrics/precision(B) metrics/recall(B)

10 20 10 20 10 20 10 20 10 20 val/box_loss val/cls_loss val/dfl_loss metrics/mAP50(B) metrics/mAP50-95(B)

Kết quả huấn luyện mô hình nhận diện ký tự trên biển số xe cho thấy các chỉ số quan trọng như loss cho train/box, train/cls, và val/box, val/cls Bên cạnh đó, các chỉ số metrics như recall và mAP50, mAP50-95 cũng được ghi nhận, cho thấy hiệu suất của mô hình trong việc nhận diện ký tự Thông qua quá trình này, các thông số như lr và pgU cũng được theo dõi để đánh giá sự cải thiện của mô hình.

5.2 Kết quả quá trình thực nghiệm Đề kiêm chứng khả năng dự đoán biên số xe của mô hình, ta tiến hành chạy mô hình trên dữ liệu đầu vào là ảnh chụp thực tế:

MAYBACH license pl dc 08” SF; TOU a

Bài viết trình bày kết quả dự đoán từ mô hình đối với ảnh đầu vào của biển số ô tô và biển số xe máy Sau khi xử lý, mô hình đã cho ra những kết quả chính xác cho cả hai loại biển số.

Đánh giá mô hình - - ĐH ng ng nh họ ki ki ki ki ki kế 25 6 KÉT LUẬN VÀ HƯỚNG PHÁT TRIỂN 222252 2222 2x2 21132 exererrrei 30 ii

YOLOv8§ được hỗ trợ sẵn các phương pháp đánh giá mô hình huấn luyện như: Confusion matrix, F1 Score,

Confusion matrix là một công cụ quan trọng trong việc đánh giá mô hình, giúp hiển thị số lượng dữ liệu thuộc về từng lớp và dự đoán của chúng Nó cung cấp thông tin chi tiết về tỷ lệ phân lớp chính xác giữa các lớp, đồng thời hỗ trợ phát hiện các lớp có tỷ lệ phân lớp thấp thông qua các khái niệm True Positive (TP) và False Positive (FP).

Positive True Positive (TP) T nE TP ype ,JTTOT (P+FN)

L False Positive (FP) ss Speciticny

Negative rT IE True Negative (TN) TN ype I Error GN + FP)

Value TP+TN on ca TN (TP +TN + FP + FN)

YOLOv8 cung cấp hai hình ảnh kết quả từ ma trận nhầm lẫn, và ma trận này được chuẩn hóa lưu trong thư mục ‘runs’ của mô hình sau khi quá trình huấn luyện kết thúc Mô hình này được sử dụng để phát hiện biển số xe.

Confusion Matrix license plate background ' ' license plate background

Confusion Matrix Normalized license plate Predicted background license plate background

26 e- Với mô hình nhận diện ký tự trên biên số xe:

N 1: Recall được coi trọng hon Precision e 6

Tiêu đề	Phát hiện và nhận diện biển số xe sử dụng yolov8
Người hướng dẫn	GVHD: Nguyễn Đúng
Trường học	Trường Đại Học Bách Khoa
Chuyên ngành	Điện - Điện Tử
Thể loại	Bài tập lớn
Năm xuất bản	2023
Thành phố	Tp. Hồ Chí Minh

Định dạng
Số trang	34
Dung lượng	6,77 MB

Tài liệu tham khảo	Loại	Chi tiết
[1] ATSCADA Lab, CONG NGHE NHAN DANG BIEN SO_XE TRONG BAI PO XE, https://atscada.net/cong-nghe-nhan-dang-bien-so-xe-trong-bai-do-xe/#ftoc-heading-3	Link
[2] Bùi Anh Thuận (May 18, 2021), [Machine Learning] Lam thé ndo dé danh gid mot mô hình May hoc? ,http://tutorials.aiclub.cs. uit.edu.vn/index.php/2021/05/18/evaluation/	Link
[3] Bui Quang Manh (6/7/2020), Nh¿n diện biển số xe Việt Nam, https://viblo.asia/p/nhan-dien-bien-so-xe-viet-nam-Do754P9L5M6[4] Glenn-jocher, NEW - YOLOvg in PyTorch > ONNX > OpenVINO >CoreML > TFLite, https://github.com/ultralytics/ultralytics	Link
[5] Hai Quan Tran, Real-time-Auto-License-Plate-Recognition-with-Jetson-Nano, https ://github.com/winter2897/Real-time-Auto-License-Plate-Recognition-with-Jetson-Nano	Khác
[10] VBD, YOLO V7: Thuát toán phát hiện đối ương có gì mới? , https:/inbigdata.com/kham-pha/yolo-v7-thuat-toan-phat-hien-doi-tuong-co-	Khác