1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng bộ cơ sở dữ liệu cho trái dưa hấu hỗ trợ trong nhận dạng và phát hiện Đối tượng

30 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây Dựng Bộ Cơ Sở Dữ Liệu Cho Trái Dưa Hấu Hỗ Trợ Trong Nhận Dạng Và Phát Hiện Đối Tượng
Tác giả Nguyen Xuan Tai
Người hướng dẫn TS. Trần Văn Đại, Nguyen Ha Huy Cuong
Trường học Trường Đại Học Công Nghệ Thông Tin & Truyền Thông Việt Hàn
Chuyên ngành Khoa Học Máy Tính
Thể loại bao cao thuc tap doanh nghiep
Năm xuất bản 2023
Thành phố Đà Nẵng
Định dạng
Số trang 30
Dung lượng 3,66 MB

Nội dung

Công nghệ này sử dụng mô hình máy học YoLo-v8 dé phát hiện và nhận dạng các loại hoa quả trong hình ảnh hoặc video.. Với sự phát triển nhanh chóng của xã hội, nhu cầu tìm kiếm và xử lý t

Trang 1

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN &

TRUYEN THONG VIET HAN

KHOA KHOA HOC MAY TINH

BAO CAO THỰC TẬP DOANH NGHIỆP

DE TAI:

XAY DUNG BO CO SO DU LIEU CHO TRAI

DUA HAU HO TRO TRONG NHAN DANG

VA PHAT HIEN DOI TUONG

Sinh viên thực hiện : NGUYEN XUAN TAI 19IT4

Giảng viên hướng dẫn : TS.TRẢN VĂN ĐẠI

Đơn vị thực tập : Trung Tâm Phát Triển Phần Mềm - ĐHĐDN

Người hướng dẫn : NGUYEN HA HUY CUONG

Da nang, thang 12 nam 2023

Trang 2

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN &

TRUYEN THONG VIET HAN

KHOA KHOA HOC MAY TINH

VA PHAT HIEN DOI TUONG

Sinh viên thực hiện : NGUYEN XUAN TAI 19IT4

Giảng viên hướng dẫn : TS.TRẢN VĂN ĐẠI

Đơn vị thực tập : Trung Tâm Phát Triển Phần Mềm - ĐHĐDN

Người hướng dẫn : NGUYEN HA HUY CUONG

Da nang, thang 12 nam 2023

Trang 4

MỞ ĐẦU

Ngày nay, trí tuệ nhân tạo đang ngày cảng phát triển mạnh mẽ Các hãng lớn như Apple, Microsoft, Google đều đưa ra các công nghệ tương tác trực tiếp với người dùng Trí tuệ nhân tạo đang ngày càng được nâng cấp hoàn thiện giúp người dùng đễ dàng tương tác, dễ sử dụng và giảm quá trình thực hiện Trí tuệ nhân tạo đang là một lĩnh vực mới mẻ và được sự quan tâm rất lớn từ các hãng công nghệ hàng đầu Với công nghệ đang ngày càng được áp dụng trong đời sống giúp con người làm việc hiệu quả hơn tiết

kiệm thời gian và sức lực, trí tuệ nhân tạo như một hệ thông được xây dựng dé phuc vu

cho điều đó

Trong vài năm trở lại đây, các dự án về AI thừa kế với những ưu việt của các công nghệ đê giúp chúng ta làm việc một cách nhanh chóng và dễ đàng hơn Đặc biệt với sự

góp mặt của các phân mềm trí tuệ nhân tạo như: Chatbot, nhận điện gương mặt, Watson,

quét vân tay ngày cảng phát triển mạnh mẽ và được nhiều người và các doanh nghiệp

ưa chuộng và giúp ích trong cuộc sống hằng ngày

Nhận dang hoa quả bằng công nghệ YoLo-v§ là một ứng dụng của công nghệ trí tuệ nhân tạo (AT) trong lĩnh vực nông nghiệp Công nghệ này sử dụng mô hình máy học

YoLo-v8 dé phát hiện và nhận dạng các loại hoa quả trong hình ảnh hoặc video Với sự

phát triển nhanh chóng của xã hội, nhu cầu tìm kiếm và xử lý thông tin ngày càng nhiều, với mục đích nghiên cứu, tìm hiểu cách xây đựng mô hình để cập nhật và huấn luyện, xử

lý thông tin, hình ảnh nhận dạng hoa quả trong nông nghiệp qua đó em quyết định chọn

đề tài “XÂY DỰNG BỘ CƠ SỞ DỮ LIỆU CHO TRÁI DƯA HẦU HỒ TRỢ NHẬN DANG VA PHAT HIEN ĐÓI TƯỢNG”.

Trang 5

LỜI CẢM ƠN

Chúng em xin chân thành cảm ơn các thầy cô và các bạn đã dành thời gian giúp đỡ

chúng em trong quá trỉnh thực hiện đồ án này Đặc biệt, chúng em xin chân thành cảm ơn

TS Trần Văn Đại là người hướng dẫn cho đề tài của chúng em Là người tận tình giúp đỡ

chúng em về thông tin của đồ án môn học Nhờ vậy mà chúng em đã hoàn chỉnh được đồ

án của mình và quan trọng hơn hết là chúng em đã tiếp thu được những kinh nghiệm trong suốt quá trình thực hiện đồ án Tuy nhiên, vì đây là lần đầu tiếp cận một công nghệ mới để thực hiên môi dự án cho bản thân măe dù đã tìm tòi nghiên cứu nhưng không tránh khki những thiếu sót

Dưới đây là kết quả của quá trình tìm hiểu và nghiên cứu mà chúng em đã đạt được trong thời gian vừa qua Tuy có nhiều cố gắng học hki trau dồi để nâng cao kiến thức nhưng không thê tránh khki những sai sót Chúng em rất mong được những sự góp ý quý báu của các thầy, cô cũng như tất cả các bạn đề bài đồ án của em được hoàn thiện hơn

Ching em xin chân thành cảm on!

Trang 6

CHUONG II: PHÂN TÍCH VÁN ĐÈ CỦA DỰ ÁN HH H2 HH re 9

2.1 Vấn đề thực tẾ ch HH HH 2 H2 tr Hà Hà H212 tr nang ng ng ung 9

2.2 Kết luận vấn đề và giới thiệu giải pháp

2.3 Giới thiệu VOLO-V8 c2 HH nề HH nh Hung hen 12 CHƯƠNG II: NỘI DUNG CÔNG VIỆC THỰC TẬP 5 22t 2211112222222 reo 14

3.1 Quá trình thực hiện wild

Trang 7

CHƯƠNG I: GIỚI THIỆU VỀ CƠ QUAN THỰC TẬP

1.1 Cơ quan thực tập

Tên đơn vị: Trung tâm phát triển phần mềm - đại học đà năng

Dia chi: 41 D Lé Duan, Hai Chau 1, Hai Chau, Da Nang 550000

Email: contact@sdc.udn.vn

Website: https://sdc.udn.vn/

1.2 Giới thiệu chung

Trung tâm phát triển phần mềm (SDC) là một đơn vị trực thuộc Đại học Đà Nẵng,

một trong ba trường đại học vùng lớn nhất Việt Nam Được thành lập từ năm 2000,

SDC đã nhanh chóng phát triển trở thành một trong những trung tâm công nghệ hàng đầu của thành phố và cả nước

SDC có đội ngũ nhân viên giàu kinh nghiệm và chuyên môn cao, được đảo tạo bài bản tại các trường đại học danh tiếng trong và ngoài nước SDC cũng đầu tư mạnh mẽ

vào cơ sở vật chất và trang thiết bị hiện đại, đáp ứng được nhu cầu phát triển của các

dự án công nghệ phức tạp

SDC hoạt động trong nhiều lĩnh vực công nghệ khác nhau, bao gồm:

e Nghiên cứu và phát triên phần mềm: SDC là một trong những trung tâm nghiên cứu và phát triển phần mềm hàng đầu Việt Nam SDC đã phát triển thành công nhiều sản phẩm phần mềm chất lượng cao, phục vụ cho nhiều ngành nghề khác nhau

¢ Thi công dự án CNTT: SDC nhận thi công rất nhiều dự án CNTT lớn nhk, từ các doanh nghiệp lớn tại Việt Nam đến các tập đoàn đa quốc gia SDC có kinh nghiệm triển khai thành công nhiều dự án phức tạp, đòi hki yêu cầu cao về kỹ

thuật và chất lượng

® Thị công dự án BIM: SDC là một trong những đơn vị tiên phong trong lĩnh

vực thi công dự án BIM tại Việt Nam BIM là một xu hướng mới trong ngành

xây dựng, giúp nâng cao hiệu quả và chất lượng của các dự án xây dựng SDC

đã triển khai thành công nhiều đự án BIM lớn, góp phân thúc đây sự phát triển của ngành xây dựng Việt Nam

Trong những năm qua, SDC đã đạt được nhiều thành tích đáng ghi nhận, góp phần thúc đây sự phát triên của ngành công nghệ thông tin Việt Nam SDC đã được nhiều

tô chức uy tin trong và ngoài nước trao tặng giải thưởng, SDC cam kết tiệp tục phát triển và

Trang 8

nâng cao chất lượng dịch vụ, góp phần đưa Việt Nam trở thành một trung tâm công nghệ thông tin hàng đầu khu vực

1.3 Mục tiêu hoạt động

Trung tâm Phát triển Phần mềm - Đại học Đà Nẵng đặt mục tiêu trở thành đơn vị

hàng đâu trong việc đào tạo, nghiên cứu và phát triển giải pháp phân mêm cũng như giải pháp Chuyền đối số trong khu vực

Trung tâm Phát triển Phần mềm - Đại học Đà Nẵng cam kết cung cấp chương trình đào tạo và đánh giá chất lượng chuyên nghiệp, phù hợp với tiêu chuẩn quốc tế đề đáp ứng nhu cầu ngày càng cao của thị trường

Trung tâm Phát triển Phần mềm xác định các gia tri cốt lõi của mình là chất lượng,

sáng tạo, trách nhiệm và cam kết Chúng tôi cam kết đáp ứng yêu cầu của các khách hàng và đối tác bằng cách cung cấp chất lượng dịch vụ và sản phẩm tốt nhất

Trang 9

CHUONG II: PHAN TICH VAN DE CUA DỰ ÁN

2.1 Van dé thực tế

Trí tuệ nhân tạo, Internet vạn vật hay đữ liệu lớn (Big Data) là những thành tựu nồi bật của Cách mạng công nghiệp 4.0; tao ra sự chuyên biến đột phá về công nghệ khoa học phục vụ mô hình sản xuất mới, tác động mạnh mẽ tới kinh tế chính trị và đời sống xã hội Trí tuệ nhân tạo đang nhanh chóng trở thành một trong những lĩnh vực khoa học rất tiềm năng được mong đợi nhất, sẽ mang lại lợi ích to lớn cho nhiều ngành công nghiệp Ứng dụng trí tuệ nhân tạo vào các lĩnh vực, trong đó ngành Nông nghiệp được sử dụng rộng rãi và mang nhiều kết quả hữu ích như: Máy kéo không người lái, máy thu hoạch

trứng tự động, hệ thông đo độ âm của đất phục vụ cho tưới tiêu nông sản Đặc biệt, nhiều nghiên cứu quốc tế đã chí ra rằng việc sử dụng trí tuệ nhân tạo có thê làm tăng tốc độ và

đo độ chính xác cho chẳn đoán nông nghiệp, hạn chế sử dụng thuốc bảo vệ thực vật và đảm bảo được chất lượng an toàn thực phẩm

Xử lý hình ảnh và thị giác máy tính được sử dụng đề đáp ứng các nhu cầu trên Nhận dạng quả cây từ hinh anh thuộc trong sô đó, hiện nay đang được triển khai nghiên

cứu và đưa vào thực tê

Xử lý ảnh và thị giác máy tính là những công nghệ tiên tiến có thê được sử dụng

đề tự động hóa nhiệm vụ này Các phương pháp này dựa trên việc phân tích các đặc điệêm hình ảnh của quả dưa hâu, chăng hạn như màu sắc, hình dạng, và kích thước

Một số phương pháp xử lý ảnh và thị giác máy tính thường được sử đụng đề phân loại dưa hấu bao gồm:

¢ Phan tich mau sắc: Phương pháp này sử dụng các thuật toán để phân tích độ bão hòa, độ sáng, và các giá trị RGB của quả đưa hấu

© Phân tích hình dạng: Phương pháp này sử dụng các thuật toán đề phân tích hình dạng của quả dưa hấu, chăng hạn như chiều dài, chiều rộng, và tỷ lệ chiều đài trên

Trang 10

dura hau bằng xử lý ảnh và thị giác máy tính là một công nghệ tiên tiến có nhiều tiềm năng ứng dụng

Dưa hấu là một loại quá giải khát rất được ưa chuộng, nhất là trong những ngày hè nóng nực Dưa hấu có nguồn gốc từ châu Phi, thuộc họ bầu bí, thân cây leo, có nhiều lông tơ trên thân và cuống Lá đưa hấu khá dày, mặt bên có nhiều lông, phiến lá cắt thành nhiều thùy, mỗi lá khoảng 7 thùy Hoa của cây dưa hầu có màu vàng, thường mọc ở nách

la Qua dua hau co vk cứng, thịt ngọt và mọng nước, phần ruột bên trong quả dưa hầu

thường có màu đk hoặc hồng, có hai loại là đưa hấu có hạt và dưa hấu không hạt Dưa

hấu chứa nhiều nước, ít calo và nhiều chất dinh dưỡng như vitamin A, vitamin C, dong, kali, lycopene và cucurbitacin E Dưa hấu có nhiều lợi ích cho sức khke như giúp giải nhiệt, giảm viêm, ngăn ngừa ung thư, tăng cường sức đề kháng và làm đẹp da Dưa hấu cũng có thê được sử dụng đề làm trang trí hoặc làm thành các món ăn ngon như sinh tố dưa hấu, salad dưa hầu hay xà lách đưa hấu Dưa hấu ở Việt Nam cũng gắn liền với nhiều

lễ hội và phong tục đân gian Ví dụ như lễ hội dựa hấu ở Hải Dương, lễ hội đưa hấu ở Quảng Ngãi hay lễ cúng dưa hấu vào ngày Tết Nguyên đán Dưa hấu cũng là một loại quả mang ý nghĩa tốt lành và may mắn trong văn hoá Việt Nam Dưa hấu thường được trưng bày trong các buổi tiệc hay trong nhà để cầu mong sự sung túc và phát tài

2.2 Kết luận vấn đề và giới thiệu giải pháp

Trong những năm gân đây, các thuật toán cải tiễn từ mạng nơ-ron tích chập đang được ứng dụng ngày cảng hiệu quả cho phép đạt tới ngưỡng chính xác tuyệt đôi được sử dụng phô biến, cho kết quả cao trong các bài toán nhận dạng và phân loại hình ảnh, nhận đạng văn bản, Mạng nơ-ron tích chập (CNN§s) cho phép khả năng trích chọn đặc trưng của lớp tích chập, sử dụng nhiều lớp tích chập và lớp gộp đề xử lý các đơn vị hình ảnh Thuật toán Faster RCNN được cải tiến từ đó, với khả năng phát hiện đối tượng, thuật toán thực hiện 2 bước chính Đầu tiên, cả bức ảnh được cho qua mô hình huấn luyện trước đề lấy bản đồ đặc trưng Sau đó bản đồ đặc trưng được dùng cho RPN đề lây được

các khu vực, sau khi lấy được vị trí các khu vực thì thực hiện tương tự Fast R-CNN

Một đề xuất khác You Only Look Once (YOLO), mét may dò áp dụng mang no- ron duy nhất cho toàn bộ hình ảnh, chia hình ảnh thành các vùng và dự đoán các hộp giới

han Byoungoun Kim va céng sự sử dụng mô hình mạng thần kinh sâu (DNN) để cải thiện

khả năng phát hiện bệnh trên trái dâu tây Jose Luis Roòas-Aranda và cộng sự sử dụng Deep learning phân loại trái cây cho cửa hàng bán lẻ, với màu đơn sắc RGB và biêu đỗ RGB từ phân cụm K-mean được sử dụng đầu mô hình Joseph Redmon đề xuất cách tiếp cận mới đề phát hiện đối tượng sử dụng hộp giới hạn và xác suất lớp liên quan, tôi ưu hóa end-to-end trực tiếp dựa trên hiệu suất phát hiện Trong lĩnh vực nông nghiệp công nghệ

cao, nhóm nghiên cứu Horea và cộng sự đã đề xuất một hệ thong huấn luyện theo kỹ

Trang 11

cộng sự đề xuất hệ thống tự động nhận dạng trái cây và rau quá sử đụng công nghệ thị

giác máy tính và máy học Md Tohidul Islam và cộng sự đề xuất một hệ thong su dung

mạng nơ-ron phức hợp đề phân loại hình ảnh thực phẩm Mạng nơ-ron phức hợp sử dụng một mô hình máy tính để mô phkng khả năng của bộ não thành cỗ máy nhận biết và phân biệt hình ảnh thực phâm Emmanuel Karlo Nyarko và cộng sự đề xuất hệ thông nhận dạng quá đến kỳ để thu hoạch tự động bằng rô-bốt thông minh Tao Yongting và Zhou

Jun đã đề xuất hệ thông nhận dạng chính xác để thu hoạch quả táo tự động bằng robot Walter Maldonado Jr va Jose Carlos Barbosa da đề xuất hệ thong chiết xuất các đặc điểm của quả xanh, vấn đề này được thực hiện với sự kết hợp của các kỹ thuật chuyền đổi

mô hình màu, tạo ngưỡng, cân bằng biều đồ, lọc không gian với các toán tử Laplace,

Sobel va lam mo Gaussian, phat triển một thuật toán đếm số quả cam xanh, có thé tao ra

công cụ hữu ích cho các nông dân trong quản lý trái cây trong vườn Nhóm nghiên cứu Xiangqin Wei và cộng sự đã mô tả phương pháp tự động trích xuất các đối tượng trái cây dưới môi trường phức tạp sử dụng rô bốt hái trái cây Nhóm nghiên cứu Sakib và cộng sự

đã đề xuất hệ thống nhận đạng trái cây bằng cách sử dụng Mạng nơ-ron tích chập (CNN)

và thị giác máy tính Mô hình toán học được xây dựng và thuc thi trong python bao gồm

việc sử dụng TensorFlow, kết quả cho thấy, với số lớp ân phù hợp, CNN có thê đạt độ

chính xác cao trong việc phân loại các loại trái cây Đặc biệt, các nhà nghiên cứu hiện

nay đang rất quan tâm tới việc ứng dụng công nghệ cao vào các lĩnh vực của đời sông Với mô hình nông nghiệp, có thê hỗ trợ nông dân trong công việc chăm sóc định kỳ, tăng chất lượng đầu ra của trái cây, từ đó có thê phát triên nền nông nghiệp vững mạnh Trong các công trình nghiên cứu của TS Nguyễn Hà Huy Cường và cộng sự, đã nghiên cứu ứng

dụng mô hình YOLO-v8, trong việc nhận dạng và phát hiện đối tượng dựa vào hình ảnh,

camera cho bốn lớp trái dứa ở các thời kỳ: Trái dứa non, trái đứa chưa chín (trái già), trái dứa chín, trái dứa hư hkng Ngoài ra, nhóm chúng tôi cũng đã nghiên cứu thực nghiệm,

đánh giá hiệu suất và so sánh ưu nhược điểm khi sử dụng mô hình YOLO và mô hình

train ROBOFLOW trén tập sở đữ liệu quả Dưa hấu đã xây dựng

YOLOv8 là một mô hình phát hiện đôi tượng dựa trên kiên trúc CNN (Mạng thân

kinh tích chập) được phát triển bởi Ultralytics Đây là phiên bản mới nhất trong dòng mô

hình YOLO, và nó đã đạt được những thành tựu đáng kẻ về độ chính xác và tốc độ YOLOv8 được xây dựng dựa trên kiến trúc CSPDarknet, đây là một biến thể của

Darknet được cải thiện về hiệu suât và khả năng mở rộng Kiến trúc CSPDarknet sử dụng các khôi kết nôi không đông nhất (CSP) đề giảm sô lượng tham sô và tăng tôc độ tính toán

YOLOv8 cũng sử dụng các kỹ thuật tiên tiên khác đề cải thiện hiệu suất, bao gồm:

¢ Bộ cân bằng kích thước: Kỹ thuật này sử dụng các kích thước lớp khác nhau cho

Trang 12

cho các trọng số của mô hình, giúp giảm đáng kê mức sử dụng bộ nhớ và tốc độ tính toán

e Huấn luyện trước: YOLOv8 được đào tạo trước trên tập dữ liệu COCO, một tập

dữ liệu lớn gồm hình ảnh và nhãn đối tượng Điều này giúp cải thiện độ chính xác

của mô hình trên các tập dữ liệu mới

YOLOv8 đã đạt được những kết quả ấn tượng vẻ độ chính xác và tốc độ trên các tập

đỡ liệu phát hiện đối tượng Trong thử nghiệm trên tập dữ liệu COCO, YOLOv8 đạt độ

chính xác mAP(00.5:0.95 la 43.3%, cao hơn 1.8% so với YOLOv7 YOLOv8 cũng có

tốc độ dự đoán nhanh, với tốc độ 400 FPS trên GPU Nvidia RTX 3090

YOLOv8 là một mô hình mạnh mẽ và hiệu quả có thê được sử dụng trong nhiều ứng

dụng phát hiện đối tượng, chăng hạn như:

® Tuy lai xe

© Theo dõi vat thé

® Nhdan dạng khuôn mặt

e Phân loại hinh ảnh

Dưới đây là một số ưu điểm và nhược điểm của YOLOv8:

® Nhin chung, YOLOv§ là một mô hình phát hiện đối tượng mạnh mẽ và hiệu quả

có thê được sử dụng trong nhiêu ứng dụng

Trang 13

CHƯƠNG III: NỘI DUNG CÔNG VIỆC THUC TẬP

3.1 Quá trình thực hiện

3.1.1 Thiêt kê hệ thông

Hệ thông nhận dạng quả Dưa hấu dựa trên trí tuệ nhân tạo cụ thê là sử dụng thị

giác máy tính và kỹ thuật xử lý hình ảnh đề phát hiện và phân loại quả Dưa hấu chín bằng cách sử dụng mạng nơ-ron tích chập đề phân tích, trích xuất đặc trưng các đặc điểm hình ảnh, tăng cường hình ảnh và xử lý các thuộc tính của dữ liệu đầu vào Chúng tôi sử dụng

mô hình Faster R-CNN cải tiến để đào tạo và cho ra kết quả nhanh chóng và chính xác hơn

đữ liệu (=> £ Kiêm Kết quả

high nh Phân câp | Tập Trích xuất tra Nhận dạng

Tập

Kiêm tra

Hình 1 Quy trình thiết kế hệ thống nhận dạng quả dựa hấu

Hệ thong được xử lý các bước sau: Bước đầu tiên sẽ cung cấp một tập đữ liệu hình

ảnh và tiền hành lưu trữ tập đữ liệu vào bộ nhớ hệ thống Tập dữ liệu hình ảnh sẽ được

tiền xử lý ảnh thô với các bước: loại bk tạp ánh, các hình ảnh không nhìn rõ Bước tiếp

theo sẽ tiến hành trích xuất đặc trưng của hình ảnh, trên cơ sở màu sắc, hình dạng, kích thước và kết cầu bề mặt quả, để xác định các khuyết tật có trên quả Dưa hấu Hệ thống

nhận dạng sẽ kiểm tra, so khớp hình ảnh tồn tại trong tập dữ liệu va tiễn hành dự đoán với

mô hình huấn luyện trước nhằm xác định độ chín của quá Dưa hấu

3.1.2 Phương pháp xử lý

1 Tập dữ liệu quả Dưa hấu đầu vào

Dữ liệu hình ảnh đầu được chúng tôi tự thu thập bằng các thiết bị quay chụp

chuyên dụng Số lượng hình ảnh đạt được là 9600 hình ảnh Được chia thành 3 tập dữ liệu nhk bao gồm tập huấn luyện, tập xác nhận và tập kiểm thử cùng với thẻ định danh

thông tin Trước khi sử dụng 1000 hình ánh đề đánh giá, chúng tôi trích 8100 hình ảnh

đầu tiên để phục vụ cho huấn luyện Tập đữ liệu kiểm thử được tạo bằng cách sử dụng

500 hình từ tập dữ liệu Sơ đồ chia hình ảnh tập đữ liệu được biéu thị tại Hình 2 dưới đây.

Trang 14

\ _ À ( À =1

Training Validation set set

Hinh 2 Táp dữ liệu hình anh

2 Mô hình huấn luyện YOLO-V8

YOLOy8 là phiên bản mới nhất của mô hình phát hiện đối tượng YOLO Phiên bản mới nhất này có kiến trúc tương tự như người tiền nhiệm của nó là 6 nhưng nó giới thiệu nhiều cải tiến so với các phiên bản trước của YOLO chăng hạn như phiên bản mới kiến trúc mạng thần kinh sử đụng cả Mạng trung bình Pyra tính năng (FPN) và Mạng tổng hợp đường dẫn (PAN) và một công cụ ghi nhãn mới giúp đơn giản hóa quá trình chú thích Công cụ ghi nhãn này chứa một số tính năng hữu ích như tự động ghi nhãn, các phím tắt ghi nhãn và các phím nóng có thê tùy chỉnh

Sự kết hợp của các tính năng này giúp việc chú thích hình ảnh để huấn luyện mô hình trở nên dễ dàng hơn FPN hoạt động bằng cách giảm dân độ phân giải không gian của hình ảnh đầu vào đồng thời tăng số lượng của các kênh tính năng Điều này dẫn đến

việc tạo ra các bản đồ đặc trưng có khả năng phát hiện các đối tượng ở các vị trí khác

nhau Quy mô và độ phân giải Mặt khác, kiến trúc PAN tay, tổng hợp các tính năng từ các cấp độ khác nhau của mạng thông qua việc bk qua các kết nối Bằng cách làm như vậy, mạng có thê năm bắt tốt hơn các đặc điểm ở nhiều tỷ lệ và độ phân giải, điều này rất quan trọng đề phát hiện chính xác các đồi tượng của kích cỡ và hình dạng khác nhau

YoLo-v8 là một mô hình máy học được sử dụng dé phat hiện đối tượng Nó là

phiên bản mới nhất trong đòng mô hình YoLo, được phát triển bởi Ultralytics YoLo-v8

được thiết kế đề đạt được độ chính xác cao và tốc độ nhanh, khiến nó trở thành một lựa

chọn tốt cho các ứng dụng phát hiện đối tượng trong thời gian thực

YoLo-v8 hoạt động bằng cach chia hình ánh thành một lưới các ô vuông nhk Mỗi

ô vuông này được coi là một khung cảnh tiềm năng đề phát hiện đối tượng Mô hình sau

đó dự đoán khả năng có đối tượng trong mỗi ô vuông, cũng như các thuộc tính của đối

tượng, chăng hạn như loại đối tượng, vị trí và kích thước

Trang 15

Hình 3 Kiến trúc hệ thống của Yolo

YoLo-v8 sử dụng một mạng lưới tích chập (CNN) đề học các đặc điểm của đối

tượng CNN là một loại mạng nơ-ron được thiết kế để phân biệt các mẫu trong đữ liệu

hình ảnh YoLo-v8 sử dụng một CNN sâu, có nghĩa là nó có nhiều lớp mạng nơ-ron Điều này cho phép nó học các đặc điểm tinh vi hơn của đối tượng, dẫn đến độ chính xác cao hơn

Tình 4 Kiến trúc hệ thong hudin luyện của Yolo-về (do người dùng guhìub RangeKing đăng tải)

YoLo-v8 cũng sử dụng một kỹ thuật gọi là "anchor box” dé cai thiện độ chính xác Anchor box là các hộp có kích thước và vị trí khác nhau được sử dụng để dự đoán vị trí

của đối tượng YoLo-v§ sử dụng các anchor box đề thu hẹp phạm vi tìm kiếm của đối

tượng, dẫn đến độ chính xác cao hơn

YoLo-v8 đã đạt được nhiều thành tựu trong lĩnh vực phát hiện đối tượng Nó đã được chứng minh là vượt trội so với các mô hình khác về độ chính xác và tốc độ YoLo-

v8 hiện đang được sử dụng trong một loạt các ứng dụng, bao gồm tự lái xe, nhận dạng

khuôn mặt và giám sát video

Dưới đây là một số điểm chính về cách YoLo-v8 hoạt động:

Ngày đăng: 20/12/2024, 16:25

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN