Công nghệ này sử dụng mô hình máy học YoLo-v8 dé phát hiện và nhận dạng các loại hoa quả trong hình ảnh hoặc video.. Với sự phát triển nhanh chóng của xã hội, nhu cầu tìm kiếm và xử lý t
Trang 1TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN &
TRUYEN THONG VIET HAN
KHOA KHOA HOC MAY TINH
BAO CAO THỰC TẬP DOANH NGHIỆP
DE TAI:
XAY DUNG BO CO SO DU LIEU CHO TRAI
DUA HAU HO TRO TRONG NHAN DANG
VA PHAT HIEN DOI TUONG
Sinh viên thực hiện : NGUYEN XUAN TAI 19IT4
Giảng viên hướng dẫn : TS.TRẢN VĂN ĐẠI
Đơn vị thực tập : Trung Tâm Phát Triển Phần Mềm - ĐHĐDN
Người hướng dẫn : NGUYEN HA HUY CUONG
Da nang, thang 12 nam 2023
Trang 2TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN &
TRUYEN THONG VIET HAN
KHOA KHOA HOC MAY TINH
VA PHAT HIEN DOI TUONG
Sinh viên thực hiện : NGUYEN XUAN TAI 19IT4
Giảng viên hướng dẫn : TS.TRẢN VĂN ĐẠI
Đơn vị thực tập : Trung Tâm Phát Triển Phần Mềm - ĐHĐDN
Người hướng dẫn : NGUYEN HA HUY CUONG
Da nang, thang 12 nam 2023
Trang 4MỞ ĐẦU
Ngày nay, trí tuệ nhân tạo đang ngày cảng phát triển mạnh mẽ Các hãng lớn như Apple, Microsoft, Google đều đưa ra các công nghệ tương tác trực tiếp với người dùng Trí tuệ nhân tạo đang ngày càng được nâng cấp hoàn thiện giúp người dùng đễ dàng tương tác, dễ sử dụng và giảm quá trình thực hiện Trí tuệ nhân tạo đang là một lĩnh vực mới mẻ và được sự quan tâm rất lớn từ các hãng công nghệ hàng đầu Với công nghệ đang ngày càng được áp dụng trong đời sống giúp con người làm việc hiệu quả hơn tiết
kiệm thời gian và sức lực, trí tuệ nhân tạo như một hệ thông được xây dựng dé phuc vu
cho điều đó
Trong vài năm trở lại đây, các dự án về AI thừa kế với những ưu việt của các công nghệ đê giúp chúng ta làm việc một cách nhanh chóng và dễ đàng hơn Đặc biệt với sự
góp mặt của các phân mềm trí tuệ nhân tạo như: Chatbot, nhận điện gương mặt, Watson,
quét vân tay ngày cảng phát triển mạnh mẽ và được nhiều người và các doanh nghiệp
ưa chuộng và giúp ích trong cuộc sống hằng ngày
Nhận dang hoa quả bằng công nghệ YoLo-v§ là một ứng dụng của công nghệ trí tuệ nhân tạo (AT) trong lĩnh vực nông nghiệp Công nghệ này sử dụng mô hình máy học
YoLo-v8 dé phát hiện và nhận dạng các loại hoa quả trong hình ảnh hoặc video Với sự
phát triển nhanh chóng của xã hội, nhu cầu tìm kiếm và xử lý thông tin ngày càng nhiều, với mục đích nghiên cứu, tìm hiểu cách xây đựng mô hình để cập nhật và huấn luyện, xử
lý thông tin, hình ảnh nhận dạng hoa quả trong nông nghiệp qua đó em quyết định chọn
đề tài “XÂY DỰNG BỘ CƠ SỞ DỮ LIỆU CHO TRÁI DƯA HẦU HỒ TRỢ NHẬN DANG VA PHAT HIEN ĐÓI TƯỢNG”.
Trang 5LỜI CẢM ƠN
Chúng em xin chân thành cảm ơn các thầy cô và các bạn đã dành thời gian giúp đỡ
chúng em trong quá trỉnh thực hiện đồ án này Đặc biệt, chúng em xin chân thành cảm ơn
TS Trần Văn Đại là người hướng dẫn cho đề tài của chúng em Là người tận tình giúp đỡ
chúng em về thông tin của đồ án môn học Nhờ vậy mà chúng em đã hoàn chỉnh được đồ
án của mình và quan trọng hơn hết là chúng em đã tiếp thu được những kinh nghiệm trong suốt quá trình thực hiện đồ án Tuy nhiên, vì đây là lần đầu tiếp cận một công nghệ mới để thực hiên môi dự án cho bản thân măe dù đã tìm tòi nghiên cứu nhưng không tránh khki những thiếu sót
Dưới đây là kết quả của quá trình tìm hiểu và nghiên cứu mà chúng em đã đạt được trong thời gian vừa qua Tuy có nhiều cố gắng học hki trau dồi để nâng cao kiến thức nhưng không thê tránh khki những sai sót Chúng em rất mong được những sự góp ý quý báu của các thầy, cô cũng như tất cả các bạn đề bài đồ án của em được hoàn thiện hơn
Ching em xin chân thành cảm on!
Trang 6CHUONG II: PHÂN TÍCH VÁN ĐÈ CỦA DỰ ÁN HH H2 HH re 9
2.1 Vấn đề thực tẾ ch HH HH 2 H2 tr Hà Hà H212 tr nang ng ng ung 9
2.2 Kết luận vấn đề và giới thiệu giải pháp
2.3 Giới thiệu VOLO-V8 c2 HH nề HH nh Hung hen 12 CHƯƠNG II: NỘI DUNG CÔNG VIỆC THỰC TẬP 5 22t 2211112222222 reo 14
3.1 Quá trình thực hiện wild
Trang 7
CHƯƠNG I: GIỚI THIỆU VỀ CƠ QUAN THỰC TẬP
1.1 Cơ quan thực tập
Tên đơn vị: Trung tâm phát triển phần mềm - đại học đà năng
Dia chi: 41 D Lé Duan, Hai Chau 1, Hai Chau, Da Nang 550000
Email: contact@sdc.udn.vn
Website: https://sdc.udn.vn/
1.2 Giới thiệu chung
Trung tâm phát triển phần mềm (SDC) là một đơn vị trực thuộc Đại học Đà Nẵng,
một trong ba trường đại học vùng lớn nhất Việt Nam Được thành lập từ năm 2000,
SDC đã nhanh chóng phát triển trở thành một trong những trung tâm công nghệ hàng đầu của thành phố và cả nước
SDC có đội ngũ nhân viên giàu kinh nghiệm và chuyên môn cao, được đảo tạo bài bản tại các trường đại học danh tiếng trong và ngoài nước SDC cũng đầu tư mạnh mẽ
vào cơ sở vật chất và trang thiết bị hiện đại, đáp ứng được nhu cầu phát triển của các
dự án công nghệ phức tạp
SDC hoạt động trong nhiều lĩnh vực công nghệ khác nhau, bao gồm:
e Nghiên cứu và phát triên phần mềm: SDC là một trong những trung tâm nghiên cứu và phát triển phần mềm hàng đầu Việt Nam SDC đã phát triển thành công nhiều sản phẩm phần mềm chất lượng cao, phục vụ cho nhiều ngành nghề khác nhau
¢ Thi công dự án CNTT: SDC nhận thi công rất nhiều dự án CNTT lớn nhk, từ các doanh nghiệp lớn tại Việt Nam đến các tập đoàn đa quốc gia SDC có kinh nghiệm triển khai thành công nhiều dự án phức tạp, đòi hki yêu cầu cao về kỹ
thuật và chất lượng
® Thị công dự án BIM: SDC là một trong những đơn vị tiên phong trong lĩnh
vực thi công dự án BIM tại Việt Nam BIM là một xu hướng mới trong ngành
xây dựng, giúp nâng cao hiệu quả và chất lượng của các dự án xây dựng SDC
đã triển khai thành công nhiều đự án BIM lớn, góp phân thúc đây sự phát triển của ngành xây dựng Việt Nam
Trong những năm qua, SDC đã đạt được nhiều thành tích đáng ghi nhận, góp phần thúc đây sự phát triên của ngành công nghệ thông tin Việt Nam SDC đã được nhiều
tô chức uy tin trong và ngoài nước trao tặng giải thưởng, SDC cam kết tiệp tục phát triển và
Trang 8nâng cao chất lượng dịch vụ, góp phần đưa Việt Nam trở thành một trung tâm công nghệ thông tin hàng đầu khu vực
1.3 Mục tiêu hoạt động
Trung tâm Phát triển Phần mềm - Đại học Đà Nẵng đặt mục tiêu trở thành đơn vị
hàng đâu trong việc đào tạo, nghiên cứu và phát triển giải pháp phân mêm cũng như giải pháp Chuyền đối số trong khu vực
Trung tâm Phát triển Phần mềm - Đại học Đà Nẵng cam kết cung cấp chương trình đào tạo và đánh giá chất lượng chuyên nghiệp, phù hợp với tiêu chuẩn quốc tế đề đáp ứng nhu cầu ngày càng cao của thị trường
Trung tâm Phát triển Phần mềm xác định các gia tri cốt lõi của mình là chất lượng,
sáng tạo, trách nhiệm và cam kết Chúng tôi cam kết đáp ứng yêu cầu của các khách hàng và đối tác bằng cách cung cấp chất lượng dịch vụ và sản phẩm tốt nhất
Trang 9CHUONG II: PHAN TICH VAN DE CUA DỰ ÁN
2.1 Van dé thực tế
Trí tuệ nhân tạo, Internet vạn vật hay đữ liệu lớn (Big Data) là những thành tựu nồi bật của Cách mạng công nghiệp 4.0; tao ra sự chuyên biến đột phá về công nghệ khoa học phục vụ mô hình sản xuất mới, tác động mạnh mẽ tới kinh tế chính trị và đời sống xã hội Trí tuệ nhân tạo đang nhanh chóng trở thành một trong những lĩnh vực khoa học rất tiềm năng được mong đợi nhất, sẽ mang lại lợi ích to lớn cho nhiều ngành công nghiệp Ứng dụng trí tuệ nhân tạo vào các lĩnh vực, trong đó ngành Nông nghiệp được sử dụng rộng rãi và mang nhiều kết quả hữu ích như: Máy kéo không người lái, máy thu hoạch
trứng tự động, hệ thông đo độ âm của đất phục vụ cho tưới tiêu nông sản Đặc biệt, nhiều nghiên cứu quốc tế đã chí ra rằng việc sử dụng trí tuệ nhân tạo có thê làm tăng tốc độ và
đo độ chính xác cho chẳn đoán nông nghiệp, hạn chế sử dụng thuốc bảo vệ thực vật và đảm bảo được chất lượng an toàn thực phẩm
Xử lý hình ảnh và thị giác máy tính được sử dụng đề đáp ứng các nhu cầu trên Nhận dạng quả cây từ hinh anh thuộc trong sô đó, hiện nay đang được triển khai nghiên
cứu và đưa vào thực tê
Xử lý ảnh và thị giác máy tính là những công nghệ tiên tiến có thê được sử dụng
đề tự động hóa nhiệm vụ này Các phương pháp này dựa trên việc phân tích các đặc điệêm hình ảnh của quả dưa hâu, chăng hạn như màu sắc, hình dạng, và kích thước
Một số phương pháp xử lý ảnh và thị giác máy tính thường được sử đụng đề phân loại dưa hấu bao gồm:
¢ Phan tich mau sắc: Phương pháp này sử dụng các thuật toán để phân tích độ bão hòa, độ sáng, và các giá trị RGB của quả đưa hấu
© Phân tích hình dạng: Phương pháp này sử dụng các thuật toán đề phân tích hình dạng của quả dưa hấu, chăng hạn như chiều dài, chiều rộng, và tỷ lệ chiều đài trên
Trang 10dura hau bằng xử lý ảnh và thị giác máy tính là một công nghệ tiên tiến có nhiều tiềm năng ứng dụng
Dưa hấu là một loại quá giải khát rất được ưa chuộng, nhất là trong những ngày hè nóng nực Dưa hấu có nguồn gốc từ châu Phi, thuộc họ bầu bí, thân cây leo, có nhiều lông tơ trên thân và cuống Lá đưa hấu khá dày, mặt bên có nhiều lông, phiến lá cắt thành nhiều thùy, mỗi lá khoảng 7 thùy Hoa của cây dưa hầu có màu vàng, thường mọc ở nách
la Qua dua hau co vk cứng, thịt ngọt và mọng nước, phần ruột bên trong quả dưa hầu
thường có màu đk hoặc hồng, có hai loại là đưa hấu có hạt và dưa hấu không hạt Dưa
hấu chứa nhiều nước, ít calo và nhiều chất dinh dưỡng như vitamin A, vitamin C, dong, kali, lycopene và cucurbitacin E Dưa hấu có nhiều lợi ích cho sức khke như giúp giải nhiệt, giảm viêm, ngăn ngừa ung thư, tăng cường sức đề kháng và làm đẹp da Dưa hấu cũng có thê được sử dụng đề làm trang trí hoặc làm thành các món ăn ngon như sinh tố dưa hấu, salad dưa hầu hay xà lách đưa hấu Dưa hấu ở Việt Nam cũng gắn liền với nhiều
lễ hội và phong tục đân gian Ví dụ như lễ hội dựa hấu ở Hải Dương, lễ hội đưa hấu ở Quảng Ngãi hay lễ cúng dưa hấu vào ngày Tết Nguyên đán Dưa hấu cũng là một loại quả mang ý nghĩa tốt lành và may mắn trong văn hoá Việt Nam Dưa hấu thường được trưng bày trong các buổi tiệc hay trong nhà để cầu mong sự sung túc và phát tài
2.2 Kết luận vấn đề và giới thiệu giải pháp
Trong những năm gân đây, các thuật toán cải tiễn từ mạng nơ-ron tích chập đang được ứng dụng ngày cảng hiệu quả cho phép đạt tới ngưỡng chính xác tuyệt đôi được sử dụng phô biến, cho kết quả cao trong các bài toán nhận dạng và phân loại hình ảnh, nhận đạng văn bản, Mạng nơ-ron tích chập (CNN§s) cho phép khả năng trích chọn đặc trưng của lớp tích chập, sử dụng nhiều lớp tích chập và lớp gộp đề xử lý các đơn vị hình ảnh Thuật toán Faster RCNN được cải tiến từ đó, với khả năng phát hiện đối tượng, thuật toán thực hiện 2 bước chính Đầu tiên, cả bức ảnh được cho qua mô hình huấn luyện trước đề lấy bản đồ đặc trưng Sau đó bản đồ đặc trưng được dùng cho RPN đề lây được
các khu vực, sau khi lấy được vị trí các khu vực thì thực hiện tương tự Fast R-CNN
Một đề xuất khác You Only Look Once (YOLO), mét may dò áp dụng mang no- ron duy nhất cho toàn bộ hình ảnh, chia hình ảnh thành các vùng và dự đoán các hộp giới
han Byoungoun Kim va céng sự sử dụng mô hình mạng thần kinh sâu (DNN) để cải thiện
khả năng phát hiện bệnh trên trái dâu tây Jose Luis Roòas-Aranda và cộng sự sử dụng Deep learning phân loại trái cây cho cửa hàng bán lẻ, với màu đơn sắc RGB và biêu đỗ RGB từ phân cụm K-mean được sử dụng đầu mô hình Joseph Redmon đề xuất cách tiếp cận mới đề phát hiện đối tượng sử dụng hộp giới hạn và xác suất lớp liên quan, tôi ưu hóa end-to-end trực tiếp dựa trên hiệu suất phát hiện Trong lĩnh vực nông nghiệp công nghệ
cao, nhóm nghiên cứu Horea và cộng sự đã đề xuất một hệ thong huấn luyện theo kỹ
Trang 11cộng sự đề xuất hệ thống tự động nhận dạng trái cây và rau quá sử đụng công nghệ thị
giác máy tính và máy học Md Tohidul Islam và cộng sự đề xuất một hệ thong su dung
mạng nơ-ron phức hợp đề phân loại hình ảnh thực phẩm Mạng nơ-ron phức hợp sử dụng một mô hình máy tính để mô phkng khả năng của bộ não thành cỗ máy nhận biết và phân biệt hình ảnh thực phâm Emmanuel Karlo Nyarko và cộng sự đề xuất hệ thông nhận dạng quá đến kỳ để thu hoạch tự động bằng rô-bốt thông minh Tao Yongting và Zhou
Jun đã đề xuất hệ thông nhận dạng chính xác để thu hoạch quả táo tự động bằng robot Walter Maldonado Jr va Jose Carlos Barbosa da đề xuất hệ thong chiết xuất các đặc điểm của quả xanh, vấn đề này được thực hiện với sự kết hợp của các kỹ thuật chuyền đổi
mô hình màu, tạo ngưỡng, cân bằng biều đồ, lọc không gian với các toán tử Laplace,
Sobel va lam mo Gaussian, phat triển một thuật toán đếm số quả cam xanh, có thé tao ra
công cụ hữu ích cho các nông dân trong quản lý trái cây trong vườn Nhóm nghiên cứu Xiangqin Wei và cộng sự đã mô tả phương pháp tự động trích xuất các đối tượng trái cây dưới môi trường phức tạp sử dụng rô bốt hái trái cây Nhóm nghiên cứu Sakib và cộng sự
đã đề xuất hệ thống nhận đạng trái cây bằng cách sử dụng Mạng nơ-ron tích chập (CNN)
và thị giác máy tính Mô hình toán học được xây dựng và thuc thi trong python bao gồm
việc sử dụng TensorFlow, kết quả cho thấy, với số lớp ân phù hợp, CNN có thê đạt độ
chính xác cao trong việc phân loại các loại trái cây Đặc biệt, các nhà nghiên cứu hiện
nay đang rất quan tâm tới việc ứng dụng công nghệ cao vào các lĩnh vực của đời sông Với mô hình nông nghiệp, có thê hỗ trợ nông dân trong công việc chăm sóc định kỳ, tăng chất lượng đầu ra của trái cây, từ đó có thê phát triên nền nông nghiệp vững mạnh Trong các công trình nghiên cứu của TS Nguyễn Hà Huy Cường và cộng sự, đã nghiên cứu ứng
dụng mô hình YOLO-v8, trong việc nhận dạng và phát hiện đối tượng dựa vào hình ảnh,
camera cho bốn lớp trái dứa ở các thời kỳ: Trái dứa non, trái đứa chưa chín (trái già), trái dứa chín, trái dứa hư hkng Ngoài ra, nhóm chúng tôi cũng đã nghiên cứu thực nghiệm,
đánh giá hiệu suất và so sánh ưu nhược điểm khi sử dụng mô hình YOLO và mô hình
train ROBOFLOW trén tập sở đữ liệu quả Dưa hấu đã xây dựng
YOLOv8 là một mô hình phát hiện đôi tượng dựa trên kiên trúc CNN (Mạng thân
kinh tích chập) được phát triển bởi Ultralytics Đây là phiên bản mới nhất trong dòng mô
hình YOLO, và nó đã đạt được những thành tựu đáng kẻ về độ chính xác và tốc độ YOLOv8 được xây dựng dựa trên kiến trúc CSPDarknet, đây là một biến thể của
Darknet được cải thiện về hiệu suât và khả năng mở rộng Kiến trúc CSPDarknet sử dụng các khôi kết nôi không đông nhất (CSP) đề giảm sô lượng tham sô và tăng tôc độ tính toán
YOLOv8 cũng sử dụng các kỹ thuật tiên tiên khác đề cải thiện hiệu suất, bao gồm:
¢ Bộ cân bằng kích thước: Kỹ thuật này sử dụng các kích thước lớp khác nhau cho
Trang 12cho các trọng số của mô hình, giúp giảm đáng kê mức sử dụng bộ nhớ và tốc độ tính toán
e Huấn luyện trước: YOLOv8 được đào tạo trước trên tập dữ liệu COCO, một tập
dữ liệu lớn gồm hình ảnh và nhãn đối tượng Điều này giúp cải thiện độ chính xác
của mô hình trên các tập dữ liệu mới
YOLOv8 đã đạt được những kết quả ấn tượng vẻ độ chính xác và tốc độ trên các tập
đỡ liệu phát hiện đối tượng Trong thử nghiệm trên tập dữ liệu COCO, YOLOv8 đạt độ
chính xác mAP(00.5:0.95 la 43.3%, cao hơn 1.8% so với YOLOv7 YOLOv8 cũng có
tốc độ dự đoán nhanh, với tốc độ 400 FPS trên GPU Nvidia RTX 3090
YOLOv8 là một mô hình mạnh mẽ và hiệu quả có thê được sử dụng trong nhiều ứng
dụng phát hiện đối tượng, chăng hạn như:
® Tuy lai xe
© Theo dõi vat thé
® Nhdan dạng khuôn mặt
e Phân loại hinh ảnh
Dưới đây là một số ưu điểm và nhược điểm của YOLOv8:
® Nhin chung, YOLOv§ là một mô hình phát hiện đối tượng mạnh mẽ và hiệu quả
có thê được sử dụng trong nhiêu ứng dụng
Trang 13CHƯƠNG III: NỘI DUNG CÔNG VIỆC THUC TẬP
3.1 Quá trình thực hiện
3.1.1 Thiêt kê hệ thông
Hệ thông nhận dạng quả Dưa hấu dựa trên trí tuệ nhân tạo cụ thê là sử dụng thị
giác máy tính và kỹ thuật xử lý hình ảnh đề phát hiện và phân loại quả Dưa hấu chín bằng cách sử dụng mạng nơ-ron tích chập đề phân tích, trích xuất đặc trưng các đặc điểm hình ảnh, tăng cường hình ảnh và xử lý các thuộc tính của dữ liệu đầu vào Chúng tôi sử dụng
mô hình Faster R-CNN cải tiến để đào tạo và cho ra kết quả nhanh chóng và chính xác hơn
đữ liệu (=> £ Kiêm Kết quả
high nh Phân câp | Tập Trích xuất tra Nhận dạng
Tập
Kiêm tra
Hình 1 Quy trình thiết kế hệ thống nhận dạng quả dựa hấu
Hệ thong được xử lý các bước sau: Bước đầu tiên sẽ cung cấp một tập đữ liệu hình
ảnh và tiền hành lưu trữ tập đữ liệu vào bộ nhớ hệ thống Tập dữ liệu hình ảnh sẽ được
tiền xử lý ảnh thô với các bước: loại bk tạp ánh, các hình ảnh không nhìn rõ Bước tiếp
theo sẽ tiến hành trích xuất đặc trưng của hình ảnh, trên cơ sở màu sắc, hình dạng, kích thước và kết cầu bề mặt quả, để xác định các khuyết tật có trên quả Dưa hấu Hệ thống
nhận dạng sẽ kiểm tra, so khớp hình ảnh tồn tại trong tập dữ liệu va tiễn hành dự đoán với
mô hình huấn luyện trước nhằm xác định độ chín của quá Dưa hấu
3.1.2 Phương pháp xử lý
1 Tập dữ liệu quả Dưa hấu đầu vào
Dữ liệu hình ảnh đầu được chúng tôi tự thu thập bằng các thiết bị quay chụp
chuyên dụng Số lượng hình ảnh đạt được là 9600 hình ảnh Được chia thành 3 tập dữ liệu nhk bao gồm tập huấn luyện, tập xác nhận và tập kiểm thử cùng với thẻ định danh
thông tin Trước khi sử dụng 1000 hình ánh đề đánh giá, chúng tôi trích 8100 hình ảnh
đầu tiên để phục vụ cho huấn luyện Tập đữ liệu kiểm thử được tạo bằng cách sử dụng
500 hình từ tập dữ liệu Sơ đồ chia hình ảnh tập đữ liệu được biéu thị tại Hình 2 dưới đây.
Trang 14
\ _ À ( À =1
Training Validation set set
Hinh 2 Táp dữ liệu hình anh
2 Mô hình huấn luyện YOLO-V8
YOLOy8 là phiên bản mới nhất của mô hình phát hiện đối tượng YOLO Phiên bản mới nhất này có kiến trúc tương tự như người tiền nhiệm của nó là 6 nhưng nó giới thiệu nhiều cải tiến so với các phiên bản trước của YOLO chăng hạn như phiên bản mới kiến trúc mạng thần kinh sử đụng cả Mạng trung bình Pyra tính năng (FPN) và Mạng tổng hợp đường dẫn (PAN) và một công cụ ghi nhãn mới giúp đơn giản hóa quá trình chú thích Công cụ ghi nhãn này chứa một số tính năng hữu ích như tự động ghi nhãn, các phím tắt ghi nhãn và các phím nóng có thê tùy chỉnh
Sự kết hợp của các tính năng này giúp việc chú thích hình ảnh để huấn luyện mô hình trở nên dễ dàng hơn FPN hoạt động bằng cách giảm dân độ phân giải không gian của hình ảnh đầu vào đồng thời tăng số lượng của các kênh tính năng Điều này dẫn đến
việc tạo ra các bản đồ đặc trưng có khả năng phát hiện các đối tượng ở các vị trí khác
nhau Quy mô và độ phân giải Mặt khác, kiến trúc PAN tay, tổng hợp các tính năng từ các cấp độ khác nhau của mạng thông qua việc bk qua các kết nối Bằng cách làm như vậy, mạng có thê năm bắt tốt hơn các đặc điểm ở nhiều tỷ lệ và độ phân giải, điều này rất quan trọng đề phát hiện chính xác các đồi tượng của kích cỡ và hình dạng khác nhau
YoLo-v8 là một mô hình máy học được sử dụng dé phat hiện đối tượng Nó là
phiên bản mới nhất trong đòng mô hình YoLo, được phát triển bởi Ultralytics YoLo-v8
được thiết kế đề đạt được độ chính xác cao và tốc độ nhanh, khiến nó trở thành một lựa
chọn tốt cho các ứng dụng phát hiện đối tượng trong thời gian thực
YoLo-v8 hoạt động bằng cach chia hình ánh thành một lưới các ô vuông nhk Mỗi
ô vuông này được coi là một khung cảnh tiềm năng đề phát hiện đối tượng Mô hình sau
đó dự đoán khả năng có đối tượng trong mỗi ô vuông, cũng như các thuộc tính của đối
tượng, chăng hạn như loại đối tượng, vị trí và kích thước
Trang 15
Hình 3 Kiến trúc hệ thống của Yolo
YoLo-v8 sử dụng một mạng lưới tích chập (CNN) đề học các đặc điểm của đối
tượng CNN là một loại mạng nơ-ron được thiết kế để phân biệt các mẫu trong đữ liệu
hình ảnh YoLo-v8 sử dụng một CNN sâu, có nghĩa là nó có nhiều lớp mạng nơ-ron Điều này cho phép nó học các đặc điểm tinh vi hơn của đối tượng, dẫn đến độ chính xác cao hơn
Tình 4 Kiến trúc hệ thong hudin luyện của Yolo-về (do người dùng guhìub RangeKing đăng tải)
YoLo-v8 cũng sử dụng một kỹ thuật gọi là "anchor box” dé cai thiện độ chính xác Anchor box là các hộp có kích thước và vị trí khác nhau được sử dụng để dự đoán vị trí
của đối tượng YoLo-v§ sử dụng các anchor box đề thu hẹp phạm vi tìm kiếm của đối
tượng, dẫn đến độ chính xác cao hơn
YoLo-v8 đã đạt được nhiều thành tựu trong lĩnh vực phát hiện đối tượng Nó đã được chứng minh là vượt trội so với các mô hình khác về độ chính xác và tốc độ YoLo-
v8 hiện đang được sử dụng trong một loạt các ứng dụng, bao gồm tự lái xe, nhận dạng
khuôn mặt và giám sát video
Dưới đây là một số điểm chính về cách YoLo-v8 hoạt động: