TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM TÓM TẮT Bài báo cáo dự án cuối kỳ về chủ đề: “Nhận diện biển báo giao thông “thực hiện trong vòng 9 tuần.. Mục tiêu dự án là nhận diện nhanh, ch
Trang 1TRI TUE NHAN TAO TRUONG DH SPKT TP.HCM
TRUONG DAI HOC SU PHAM KY THUAT THANH PHO HO CHi
MINH KHOA CO KHI CHE TAO MAY
Trang 2TRI TUE NHAN TAO TRUONG DH SPKT TP.HCM
Nam hoc: 2023 — 2024
Trang 3
TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
LỜI CẢM ƠN
Chung em xin bay to lòng biết ơn sâu sắc đến thầy Trần Vũ Hoảng, giảng viên môn Trí
tuệ nhân tạo Suốt quá trinh học tập và thực hiện bài tiểu luận cuối kỳ này, thầy đã luôn tận tỉnh hướng dẫn, truyền đạt những kiến thức quý báu cho chúng em Sự nhiệt huyết
và tận tụy của thầy đã tạo nên một môi trường học tập đầy hứng khởi và sáng tạo, g1úp chúng em phát triển khả năng tư duy, phân tích và giải quyết vấn đề một cách hiệu quả Những hướng dẫn chi tiết và những phản hồi kịp thời của thầy trong quá trình làm báo cáo đã giúp chúng em hoàn thiện và nâng cao chất lượng bài làm của mình Sự kiên nhẫn và tận tâm của thầy đã giúp chúng em không ngừng cải thiện và đạt được kết quả
tốt nhất
Chúng em xin gửi lời cảm ơn chân thành đến thầy Trần Vũ Hoàng vì tất cả sự hỗ trợ vả
động viên quý báu trong suốt thời gian qua Chúng em luôn ghi nhớ và trân trọng những
gì thầy đã truyền đạt, và điều đó sẽ là hành trang quý giá trong chặng đường học tap va
công việc sau này của chúng em
Chúng em chân thành cảm ơn thầy!
Trang 4
TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
Trang 5
TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
TÓM TẮT
Bài báo cáo dự án cuối kỳ về chủ đề: “Nhận diện biển báo giao thông “thực hiện trong vòng 9 tuần Dự án được thực nhằm ứng dụng trong hệ thống hỗ trợ tài xế lái xe, hạn chế tình trạng tai nạn giao thông Từ đó đóng góp vảo an toàn giao thông trên thế giới nói chung và tại Việt Nam nói riêng Mục tiêu dự án là nhận diện nhanh, chính xác các loại biến báo giao thông trong hệ thống biên báo tại Việt Nam Ngoài ra yêu cầu phần mềm hệ thông có dung lượng thấp giúp đảm bảo có thế áp dụng trên các phần cứng đơn
giản trên phương tiện giao thông Trong quá trình khảo sát nhóm nhận thấy những thách
thức đặt ra như sự đa dạng về số lượng biên báo giao thong 6 Viet Nam, biến thể của các loại biến báo và sự phụ thuộc vào môi trường như ánh sáng, cây cối Từ đó nhóm
đã quyết định sử dụng YOLOv5 để thực hiện dự án nhằm đáp ứng những yêu cầu và thách thức đã nêu ở trên Sau khi thực hiện mô hình đã dự đoán các biến báo có tỉ lệ chính xác khá cao, phần mềm có thê đáp ứng được trong thực tế Tuy nhiên vỉ thời gian
có hạn nên dự án hiện chưa thể thực hiện trên phần cứng Vậy nên, nhóm hy vọng dự án
có thể sớm được phát triển hơn nữa bằng cách có thể áp dụng rộng rãi trong thực tế
Trang 6
TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
MỤC LỤC
L TỎNG QUAN LH nn ng KĐT TK EEkKEKTKEEKEEEEI 6
II CƠ SỞ LÝ THUYẾT ĐT HH HH ướt 9
II PHƯƠNG PHÁP ĐÈ XUẤT, SG 0S ST TT HT HH HH TH HH Hành 10
TV KẾT QUÁ ĐẠT ĐƯỢC uc TL TS HT TH TH TT ng Hà ấu 15
Trang 7TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
Trang 8
TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
DANH MỤC HÌNH ẢNH
Hình 1 So sánh tốc độ xử lý và độ chính xác các phiên bản YOLOVB 14 Hình 2 Kiến trúc YOLOVB[2] 2t vn HS SSS ST HT TT nh TH HT ng kg vn 15
Hinh N/®ai-ávcioiolQdi(-csca 18
Hình 6 Kết quả thực nghiệm của mô hình c c2 32 xxx eray 20 Hình 7 Sử dụng mô hình YOLOV5 có trên Github che 21
Hình 10 Cấu hình và kiến trúc mô hình cc tt c nhe gio 22 Hình 11 Thông số tóm tắt của Các lay€T c0 12 vn HS ng nghe 23 Hình 12 Quá trình huấn luyện hoàn thành sau 50 epoch ccccccccsccce 23 Hình 13 Kết quả chỉ tiết của các class Sau qua trình huấn luyện 24 Hình 14 Lưu các Hyperparamet€r ch n TH TT TH TK TK K kh nh 24 Hình 15 Các siêu tham SỐ ntnnn TT T TT TT TT HH gen 25
Hình 19 Thông số về phương pháp đánh giá c các tt chào 29 Hình 20 Hình ảnh kết quả phương pháp đánh giá c cà ccSSsssehhiirrrrrses 29 Hình 21 Biểu đồ Box LOSS c nQ1 1 12 1S SH v ST HT TT TH KH Tnhh 30 Hình 22 Biểu đồ Objectness LOSS n1 HS SS SH TH ng khe ss 31 Hình 23 Biểu đồ ClassifiCation LOSS c1 1111211111111 1111 1 111g khhyờ 31
Trang 9
TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
Hình 25 Kết quả thực nghiệm - 11111111 ng TH TH TH ng gio 32
Hình 27 Kết quả thực nghiệm bằng video L1 HS HS TH HH He 33
Trang 10
TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
và phân loại các biến báo giao thông một cách hiệu quả Điều này không chỉ giúp người lái xe nhận biết kip thời các biển báo trên đường mà còn hỗ trợ họ đưa ra các phản ứng phù hợp trone những tình huồng giao thông phức tạp Nhờ vậy, nguy cơ xảy ra tai nạn được giảm thiểu đáng kế, đảm bảo an toàn cho cả người lái và người tham gia giao thông khác
Hơn nữa, việc triển khai hệ thống nhận diện biển báo giao thông còn có ý nghĩa lớn trong việc nhắc nhở người lái xe tuân thủ các quy định giao thông Hệ thống có thê cảnh báo các hành vị vị phạm như chạy quá tốc độ hoặc đi sai làn đường và đưa ra cảnh báo
ngay lập tức, giúp người lái xe điều chỉnh hành vi kịp thời Điều này không chỉ giúp
giảm thiểu các vi phạm giao thông mà còn góp phần tạo nên một môi trường giao thông văn minh và an toàn hơn
Việc nghiên cứu và phát triển hệ thông nhận diện biến báo giao thông là một hướng đi
mang lại nhiều tiềm năng ứng dụng trong tương lai Hệ thống này không chỉ có khả
năng hỗ trợ lái xe mà còn có thể ứng dụng trong các hệ thống tích hợp vào các phương
tiện giao thông thông minh Với những lợi ích thiết thực và ý nghĩa lớn lao mả nó mang
lại, đề tài này không chỉ đóng góp vào việc đảm bảo an toản giao thông mà còn thúc đây
sự phát triển của công nghệ và xã hội trong thời đại mới
Mục tiêu của dự án nhận diện biển báo giao thông bao gồm hai điểm chính: nhận diện
chính xác và tốc độ nhận diện các loại biển báo đủ nhanh đề ứng dụng trong thực tế Thứ nhất, việc nhận diện chính xác các loại biến báo giao thông là yếu tô quan trọng nhằm đảm bảo an toản cho người tham gia giao thông và tuân thủ đúng các quy định
Trang 11
TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
pháp luật Hệ thống nhận diện phải có khả năng phân biệt rõ ràng và đúng đắn các loại biến báo, từ biển báo cắm, biến báo chỉ dẫn, đến các biên báo nguy hiểm
Thứ hai, tốc độ nhận diện nhanh là nhiệm vụ thiết yếu đề hệ thống có thể hoạt động
hiệu quả trong thời p1an thực, ø1úp người lái xe có đủ thời ø1an phản ứng và đưa ra các quyết định kịp thời khi điều khiển phương tiện Điều này đòi hỏi sự kết hợp giữa các thuật toán nhận diện hiện đại và khả năng xử lý mạnh mẽ của phần cứng, nhằm tối ưu hóa quá trình nhận diện mà không làm giảm độ chính xác
Bằng cách đạt được hai mục tiêu này, dự án hướng tới việc cung cấp một công cụ hỗ trợ lái xe hữu ích và an toàn trên các con đường
3 Giới hạn đề tài
Trong khuôn khô đề tài này, chúng em chỉ tập trung xây dựng chương trình nhận diện biển báo giao thông Mặc dủ mục tiêu ban đầu là xây dựng một hệ thông tích hợp trên các thiết bị phần cứng đề áp dụng trực tiếp trên phương tiện giao thông, nhằm hỗ trợ tài
xế lái xe một cách hiệu quả hơn, nhưng do hạn chế về thời gian và kinh phí, chúng em buộc phải điều chỉnh pham vị nghiên cứu Việc phát triển phần mềm nhận diện biển báo giao thông là một điều thiết thực trong điều kiện hiện tại Phần mềm này sẽ sử dụng hình ảnh từ camera để nhận diện và phân loại các biển báo giao thông, cung cấp thông tin hữu ích cho người dùng Chúng em tin rằng, dù chỉ dừng lại ở mức phần mềm, kết quả nghiên cứu này vẫn có giá trị ứng dụng cao, đồng thời mở ra nhiều hướng phát triển tiềm năng trong tương lai Khi có thêm nguồn lực về tài chính và thời gian, chúng em mong muốn tiếp tục phát triển đề tài nảy, tích hợp phần mềm vào các hệ thống phần cứng trên phương tiện giao thông đề hỗ trợ tốt hơn cho các tài xế trong việc nhận điện
và tuân thủ biến báo giao thông
Đồ án được nghiên cứu theo phương pháp thu thập đữ liệu, nghiên cứu lý thuyết và thực nghiệm, theo thứ tự sau:
- Tìm kiếm dữ liệu phù hợp với mô hình sẽ xây dựng
Trang 12
TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
chọn
- Đánh giá và hoàn chỉnh lại mô hình dựa trên mục tiêu đã đề ra
10
Trang 13TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
Đề có thê hoàn thành các nhiệm vụ trên, chúng em đã xây dựng bảng kế hoạch dựa trên
số lượng thành viên, nhiệm vụ và thời ø1an như sau:
BANG PHAN CONG NHIEM VỤ
Khao sat
Tìm dữ liệu
Xác định mục
Bao cao gitra
Trang 14TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
- _ Ảnh hưởng của môi trường Điều kiện thời tiết khắc nghiệt như mưa, sương mù, ,
và ánh sáng mạnh có thé lam giam d6 chinh xac cua hệ thong nhận diện Thêm vào đó,
sự biến đổi trong ánh sáng ngày và đêm, cùng với bóng đồ từ các vật thê khác, cũng gây
khó khăn cho việc nhận diện chính xác biến báo
biển báo có nhiều kích cỡ, hình đạng, màu sắc và nội dung khác nhau gây sự nhằm lẫn
trong quá trình training cho hệ thống
=> Để giải quyết 2 thách thức trên thì yêu cầu bộ dữ liệu của chúng ta phải đầy đủ và
đa dạng các mẫu hình ảnh trong các môi trường, thời tiết và kích thước khác nhau Nếu không có bộ dữ liệu đầy đủ thì chúng ta có thể cho mô hình học cải thiện nhằm đảm bảo đầu ra được chính xác nhất có thê Tuy nhiên, luật giao thông có thé cap nhat tuy theo thực tế điều đó gây ra những khó khăn cho hệ thống vì vậy chúng ta cũng phải cập nhật
dữ liệu một cách thường xuyên khi có những thay đối
- _ Ngoài ra, đề triển khai hệ thống nhận điện biến báo giao thông trên các phương tiện thực tế, yêu cầu về mô hình gọn nhẹ và phù hợp với phần cứng hệ thống là rất quan trọng Nhiều phương tiện không có khả năng xử lý mạnh mẽ như các máy tính cao cấp
Do đó, mô hình phải được tôi ưu hóa để hoạt động hiệu quả trên phần cứng hạn chế Điều này đòi hỏi phải sử dụng các thuật toán và kiến trúc mạng neural tiết kiệm tài nguyên, nhưng vẫn đảm bảo được độ chính xác và tốc độ xử lý cần thiết
quyết mà chúng ta phải thực hiện Hiện nay có rất nhiều mô hình có thể xây dựng được
hệ thông nhận diện biên báo giao théng nhu Yolo, Faster R-CNN, SSD day cting la
12
Trang 15TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
thách thức cho chúng ta lựa chọn mô hình không chỉ phù hợp về tính gọn nhẹ mà còn về
độ chính xác, tôc độ xử lý,
II PHƯƠNG PHÁP ĐÈ XUẤT
I Yêu cầu thiết kế
Trong việc phát triển hệ thống nhận diện biển báo giao thông, yêu cầu thiết kế mô hình phải dựa trên mục tiêu chính của dự án là tạo ra một hệ thống nhận diện biển báo giao thông có khả năng hoạt động ổn định và chính xác trong nhiều điều kiện môi trường khác nhau, đồng thời cũng phải đáp ứng được yêu cầu về tốc độ xử ly, linh hoạt và tích hợp đễ dàng vào các hệ thống thực tế
Với mục tiêu nảy, việc thiết kế phải tập trung vào các yếu tổ sau:
- — Độ chính xác: Hệ thống cần phải nhận diện chính xác các loại biển báo giao thông với độ tin cậy cao, ngay ca trong các điều kiện ánh sáng khác nhau và các biến thê của biển báo
- _ Tốc độ xử lý: Đối với các ứng dụng thời gian thực như hệ thông hỗ trợ tài xế lái xe thi hệ thống cần có khả năng xử lý nhanh chóng đề đảm bảo phản ứng kịp thời
- Tính linh hoạt và dễ triển khai: Việc thiết kế phải linh hoạt và dễ dàng tích hợp vào
các hệ thống đã tồn tại mà không gây ra quá nhiều rắc rối trong quá trình triển khai
Trung binh dén
Độ phức | Phức tạp, yêu Đơn giản hơn Rât phúc tạp, triển khai nhưng
trong việc sử | yêu cầu nhiêu tài
hiệu suất không
băng các mô
hình khác
tạp của | câu điêu chỉnh
mô hình | tham sô nhiêu
13
Trang 16
nang tang tot trong nhieu Ấ aN tién hon “A yêu câu huan A A kK không băng a Ỳ
Yêu cầu | CẢGPU | 1ôlưuchotả L cài GbỤ mạnh, |_ trên cả GPU và
binh
gian | „san phạc| vuđểhuấn | Dài đồihỏi tài | Faster R-CNN,
ưu hóa Khả
.^ xá | mot so truong với đôi tượng không băng
trong
nhỏ
ưu hóa và cấu | framework hỗ phúc tạp
Từ những yêu câu trên cộng với việc nhìn nhận các ưu nhược điêm của mỗi phương
pháp nhận thấy YOLOw5 là lựa chọn phù hợp nhất để xây dựng hệ thông nhận diện biển
báo ø1ao thông
YOLOwv5 là phiên bản thứ 5 của YOLO Mô hình này được phát triển bởi công ty Ultralytics và được sử dụng đề phát hiện đối tượng YOLO đã được cộng đồng thị giác
máy tính phát triển không ngừng kê từ lần ra mắt đầu tiên vào năm 2015 bởi Joseph
Redmond Trong những ngày đầu (phiên bản 1-4), YOLO được duy trì bằng ngôn ngữ
14
Trang 17TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
C trong một khung học sâu tùy chỉnh do Redmond viết có tên là Darknet Phiên ban YOLOv5 sau khi được Ultralytics ra mắt đã nhanh chóng được sử dụng rộng rãi nhờ
cau trúc linh hoạt của nó [1] YOLOv5 có độ chính xác và tốc độ xử lý được cải thiện
khá rõ ràng so với phiên bản tiền nhiệm của nó là YOLOv4 Ngoài ra, đây còn là phiên bản đã được giảm kích thước mô hình nhằm đảm bảo có thể chạy được trên các thiết bị
phức tạp hơn nhưng vẫn giữ được tốc độ xử lý khá nhanh
- _ YOLOvấ5x: Phiên bản lớn nhất, độ chính xác cao nhất, phù hợp cho các ứng dụng
yêu cầu độ chính xác tối đa dù phải đánh đôi bằng tài nguyên và thời gian xử lý
15
Trang 18TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
+ Tốc độ cao: YOLOv5s được thiết kế đề có tốc độ xử lý nhanh, phù hợp với các ứng dụng thời ø1an thực
+ Hiệu quả: Dù nhỏ gọn, YOLOv5s vẫn duy trì độ chính xác đủ cao cho các tác vụ nhận
diện đối tượng
+ Tài nguyên: YOLOv5s yêu cầu ít tài nguyên phần cứng hơn so với các phiên bản lớn
hơn, giúp dé dang triển khai trên các thiết bị có tải nguyên hạn chế
Hinh 2, Kién tric YOLOv5[2]
Cấu trúc của YOLOv5 gồm 3 phần chính:
- _ Chức năng: Trích xuất các đặc trưng từ ảnh đầu vào
thể của Darknet53, có thêm các module CSP (Cross Stage Partial) dé cai
thiện hiệu suất và giảm thiêu tính toán, từ đó tối ưu mô hình tăng tốc độ huấn
Trang 19TRÍ TUỆ NHÂN TAO TRƯỜNG ĐH SPKT TP.HCM
dé giup nhan dién déi tượng ở các kích thước khác nhau
- Kích thước của hình ảnh đầu vào có thê được điều chỉnh, nhưng thường được chuẩn hóa thành một kích thước cố định
17