Vì vậy, việc xây dựng các hệ thông quản lý giao thôngthông minh Intelligent Transportation System đang là nhu cầu tất yêu của các thành phó.Trong đó, tác vụ đếm phương tiện giao thông từ
Trang 1ĐẠI HỌC QUOC GIA TP HO CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA KHOA HỌC VÀ KỸ THUẬT THÔNG TIN
NGUYEN VAN KHOA
KHOA LUAN TOT NGHIEP
Real-Time Distributed Traffic Statistics System
CU NHAN NGANH CONG NGHE THONG TIN
ĐỊNH HƯỚNG NHẬT BẢN
TP HÒ CHÍ MINH, 2022
Trang 2ĐẠI HỌC QUOC GIA TP HO CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA KHOA HỌC VÀ KỸ THUẬT THÔNG TIN
NGUYÊN VĂN KHOA - 18520929
KHÓA LUẬN TÓT NGHIỆP
HỆ THONG THONG KE LƯU LƯỢNG GIAO THONG
XU LY PHAN TAN THEO THOI GIAN THUC
Real-Time Distributed Traffic Statistics System
CU NHAN NGANH CONG NGHE THONG TIN
Trang 3THONG TIN HOI DONG CHAM KHÓA LUẬN TOT NGHIỆP
Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số
¬ eee eaeeeeeceeeeaees Ngay - của Hiệu trưởng Trường Dai hoc Công
nghệ Thông tin.
II — Chủ tịch.
PA = — Thư ký
Trang 4ĐẠI HỌC QUOC GIA TP HO CHÍMINH CONG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Tên khóa luận:
HE THONG THONG KE LƯU LUQNG GIAO THONG
XU LY PHAN TAN THEO THOI GIAN THUC
(Real-Time Distributed Traffic Statistics System)
Nhóm sinh viên thực hiên: Cán bộ hướng dẫn:
Nguyễn Văn Khoa - 18520929 TS Ngô Đức Thành
Đánh giá khóa luận:
1 Vé cuôn báo cáo:
Số trang Số chương
Số bảng số liệu Số hình vẽ
Số tài liệu tham khảo Sản phẩm
Một sô nhận xét về hình thức cuôn báo cáo:
Trang 52 Về nội dung nghiên cứu:
Điểm từng sinh viên:
Nguyễn Văn Khoa — /10
Người nhận xét
TS Ngô Đức Thành
Trang 6ĐẠI HỌC QUOC GIA TP HO CHÍMINH CONG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Tên khóa luận:
HE THONG THONG KE LƯU LUQNG GIAO THONG
XU LY PHAN TAN THEO THOI GIAN THUC
(Real-Time Distributed Traffic Statistics System)
Nhóm sinh viên thực hiện: Cán bộ hướng dẫn:
Nguyễn Văn Khoa — 18520929 ThS Đỗ Văn Tiến
Đánh giá khóa luận:
1 Vé cuôn báo cáo:
Số trang Số chương
Số bảng số liệu Số hình vẽ
Số tài liệu tham khảo Sản phẩm
Một sô nhận xét về hình thức cuôn báo cáo:
Trang 72 Về nội dung nghiên cứu:
Điểm từng sinh viên:
Nguyễn Văn Khoa — /10
Người nhận xét
ThS Đỗ Văn Tiến
Trang 8ĐẠI HỌC QUOC GIA TP HO CHÍMINH CONG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Tên khóa luận:
HE THONG THONG KE LƯU LUQNG GIAO THONG
XU LY PHAN TAN THEO THOI GIAN THUC
(Real-Time Distributed Traffic Statistics System)
Nhom sinh vién thuc hién: Can bô phan biên:
Nguyễn Văn Khoa — 18520929
Đánh giá khóa luận:
1 Vé cuôn báo cáo:
Số trang Số chương
Số bảng số liệu Số hình vẽ
Số tài liệu tham khảo Sản phẩm
Một sô nhận xét về hình thức cuôn báo cáo:
Trang 92 Về nội dung nghiên cứu:
Điểm từng sinh viên:
Nguyễn Văn Khoa — /10
Người nhận xét
Trang 10ĐẠI HỌC QUOC GIA TP HO CHÍMINH CONG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
TRƯỜNG ĐẠI HỌC Độc Lập -Tự Do -Hạnh Phúc
TP HCM, ngày 23 tháng 07 năm 2022
DE CƯƠNG CHI TIẾT
TÊN ĐÈ TÀI: HỆ THÓNG THÓNG KÊ LƯU LƯỢNG GIAO THÔNG XỬ LÝ
PHÂN TÁN THEO THỜI GIAN THỰC
TÊN DE TÀI (tiếng Anh): REAL-TIME DISTRIBUTED TRAFFIC STATISTICS
SYSTEM
Cán bộ hướng dẫn:
1 TS Ngô Đức Thành
2 ThS Đỗ Văn Tiến
Thời gian thực hiện: Từ ngày 10/02/2022 đến ngày 10/07/2022
Sinh viên thực hiện:
Nguyễn Văn Khoa — 18520929
Nội dung đề tai:(M6 tả chỉ tiết mục tiêu, phạm vi, đối tượng, phương pháp thực hiện, kết
quả mong đợi của dé tài)
Giới thiệu:
Những năm gần đây, với tốc độ phát triển đô thị hóa nhanh chóng, lượng phương tiện đồ
về các thành phố lớn ngày càng nhiều Điều này đã gây áp lực cho các tuyên đường có mật
độ phương tiện lưu thông dày đặc, ảnh hưởng không nhỏ đến môi trường sống và làm việc
của người dân Một trong những nguyên nhân chính gây lên tình trạng này đó là chưa có
nhiều các công cụ hay hệ thống hỗ trợ cho việc điều tiết lượng giao thông dựa trên tình
Trang 11trạng thực tê của mỗi tuyến đường Vì vậy, việc xây dựng các hệ thông quản lý giao thôngthông minh (Intelligent Transportation System) đang là nhu cầu tất yêu của các thành phó.Trong đó, tác vụ đếm phương tiện giao thông từ dit liệu thu được bởi camera giao thông
là tác vụ cốt lõi và đã trở thành một trong những chủ đề được quan tâm nghiên cứu trong
lĩnh vực Thị giác Máy tính [1][2] Tiềm năng của việc giải quyết bài toán này chính là
giúp các chính quyền và người dân có thể nắm bắt được tình hình giao thông của thànhphố theo thời gian thực, từ đó đưa ra những phương án dé giảm thiêu ùn tắc và nâng cao
hiệu quả của đèn giao thông.
Bài toán này được mô tả như sau:
e Đầu vào: Một video hoặc video stream trực tiếp từ hệ thống camera thành phố
cùng với thông tin vê vùng quan sát và hướng di chuyên cân quan tâm.
e Đầu ra: Số lượng mỗi loại phương tiện đi theo các hướng định nghĩa trước.
Phương pháp được đề xuất cho bài toán này cần ghi lại thời điểm mỗi phương tiện rời khỏivùng quan sát (region of interest) đồng thời cho biết loại phương tiện và hướng di chuyển
của phương tiện đó.
Đã có nhiều phương pháp cũng như cuộc thi trong và ngoài nước được tô chức nhằm tim
ra giải pháp cho bài toán này Ở quy mô quốc tế có cuộc thi NVIDIA AI City Challenge[31] với sự tham gia của nhiều doanh nghiệp và trường đại học Đối với phạm vi trongnước có cuộc thi [1] được tổ chức bởi Sở Thông tin và Truyền thông TP HCM Nhìnchung, các lời giải tốt nhất hiện có cho bài toán này [9][10][11][12] đều thiết kế hệ thốngtheo khuôn khổ DTC [13] gồm ba mô-đun chính:
e Phat hiện va phân loại phương tiện giao thông (Vehicle Detection).
e Truy vết phương tiện giao thông (Vehicle Tracking)
e Xác định hướng di chuyển của mỗi phương tiện (Vehicle Counting).
Trang 12Tại Việt Nam, có hai thách thức chính đối với bai toán này:
Về mặt phương pháp: Vì đây là bài toán lớn được chia nhỏ thành ba bước trong quytrình xử lý, hiệu năng của mỗi bước sẽ trực tiếp ảnh hưởng đến kết quả của toàn hệthống Do đó, việc nghiên cứu lựa chọn phương pháp phù hợp đề tăng độ chính xác
và tính hiệu quả của mỗi bước trở thành một vấn đề cần được quan tâm và chú
trọng.
Về mặt dữ liệu: Day là bài toán nhắm đến việc xử lý dit liệu giao thông thực tế đặcthù ở Việt Nam, mang đến những thách thức liên quan đến độ phức tạp của bối
cảnh giao thông, chất lượng và độ ồn định của dữ liệu video Ngoài ra, cần thiết kế
một hệ thống có khả năng đáp ứng nhu cau xử lý trong thời gian thực (real-time)với lượng đữ liệu lớn đến từ vài chục, vài trăm, thậm chí là hàng ngan camera giaothông của thành phô
Dé giải quyết những van dé nêu trên, trong dé tài này tôi sẽ thực hiện triển khai một hệthống đếm phương tiện giao thông tự động trên bối cảnh giao thông tại Việt Nam dựa theokhuôn khổ DTC, đồng thời tích hợp công nghệ xử lý Dữ liệu Lớn Apache Kafka [3] nhằmtận dụng khả năng xử lý phân tán giúp hệ thống có thé đáp ứng theo thời gian thực
Mục tiêu:
Tìm hiểu tổng quan và thực hiện đánh giá cho bài toán thống kê lưu lượng giao
thông trên video Trong đó, tôi tập trung vào các bài toán con là phát hiện phương
tiện, truy vết phương tiện và đếm phương tiện
Đánh giá và phân tích một số phương pháp hiện nay cho bài toán bằng các độ đotiêu chuẩn
Xây dựng hệ thống có khả năng đáp ứng theo thời gian thực sử dụng Apache Kafka.
Phạm vỉ:
Dữ liệu mà dé tài sử dụng được thu thập tại bối cảnh giao thông của thành phố HồChí Minh, bao gồm dữ liệu có được từ Hội thi Giải pháp Trí tuệ Nhân tạo trên địa
Trang 13bàn Thành phô Hồ Chí Minh năm 2020 [4] kết hợp cùng tập dữ liệu do tôi tự pháttriển với nguồn ảnh từ http://giaothong.hochiminhcity.gov.vn/.
Nghiên cứu các phương pháp phát hiện vật thé tiên tiến như YOLOv4 [5],
YOLOv5s [6], Faster-RCNN [7], Cascade R-CNN [8] trong tác vụ phát hiện
phương tiện giao thông.
Đánh giá các phương pháp phát hiện vật thé cho bài toán trên tap dit liệu VDI0k với các độ đo tiêu chuẩn mAP, AP50, AP75
UIT-Áp dụng phương pháp DeepSORT [9] đề tiến hành theo vết phương tiện giao thông.Xây dựng phương pháp đếm phương tiện giao thông
Xây dựng hệ thống xử lý end-to-end Trong đó, các thành phần trong DTC sẽ đượcphát triển thành những mô-đun độc lập, các mô hình hoc sâu sẽ được huấn luyện
và chạy cục bộ.
Tích hợp công nghệ xử lý Dữ liệu Lớn Apache Kafka nhằm tận dụng khả năng xử
lý phân tán Cụ thể, các Kafka Broker sẽ đảm nhiệm vai trò đệm dữ liệu lớn giữaluồng video đồ về của các camera với các mô-đun xử lý của hệ thống Với khả năng
mở rộng theo chiều ngang một cách linh hoạt của Kafka, kiến trúc hệ thống nêutrên có thé nâng cao khả năng xử lý bằng cách gia tăng số lượng Broker đồng thời
Trang 14gia tăng sô lượng node xử lý cho DTC Từ đó hiệu năng của hệ thông không còn bị
giới hạn bởi năng lực tính toán của một máy tính.
e Xây dựng chương trình ứng dụng trên nền web cho phép người dùng chọn xem chi
tiết thống kê mật độ giao thông của từng camera
Kết quả dự kiến:
e Báo cáo kỹ thuật các phương pháp được sử dụng trong bài toán phát hiện phương
tiện giao thông, theo vết phương tiện giao thông Kết quả thực nghiệm, so sánh và
đánh giá của các phương pháp.
e Tập dữ liệu UIT-VD10k gồm 10.000 ảnh bối cảnh giao thông tại thành phó Hồ Chi
Minh cho bài toán đếm phương tiện giao thông
e Ứng dụng minh họa.
Tài liệu tham khảo:
[1] Chang, Ming-Ching, et al “Ai city challenge 2020-computer vision for smart
transportation applications.” Proceedings of the IEEE/CVF conference on computer vision
and pattern recognition workshops 2020.
[2] Naphade, Milind, et al “The 2019 AI City Challenge.” CVPR workshops Vol 8.
2019.
[3] Sax, Matthias J., S Sakr, and A Zomaya “Apache Kafka.” (2019).
[4] Hội thi giải pháp ứng dung Trí tuệ Nhân tạo (AI) trên địa bàn thành phố Hồ Chí Minh
năm 2020, http://aichallenge.hochiminhcity.gov.vn (truy cập ngày 07/09/2021).
[5] Bochkovskiy, Alexey, Chien-Yao Wang, and Hong-Yuan Mark Liao “Yolov4:
Optimal speed and accuracy of object detection.” arXiv preprint arXiv:2004.10934 (2020).
[6] Jocher, Glenn, et al 2020, “ultralytIcs/yolov5: v5.0 - YOLOv5-P6 1280 models, AWS,
Supervise.ly and YouTube integrations”, https://github.com/ultralytics/yolovS
Trang 15[7] Ren, Shaoqing, et al “Faster R-CNN: towards real-time object detection with region
proposal networks.” JEEE transactions on pattern analysis and machine intelligence 39.6
(2016): 1137-1149.
[8] Cai, Zhaowei, and Nuno Vasconcelos “Cascade r-cnn: Delving into high quality
object detection.” Proceedings of the IEEE conference on computer vision and pattern
recognition 2018.
[9] Bewley, Alex, et al “Simple online and realtime tracking.” 2016 IEEE international
conference on image processing (ICIP) TEEE, 2016.
[10] Lu, Jincheng, et al “Robust and online vehicle counting at crowded intersections.”
Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition.
2021.
[11] Tran, Duong Nguyen-Ngoc, et al “A region-and-trajectory movement matching for
multiple turn-counts at road intersection on edge device.” Proceedings of the IEEE/CVF
Conference on Computer Vision and Pattern Recognition 2021.
[12] Tran, Vu-Hoang, et al “Real-time and robust system for counting movement-specific
vehicle at crowded intersections.” Proceedings of the IEEE/CVF Conference on Computer
Vision and Pattern Recognition 2021.
[13] Naphade, Milind, et al “The 5th ai city challenge.” Proceedings of the IEEE/CVF
Conference on Computer Vision and Pattern Recognition 2021.
Kế hoạch thực hién:(M6 ta kế hoạch làm việc và phân công công việc cho từng sinh viên
tham gia)
e Tuần 1 - 8: Xây dựng bộ dữ liệu UIT-VD10k, khảo sat và chạy thực nghiệm các
phương pháp phát hiện vật thê cho bài toán phát hiện phương tiện
o Kết quả dự kiến:
m Bộ dữ liệu UIT-VD10k gồm 10.000 ảnh 1080x720
Trang 16m Tài liệu kỹ thuật chi tiết các phương pháp YOLOv4, YOLOv5s,
Faster-RCNN, Cascade R-CNN.
m Tài liệu độ đo tiêu chuẩn mAP, AP50, AP75
m Bảng kết quả đánh giá và theo dõi thực nghiệm của các thuật toán
YOLOv4, YOLOv5s, Faster-RCNN, Cascade R-CNN dựa trên bộ dữ
liệu UIT-VD10k.
Tuần 9 - 10: Sử dụng DeepSORT cho bài toán theo vết phương tiện, phát triểnphương pháp đếm phương tiện, hoàn thành hệ thống theo khuôn khổ DTC
o Kết quả dự kiến:
m Tài liệu kỹ thuật về DeepSORT, khuôn khổ DTC
Tuần 11 - 14: Tích hop Apache Kafka dé xây dựng hệ thống có thé đáp ứng nhiều
camera theo thời gian thực.
o Kết qua dự kiến:
mẽ Tài liệu kỹ thuật về Apache Kafka
m Kết quả thực nghiệm, đánh giá khả năng đáp ứng theo thời gian thực
của apache Kafka đôi với bài toán.
Tuần 15 - 18: Xây dựng ứng dụng minh họa kết quả
o Kết qua dự kiến:
m Chương trình ứng dụng trên nền web cho phép người dùng chọn xem
chỉ tiết thống kê mật độ giao thông của từng camera
Trang 17(Ký tên và ghi rõ họ tên)
Nguyễn Văn Khoa
Trang 18LỜI CẢM ƠN
Đầu tiên, tôi xin gửi lời cảm ơn đến tập thể quý Thầy/Cô Trường Đại học Côngnghệ Thông tin — Dai học Quốc Gia TP.HCM nói chung, quý thầy cô khoa Khoa học
và Kỹ thuật Thông tin, và Khoa Khoa học máy tính nói riêng đã giúp cho tôi tích lũy
được những kiến thức nền tang dé thực hiện nghiên cứu này
Đặc biệt, tôi xin gửi lời cảm ơn chân thành tới TS Ngô Duc Thành và Thể.
Đỗ Văn Tiến đã đồng hành và theo sát tôi để hướng dẫn, quan tâm, lo lắng và giúp
đỡ tôi hoàn thiện được khóa luận tốt nghiệp tốt nhất Các Thầy là hai người truyền
nguồn cam hứng, kiến thức dé tôi có đủ nhiệt huyết dé thực hiện khóa luận tới cuối
cùng.
Xin cảm ơn ThS Võ Duy Nguyên đã cho tôi những nhận xét mang tính xây
dựng cao, những góp ý giá trị giúp tôi có thể hoàn thành tốt nhất khóa luận
Cuôi cùng, tôi xin cảm ơn đên gia đình và bạn bè đã động viên, khuyên khích
và truyền năng lượng tích cực cho tôi dé hoàn thành khóa luận
Xin chân thành cảm ơn quý Thay/C6
Trang 19DANH MỤC HÌNH
Hình 1.1 Minh họa đầu vào của bài toán thống kê lưu lượng giao thông Trong đó,
đa giác màu đỏ thể hiện vùng ROI, các mũi tên thé hiện các MOL 26Hình 2.1 Minh họa cho bài toán phát hiện vat thể -: -¿©2255¿5c5z+2 32Hình 2.2 Minh hoa bai toán theo vết vật thỂ - ¿+ s+sSx+EvEEvEEEeEzEerxsrerxee 33Hình 2.3 Kiến trúc của Apache Kafka [2 ]] - c- S5 1t + St rey 35Hình 3.1 Kết quả sau khi lấy trung bình của các khung hình . 37Hình 4.1 Biểu đồ phân bồ nhãn các loại phương tiện trong bộ dữ liệu 42Hình 5.1 Kiến trúc microservice .cccccessssssessessesssssseessesssssessessesssssessessesssssesseesesseen 48Hình 5.2 Kiến trúc hệ thống tích hợp Apache KafKa -:- ¿25+ 50
Hình 5.3 Giao diện frontend với chức năng hién thị và trực quan hóa lưu lượng giao
Trang 20DANH MỤC BANG
Bang 1 Chi tiết về câu hình các phương pháp phát hiện đối tượng - 43
Bảng 2 Kết quả chạy thực nghiệm cho mô-đun phát hiện phương tiện 44Bang 3 Kết quả trên Testset B của HCM AI Challenge 2020 2- 52 45Bang 4 So sánh tốc độ thực thi trước và sau khi áp dung Apache Kafka 53
Trang 21DANH MỤC TU VIET TAT
AI Artificial Intelligence DTC Detection — Tracking — Counting HCMC Ho Chi Minh City
ITS Intelligent Transportation System MOI Movement Of Interest
RMSE Root Mean Square Error ROI Region Of Interest
Trang 22MỤC LỤC
TÓM TẮT KHÓA LUẬN 24Chương 1 TONG QUAN 25
2.1 Bài toán phát hiện vật thé 312.2 Bài toán theo vét vật thể 322.3 Một số công nghệ liên quan 33
3.2 Phát hiện phương tiện 37
3.3 Theo vết phương tiện 383.4 Đếm phương tiện 40
Trang 23Chương 4 ĐÁNH GIÁ VÀ PHAN TÍCH 42
5.2.1 Mô-đun tích hợp 50
5.2.2 Thiết kế giao diện người dùng 515.3 Đánh giá khả năng chịu tải của hệ thống 52Chương 6 KET LUẬN VÀ HƯỚNG PHAT TRIEN 54
1 Kết luận 54
2 Hướng phát triển 54TÀI LIỆU THAM KHẢO 56
Trang 24TOM TAT KHÓA LUẬN
Cùng với sự phát trién của Hệ thống Giao thông Thông minh (Intelligent TransportationSystem - ITS), bài toán đếm phương tiện giao thông từ video mà camera giao thông thunhận đã trở thành một bài toán được quan tâm nghiên cứu, tiềm năng của việc này đó làgiúp các thành phố có thé định hướng giao thông hiệu quả, tối ưu hóa cơ sở hạ tang giaothông, giảm thiểu tai nạn, v.v Hiện nay có 2 thách thức lớn nhất đối với bài toán này đó
là độ chính xác và khả năng chịu tải Xét về độ chính xác, các bài toán đếm xe truyềnthống tập trung vào việc đếm các xe trong một bức ảnh, rõ ràng điều đó không sẽ khôngthé xác định hướng di chuyên của phương tiện (Movement Of Interest - MOI), do đó,trong báo cáo này, khuôn khổ DTC được áp dụng nhằm khai thác tối đa lượng thông tin
mà video mang lại Phương pháp dựa trên DTC trong báo cáo này đã được kiểm nghiệm
là dat sai số RMSE thấp nhất Test Set B của HCMC AI Challenge 2020 khi chạmngưỡng giá trị 1,39 Xét về khả năng chịu tải, với số lượng lớn camera giao thông củathành phố cùng bản chat gây nặng tải vốn có của dữ liệu dạng video, cần thử nghiệm áp
dụng công nghệ Dữ liệu Lớn dé đánh giá khả năng tiếp nhận và xử lý dữ liệu giữa những
mô-đun trong hệ thống Trong bài báo cáo này, Apache Kafka đã được sử dụng dé xâydựng hệ thống có khả năng chịu tải và xử lý dữ liệu theo thời gian thực Kết quả thựcnghiệm cho thấy Apache Kafka giúp tăng tốc độ xử lý lên gấp 3,55 lần so với hệ thống
dựa trên kiên trúc microservice cơ bản.
24
Trang 25Chương 1 TONG QUAN
hệ thống quản lý giao thông thông minh (Intelligent Transportation System - gọi làITS) [29] đang là nhu cầu tất yêu của các thành phố Trong đó, bài toán đếm phương
tiện giao thông từ video ma camera giao thông thu nhận đã trở thành một bài toán
được quan tâm nghiên cứu [30], đây là bài toán thuộc lĩnh vực Thị giác Máy tính ứng
dụng trong ITS Tiềm năng của việc này đó là giúp các thành phố có thé định hướnggiao thông hiệu quả, tối ưu hóa cơ sở hạ tầng giao thông, giảm thiểu tai nạn, giảm
lượng khí thải từ phương tiện, v.v.
Bài toán này được mô tả như sau:
e Đầu vào: Một video hoặc video stream trực tiếp từ hệ thống camera thành phố,
cùng với đó là thông tin vê vùng quan sát và hướng di chuyên cân quan tâm.
® Đầu ra: Số lượng mỗi loại phương tiện đã đi theo các hướng được định nghĩa
25
Trang 26Trong đó, bối cảnh giao thông tại Việt Nam gồm 4 nhóm phương tiện cần quan tâmgồm:
Xe đạp, xe may
Xe ô tô, xe bán tải
Xe buýt, xe khách
FY Ð = Xe tải và container
Trong mỗi video giao thông, cần xác định một vùng quan sát (Region-of-Interest, gọi
là ROD) và các hướng di chuyên (Motion-of-Interest, gọi là MOI):
e Vùng ROI được biểu diễn dưới dạng một đa giác, giới hạn vùng không gian
cần tập trung quan sát và xử lý
e Các MOI giúp xác định các làn xe di chuyên theo các hướng cụ thé khác nhau
trong video.
Hình 1 Minh họa đầu vào của bài toán thống kê lưu lượng giao thông
Trong đó, đa giác màu đỏ thé hiện vùng ROI, các mũi tên thé hiện các MOI
Hình minh họa về MOI và ROI được hiển thị trong Hình 1 Mục tiêu của việc đếmphương tiện theo MOI là đề tìm ra chính xác số lượng phương tiện tương ứng với cácMOI đó, trong đó MOI có thé được định nghĩa từ trước bởi tất cả các trạng thái, cáchành vi có thé có của phương tiện, kết hợp các làn đường va chi dẫn (rẽ trái/rẽ phải/đi
26
Trang 27thăng) Một phương tiện được tính là đếm ngay khi nó di chuyên hoàn toàn ra khỏi
vùng ROI.
Các bài toán đếm xe truyền thống có thé được chia thành hai nhánh Nhánh thứ nhất
là đếm xe theo khung hình (frame) [4, 18, 41, 43] nhăm đếm các xe trong một frameđơn nhất, bất kế định danh của từng xe Trong nhánh này có hai phương pháp chính
đó là (1) sử dụng các thuật toán hồi quy dé ước tính mật độ phương tiện [6, 8, 18]hoặc (2) là đếm dựa trên kết quả của phát hiện đối tượng [10, 15, 36, 38, 45], tức làphát hiện xe trước rồi mới đếm chúng sau Tuy nhiên, do hiện tượng che khuất nhaugiữa các phương tiện nên việc đếm trong I frame đơn nhất thường bỏ sót rất nhiềuđối tượng Nhánh thứ hai trong đếm xe truyền thống là đếm các xe theo cá thể (cógan định danh) trong các frame liên tiếp Nhờ đó, những xe bị che khuất và khôngđược phát hiện có thé được tính bằng cách tận dụng thông tin từ các frame liên tiếp.Đặc biệt, các phương pháp [10, 38] tuân theo khuôn khô Phát hiện - Theo vết - Đếm(Detection - Tracking - Counting gọi là DTC), tức là thực hiện theo vết đa đối tượngdựa trên kết quả của mô-đun detection, sau đó đếm xe dựa trên kết quả theo vết ấy
Khác với 2 bài toán đếm phương tiện truyền thống đã đề cập ở trên, bài báo này đềcập đến tác vụ đếm phương tiện theo hướng di chuyên xác định Cụ thể là không chỉđếm phương tiện theo từng hướng di chuyên MOI, mà còn ghi lại mốc thời gian chínhxác khi mỗi xe di chuyên ra khỏi ROI Cách tiếp cận đề xuất chủ yếu tuân theo khuônkhổ DTC, trong đó chọn YOLOv4 [35] và SORT [9] làm những phương pháp cơ sở(baseline) cho tác vụ phát hiện đối tượng và theo vết đa đối tượng
27
Trang 281.2 Thách thức, phạm vi, mục tiêu
1.2.1 Thách thức
Tại Việt Nam, có hai thách thức chính đối với bài toán này:
e Vẻ mặt phương pháp: Vì đây là bài toán lớn được chia nhỏ thành ba bước trong
quy trình xử lý, hiệu năng của mỗi bước sẽ trực tiếp ảnh hưởng đến kết quảcủa toàn hệ thống Do đó, việc nghiên cứu lựa chọn phương pháp phù hợp détăng độ chính xác và tính hiệu quả của mỗi bước trở thành một vấn đề cần
được quan tâm và chú trọng.
e Vẻ mặt dữ liệu: Đây là bài toán nhằm đến việc xử ly dit liệu giao thông thực
tế đặc thù ở Việt Nam, mang đến những thách thức liên quan đến độ phức tạp
của bối cảnh giao thông, chất lượng và độ ôn định của dữ liệu video Ngoài ra,
cần thiết kế một hệ thống có khả năng đáp ứng nhu cầu xử lý trong thời gianthực (real-time) với lượng dt liệu lớn đến từ vài chục, thậm chí là hàng trămcamera giao thông của thành phó
1.2.2 Phạm vi
Phạm vi, khuôn khô được giới hạn trong bài bao cáo nay như sau:
e Các phương pháp được triển khai và thử nghiệm trên tập dữ liệu UIT-VD10k,
đây là tập dữ liệu được xây dựng dé phục vụ cho báo cáo này Cụ thé, bối cảnhgiao thông là của thành phó H6 Chí Minh, bao gồm hình ảnh có được từ Hộithi Giải pháp Trí tuệ Nhân tạo trên địa ban Thành phố Hồ Chi Minh năm 2020
- HCMC AI Challenge 2020 [1] kết hợp cùng hình ảnh thu được từ trang giaothông của thành phố [2]
e Apache Kafka sẽ được triển khai ở 4 nút CPU 8 cores Intel(R) Xeon(R) Silver
4210.
1.2.3 Mục tiêu
Mục tiêu hướng đên của báo cáo này bao gôm:
28
Trang 29e Tìm hiểu tông quan và thực hiện đánh giá cho bài toán thống kê lưu lượng
giao thông trên video Trong đó, tôi tập trung vào các bai toán con là phát hiện
phương tiện, truy vết phương tiện và đếm phương tiện
e Đánh giá và phân tích một số phương pháp hiện nay cho bài toán bằng các độ
đo tiêu chuẩn
e Xây dựng hệ thống có khả năng đáp ứng theo thời gian thực sử dung Apache
Kafka.
1.3 Đóng góp
Dưới đây là những đóng góp trong bài nghiên cứu:
e Bộ dữ liệu chuân UIT-VD10k cho bài toán phát hiện phương tiện giao thông
gồm 10.000 ảnh với độ phân giải 1080x720 thuộc 10 góc camera tiêu biểu tạithành phố Hồ Chí Minh va 10.000 nhãn tương ứng ở định dang Pascal VOC
e Phương pháp dựa trên DTC trong bao cáo này đạt được độ chính xác cao trong
việc đếm phương tiện ở thành phố Hồ Chí Minh, được chấp nhận tại hội nghịquốc tế chuyên về Thị giác Máy tính MAPR 2021 Thêm vào đó còn đượckiểm nghiệm là đạt sai số RMSE thấp nhất Test Set B của HCMC AI
Challenge 2020 khi chạm ngưỡng gia trị 1,39, đạt giải nhì chung cuộc với độ
chính xác cao nhất so với các đội từ nhiều trường đại học và công ty trên quy
mô toàn quốc Ngoài ra, từ kết quả của phương pháp trên, chúng tôi cũng đã
đạt giải ba trong Giai thưởng Sinh viên Nghiên cứu khoa học — Euréka năm
2021.
e Hệ thống tích hop Apache Kafka trong báo cáo này đạt tốc độ xử lý nhanh hơn
gap 3,55 lân so với kiên trúc Microservice cơ bản.
29
Trang 301.4 Cấu trúc
Bài nghiên cứu của tôi gôm có sáu phân:
Chương 1: Giới thiệu tông quan về dé tài Định nghĩa bài toán, trình bày các
thử thách, mục tiêu và đóng góp của công trình nghiên cứu.
Chương 2: Khao sát và tong hợp các nghiên cứu các van đề liên quan đến bàitoán Thống kê Lưu lượng Giao thông và sự ứng dụng của Dữ liệu Lớn trong
ITS.
Chương 3: Mô tả chỉ tiết quá trình cài đặt phương pháp dựa trên khuôn khổDTC cho bài toán Thống kê Lưu lượng Giao thông
Chương 4: Thực hiện đánh giá và so sánh các phương pháp tiên tiễn trên các
độ đo tiêu chuẩn
Chương 5: Chỉ tiết kỹ thuật về cách xây dựng hệ thống minh họa và đánh giáhiệu năng thông qua mô phỏng thực tế
Chương 6: Kết luận về ưu điểm và hạn chế của hệ thống được đề xuất, nêu rahướng phát trién của đề tài trong tương lai
30