Lý do xây dựng bộ dữ liệu

Sau khi tiến hành khảo sát các bộ dữ liệu ảnh sương mờ đã được công bố trên thế giới, chúng tôi nhận thấy rằng một số thiếu sót như sau.

Đầu tiên, đa phần các bộ dữ liệu được thu thập ở góc nhìn từ xe ô tô hoặc được chụp cố định từ một góc máy đặt trên mặt đất. Điều này làm cho góc nhìn của hạn bị giới hạn và đôi khi chỉ thu thập được rất ít đối tượng trong một khung ảnh. Hơn nữa, góc chụp này không cho phép chúng ta có góc quan sát toàn cảnh về một khu vực có nhiều đối tượng.

Tiếp theo, số lượng của các đối tượng trong một ảnh của các bộ dữ liệu này không quá lớn. Điều này được thể hiện rõ nhất trong bộ dữ liệu UAVDT- Benchmark-M khi bối cảnh chủ yếu được quay ở các con đường lớn với mật độ giao thông thưa thớt. Việc này làm cho hiệu quả phát hiện đối tượng giảm xuống khi ta ứng dụng các mô hình này vào thực tế ở các khu vực có giao thông đông đúc như Việt Nam.

Cuối cùng, một số bộ dữ liệu có sương mờ được xây dựng chủ yếu để phục vụ cho tác vụ khử sương, vì vậy, số loại đối tượng và bối cảnh bị hạn chế và lặp lại nhiều lần.

Với những kết quả khảo sát từ các bộ dữ liệu trên thế giới, đánh giá được những thiếu sót của các bộ dữ liệu này khi so sánh với điều kiện giao thông tại Việt Nam, chúng tôi đã quyết định xây dựng bộ dữ liệu UIT-DroneFog – bộ dữ liệu không ảnh chứa sương mờ dựa trên bộ dữ liệu UIT-Drone21. Lý do chúng tôi lựa chọn bộ dữ liệu UIT-Drone21 làm nền tảng vì đây là bộ dữ liệu thể hiện được đặc trưng mật độ giao thông đông đúc tại Việt Nam với nhiều bối cảnh tại nhiều thành phố đông dân.

Các kỹ thuật trong Phát hiện đối tượng

Phân loại thuật toán phát hiện đối tượng