UIT-DroneFog có thể được xem như là phiên bản sương mờ của bộ dữ liệu UIT-Drone21 với 15,370 không ảnh chứa sương khoảng 600,000 bounding box của 4 lớp đối tượng gồm: Pedestrian, Motor, Car, Bus. Ngoài ra, bộ dữ liệu UIT- DroneFog có những điểm nổi bật riêng sau:
(1)Hình ảnh đa dạng và chất lượng cao: Q trình mơ phỏng sương mờ sử dụng hình ảnh được chụp lại từ máy bay không người lái cao cấp với 3 độ phân giải khác nhau (3840x2160, 1920x1080, 1440x1080) dẫn đến hình ảnh
39
sương mờ của bộ dữ liệu không bị mờ, biến dạng mà vẫn giữ được chất lượng ban đầu của bộ dữ liệu UIT-Drone21.
(2)Bối cảnh đa dạng: Mỗi hình ảnh trong bộ dữ liệu của nhóm là duy nhất. Chúng khác nhau về phân bố sương mờ, góc chụp và độ cao. Hơn nữa, nhóm đã mơ phỏng sương mờ khơng chỉ ở một địa điểm nhất định mà ở nhiều nơi khác nhau ở các thành phố khác nhau tại Việt Nam
(3)Thách thức từ các lớp dữ liệu: Bởi vì bộ dữ liệu này được thực hiện trên đường phố Việt Nam nên phần lớn là đối tượng xuất hiện trong ảnh là Motor trong khi đó lớp đối tượng Bus xuất hiện cực kì ít mặc dù. Sự mất cân bằng này là một thách thức để việc phát hiện hoạt động hiệu quả. Bên cạnh đó, xe máy có kích thước nhỏ và xuất hiện dày đặc trên đường có thể gây khó khăn cho các mơ hình trong q trình phát hiện các đối tượng này.
40
Chương 4.THỰC NGHIỆM VÀ ĐÁNH GIÁ
Trong chương này, chúng tơi sẽ trình bày q trình cài đặt thực nghiệm với bộ dữ liệu được xây dựng và đánh giá kết quả mơ hình SOTA được sử dụng trên bộ dữ liệu này.
4.1.Dữ liệu thực nghiệm 4.1.1.Mô tả cơ bản 4.1.1.Mô tả cơ bản
Bộ dữ liệu huấn luyện UIT-DroneFog bao gồm 15,370 không ảnh được thành 3 tập con: tập dữ liệu huấn luyện (Training set) gồm 8,582 ảnh kèm nhãn, tập đánh giá (Validation set) gồm 1,061 ảnh và tập kiểm tra (Testing set) có 5,729 ảnh. Mơ tả chi tiết ở Hình 4.1 bên dưới.