Kết quả thực nghiệm phương pháp D2Det

Một phần của tài liệu Nghiên cứu và đánh giá phương pháp phát hiện phương tiện giao thông trong không ảnh (khóa luận tốt nghiệp) (Trang 70 - 73)

4.4.2.1. Kết quả thực nghiệm

Bảng 4.3 Kết quả thực nghiệm D2Det. (Kết quả cao nhất được in đậm)

Từ bảng 4.3, cả 6 mô hình D2Det đều không hiệu quả đối với bộ dữ liệu UAVDT-benchmark-M khi mô hình có kết quả tốt nhất trên tập test chỉ đạt được AP@50 = 28%. Cụ thể, mô hình D2Det-ResNet50-12 có kết quả tốt nhất trên các tập test, daylight, medium-alt, front-view, bird-view và long-term. Mô hình D2Det- ResNet50-24 có kết quả tốt nhất trên tập night. Mô hình D2Det-ResNet50-24-MS có kết quả tốt nhất trên các tập fog, high-alt. Mô hình D2Det-ResNet101-12 có kết quả tốt nhất trên tập low-alt và side-view. So với các mô hình vừa đề cập, mô hình D2Det-ResNet50-12 có thời gian huấn luyện thấp nhất nhưng có độ hiệu quả vượt trội hơn (kết quả dự đoán không quá chênh lệch ở các trường hợp không cao nhất).

Xét về độ hiệu quả của backbone ResNet50 và ResNet101, các mô hình sử dụng backbone ResNet101 đều mất nhiều thời gian huấn luyện hơn ResNet50 nhưng kết quả dự đoán không quá chênh lệch (trừ D2Det-ResNet50-12). Việc huấn luyện multi-scale không có cải thiện rõ rệt trong kết quả.

Xét về từng thuộc tính của bộ dữ liệu, cả 6 mô hình D2Det đều đạt kết quả khá tốt (> 50%) trên tập low-alt. Các trường hợp còn lại đều có kết quả chưa tốt, trong đó, tập fog và high-alt là thấp nhất.

54

4.4.2.2. Hình ảnh minh họa

Trường hợp mô hình dự đoán tốt:

a) ResNet50-12

b) ResNet101-12

Hình 4.9 Ảnh minh họa kết quả dự đoán tốt của các mô hình D2Det.

Nhận xét: Các đối tượng được mô hình phát hiện đúng, không gặp tình trạng đối tượng bị chồng lắp bounding box nhưng cả 2 đều bị sót vài đối tượng.

55

Trường hợp mô hình dự đoán kém

a) ResNet50-12

b) ResNet101-12

Hình 4.10 Ảnh minh họa kết quả dự đoán kém của các mô hình D2Det.

Nhận xét: ResNet50-12 dự đoán được nhiều đối tượng hơn so với ResNet101-12. Tuy nhiên, cả 2 mô hình vẫn còn sót rất nhiều đối tượng.

Trong quá trình thực nghiệm, có 2 mô hình tôi chưa thể trực quan hóa được, song, nó không ảnh hưởng đến kết quả đánh giá. 2 mô hình chưa thể trực quan hóa là D2Det với backbone ResNet50 và ResNet101 được huấn luyện multi-scale trong vòng 24 epoch.

56

Một phần của tài liệu Nghiên cứu và đánh giá phương pháp phát hiện phương tiện giao thông trong không ảnh (khóa luận tốt nghiệp) (Trang 70 - 73)