.13 Adaptive Weighted Pooling

Một phần của tài liệu Tìm hiểu phương pháp d2det cho bài toán phát hiện phương tiện giao thông trong không ảnh (Trang 50 - 53)

o Tại đây, các điểm mẫu ban đầu, F ∈ R2k×2k (tương ứng với mỡi giá trị

của ma trận đặc trưng k

2×k

2 thu được từ RoIAlign ta có 4 điểm mẫu gốc) được dùng để dự đốn các trọng số tương ứng (W ∈ R2k×2k). Các

51

trọng số này cho biết khả năng phân biệt của chúng trong tồn bộ khơng gian vùng con đó.

o Sau đó, ma trận đặc trưng Weighted RoI 𝐹̃ được tính bằng cơng thức: F̃ = W(F) ⊙ F

▪ Trong đó:

• ⊙: Tích Hadamard.

• F: Ma trận các điểm mẫu ban u ca ma trn k

2ìk 2 thu c t RoIAlign.

ã W(F): Ma trận các trọng số tương ứng với mỡi điểm mẫu

của F được tính thơng qua lớp convolutional.

o Tiếp theo, tác giả dùng average pooling với stride bằng 2 trên F̃ và thu được ma trận đặc trưng discriminative RoI với kích thước k × k. o Cuối cùng, ma trận đặc trưng discriminative RoI được xem như một

vector toàn cục, như trong Faster R-CNN, vector này được truyền qua 2 lớp fully connected để thu được classification score.

3.2.4. Kết quả thực nghiệm

D2Det được thực nghiệm trên bộ dữ liệu MS COCO và UAVDT, trong đó:

− MS COCO: gồm 80 lớp và được đánh giá bằng độ đo AP của MS COCO.

− UAVDT: gồm 3 lớp (car, truck, bus) và được đánh giá bằng độ đo AP của PASCAL VOC tại IoU = 0.7.

52

Bảng 3.1 Kết quả trên bộ dữ liệu MS COCO test-dev.

53

Chương 4. BỢ DỮ LIỆU UAVDT-BENCHMARK-M

Nội dung chương này trình bày tởng quan về bộ dữ liệu UAVDT và chi tiết hơn về bộ dữ liệu UAVDT-benchmark-M dành cho bài toán của chúng tơi.

4.1. Bộ dữ liệu UAVDT

Có nhiều bộ dữ liệu hỡ trợ thực hiện bài tốn, nhưng chúng tơi tập trung vào bộ dữ liệu UAVDT [2] bởi sự đa nhiệm, cũng như có những yếu tố phức tạp (ánh sáng, độ cao, góc quay) phù hợp cho bài tốn.

Một phần của tài liệu Tìm hiểu phương pháp d2det cho bài toán phát hiện phương tiện giao thông trong không ảnh (Trang 50 - 53)