.15 Dense local regression

Một phần của tài liệu Nghiên cứu và đánh giá phương pháp phát hiện phương tiện giao thông trong không ảnh (khóa luận tốt nghiệp) (Trang 40 - 41)

Mục tiêu của nhánh bounding-box regression của các phương pháp phát hiện đối tượng 2 giai đoạn đều là định vị đối tượng bằng bounding box bao xung quanh đối tượng và mục tiêu của dense local regression cũng như vậy.

Dense local regression xem ma trận 𝑘 × 𝑘 chiều ma thu được từ quá trình RoI Pooling hoặc RoIAlign như 𝑘2 đặc trưng cục bộ (local feature) liền kề trong không gian. Mỗi đặc trưng cục bộ này được biểu diễn là 𝑝𝑖 (với các thông số 𝑙𝑖, 𝑟𝑖,

𝑡𝑖, 𝑏𝑖 đã được tính tốn).

Số lượng đặc trưng cục bộ của proposal P thuộc về ground-truth box G dựa vào phần giao nhau giữa proposal và ground-truth tương ứng của nó. Tuy nhiên, dù là trong trường hợp đa số các đặc trưng cục bộ của P thuộc về G thì vẫn sẽ tồn tại các đặc trưng không cần thiết (nền) khiến cho kết quả khơng chính xác. Để giải quyết vấn đề đó, dense local regression dùng binary overlap prediction 𝑚̂𝑖 để phân loại mỗi đặc trưng cục bộ thuộc về ground-truth bounding box hay thuộc về nền.

24

Như vậy, trong q trình tính tốn, dense local regression dự đốn 4 thơng số 𝑙̂𝑖, 𝑡̂𝑖,

𝑟̂𝑖, 𝑏̂𝑖 cùng 𝑚̂𝑖 tại mỗi đặc trưng cục bộ 𝑝𝑖 ∈ 𝑃.

Trong quá trình huấn luyện, 𝑚̂𝑖 được truyền qua hàm chuẩn hóa sigmoid (𝜎) để tính tốn binary cross-entropy loss với nhãn ground-truth 𝑚𝑖 = 1 nếu đặc trưng cục bộ 𝑝𝑖 thuộc phần giao nhau giữa proposal P và ground-truth G, 𝑚𝑖 = 0 nếu đặc trưng cục bộ thuộc về nền. Các thơng số của dense box tại các vị trí 𝜎(𝑚̂𝑖) > 0.5

được sử dụng để tính vị trí góc trái trên và góc phải dưới của predicted box. Cuối cùng, các predicted box được tính bởi nhiều đặc trưng cục bộ sẽ được tính trung bình để thu được bounding box cuối cùng.

2.4.2.2.Discriminative RoI pooling

Một phần của tài liệu Nghiên cứu và đánh giá phương pháp phát hiện phương tiện giao thông trong không ảnh (khóa luận tốt nghiệp) (Trang 40 - 41)