Dense local regression

Một phần của tài liệu Tìm hiểu phương pháp d2det cho bài toán phát hiện phương tiện giao thông trong không ảnh (Trang 48 - 49)

Chương 2 CÁC NGHIÊN CỨU LIÊN QUAN

3.2.2.Dense local regression

Mục tiêu của nhánh bounding-box regression của các phương pháp phát hiện đối tượng 2 giai đoạn đều là định vị đối tượng bằng bounding box bao xung quanh đối tượng và mục tiêu của dense local regression cũng như vậy.

Hình 3.11 Dense local regression.

Dense local regression xem đặc trưng RoI k × k chiều (ma trận thu được từ quá trình RoI Pooling hoặc RoIAlign) như k2 đặc trưng cục bộ (local feature) liền kề trong không gian. Mỗi đặc trưng cục bộ này được biểu diễn là pi. Mỗi thông số ground-truth (li, ri, ti, bi) tương ứng với pi được tính như sau:

li =xi− xl wP , ri = xr− xi wP , ti = yi− yt hP , bi = yb− yi hP

49

− Trong đó:

o xi, yi: tọa độ vị trí của pi.

o xl, yt: tọa độ góc trái trên của ground-truth box G. o xr, yb: tọa độ góc phải dưới của ground-truth box G. o wP, hP: chiều rộng và chiều cao của proposal P.

Số lượng đặc trưng cục bộ của proposal P thuộc về ground-truth box G dựa vào phần giao nhau giữa proposal và ground-truth tương ứng của nó. Tuy nhiên, dù là trong trường hợp đa số các đặc trưng cục bộ của P thuộc về G thì vẫn sẽ tồn tại các đặc trưng không cần thiết (nền,…) khiến cho kết quả khơng chính xác. Để giải quyết vấn đề đó, dense local regression dùng binary overlap prediction m̂𝑖 để phân loại mỗi đặc trưng cục bộ thuộc về ground-truth bounding box hay thuộc về nền. Như vậy, trong q trình tính tốn, dense local regression dự đốn 4 thơng số dense box (l̂i, t̂i, r̂i, b̂i) cùng m̂i tại mỗi đặc trưng cục bộ pi ∈ P.

Trong quá trình huấn luyện, m̂i được truyền qua hàm chuẩn hóa sigmoid (σ) để tính tốn binary cross-entropy loss với nhãn ground-truth mi = 1 nếu đặc trưng cục bộ pi thuộc phần giao nhau giữa proposal P và ground-truth G, mi= 0 nếu đặc trưng cục bộ thuộc về nền. Các thơng số của dense box tại các vị trí σ(m̂i) > 0.5 được sử dụng để tính vị trí góc trái trên và góc phải dưới của predicted box. Cuối cùng, các predicted box được tính bởi nhiều đặc trưng cục bộ sẽ được tính trung bình để thu được một bounding box cuối cùng.

Một phần của tài liệu Tìm hiểu phương pháp d2det cho bài toán phát hiện phương tiện giao thông trong không ảnh (Trang 48 - 49)