Tính góc và biên độ theo X-gradient và Y-gradient

Một phần của tài liệu Ứng dụng kỹ thuật phát hiện người trong giám sát an ninh (Trang 33 - 36)

 Bƣớc 4: Đặt các vector gradient c a mỗi cell vào một biểu đồ 9 bin. Các khoảng c a biểu đồ từ 00 đến 1800, do đó mỗi bin là 200 (kích thƣớc bin khoảng 20o cho kết quả tốt nhất -Dalal and Triggs). Đối với mỗi vector gradient, nó là phần góp cho biểu đồ đƣợc cho bởi độ lớn c a vector (do đó gradient mạnh hơn có ảnh hƣởng lớn hơn đến biểu đồ). Ta chia phần góp giữa hai bin gần nhất. Ví dụ, nếu một vetor gradient có góc là 800 độ thì cộng thêm 1/2 biên độ c a nó vào bin có tâm tại 700, và

18

1/2 biên độ c a nó vào bin có tâm tại 900. Nhƣng nếu một vetor gradient có góc là 850 độ thì cộng thêm 1/4 biên độ c a nó vào bin có tâm tại 700, và 3/4 biên độ c a nó vào bin có tâm tại 900.

 Bƣớc 5: Tính vector đặc trƣng cho từng cell (kích thƣớc 8x8). Vector đặc trƣng c a mỗi cell sẽ gồm 9 thành phần tƣơng ng với 9 bin, và giá trị tại thành phần i bằng tổng giá trị c a các điểm trong bin i mà có tọa độ nằm trong cell đó.

(a) (b)

1800 1600

Hướng (Orientation)

Hình 2.10. Mơ tả 9 bin hƣớng c a HOG (a) và ví dụ về HOG c a một cell ảnh

(8x8 pixels)

 Bƣớc 6: Tính vector đặc trƣng cho từng block (gồm 2x2=4 cell). Ta chỉ cần ghép các vector đặc trƣng c a từng cell trong block lại với nhau để đƣợc vector đặc trƣng c a một block và chuẩn hóa lại vector đặc trƣng c a block này. Nhƣ vậy vector đặc trƣng c a block sẽ gồm 9 bin x 4 cell = 36 phần tử.

Chuẩn hóa các block: Dùng chuẩn hóa L2-norm : gọi v là vector ch a các histogram c a một block cho trƣớc, v 2là chuẩn hóa c a v và giá trị Ɛ là một hằng số rất bé.

Khi đó: 2 2 2     v v v

v . Theo Dalal và Triggs, chuẩn hóa L2-norm cho kết

quả tốt. Chuẩn hóa L1-norm làm giảm hiệu suất 5%, khơng chuẩn hóa giảm hiệu suất 27%.

19

Hướng (Orientation)

Hình 2.11. Ví dụ về HOG c a một block ảnh (2x2 cells)

 Bƣớc 7: Tính vector đặc trƣng cho toàn bộ window (64x128). Ta chỉ cần ghép các vector đặc trƣng c a từng block lại với nhau để đƣợc vector đặc trƣng c a cả window. Lƣu ý rằng các block không đặt tách biệt nhau mà gối lên nhau, cách nhau một khoảng bằng kích thƣớc c a cell theo mỗi chiều. Window nhận dạng 64x128 pixels sẽ chia thành 7 blocks ngang và 15 blocks dọc thành tổng cộng 7x15=105 blocks. Mỗi block ch a 4 cells với một hisrogram 9 bins cho mỗi cell, cho tổng 36 phần tử cho mỗi block. Do đó kích thƣớc c a vecor cuối cùng cho window là 105 blocks x 36 phần tử = 3780 phần tử.

Công th c tổng qt tính chiều c a bộ mơ tả [18]:

) ).(

.( .

_sizebs2 nb vcellbs  hcellbs

Desc (2.7)

Trong đó: nb: số bin;

s

b : kích thƣớc block (theo cell);

 : khoảng trƣợt giữa các block (theo cell);

cell

v : chiều rộng window (theo cell);

cell

20

(a) (b) (c)

Hình 2.12. Ảnh (a) và hình dung (Visualization) HOG c a ảnh: (b) kích thƣớc cell

8x8 pixel, (c) kích thƣớc cell 16x16 pixel. Mơ tả tồn bộ q trình trích rút đặc trƣng HOG nhƣ hình 2.13 .

Một phần của tài liệu Ứng dụng kỹ thuật phát hiện người trong giám sát an ninh (Trang 33 - 36)

Tải bản đầy đủ (PDF)

(100 trang)