2.3.4. Các biến thể của phƣơng pháp HOG
Các biến thể c a phƣơng pháp HOG [19] gồm: R – HOG (rectangular HOG), C-HOG (circular HOG), center-surround HOG, R2 –HOG.
- R-HOG (Rectangular HOG): Các block là lƣới các cell vuông giống nhƣ bộ mô tả đặc trƣng SIFT. Trong mỗi cell, hƣớng mỗi pixel đƣợc đánh dựa vào trọng số Gaussian.
- C-HOG (Circular HOG): Các cell trong block đƣợc định nghĩa là những hình dạng cực theo bán kính và các góc. Cell trung tâm c a block đƣợc chia thành các bin theo góc và bán kính. Các bin góc đƣợc phân bố đều theo hình trịn. Các bin bán kính đƣợc tính theo tỉ lệ log, dẫn đến kết quả làm tăng kích thƣớc bin khi khoảng cách tăng so với trung tâm. Phƣơng pháp biểu diễn C-HOG khá giống phƣơng pháp Shape-Context.
- Centre-Surround HOG: Cấu trúc dựa trên R-HOG và C-HOG. Phƣơng pháp này không đánh trọng số Gaussian nên các cell chỉ đƣợc chuẩn hóa một lần. Do đó, cách tiếp cận này cho phép tính tốn nhanh c a HOG.
- R2-HOG: Sử dụng gradient theo cạnh, tính thêm đạo hàm bậc hai, nối hai kết quả histogram c a gradient này lại với nhau để tạo thành vector đặc trƣng.
Hình 2.14. Các biến thể c a bộ mơ tả HOG tĩnh [19]. (a) Bộ mô tả R-HOG với các
block 3 × 3 cells. (b) Bộ mơ tả C-HOG với cell trung tâm đƣợc chia thành các phần nhỏ theo góc nhƣ trong shape contexts. (c) Bộ mơ tả C-HOG với một cell đơn trung
tâm.
2.3.5. Các bộ mô tả đặc trƣng khác
Một Haar-wavelet dựa trên hệ thống phát hiện ngƣời đi bộ dùng các đáp ng cải thiện từ việc hoàn tất ba bậc đầu tiên c a Haar-wavelet
1 1 1 1 , 1 1 1 1 , 1 1 1 1 nhƣ là một dãy đặc trƣng. - Shape Contexts
Shape contexts gốc dùng biên hiện có (nhị phân) bầu chọn cho các bin histogram không gian cực, không quan tâm đến hƣớng biên. Dalal và Trigs dùng bộ mô tả C-HOG với chỉ 1 bin hƣớng. Có hai biến thể cƣờng độ gradient (GShapeC) và biên hiện có (E-ShapeC). Trong trƣờng hợp E-ShapeC, ngƣỡng biên đƣợc chọn tự động để cực đại hiệu suất phát hiện. Các giá trị đƣợc chọn là biến thay đổi nào đó, trong vùng 20–50 m c xám. Cả hai biến thể đều đƣợc chuẩn hóa cục bộ để đạt đƣợc bất biến độ chói nhƣ trong CHOG.
(a) Gradient shape context (b) Edge shape context
Hình 2.15. Hai biến thể cƣờng độ gradient (GShapeC) và biên hiện có (E-ShapeC)
chỉ dùng 1bin hƣớng [19].
- PCA-SIFT
Bộ mô tả PCA-SIFT giống bộ mô tả SIFT (Scale Invariant Feature Transform) nhƣng đƣợc áp dụng PCA (Principal Components Analysis) cho các patch ảnh gradient đã chuẩn hóa.
Hình 2.16. Mô tả hiệu quả c a HOG tốt hơn so với các phƣơng pháp trƣớc đó [19].
(a) thực hiện trên tập dữ liệu c a MIT; (b) thực hiện trên tập dữ liệu c a INRIA.
2.4. Cải thiện cách tính đặc trƣng HOG:
Bộ mơ tả đặc trƣng sử dụng đa tỉ lệ MHOG [20] đƣợc dùng nhƣ một không gian đặc trƣng mở rộng cho phép thu đƣợc các đặc trƣng phân biệt cao giúp phát hiện tốt hơn. Bộ mô tả đặc trƣng MHOG dựa trên cơ sở bộ mô tả đặc trƣng HOG gốc bằng cách dùng đa tỉ lệ blocks. Các m c đa tỉ lệ HOG đƣợc tính lặp lại nhiều lần quanh một vùng mẫu. Do đó, để tăng tốc hệ thống, dùng phƣơng pháp tổng tích l y c a gradients để tính nhanh bộ mơ tả đặc trƣng. Tƣơng tự, histogram c a mỗi gradient hƣớng trong một vùng bất kỳ đƣợc tính với bốn lối vào dùng bảng tổng tích l y các gradients ng hộ. Tùy vào đặc trƣng c a bảng tổng tích l y, các gradients đƣợc tách thành các các nhóm dựa theo hƣớng góc, mỗi nhóm đƣợc tổ ch c thành một bảng để tính các tổng tích l y. Mỗi bảng tích l y đƣợc dùng để tính histogram c a các gradients đối với mỗi khoảng góc, ví dụ, 200 cho mỗi nhóm đƣợc coi là một lớp nhƣ mô tả trong hình 2.17 [20]. Cuối cùng biểu đồ gradient trong khối bất kỳ chỉ yêu cầu 4 toán tử / một lớp x 9 lớp = 36 phép truy xuất cho 9 nhóm c a gradient hƣớng.
Hình 2.17. Xử lý gradient theo hƣớng c a ảnh đối với phƣơng pháp tổng tích l y.
Bộ mơ tả đặc trƣng c ng nhƣ tính tốn nhanh dựa trên tổng tích l y các độ lớn gradient đƣợc mơ tả trong hình 2.18 [20].
Ảnh vào Chuẩn hóa màu Tính gradient Tách gradient thành các bảng Tính tổng tích l y cho mỗi bảng Cấu trúc vector đặc trƣng Chuẩn hóa các
vector khối HOG Tính các
khối HOG