CHƯƠNG 3. PHÂN TÍCH DÁNG ĐI CHỐNG ĐAU SỬ DỤNG MÁY VÉC TƠ HỖ TRỢ
3.3. TRÍCH ĐẶC TRƯNG HOG
HOG là viết tắt của Histogram of Orientation Gradient, đặc trưng HOG được đề xuất bởi N.Dalal, et al., 2005. Phương pháp HOG dựa trên việc đếm số lần xuất hiện các hướng đạo hàm (gradient orientation) trong các vùng cục bộ ảnh [2].
Bản chất của HOG là các thông tin về hình dáng và vẻ bề ngoài của các đối tượng cục bộ trong ảnh có thể được mô tả bằng cách sử dụng thông tin về sự phân bố của các cường độ gradient hoặc của hướng biên. Các toán tử HOG được cài đặt bằng cách chia nhỏ một bức ảnh thành các vùng con được gọi là “tế bào” (cells) và với mỗi cell đó một biểu đồ về các hướng của gradient sẽ được tính cho các điểm nằm trong cell. Ghép các biểu đồ này lại ta sẽ có một biểu diễn cho bức ảnh đầu. Để tăng cường hiệu năng nhận dạng, các biểu đồ cục bộ có thể được chuẩn hóa về độ tương phản bằng cách tính một ngưỡng cường độ trong một vùng lớn hơn của ảnh, gọi là các khối (blocks) và sử dụng giá trị ngưỡng đó để chuẩn hóa tất cả các cell trong khối. Kết quả của bước chuẩn hóa này là vecto đặc trưng sẽ có tính bất biến cao hơn đối với các thay đổi về điều kiện ánh sáng. Đặc trưng HOG gồm một số loại như R-HOG, R2-HOG, C- HOG, đối với bài toán nhận dạng thông thường người ra sử dụng đặc trưng R-HOG (mỗi ô có hình dạng là hình chữ nhật). Bài toán tính toán HOG thường gồm 5 bước:
1. Chuẩn hóa hình ảnh trước khi xử lý;
2. Tính toán gradient theo cả hướng x và y;
3. Tính véc tơ đặc trưng cho từng cell;
4. Tính và chuẩn hóa véc tơ đặc trưng các block;
5. Thu thập tất cả các biểu đồ cường độ gradient định hướng từ các block để tạo ra véc tơ đặc trưng cuối cùng.
Sau đây luận văn xin trình bày cụ thể nội dung của các bước như sau:
Bước 1. Chuẩn hóa hình ảnh trước khi xử lý
Bước chuẩn hóa này hoàn toàn không bắt buộc, nhưng trong một số trường hợp, bước này có thể cải thiện hiệu suất của bộ mô tả HOG. Có những phương pháp chuẩn hóa chính mà chúng ta có thể xem xét:
- Quy định về chuẩn Gamma /power : Trong trường hợp này, ta lấy √ ( của mỗi pixel p trong hình ảnh đầu vào.
- Chuẩn hoá gốc-vuông: Ở đây chúng ta lấy √ ( của mỗi pixel p trong hình ảnh đầu vào. Theo định nghĩa, sự bình thường của các căn bậc hai nén các cường độ điểm ảnh đầu vào thấp hơn nhiều so với chuẩn bình thường của gamma.
- Variance normalization: Ở đây, chúng ta tính cần giá trị cường độ điểm ảnh trung bình μ và độ lệch tiêu chuẩn σ của hình ảnh đầu vào. Với mỗi điểm ảnh ta trừ đi
giá trị trung bình của cường độ điểm ảnh và sau đó được chuẩn hóa bằng cách chia cho độ lệch chuẩn: p' = (p−μ)/σ.
Bước 2. Tính gradient
Tính toán này thường được thực hiện bằng hai phép nhân chập ảnh gốc 2 nhân 1 chiều tương ứng với các toán tử lấy đạo hàm ảnh theo hai hướng Ox và Oy, cụ thể là Dx = [-1 0 1] và Dy = [1 0 -1].
Để lấy được hình ảnh gradient, chúng ta sẽ sử dụng hai phép nhân chập:
Gx = I * Dx và Gy = I * Dy
Trong đó: I là hình ảnh đầu vào;
Dx là bộ lọc cho chiều x ; Dy là bộ lọc cho chiều y.
Sau khi có các ảnh gradient, chúng ta có thể tính toán cường độ gradient của hình ảnh: | | √ .
Cuối cùng, hướng của gradient cho mỗi pixel trong hình ảnh ban đầu được tính bằng cách: θ = arctan2(Gy,Gx) Dựa vào |G| vàθ, chúng ta có thể tính được một biểu đồ cường độ gradient, trong đó cột của biểu đồ dựa trên θ và trọng số mỗi cột của biểu đồ được dựa trên |G|.
Hình 3.5. Ảnh đầu vào và HoG.
Bước 3. Tính véc tơ đặc trưng cho từng ô
Bây giờ chúng ta cần chia hình ảnh nhiều khối, mỗi khối có số ô bằng nhau. Một ô là một vùng hình chữ nhật được xác định bởi số điểm ảnh thuộc mỗi ô, số lượng các điểm ảnh trên mỗi cell là bằng nhau. Các khối được xếp chồng lên nhau một ô như hình 3.6. Theo tác giả của HOG, chia thành 9 vùng sẽ cho kết quả tốt nhất cho các bài toán nhận dạng.
Hình 3.6. Chia khối trích đặc trưng HOG.
- Tính véc tơ đặc trưng cho từng ô:
+ Chia không gian hướng thành p bin (số chiều véc tơ đặc trưng của ô);
+ Góc hướng nghiêng tại pixel(x,y) có độ lớn α(x,y) được rời rạc hóa vào một trong p bin.
Rời rạc hóa unsigned-HOG (p=9):
( ( ( ) mod p ( 3.1) Rời rạc hóa signed-HOG (p=18):
( ( ( ) mod p ( 3.2)
Giá trị của bin được định lượng bởi tổng cường độ biến thiên của các pixels thuộc về bin đó.
Bước 4. Tính và chuẩn hóa véc tơ cho các khối Số khối được tính theo công thức sau:
(
) (
)(3.3) Trong đó: Wimage, Wblock, Wcell lần lượt là chiều rộng của ảnh, khối, ô.
Himage, Hblock, Hcell lần lượt là chiều cao của ảnh, khối, ô.
Nối các véc tơ đặc trưng ô để được véc tơ đặc trưng khối. Số chiều véc tơ đặc trưng của khối tính theo công thức sizefeature/block = ncells*sizefeature/cell. Trong đó, ncells là số ô trong khối và sizefeature/cell số chiều của véc tơ đặc trưng mỗi ô.
Có nhiều phương pháp được dùng cho việc chuẩn hóa khối. Chuẩn hóa véc tơ đặc trưng khối bằng một trong các công thức (3.4), (3.5), (3.6) được trình bày dưới đây. Theo tác giả của HOG, kết quả chuẩn hóa khi dùng L2-norm và L1-sprt là như nhau, L1-norm thì kém hơn.
L2-norm:
√ ( 3.4)
L1-norm:
( ( 3.5)
L1-sqrt: √ ( 3.6)
Trong đó: + là véc tơ đặc trưng ban đầu của khối;
+ là giá trị chuẩn của nó theo các chuẩn k = 1, 2;
+ là hằng số nhỏ.
Bước 5. Tính véc tơ cho ảnh
Ghép các véc tơ đặc trưng khối tạo nên ảnh để được véc tơ đặc trưng cho ảnh. Số chiều véc tơ đặc trưng của khối tính theo công thức sizefeature/image= nblocks*sizefeature/block. Trong đó, nblocks là số khối và sizefeature/cell số chiều của véc tơ đặc trưng mỗi khối.
Hình 3.7.Các bước rút trích đặc trưng HOG.