5. Ý nghĩa khoa học và thực tiễn của đề tài
1.5. Kết luận chƣơng 1
Chƣơng 1 trình bày tổng quan cơ sở về bà toán nhận dạng khuôn mặt, một số vấn đề chính trong xử lý ảnh nhằm mục đích cho phát hiện và nhận dạng khuôn mặt, bao gồm cơ sở lý thuyết về ảnh, quá trình xử lý ảnh, và một số hƣớng tiếp cận trong bài toán phát hiện khuôn mặt ngƣời.
33
CHƢƠNG 2. NHẬN DẠNG KHUÔN MẶT DỰA TRÊN HISTOGRAM HƢỚNG GRADIENT VÀ MẠNG NORON TÍCH CHẬP
2.1. Kỹ thuật trích chọn đặc trƣng histogram hƣớng gradient
2.1.1. Khái niệm histogram hướng gradient
Histogram hƣớng gradient (Histogram of Oriented Gradient – HOG) là một loại kỹ thuật trích chọn và mô tả đặc trƣng. Các đặc trƣng HOG ban đầu đƣợc thiết kế để phát hiện ngƣời (human detection) trong dữ liệu ảnh nhƣng sau đó đƣợc mở rộng và đƣợc sử dụng rộng rãi cho các bài toán phát hiện đối tƣợng nói chung (object detection). Kỹ thuật HOG dựa trên việc đếm số lần xuất hiện của các hƣớng đạo hàm (gradient orientation) trong các vùng ảnh cục bộ.
Ý tƣởng chính của HOG là tạo ra các bộ mô tả đặc trƣng (feature descriptor) nhằm mục đích phát hiện đối tƣợng (object detection). Từ một bức ảnh, ta sẽ lấy ra hai ma trận quan trọng giúp lƣu thông tin ảnh đó là độ lớn gradient (gradient magnitute) và hƣớng của gradient (gradient orientation). Bằng cách kết hợp hai thông tin này vào một biểu đồ phân phối histogram, trong đó độ lớn gradient đƣợc đếm theo các nhóm bins của phƣơng gradient. Cuối cùng ta sẽ thu đƣợc véc tơ đặc trƣng HOG đại diện cho histogram. Trên thực tế thuật toán hoạt động phức tạp hơn khi véctơ HOG đƣợc tính trên từng vùng cục bộ nhƣ mạng noron tích chập CNN và sau đó là phép chuẩn hóa cục bộ để đồng nhất độ đo. Cuối cùng véctơ HOG tổng hợp từ các véctơ trên vùng cục bộ.
Bản chất của kỹ thuật dựa trên HOG là các thông tin về hình dáng và vẻ bề ngoài của các đối tƣợng cục bộ trong ảnh có thể đƣợc mô tả bằng cách sử dụng thông tin về sự phân bố của các cƣờng độ gradient (intensity gradients) hoặc của các hƣớng biên (edge directions). Các toán tử HOG đƣợc cài đặt bằng cách chia nhỏ một bức ảnh thành các vùng con đƣợc gọi là các “tế bào”
34
(cells) và với mỗi cell đó một histogram về các hƣớng của gradients sẽ đƣợc tính cho các điểm nằm trong cell. Ghép các histogram này lại ta sẽ có một biểu diễn cho bức ảnh ban đầu. Để tăng cƣờng hiệu năng nhận dạng, các histogram cục bộ có thể đƣợc chuẩn hóa về độ tƣơng phản bằng cách tính một ngƣỡng cƣờng độ trong một vùng lớn hơn của ảnh, gọi là các khối (blocks) và sử dụng giá trị ngƣỡng đó đểchuẩn hóa tất cảcác cell trong khối. Kết quả của bƣớc chuẩn hóa này là vector đặc trƣng sẽ có tính bất biến cao hơn đối với các thay đổi về điều kiện ánh sáng.