Thứ tự làm mịn cho mỗi Octave

Một phần của tài liệu Nhận dạng và định danh khuôn mặt người thời gian thực và sử dụng camera 2d giá rẻ (Trang 41 - 43)

Tất nhiên, nếu ta làm mịn hình ảnh trước khi phát hiện cực trị, ta đang loại bỏ hiệu quả của các tần số không gian cao nhất. Vì vậy, để sử dụng đầy đủ các đầu vào, các hình ảnh có thể được mở rộng để tạo thêm nhiều điểm hơn mẫu đã có mặt trong bản gốc. Ta tiến hành nhân đơi kích thước của hình ảnh đầu vào sử dụng nội suy tuyến tính trước khi xây dựng các mức đầu tiên của kim tự tháp. Trong khi các hoạt động tương đương có thể có hiệu quả đã được thực hiện bởi việc dùng bộ lọc bù tập con điểm ảnh trên ảnh gốc, tăng gấp đơi hình ảnh dẫn đến việc thực hiện hiệu quả hơn. Ta giả định rằng các hình ảnh ban đầu có một vệt mờ tối thiểu σ = 0,5 (mức tối thiểu cần thiết để ngăn chặn hiện tượng răng cưa tại đường biên ảnh), và do đó để tăng các điểm ảnh ta cần tăng gấp đôi giá trị σ = 1,0 . Điều này có nghĩa rằng việc làm mịn bổ sung là cần thiết trước khi tạo ra các octave đầu tiên của không gian tỉ lệ. Việc tăng gấp đơi hình ảnh làm tăng số lượng các keypoint ổn định gần gấp 4.

2.5.4. Định vị các Keypoint

Khi một ứng viên keypoint đã được tìm thấy bằng cách so sánh một pixel với các điểm láng giềng của nó, bước tiếp theo là để thực hiện một cách chi tiết để các dữ liệu trong khu vực với vị trí, tỉ lệ và tỉ lệ của độ cong chính. Điều này cho phép các điểm được loại bỏ khi có độ tương phản thấp (và do đó nhạy cảm với nhiễu) hoặc ít được địa phương hóa dọc theo một cạnh.

Việc thực hiện ban đầu của phương pháp này (Lowe, 1999) chỉ đơn giản là định vị keypoint vào vị trí và tỉ lệ của các điểm mẫu trung tâm. Tuy nhiên, thời gian gần đây Brown đã phát triển một phương pháp (Brown và Lowe, 2002) cho một hàm bậc hai 3D vừa khít với các điểm lấy địa phương để xác định vị trí nội suy tối đa, và thí nghiệm của ơng cho thấy rằng việc này cung cấp một sự cải thiện đáng kể phù hợp và ổn định. Cách tiếp cận của ông sử dụng các mở rộng Taylor (lên đến các phương trình bậc hai) của hàm tỉ lệ không gian, D(x, y, σ), dịch chuyển sao mà nguồn gốc là ở vị trí mẫu:

Trong đó D và các dẫn xuất của nó được đánh giá ở vị trí mẫu và x = (x, y, σ)T là phần bù đắp từ vị trí này. Các vị trí của các cực trị ̂ được xác định bằng cách lấy đạo hàm của hàm này đối với x và gán nó bằng 0, cho

2 1 2 D D x x x        (2.10)

Một phần của tài liệu Nhận dạng và định danh khuôn mặt người thời gian thực và sử dụng camera 2d giá rẻ (Trang 41 - 43)

Tải bản đầy đủ (PDF)

(104 trang)