Tần suất lấy mẫu tỉ lệ

Một phần của tài liệu Nhận dạng và định danh khuôn mặt người thời gian thực và sử dụng camera 2d giá rẻ (Trang 26 - 28)

2.5. Thuật toán SIFT [4] [5]

2.5.3.2. Tần suất lấy mẫu tỉ lệ

Ta thực hiện việc đối sánh dùng một bộ sưu tập 32 hình ảnh thực tế rất đa dạng, bao gồm cả ngoại cảnh, khuôn mặt người, hình ảnh trên khơng và hình ảnh cơng nghiệp (miền hình ảnh đã được tìm thấy hầu như khơng có ảnh hưởng đến bất kỳ kết quả nào). Mỗi hình ảnh sau đó đã phải chịu một loạt các biến đổi, bao gồm quay, thay đổi tỉ lệ, Affine,sự thay đổi về độ sáng và độ tương phản và bổ sung các nhiễu hình ảnh. Bởi vì những thay đổi này là tổng hợp, nó đã có thể dự đốn chính xác nơi mỗi thuộc tính trong một hình ảnh ban đầu sẽ xuất hiện trong hình ảnh chuyển đổi, cho phép đo lặp lại chính xác và độ chính xác vị trí cho mỗi thuộc tính.

Hình 2.8: Số lượng mẫu tỷ lệ trên mỗi Octave

Hình 2.8 cho thấy các kết quả mô phỏng được sử dụng để kiểm tra tác động của thay đổi số lượng tỉ lệ mỗi octave mà tại đó các chức năng chụp ảnh được lấy mẫu trước khi phát hiện cực trị. Trong trường hợp này, mỗi hình ảnh được lấy mẫu lại xoay sau bằng một góc ngẫu nhiên và nhân rộng bởi một số lượng ngẫu nhiên giữa 0,2 và 0,9 lần kích thước ban đầu. Keypoint từ các hình ảnh có độ phân giải giảm được đối sánh với những điểm đó từ các hình ảnh gốc vì thế tỉ lệ cho tất cả các keypoint được thể hiện trong ảnh đối sánh. Ngồi ra, 1% nhiễu hình ảnh đã được bổ sung, nghĩa là mỗi điểm ảnh đã thêm vào một số ngẫu nhiên từ khoảng thống nhất [- 0.01,0.01] nơi các giá trị điểm ảnh nằm trong khoảng [0,1]

Dòng trên cùng trong đồ thị đầu tiên của Hình 2.8 cho thấy số phần trăm keypoint được phát hiện tại địa điểm đối sánh và tỉ lệ trong hình ảnh chuyển đổi. Đối với tất cả các ví dụ này, tỉ lệ đối sánh là √ của tỉ lệ chính xác và vị trí đối sánh là trong σ pixels, σ là tỉ lệ của các keypoint (định nghĩa phương trình (2.5) là độ lệch chuẩn của Gaussian nhỏ nhất được sử dụng trong hàm DOG). Các dòng thấp hơn trên biểu đồ này cho thấy số lượng các keypoint được đối sánh một cách chính xác đến một cơ sở dữ liệu gồm 40.000 keypoint sử dụng thủ tục đối sánh láng giềng gần để mô tả trong phần 2.1.6 (điều này cho thấy rằng một khi các keypoint được lặp đi lặp lại, nó có khả năng là hữu ích cho nhận dạng và phù hợp với nhiệm vụ đối sánh). Như biểu đồ này cho thấy, độ lặp lại cao nhất thu được khi lấy mẫu 3 thang mỗi octave.

tăng. Từ thành công trong nhận dạng đối tượng thường phụ thuộc nhiều vào số lượng keypoint đối sánh đúng, và phần trăm đối sánh đúng cũng tăng, nhiều ứng dụng sẽ được tối ưu để sử dụng một số lượng lớn các mẫu tỉ lệ. Tuy nhiên, chi phí của việc tính tốn cũng tăng lên với con số này, vì vậy mà ta lựa chọn sử dụng chỉ 3 mẫu tỉ lệ mỗi octave.

Các thí nghiệm cho thấy rằng hàm khơng gian tỉ lệ hàm DOG có một số lượng lớn các cực trị và nó sẽ rất tốn kém để phát hiện tất cả. Và điều may mắn là ta có thể phát hiện các tập con ổn định nhất và hữu ích ngay cả với một mẫu thô của tỉ lệ.

Một phần của tài liệu Nhận dạng và định danh khuôn mặt người thời gian thực và sử dụng camera 2d giá rẻ (Trang 26 - 28)

Tải bản đầy đủ (PDF)

(90 trang)