Số lượng mẫu tỷ lệ trên mỗi Octave

Hình 2.8 cho thấy các kết quả mơ phỏng được sử dụng để kiểm tra tác động của thay đổi số lượng tỉ lệ mỗi octave mà tại đó các chức năng chụp ảnh được lấy mẫu trước khi phát hiện cực trị. Trong trường hợp này, mỗi hình ảnh được lấy mẫu lại xoay sau bằng một góc ngẫu nhiên và nhân rộng bởi một số lượng ngẫu nhiên giữa 0,2 và 0,9 lần kích thước ban đầu. Keypoint từ các hình ảnh có độ phân giải giảm được đối sánh với những điểm đó từ các hình ảnh gốc vì thế tỉ lệ cho tất cả các keypoint được thể hiện trong ảnh đối sánh. Ngồi ra, 1% nhiễu hình ảnh đã được bổ sung, nghĩa là mỗi điểm ảnh đã thêm vào một số ngẫu nhiên từ khoảng thống nhất [- 0.01,0.01] nơi các giá trị điểm ảnh nằm trong khoảng [0,1]

Dòng trên cùng trong đồ thị đầu tiên của Hình 2.8 cho thấy số phần trăm keypoint được phát hiện tại địa điểm đối sánh và tỉ lệ trong hình ảnh chuyển đổi. Đối với tất cả các ví dụ này, tỉ lệ đối sánh là √ của tỉ lệ chính xác và vị trí đối sánh là trong σ pixels, σ là tỉ lệ của các keypoint (định nghĩa phương trình (2.5) là độ lệch chuẩn của Gaussian nhỏ nhất được sử dụng trong hàm DOG). Các dòng thấp hơn trên biểu đồ này cho thấy số lượng các keypoint được đối sánh một cách chính xác đến một cơ sở dữ liệu gồm 40.000 keypoint sử dụng thủ tục đối sánh láng giềng gần để mô tả trong phần 2.1.6 (điều này cho thấy rằng một khi các keypoint được lặp đi lặp lại, nó có khả năng là hữu ích cho nhận dạng và phù hợp với nhiệm vụ đối sánh). Như biểu đồ này cho thấy, độ lặp lại cao nhất thu được khi lấy mẫu 3 thang

tăng. Từ thành công trong nhận dạng đối tượng thường phụ thuộc nhiều vào số lượng keypoint đối sánh đúng, và phần trăm đối sánh đúng cũng tăng, nhiều ứng dụng sẽ được tối ưu để sử dụng một số lượng lớn các mẫu tỉ lệ. Tuy nhiên, chi phí của việc tính tốn cũng tăng lên với con số này, vì vậy mà ta lựa chọn sử dụng chỉ 3 mẫu tỉ lệ mỗi octave.

Các thí nghiệm cho thấy rằng hàm khơng gian tỉ lệ hàm DOG có một số lượng lớn các cực trị và nó sẽ rất tốn kém để phát hiện tất cả. Và điều may mắn là ta có thể phát hiện các tập con ổn định nhất và hữu ích ngay cả với một mẫu thơ của tỉ lệ.

2.5.3.3. Tần suất lấy mẫu trong miền không gian

Để xác định tần số lấy mẫu cho mỗi octave của khơng gian tỉ lệ thì phải xác định tần số lấy mẫu trong hình ảnh liên quan đến tỉ lệ của độ mịn. Giả sử rằng cực trị có thể được tự ý gần nhau, sẽ có một sự hốn đổi tương tự giữa tần số lấy mẫu và tỷ lệ phát hiện. Hình 2.9 cho thấy thực nghiệm của lượng làm mịn trước khi σ được áp dụng cho từng cấp hình ảnh trước khi xây dựng các không gian biểu diễn tỉ lệ cho một octave. Dòng trên cùng là lặp lại của phát hiện keypoint và kết quả cho thấy rằng khả năng lặp lại tiếp tục tăng với σ. Tuy nhiên, nếu chọn σ quá lớn thì lại mất nhiều thời gian, để tăng hiệu quả ta lựa chọn σ = 1.6 cung cấp gần lặp lại tối ưu. Giá trị này đã được sử dụng cho các kết quả trong hình 2.8.

Mơ hình phân tầng cascade

Thứ tự làm mịn cho mỗi Octave