Trong phương pháp HT ban đầu để tìm đường trịn, gradient cường độ trước tiên được ước tính tại tất cả các vị trí trong ảnh và được lập ngưỡng để cung cấp cho các vị trí của các cạnh có ý nghĩa. Vị trí của tất cả các vị trí trung tâm có thể sau đó được tích lũy trong khơng gian tham số. Cuối cùng, khơng gian tham số được tìm kiếm các đỉnh tương ứng với tâm của các vật thể trịn. Vì các cạnh có độ rộng khác khơng và nhiễu sẽ ln cản trở q trình xác định vị trí đỉnh, vị trí trung tâm chính xác địi hỏi phải sử dụng các quy trình lấy trung bình phù hợp. Cách tiếp cận này yêu cầu một số lượng lớn điểm được tích lũy trong khơng gian tham số. Khả năng khác là sử dụng thơng tin định hướng cạnh sẵn có tại địa phương tại mỗi điểm ảnh cạnh để cho phép ước tính vị trí chính xác của các tâm vịng trịn. Điều này đạt được bằng cách di chuyển khoảng cách R dọc theo cạnh bình thường tại mỗi vị trí cạnh. Điều này thể hiện sự tiết kiệm đáng kể trong tải tính tốn.
Hình 25: Khơng gian Hough cho tọa độ các đường trịn đồng tâm với bán kính khác nhau (ảnh nguồn được sử dụng từ hệ thống camera toàn hướng)
Tuy nhiên, cải tiến này mang lại những sai số khác trong phép đo hướng cạnh cục bộ. Các toán tử cạnh như Sobel đưa ra độ khơng chính xác cố hữu khoảng 1 °. Nhiễu hình ảnh thường gây thêm sai số 1 ° nữa và đối với các đối tượng có bán kính 250 điểm ảnh, kết quả là độ khơng đảm bảo tổng thể khoảng 8 điểm ảnh trong ước tính vị trí trung tâm. Nói chung, khơng thể mong đợi độ chính xác điểm ảnh phụ của vị trí trung tâm khi một mặt phẳng tham số đơn được sử dụng để phát hiện các vịng trịn trên một loạt các kích thước. Điều này là do số lượng "lộn xộn" không liên quan xuất hiện trong khơng gian tham số, có tác dụng làm giảm tỷ lệ tín hiệu trên nhiễu. Để có độ chính xác cao, một phạm vi giá trị bán kính tương đối nhỏ nên được sử dụng trong bất kỳ một mặt phẳng thông số nào, trong khi đối với tốc độ cao một mặt phẳng thông số thường sẽ bao
gồm việc phát hiện tất cả các kích thước vịng trịn. Khi tâm cần được ước tính trong phạm vi 0,1 điểm ảnh, chúng ta nên tích lũy trong khơng gian tham số không phải là một điểm trung tâm ứng viên duy nhất tương ứng với điểm ảnh cạnh đã cho, mà là một hàm trải đều điểm (PSF) có thể được xấp xỉ bởi một hàm lỗi Gauss. Tuy nhiên, một kỹ thuật có sẵn có thể cắt giảm việc tính tốn mà khơng có độ chính xác đáng kể.
Hình 26: Cách sắp xếp để gia tăng xấp xỉ trung tâm
Sự cải tiến hơn nữa có thể đạt được bằng cách loại bỏ các sai số ngang, bởi vì hầu hết sự thiếu chính xác trong việc tính tốn vị trí của tâm phát sinh từ sai số ngang chứ không phải là sai số xuyên tâm [ CITATION Dav05 \l 4105 ]. Điều này dẫn đến chiến lược sau: tìm một điểm D trong vùng của trung tâm và sử dụng nó để có được giá trị gần đúng hơn A đến tâm bằng cách di chuyển từ điểm ảnh cạnh hiện tại P một khoảng bằng bán kính dự kiến r theo hướng của D (xem Hình 26). Sau đó lặp lại quy trình từng điểm ảnh một cho đến khi tất cả các điểm ảnh cạnh đã được tính đến. Lý thuyết cho thấy rằng đối với d nhỏ, kết quả trung bình sẽ là một sự cải thiện bởi một hệ số gần với 1,6 (giá trị giới hạn là 0 d → là 2 / π (E.R. Davies, 1988)).
Mặc dù kỹ thuật Hough đã được chứng minh là có hiệu quả và mạnh mẽ trong việc chống lại các vết cắn, tiếng ồn và các hiện vật khác, nhưng nó phải lưu trữ và tính tốn đáng kể –đặc biệt nếu cần xác định vị trí các vịng trịn có bán kính khơng xác định hoặc nếu u cầu độ chính xác cao.
16. RANSAC
RANSAC là từ viết tắt của RANdom SAmple Consensus và liên quan đến việc cố gắng nhiều lần để đạt được sự đồng thuận (tập hợp các nội dung) từ dữ liệu cho đến khi mức độ phù hợp vượt quá một tiêu chí nhất định. Fischler và Bolles đã giới thiệu nó vào năm 1981. Nó có khả năng giải thích và làm mịn dữ liệu có chứa một tỷ lệ phần trăm lỗi tổng đáng kể. Ước tính chỉ đúng với một xác suất nhất định, vì RANSAC là cơng cụ ước tính ngẫu nhiên. Thuật tốn đã được áp dụng cho một loạt các vấn đề ước lượng tham số
mơ hình trong thị giác máy tính, chẳng hạn như đối sánh đặc trưng, đăng ký hoặc phát hiện các nguyên thủy hình học.
Cấu trúc của thuật tốn RANSAC rất đơn giản nhưng mạnh mẽ. Đầu tiên, các mẫu được lấy đồng nhất và ngẫu nhiên từ tập dữ liệu đầu vào. Mỗi điểm có xác suất chọn như nhau (lấy mẫu điểm đồng nhất). Đối với mỗi mẫu, một giả thuyết mơ hình được xây dựng bằng cách tính tốn các tham số của mơ hình bằng cách sử dụng dữ liệu mẫu. Kích thước của mẫu phụ thuộc vào mẫu người ta muốn tìm. Thơng thường, nó là kích thước nhỏ nhất đủ để xác định các thơng số của mơ hình. Trong trường hợp của chúng tơi, việc phát hiện vịng trịn "biến dạng" là đủ ba điểm để xác định các tham số. Đạo hàm tham số có thể được tìm thấy bằng cách giải phương trình định thức sau:
Trong đó đường trịn duy nhất đi qua ba điểm (x1,y1) (x2,y2) (x3,y3), Ba điểm này xác định một đường tròn duy nhất nếu và chỉ khi, chúng không nằm trên cùng một đường thẳng. Đánh giá các đồng yếu tố cho hàng đầu tiên của định thức có thể giải quyết định thức. Định thức có thể được viết dưới dạng một phương trình của các hệ số này:
Sử dụng phương trình tổng qt của đường trịn, sắp xếp lại các số hạng và thay thế bằng phương trình (2), cho ra:
Lưu ý rằng khơng có nghiệm khi M11 bằng không. Trong trường hợp này, các điểm khơng nằm trên một đường trịn; tất cả chúng có thể nằm trên một đường thẳng.
Việc vẽ nhiều hơn số lượng điểm mẫu tối thiểu là khơng hiệu quả, vì xác suất chọn mẫu chỉ bao gồm các điểm dữ liệu cơ bản (tức là tất cả các điểm dữ liệu thuộc cùng một mơ hình), đưa ra một ước tính tốt và ngẫu nhiên, giảm xuống so với kích thước mẫu ngày càng tăng. Do đó, tập mẫu tối thiểu tối đa hóa xác suất chọn một tập hợp các giá trị ngoại lệ mà từ đó ước tính tốt sẽ được tính tốn sau này. Trong bước tiếp
theo, chất lượng của các mơ hình giả định được đánh giá trên tập dữ liệu đầy đủ. Hàm chi phí tính tốn chất lượng của mơ hình. Một chức năng phổ biến là đếm số lượng các giá trị ngoại lai (tức là các điểm dữ liệu đồng ý với mơ hình trong phạm vi dung sai). Giả thuyết đưa ra ước tính tốt nhất được hỗ trợ nhiều nhất từ tập dữ liệu, đưa ra ước tính tốt nhất. Thơng thường, các thơng số mơ hình do RANSAC ước tính khơng chính xác lắm. Do đó, các tham số mơ hình ước tính được tính tốn lại bằng ví dụ, một bình phương nhỏ nhất phù hợp với tập hợp con dữ liệu, hỗ trợ ước tính tốt nhất.
Kỹ thuật RANSAC sử dụng ba biến để kiểm sốt q trình ước lượng mơ hình. Đầu tiên xác định xem một điểm dữ liệu có đồng ý với một mơ hình hay khơng. Thông thường, đây là một số khả năng chịu lỗi xác định một khối lượng mà trong đó tất cả các điểm tương thích phải nằm trong đó. Số lượng giả thuyết mơ hình được tạo là biến thứ hai. Nó phụ thuộc vào xác suất để vẽ một mẫu chỉ bao gồm các điểm dữ liệu bên trong. Khi tỷ lệ các giá trị ngoại lệ và kích thước bộ mẫu tối thiểu tăng lên thì số lượng giả thuyết của mơ hình phải được tăng lên để có được một ước lượng tốt về các tham số của mơ hình. Tỷ lệ các giá trị ngoại lệ phụ thuộc vào mức độ nhiễu và số lượng mơ hình được hỗ trợ bởi tập dữ liệu. Hơn nữa, cần có một biến dung sai để xác định xem đã tìm thấy mơ hình đúng hay chưa. Mơ hình trích xuất được coi là hợp lệ nếu có đủ sự hỗ trợ từ các điểm dữ liệu cho mơ hình này. Hiệu suất của thuật tốn suy giảm khi kích thước mẫu ngày càng tăng. Hiệu quả tính tốn của thuật tốn có thể được cải thiện đáng kể theo một số cách. Tốc độ phụ thuộc vào hai yếu tố: thứ nhất, số lượng mẫu phải được rút ra để đảm bảo độ tin cậy nhất định để có được một ước tính tốt; và thứ hai, thời gian dành để đánh giá chất lượng của từng mơ hình giả định. Cái sau tỷ lệ với kích thước của tập dữ liệu. Việc đánh giá các mơ hình có thể được tối ưu hóa về mặt tính tốn bằng cách đánh giá ngẫu nhiên. Mọi mơ hình giả định chỉ được thử nghiệm đầu tiên với một số lượng nhỏ các điểm dữ liệu ngẫu nhiên từ tập dữ liệu. Nếu một mơ hình khơng nhận được đủ hỗ trợ từ tập hợp điểm ngẫu nhiên này, thì người ta có thể giả định với độ tin cậy cao rằng mơ hình khơng phải là một ước tính tốt. Các mơ hình vượt qua đánh giá ngẫu nhiên sau đó sẽ được đánh giá trên tập dữ liệu đầy đủ.