Thuật toán phân vùng biên

Cho M1 M2 ……MR là bộ biểu thị tọa độ của các điểm trong tiểu khu vực của một hình ảnh g (x, y). Như đã trình bày ở phần cuối của mục 10.5.1, điều này thường sẽ là một hình ảnh gradient. Cho C (Mi) là một tập hợp biểu thị tọa độ của các điểm trong lưu vực lưu vực kết hợp với tối thiểu vùng Mi (nhớ lại rằng các điểm trong bất kỳ hình thức lưu vực lưu vực một thành phần kết nối). Các ký hiệu min và max sẽ được sử dụng để biểu thị giá trị tối thiểu và tối đa của g (x, y). Cuối cùng, chúng ta hãy T [n] đại diện cho tập hợp các tọa độ (s, t) mà g (s, t) < n. Đó là,

T[n] ={ (s,t) │ g(s,t) < n } (10.5-1)

Theo hình học , T [n] là tập hợp tọa độ của điểm trong g (x, y) nằm bên dưới mặt phẳng g (x, y) = n.

Sự tính toán sẽ gia tăng số nguyên, từ n = min + 1 đến n = max + 1. Tại bất kỳ bước n của quá trình làm phẳng, các thuật toán cần phải biết số lượng các điểm dưới độ sâu . Khái niệm, giả sử rằng các tọa độ trong T [n] mà bên dưới mặt phẳng g (x, y) = n được "đánh dấu" đen, và tất cả các tọa độ khác được đánh dấu màu trắng . Sau đó, khi nhìn "xuống" trên tọa độ tại bất kỳ tăng n của độ phẳng, chúng ta sẽ thấy một hình ảnh nhị phân trong đó điểm đen tương ứng với điểm trong các chức năng mà là dưới tọa độ g (x, y) = n. Giải thích này là khá hữu ích trong việc giúp hiểu được thảo luận dưới đây

Cn(Mi) biểu thị tập hợp tọa độ của điểm trong lưu vực kết hợp với Mi tối thiểu đang làm phẳng ở giai đoạn n. Với tham khảo các cuộc thảo luận trong đoạn trước. Cn(Mi) có thể được xem như là một hình ảnh nhị phân được đưa ra bởi

Cn(Mi) = C(Mi) (10.5-2)

Trong các từ, Cn(Mi) = 1 tại vị (x,y) if (x, y) ϵ C(Mi) AND (x, y) ϵ T[n] , nếu không Cn (Mi) = 0. Việc giải thích hình học của kết quả này là đơn giản. Chúng tôi chỉ đơn giản bằng cách sử dụng toán tử AND để cô lập ở giai đoạn n của làm phẳng một phần của hình ảnh nhị phân trong T [n] được kết hợp với Mi tối thiểu vùng. Tiếp theo, chúng ta để cho C [n] biểu thị sự kết hợp của các lưu vực bị làm phẳng phần ở giai đoạn n:

= (10.5-3)

Sau đó, C [max + 1] là sự kết hợp của tất cả các lưu vực nhỏ : = (10.5-4)

Có thể được chỉ ra (vấn đề 10.29) các yếu tố trong cả hai Cn(Mi) và T [n] không bao giờ thay thế trong thực hiện các thuật toán, và số phần tử trong hai bộ tăng hoặc vẫn giữ nguyên như n tăng . Do đó, C [n - 1] là một tập hợp con của C [n]. Theo Eqs. (10,5-2) và (10,5-3), C [n] là một tập hợp con của T [n], vì vậy sau đó C [n - 1] củng là một tập hợp con của T [n]. Từ đây chúng ta có kết quả quan trọng mà mỗi thành phần kết nối của C [n - 1] được chứa trong chính xác một thành phần kết nối của T [n].

Các thuật toán cho việc tìm kiếm các dòng đầu nguồn được khởi tạo với C[min + 1] = T[min + l] ,Thuật toán sau đó tiến hành đệ quy, giả định ở bước n rằng C [n - 1] đã được xây dựng. Một thủ tục thu được C [n] từ C [n -1] là như sau. Cho Q biểu thị tập hợp các thành phần kết nối trong T [n]. Sau đó, đối với mỗi thành phần kết nối q ϵ Q[n], có ba khả năng.

(a) q là trống

(b) q chứa một thành phần kết nối của C [n - 1]. (c) q chứa nhiều thành phần kết nối của C [n - 1].

Xây dựng C [n] từ C [n-1] phụ thuộc vào ba điều kiện. Điều kiện (a) xảy ra khi một tối thiểu mới xuất hiện , trong trường hợp thành phần kết nối q được đưa vào [n - 1] để tạo thành C [n]. Điều kiện (b) xảy ra khi q nằm trong lưu vực của một số vùng tối thiểu , trong trường hợp q được đưa vào C [n - 1] để tạo thành C [n] . Điều kiện (c) xảy ra khi tất cả hoặc một phần, của một phần điỉnh tách hai hoặc nhiều lưu vực là gặp phải. Làm phẳng sẽ tiếp tục gây ra làm cho các lưu vực sẽ kết hợp. Vì vậy, một đường biên (hoặc nhiều đường biên nếu có nhiều hơn hai lưu vực lưu vực có liên quan) phải

được xây dựng trong q để ngăn chặn việc tràn giữa các lưu vực . Như đã giải thích ở phần trước, một đường biên với điểm ảnh dày có thể được xây dựng khi cần thiết bằng cách làm giãn q với 3 x 3 yếu tố cấu trúc l's, và kìm hãm sự giãn nở đến q.

Hiệu quả thuật toán được cải thiện bằng cách sử dụng chỉ có giá trị của n tương ứng với giá trị màu xám cấp hiện có trong g (x, y), chúng ta có thể xác định các giá tr ị, cũng như các giá trị của min và max, từ lược đồ mức xám của g(x. y).

Ví dụ 10.18 : Minh họa của thuật toán phân vùng biên

Xem xét các hình ảnh và độ dốc của nó, thể hiện trong hình. 10.46 (a) và (b) tương ứng. Áp dụng các thuật toán dò biên vừa mô tả mang lại những đường biên (đường trắng) của hình ảnh gradient chỉ ở 10,46 (c). Những ranh giới phân chia nhỏ được hiển thị chồng lên hình ảnh ban đầu trong hình 10,46 (d). Như đã nói ở đầu bài này, ranh giới phân chia có tính chất quan trọng là các đường kết nối.

Sử dụng dấu

Ứng dụng trực tiếp của thuật toán phân vùng biên theo hình thức thảo luận trong phần trước thường dẫn đến chồng cùng do tiếng nhiễu và những vi phạm khác tại đường dốc của vùng đó. Như thể hiện trong hình 10.47, chồng vùng có thể làm cho kết quả của thuật toán vô dụng. Trong trường hợp này, điều này có nghĩa là một số lượng lớn các khu vực phân đoạn. Một giải pháp thiết thực cho vấn đề này là để hạn chế số lượng các vùng cho phép bằng cách kết hợp một giai đoạn tiền xử lý được thiết kế để mang lại kiến thức bổ sung vào các thủ tục phân vùng .

Một cách tiếp cận được sử dụng để kiểm soát chồng vùng dựa trên khái niệm về dấu . Một điểm đánh dấu là một thành phần kết nối thuộc một hình ảnh . Chúng ta đánh dấu nội bộ, kết hợp với các đối tượng quan tâm, và đánh dấu bên ngoài liên kết với các nền. Một thủ tục lựa chọn đánh dấu thông thường sẽ bao gồm hai bước chính: (1) tiền xử lý, và (2) định nghĩa một tập hợp các tiêu chí mà các dấu hiệu phải đáp ứng .

Để minh họa, xem xét Fig.10.47 (a) một lần nữa.. Một phần của vấn đề mà dẫn đến kết quả chồng vùng trong hình. 10,47 (b) là số lượng lớn các khả năng tối thiểu . Bởi vì kích thước của chúng, rất nhiều các tối thiểu thực sự là chi tiết không liên quan Như đã chỉ ra trong các cuộc thảo luận trước đó, một phương pháp hiệu quả để giảm thiểu tác động của các chi tiết không gian nhỏ là để lọc hình ảnh với một bộ lọc làm mịn. Đây là một tiền xử lý thích hợp trong các trường hợp đặc biệt.

Giả sử chúng ta xác định đánh dấu nội bộ trong trường hợp này là (1) một khu vực được bao quanh bởi điểm cao hơn "độ cao", (2) sao cho các điểm trong khu vực tạo thành một thành phần kết nối, và (3) trong đó tất cả các điểm trong thành phần kết nối có cùng một giá trị mức xám. Sau khi hình ảnh đã được làm nhẵn, đánh dấu nội bộ kết quả từ định nghĩa này được thể hiện như ánh sáng màu xám, vùng bloblike trong hình 10.48 (a). Tiếp theo các thuật toán đầu nguồn đã được áp dụng cho các hình ảnh được làm trơn, dưới sự hạn chế đó các dấu nội bộ là chỉ cho phép là tối thiểu vùng. Hình 10.48 (a) cho thấy các đường biên. Những đường biên được định nghĩa là các đánh dấu bên ngoài. Lưu ý rằng các điểm dọc theo dòng đường biên là đại diện tốt cho nền bởi vì chúng vượt qua cùng điểm cao nhất giữa những đánh dấu lân cận.

Các đánh dấu bên ngoài thể hiện trong Fig.10.48 (a) phân vùng có hiệu quả các hình ảnh thành các vùng, mỗi khu vực có chứa một đánh dấu nội bộ đơn và một phần của nền. Vấn đề là do đó giảm xuống còn phân vùng từng khu vực thành hai: một đối tượng duy nhất và nền tảng của nó. Chúng ta có thể đưa vấn đề đơn giản rất nhiều bằng các kỹ thuật phân chia nhỏ như thảo luận ở trong chương này trước đó . Cách tiếp cận khác chỉ đơn giản là để áp dụng các thuật toán phân vùng biên cho mỗi khu vực riêng biệt . Nói cách khác, chúng ta chỉ cần đơn giản độ dốc của hình ảnh trơn [như trong hình, 10,46 (b) và sau đó hạn chế các thuật toán để hoạt động trên lưu vực có chứa các dấu hiệu trong đó khu vực cụ thể. Kết quả thu được sử dụng phương pháp này được thể hiện trong 10.48 (b). Việc cải thiện hình ảnh trong 10.47 (b) là điều hiển nhiên.

Sử dụng chuyển động trong phân vùng ảnh

Kĩ thuật miền tần số