Phân vùng ảnh dựa trên phân tích kết cấu

Kết cấu thường được nhận biết trên bề mặt của các đối tượng như gỗ, cát, vải vóc…Kết cấu là thuật ngữ phản ánh sự lặp lại của các phần tử mẫu kết cấu cơ bản. Sự lặp lại này có thể ngẫu nhiên hay có tính chu kì hoặc gần chu kì. Một mẫu kết cấu chứa rất nhiều điểm ảnh. Trong phân tích ảnh, kết cấu được chia làm hai loại chính là: loại thống kê và loại cấu trúc.

a) Phƣơng pháp thống kế.

Tính kết cấu ngẫu nhiên rất phù hợp với các đặc trưng thống kê. Vì vậy, người ta có thể dùng các đặc trưng ngẫu nhiên để đo nó như: Hàm tự tương quan (AutoCorrelation Function- ACF), các biến đổi mật độ gờ, ma trận tương tranh,… Theo cách tiếp cận bằng hàm tự tương quan, độ thô của kết cấu sợi tỉ lệ với độ rộng của ACF, được biểu diễn bởi khoảng cách x0, y0 sao cho r(x0,0) = r(0,y0) = 1. Người ta cũng dùng cách đo nhánh của ACF nhờ hàm khởi sinh moment:

𝑀 𝑘, 𝑙 = 𝑛 − 𝜇1 𝑘 𝑚 − 𝜇2 𝑟 𝑛, 𝑚 𝑚

𝑛

𝑣ớ𝑖 𝜇1 = 𝑛. 𝑟 𝑛, 𝑚 𝑣à 𝜇𝑛 2 = 𝑚. 𝑟 𝑛, 𝑚 𝑛

Các đặc trưng của kết cấu sợi như độ thô, độ mịn hay hướng có thể ước lượng nhờ các biến đổi ảnh bằng kỹ thuật lọc tuyến tính. Một mô hình đơn giản trong trường hợp ngẫu nhiên cho việc phân tích tính kết cấu được mô tả trong hình dưới đây:

Hình 1.6 Phân tích kết cấu bằng dải tƣơng quan

Trong mô hình này, trường kết cấu sợi trước tiên được giải chập bởi bộ lọc lấy từ đầu ra của ACF. Như vậy, nếu r(m,n) là ACF thì u(n, m)  a(n, m) = ε(n, m) là trường ngẫu nhiên không tương quan.

Lưu ý rằng, bộ lọc là không duy nhất, có thể là nhân quả, bán nhân quả hay không nhân quả. Các ACF hay dùng như M(0, 2), M(2, 0), M(1, 1), M(2, 2).

phân tán 𝜇2 cũng hay được sử dụng. Ngoài các đặc trưng trên, có thể đưa thêm một số khái niệm và định nghĩa các đại lượng dựa trên đó như: lược đồ mức xám (Histogram Grey Level Difference), ma trận xuất hiện mức xám.

Lược đồ hiệu mức xám.

Lược đồ hiệu mức xám dùng để mô tả các thông tin mang tính không gian và được định nghĩa như sau. Cho d = (d1, d2) là vecto dịch chuyển giữa 2 điểm ảnh và g(d) là hiệu mức xám với khoảng cách d: g(d) = |f(k,l) – f(k+d1, l+d2)| với hàm f(k, l) cho giá trị mức xám tại tọa độ (k, l). Gọi hg(g, d) là lược đồ của hiệu mức xám khoảng cách d. Với mỗi khoảng cách d ta có một lược đồ mức xám riêng. Với một miền ảnh có kết cấu thô, lược đồ hg(g, d) có khuynh hướng tập trung xung quanh g=0 với khoảng cách d nhỏ. Trái lại, với một miền ảnh có kết cấu mịn, hg(g, d) sẽ phân nhánh dù với vecto dịch chuyển d khá nhỏ. Dựa trên lược đồ này, người ta định nghĩa lại một số đại lượng :

- Trung bình : 𝜇𝑑 = 𝑁 𝑔𝑘ℎ𝑘 𝑘=1 (𝑔𝑘, 𝑑) - Phương sai : 𝜎𝑑2 = 𝑁 𝑔𝑘 − 𝜇𝑑 2 𝑘=1 ℎ𝑔(𝑔𝑘, 𝑑) - Độ tương phản : 𝑐𝑑 𝑁 𝑔𝑘2 𝑘=1 ℎ𝑔(𝑔𝑘, 𝑑)

Phương sai đo độ tản mát của hiệu mức xám tại một khoảng cách d nào đấy. Kết cấu tất định thường có phương sai d σ tương đối nhỏ. Độ tương phản cd chính là mômen của lược đồ hg(g, d) xung quanh g = 0 và đo độ tương phản của hiệu mức xám. Người ta sử dụng entropy để đo độ đồng nhất cảu lược đồ hg:

𝐻𝑔 = − ℎ𝑔(𝑔𝑘, 𝑑)ln⁡(ℎ𝑔 𝑁

𝑘=1

(𝑔𝑘, 𝑑))

Ưu điểm cơ bản của lược đồ hiệu mức xám là tính toán đơn giản. Ngoài ra còn có khả năng cho ta tổ chức kết cấu không gian.

Ma trận xuất hiện liên hiệp mức xám.

k,l tương ứng cách nhau một khoảng d. Xác suất này dễ dàng tính được nhờ việc tính số lần xuất hiện nk,l của cặp điểm ảnh (fk, f1) có mức xám k và l với khoảng cách d. Gọi n là tổng số cặp liên hiệp có thể với khoảng cách d trong ảnh. Các phần tử ck,l

của ma trận xuất hiện liên hiệp mức xám cd được tính như sau : cd = (ck,l ) và

ck,l=P(k,l,d)=nk,l/n. Ma trận xuất hiện liên hiệp mức xám Cd là ma trận vuông N x N phần tử (N là số mức xám của ảnh). Ma trận này chứa các thông tin hữu ích về tổ chức kết cấu không gian. Nếu kết cấu tương đối thô thì các phần tử của ma trận tập trung xung quanh đường chéo chính. Ngược lại, nếu kết cấu bề mặt mịn, giá trị các phần tử của cd sẽ phân rải tương đối rõ. Dựa trên khái niệm này người ta định nghĩa về một số độ đo:

- Xác suất cực đại: pd=max(k,l)Ck,l

- Entropy: 𝐻𝑑 = − 𝑁 𝐶𝑘,𝑙𝑙𝑛⁡(𝐶𝑘,𝑙 𝑙=1

𝑁

𝑘=1 )

Dễ dàng thấy được entropy cực đại khi xác suất liên hiệp P(k,l,d) có phân phối đều. Mô men bậc m : 𝐼𝑑 = 𝑁 |𝑘 − 𝑙|𝑚𝐶𝑘,𝑙

𝑙=1 𝑁

𝑘=1 .

Id cực tiểu khi các phân tử của ma trận C tập trung trên đường chéo chính vì khoảng cách |k-l|m rất nhỏ, Id nhỏ có nghĩa là kết cấu khá thô. Người ta cũng còn đưa vào một số độ đo khác như hàm tự tương quan, phổ năng lượng. Để áp dụng cách tiếp cận này, cần cài đặt các giải thuật tính các đại lượng đo trên.

b) Phƣơng pháp cấu trúc.

Kết cấu sợi có cấu trúc thuần nhất là những mấu kết cấu xác định, mà sự xuất hiện lặp đi lặp lại tuân theo một luật tất định hay ngẫu nhiên nào đấy. Một mẫu kết cấu về thực tế là một nhóm các điểm ảnh có cùng một số tính chất bất biến lặp trên ảnh. Một mẫu kết cấu cũng có định nghĩa theo mức xám, theo bề mặt hay tính đồng nhất đối với một số các tính chất như kích thước, hướng, lược đồ bậc hai (ma trận tương tranh). Với các mẫu kết cấu được phân bố ngẫu nhiên, tính kết cấu sợi tương ứng của nó được coi là yếu (Weak) ngược với qui luật phân bố tất định gọi là mạnh (Strong). Khi tính kết cấu sợi là yếu, luật phân bố có thể đo bởi:

- Các loạt dài của các mẫu kết cấu liên thông tối đa

- Mật độ cực trị tương đối; số pixel trên một đơn vị diện tích có mức xám cực trị địa phương so với các lân cận.

Ngoài hai cách tiếp cận trên, người ta còn dùng cách tiếp cận khác bằng cách lấy tổ hợp 2 cách trên và gọi là kỹ thuật mosaic. Mô hình này biểu diễn các quá trình học ngẫu nhiên, thí dụ như khảm ngẫu nhiên hay đều của một mặt phẳng vào các đường cong lồi sẽ làm nổi lên tính kết cấu tế bào.

c) Tiếp cận theo tính kết cấu.

Khi đối tượng xuất hiện trên một nền có tính kết cấu cao, việc phân đoạn dựa vào tính kết cấu trở nên quan trọng. Nguyên nhân là kết cấu sợi thường chứa mật độ cao các gờ (edge) làm cho phân đoạn theo biên kém hiệu quả, trừ phi ta loại tính kết cấu. Việc phân đoạn dựa vào miền đồng nhất cũng có thể áp dụng cho các đặc trưng kết cấu và có thể dùng để phân đoạn các miền có tính kết cấu.

Nhìn chung, việc phân loại và phân vùng dựa vào kết cấu là một vấn đề phức tạp.

Ở đây, tài liệu chỉ mang tính chất giới thiệu. Có thể giải quyết vấn đề này trong thực tế nếu ta biết trước các loại kết cấu (dựa vào quy luật hay các phân bố của nó).

1.2.2.4 Phân vùng ảnh dựa trên sự phân lớp điểm ảnh.

a) Mô hình bài toán:

Cho ảnh X ={pi} , i∈ [1,N.M] , với N là chiều rộng của ảnh và M là chiều cao của ảnh, pi là điểm ảnh thứ i và A(pi) là thuộc tính của pi . Đối tượng phân lớp ở đây là các pi.

Phân vùng ảnh X chính là phân lớp tập X thành các lớp Ci sao cho từ Ci phát triển thành các vùng Ri. Chỉ tiêu phân lớp ở đây chính là độ đồng đều (tương tự) về thuộc tính của các điểm ảnh.

Quá trình phân lớp có thể sử dụng các phương pháp học máy và quyết định phân lớp.

b) Phân lớp điểm ảnh trong không gian thuộc tính một chiều.

Trong phần này sẽ giới thiệu một thuật toán vùng dựa trên sự phân lớp các điểm ảnh trên nguyên tắc phân tích tự tổ chức theo nguyên tắc lặp (ISODATA – Interactive Seft Organization DATa Analysis).

Thuật toán ISODATA trong phân vùng ảnh:

Đầu vào: X={pi},i[1,N.M], A(pi) là gia trị mức xám của pi.

Đầu ra : Số vùng ảnh

Phương pháp:

1. Khởi tạo: (t=0)

 Đoán nhận số vùng K (số lớp) trên cơ sở lượt đồ phân bố mức xám (histogram). Trong đó lmin là giá trị mức xám thấp nhất và lmax là mức xám giá trị cao nhất của ảnh X.

 Chọn các giá trị ngưỡng ban đầu của các lớp theo nguyên tắc sau:

T0=lmin, TK=lmax và Ti(t)= 𝑖.𝑙𝑚𝑎𝑥−𝑙𝑚𝑖𝑛

𝐾 + 𝑇0 , với i=1…K-1

2. Bước lặp

 Thực hiện phân lớp điểm theo các ngưỡng Ti(t-1)

PiCk nếu Ti(t-1) ≤ A(pi)≤Ti+1(t-l),k[l,K]

 Tính giá trị trung bình của mỗi lớp tại thời điểm t

𝑚𝑘 𝑡 = 1

𝐶𝑎𝑟𝑑 𝐶𝑘 𝐴(𝑝𝑖) 𝑃𝑖∈𝐶𝑘

𝑇𝑖 𝑡 = 𝑚𝑖(𝑡) − 𝑚𝑖+1(𝑡) 2

 Kiểm tra điều kiện lặp

- Nếu Ti(t)Ti(t-1) thì dừng hoặc mi(t)mi(t-1) thì dừng

3. Phân lớp các lớp Ck theo các Ti , i=1..K-1 đã ổn định. Hình thành các vùng Rk từ các lớp Ck. Gán nhãn các vùng theo giá trị trung bình của lớp và hiển thị ảnh các vùng đã phân bố.

1.2.2.5 Phân vùng dựa vào lý thuyết đồ thị.

Trong thời gian gần đây, các nhà nghiên cứu đã đưa ra một số phương pháp phân vùng dựa trên những hướng tiếp cận mới, trong đó có hướng tiếp cận phân vùng dựa trên đồ thị. Đối với phương pháp này, hình ảnh sẽ được mô tả như một đồ thị với các đỉnh của đồ thị là các điểm ảnh và các cạnh trên đồ thị nối các điểm ảnh lân cận với nhau.

Từ trước đến nay, các phương pháp phân vùng dựa trên đồ thị chỉ dừng lại ở việc lựa chọn các cạnh từ một đồ thị để thực hiện việc phân vùng ảnh. Trong phần này, chúng tôi sẽ giới thiệu phương pháp phân vùng ảnh dựa trên lý thuyết đồ thị. Khác với các phương pháp phân vùng dựa trên đồ thị khác, phương pháp phân vùng dựa trên lý thuyết đồ thị thực hiện việc phân vùng dựa trên mức độ biến thiên giữa các vùng lân cận trong ảnh. Cụ thể, phương pháp này so sánh sự khác nhau trong nội tại của một vùng so với sự khác nhau của vùng đó so với các vùng khác.

a) Biểu diễn ảnh nhƣ là một đồ thị.

Kỹ thuật phân vùng ảnh dựa trên lý thuyết đồ thị biểu diễn ảnh như là một đồ thị G = (V, E). Trong đó, V là tập hợp các đỉnh và E là tập hợp các cạnh của đồ thị. Mỗi đỉnh vi ∈ V tương ứng với các điểm ảnh và các cạnh (vi , vj) ∈ E tương ứng là cạnh kết nối các cặp điểm ảnh lân cận. Mỗi cạnh (vi , vj) ∈ E có một trọng số tương ứng là sự khác nhau về màu sắc, cường độ giữa hai điểm ảnh lân cận vi, vj và được ký hiệu là w(vi,vj).

V : Tập đỉnh

E : Tập các cạch kết nối

Ảnh = {Điểm ảnh} Điểm ảnh tương tự

Hình 1.7 Biểu diễn ảnh dƣới dạng một đồ thị

 Đỉnh liền kề.

Hai đỉnh vi và vj của đồ thị G được gọi là kề nhau nếu (vi,vj) là cạnh của đồ thị G. Nếu e = (vi, vj) là cạnh của đồ thị ta nói cạnh này nối đỉnh vi và đỉnh vj, đồng thời các đỉnh vi và vj sẽ được gọi là các đỉnh đầu của cạnh (vi, vj). Khi đó, bậc deg(v) của đỉnh v là số cạnh nối với nó. Đỉnh bậc 0 được gọi là đỉnh cô lập, còn đỉnh bậc 1 gọi là đỉnh treo.

 Đồ thị con và đồ thị riêng.

Đồ thị G’ = (V’, E’) được gọi là đồ thị con của đồ thị G nếu V’⊆ V và E’= E ∩ (V’ × V’).

Đồ thị G”= (V, E”) với E” ⊆ E, được gọi là đồ thị riêng của đồ thị G.

Mỗi tập con các đỉnh V’ của đồ thị tương ứng duy nhất với một đồ thị con, do vậy để xác định một đồ thị con ta chỉ cần nêu tập đỉnh của nó.

Còn đồ thị riêng là đồ thị giữ nguyên tập đỉnh và bỏ bớt đi một số cạnh.

 Cây bao trùm tối thiểu.

trên cây gọi là lá, và tất cả các cạnh được gọi là cành. Một cây được gọi là cây bao trùm của đồ thị G nếu cây đó chứa tất cả các đỉnh của đồ thị G. Hay nói cách khác, cây đó là một đồ thị riêng của đồ thị G.

Một cây được gọi là cây bao trùm tối thiểu của đồ thị G nếu chứa tất cả các đỉnh của G và trọng số mỗi cạnh kết nối với một đỉnh bất kì là cạnh có trọng số nhỏ nhất trong số các cạnh kết nối với đỉnh đó trong đồ thị G.

a) Đồ thị G b) Cây bao trùm tối thiểu của G

Hình 1.8 Minh họa cây bao trùm tối thiểu của một đồ thị.

 Phân vùng ảnh trên đồ thị.

Một phân vùng S của ảnh trên đồ thị là tập hợp các vùng mà mỗi vùng C ϵ S tương ứng với một thành phần liên thông G’ = (V’, E’), với V’⊆V, E’ ⊆ E trong đồ thị sao cho các cạnh nối giữa hai đỉnh trong một vùng có trọng số nhỏ và các cạnh nối giữa hai đỉnh trong hai vùng khác nhau có trọng số lớn.

b) Một số định nghĩa và tính chất liên quan.

 Tính chất so sánh vùng.

Trong phần này, chúng ta định nghĩa một tính chất D, để đánh giá có hoặc không có một ranh giới giữa hai vùng trong một phân vùng. Tính chất này được xác định nhờ việc so sánh sự khác nhau giữa hai vùng dọc theo ranh giới với sự khác nhau giữa các điểm ảnh trong mỗi vùng. Chúng ta định nghĩa sự khác biệt nội bộ

của một vùng C ⊆ V dựa vào trọng số cạnh lớn nhất trong cây bao trùm tối thiểu MST(C, E) của thành phần trong đồ thị tương ứng với vùng đó:

Int(C)=maxeMST(C,E)w(e)

Sự khác nhau giữa hai vùng C1, C2 ⊆ V được định nghĩa bằng trọng số cạnh nhỏ nhất kết nối hai vùng. Đó là,

Dif(C1,C2)=minviC1,vjC2,(vi,vj)EW(vi,vj)

Nếu không có cạnh nối C1, C2 thì chúng ta có Dif( C1, C2) = ∞. Như vậy, giữa hai vùng lân cận sẽ có một ranh giới nến sự khác biệt giữa hai vùng Dif( C1,C2) là lớn hơn sự khác biệt nội bộ ít nhất một trong hai vùng, Int(C1) và Int(C2).

Chúng ta định nghĩa sự khác biệt nội bộ tối thiểu của hai vùng lân cận C1,C2 như sau:

Mint(C1,C2)=min(Int(C1)+T(C1), Int(C2)+T(C2))

với T(C) = k / |C|. Trong đó k là một số không đổi, |C| là kích thước của vùng C. Lúc này, tính chất so sánh cặp vùng C1 và C2, ký hiệu là D(C1, C2) được định nghĩa như sau:

D(C1,C2)=

1, Nếu Dif C1, C2 > 𝑀𝑖𝑛𝑡 C1, C2 0, Trong trường hợp ngược lại

Trong thực tế, giá trị của k là không cố định, tùy thuộc vào người thực hiện phân vùng nhưng nói chung là không nhỏ hơn kích thước của vùng nhỏ nhất. Nếu k lớn thì kích thước các vùng kết quả sẽ lớn, còn k nhỏ thì kích thước vùng kết quả sẽ nhỏ. Hay nói cách khác, kích thước của vùng kết quả tỷ lệ thuận với giá trị của k.

 Một số định nghĩa.

Trong phần này sẽ giới thiệu một số định nghĩa là cơ sở nền tảng cho thuật toán thực hiện việc phân vùng theo tính chất so sánh vùng D được định nghĩa ở phần.

Định nghĩa 1.

Một phân vùng S được gọi là quá mịn nếu trong mỗi vùng kết quả C∈S bất kỳ ta lấy một số cặp vùng bất kỳ C1, C2∈ C mà không tìm thấy ranh giới giữa chúng. Định nghĩa 2.

Để bổ sung cho định nghĩa một phân vùng quá thô, chúng tôi sẽ giới thiệu khái niệm tinh chỉnh (refinement) của một phân vùng.

Cho S và T là hai phân vùng kết quả của cùng một ảnh, ta nói rằng T là một tinh chỉnh của S khi mỗi vùng trong phân vùng S chứa một số vùng trong phân vùng T. Ngoài ra, chúng ta nói T là một tinh chỉnh đúng (proper refinement) khi T

Phân vùng ảnh dựa trên phân tích kết cấu

Tổng quan về phân đoạn ảnh

Phân vùng theo miền đồng nhất