Phân vùng ảnh dựa trên phân tích kết cấu

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát (Trang 35 - 80)

Kết cấu thường được nhận biết trên bề mặt của các đối tượng như gỗ, cát, vải vóc…Kết cấu là thuật ngữ phản ánh sự lặp lại của các phần tử mẫu kết cấu cơ bản. Sự lặp lại này có thể ngẫu nhiên hay có tính chu kì hoặc gần chu kì. Một mẫu kết cấu chứa rất nhiều điểm ảnh. Trong phân tích ảnh, kết cấu được chia làm hai loại chính là: loại thống kê và loại cấu trúc.

a) Phƣơng pháp thống kế.

Tính kết cấu ngẫu nhiên rất phù hợp với các đặc trưng thống kê. Vì vậy, người ta có thể dùng các đặc trưng ngẫu nhiên để đo nó như: Hàm tự tương quan (AutoCorrelation Function- ACF), các biến đổi mật độ gờ, ma trận tương tranh,… Theo cách tiếp cận bằng hàm tự tương quan, độ thô của kết cấu sợi tỉ lệ với độ rộng của ACF, được biểu diễn bởi khoảng cách x0, y0 sao cho r(x0,0) = r(0,y0) = 1. Người ta cũng dùng cách đo nhánh của ACF nhờ hàm khởi sinh moment:

𝑀 𝑘, 𝑙 = 𝑛 − 𝜇1 𝑘 𝑚 − 𝜇2 𝑟 𝑛, 𝑚 𝑚

𝑛

𝑣𝑖 𝜇1 = 𝑛. 𝑟 𝑛, 𝑚 𝑣à 𝜇𝑛 2 = 𝑚. 𝑟 𝑛, 𝑚 𝑛

Các đặc trưng của kết cấu sợi như độ thô, độ mịn hay hướng có thể ước lượng nhờ các biến đổi ảnh bằng kỹ thuật lọc tuyến tính. Một mô hình đơn giản trong trường hợp ngẫu nhiên cho việc phân tích tính kết cấu được mô tả trong hình dưới đây:

Hình 1.6 Phân tích kết cấu bằng dải tƣơng quan

Trong mô hình này, trường kết cấu sợi trước tiên được giải chập bởi bộ lọc lấy từ đầu ra của ACF. Như vậy, nếu r(m,n) là ACF thì u(n, m)  a(n, m) = ε(n, m) là trường ngẫu nhiên không tương quan.

Lưu ý rằng, bộ lọc là không duy nhất, có thể là nhân quả, bán nhân quả hay không nhân quả. Các ACF hay dùng như M(0, 2), M(2, 0), M(1, 1), M(2, 2).

phân tán 𝜇2 cũng hay được sử dụng. Ngoài các đặc trưng trên, có thể đưa thêm một số khái niệm và định nghĩa các đại lượng dựa trên đó như: lược đồ mức xám (Histogram Grey Level Difference), ma trận xuất hiện mức xám.

Lược đồ hiệu mức xám.

Lược đồ hiệu mức xám dùng để mô tả các thông tin mang tính không gian và được định nghĩa như sau. Cho d = (d1, d2) là vecto dịch chuyển giữa 2 điểm ảnh và g(d) là hiệu mức xám với khoảng cách d: g(d) = |f(k,l) – f(k+d1, l+d2)| với hàm f(k, l) cho giá trị mức xám tại tọa độ (k, l). Gọi hg(g, d) là lược đồ của hiệu mức xám khoảng cách d. Với mỗi khoảng cách d ta có một lược đồ mức xám riêng. Với một miền ảnh có kết cấu thô, lược đồ hg(g, d) có khuynh hướng tập trung xung quanh g=0 với khoảng cách d nhỏ. Trái lại, với một miền ảnh có kết cấu mịn, hg(g, d) sẽ phân nhánh dù với vecto dịch chuyển d khá nhỏ. Dựa trên lược đồ này, người ta định nghĩa lại một số đại lượng :

- Trung bình : 𝜇𝑑 = 𝑁 𝑔𝑘ℎ𝑘 𝑘=1 (𝑔𝑘, 𝑑) - Phương sai : 𝜎𝑑2 = 𝑁 𝑔𝑘 − 𝜇𝑑 2 𝑘=1 ℎ𝑔(𝑔𝑘, 𝑑) - Độ tương phản : 𝑐𝑑 𝑁 𝑔𝑘2 𝑘=1 ℎ𝑔(𝑔𝑘, 𝑑)

Phương sai đo độ tản mát của hiệu mức xám tại một khoảng cách d nào đấy. Kết cấu tất định thường có phương sai d σ tương đối nhỏ. Độ tương phản cd chính là mômen của lược đồ hg(g, d) xung quanh g = 0 và đo độ tương phản của hiệu mức xám. Người ta sử dụng entropy để đo độ đồng nhất cảu lược đồ hg:

𝐻𝑔 = − ℎ𝑔(𝑔𝑘, 𝑑)ln⁡(ℎ𝑔 𝑁

𝑘=1

(𝑔𝑘, 𝑑))

Ưu điểm cơ bản của lược đồ hiệu mức xám là tính toán đơn giản. Ngoài ra còn có khả năng cho ta tổ chức kết cấu không gian.

Ma trận xuất hiện liên hiệp mức xám.

k,l tương ứng cách nhau một khoảng d. Xác suất này dễ dàng tính được nhờ việc tính số lần xuất hiện nk,l của cặp điểm ảnh (fk, f1) có mức xám k và l với khoảng cách d. Gọi n là tổng số cặp liên hiệp có thể với khoảng cách d trong ảnh. Các phần tử ck,l

của ma trận xuất hiện liên hiệp mức xám cd được tính như sau : cd = (ck,l )

ck,l=P(k,l,d)=nk,l/n. Ma trận xuất hiện liên hiệp mức xám Cd là ma trận vuông N x N phần tử (N là số mức xám của ảnh). Ma trận này chứa các thông tin hữu ích về tổ chức kết cấu không gian. Nếu kết cấu tương đối thô thì các phần tử của ma trận tập trung xung quanh đường chéo chính. Ngược lại, nếu kết cấu bề mặt mịn, giá trị các phần tử của cd sẽ phân rải tương đối rõ. Dựa trên khái niệm này người ta định nghĩa về một số độ đo:

- Xác suất cực đại: pd=max(k,l)Ck,l

- Entropy: 𝐻𝑑 = − 𝑁 𝐶𝑘,𝑙𝑙𝑛⁡(𝐶𝑘,𝑙 𝑙=1

𝑁

𝑘=1 )

Dễ dàng thấy được entropy cực đại khi xác suất liên hiệp P(k,l,d) có phân phối đều. Mô men bậc m : 𝐼𝑑 = 𝑁 |𝑘 − 𝑙|𝑚𝐶𝑘,𝑙

𝑙=1 𝑁

𝑘=1 .

Id cực tiểu khi các phân tử của ma trận C tập trung trên đường chéo chính vì khoảng cách |k-l|m rất nhỏ, Id nhỏ có nghĩa là kết cấu khá thô. Người ta cũng còn đưa vào một số độ đo khác như hàm tự tương quan, phổ năng lượng. Để áp dụng cách tiếp cận này, cần cài đặt các giải thuật tính các đại lượng đo trên. (adsbygoogle = window.adsbygoogle || []).push({});

b) Phƣơng pháp cấu trúc.

Kết cấu sợi có cấu trúc thuần nhất là những mấu kết cấu xác định, mà sự xuất hiện lặp đi lặp lại tuân theo một luật tất định hay ngẫu nhiên nào đấy. Một mẫu kết cấu về thực tế là một nhóm các điểm ảnh có cùng một số tính chất bất biến lặp trên ảnh. Một mẫu kết cấu cũng có định nghĩa theo mức xám, theo bề mặt hay tính đồng nhất đối với một số các tính chất như kích thước, hướng, lược đồ bậc hai (ma trận tương tranh). Với các mẫu kết cấu được phân bố ngẫu nhiên, tính kết cấu sợi tương ứng của nó được coi là yếu (Weak) ngược với qui luật phân bố tất định gọi là mạnh (Strong). Khi tính kết cấu sợi là yếu, luật phân bố có thể đo bởi:

- Các loạt dài của các mẫu kết cấu liên thông tối đa

- Mật độ cực trị tương đối; số pixel trên một đơn vị diện tích có mức xám cực trị địa phương so với các lân cận.

Ngoài hai cách tiếp cận trên, người ta còn dùng cách tiếp cận khác bằng cách lấy tổ hợp 2 cách trên và gọi là kỹ thuật mosaic. Mô hình này biểu diễn các quá trình học ngẫu nhiên, thí dụ như khảm ngẫu nhiên hay đều của một mặt phẳng vào các đường cong lồi sẽ làm nổi lên tính kết cấu tế bào.

c) Tiếp cận theo tính kết cấu.

Khi đối tượng xuất hiện trên một nền có tính kết cấu cao, việc phân đoạn dựa vào tính kết cấu trở nên quan trọng. Nguyên nhân là kết cấu sợi thường chứa mật độ cao các gờ (edge) làm cho phân đoạn theo biên kém hiệu quả, trừ phi ta loại tính kết cấu. Việc phân đoạn dựa vào miền đồng nhất cũng có thể áp dụng cho các đặc trưng kết cấu và có thể dùng để phân đoạn các miền có tính kết cấu.

Nhìn chung, việc phân loại và phân vùng dựa vào kết cấu là một vấn đề phức tạp.

Ở đây, tài liệu chỉ mang tính chất giới thiệu. Có thể giải quyết vấn đề này trong thực tế nếu ta biết trước các loại kết cấu (dựa vào quy luật hay các phân bố của nó).

1.2.2.4 Phân vùng ảnh dựa trên sự phân lớp điểm ảnh.

a) Mô hình bài toán:

Cho ảnh X ={pi} , i∈ [1,N.M] , với N là chiều rộng của ảnh và M là chiều cao của ảnh, pi là điểm ảnh thứ i và A(pi) là thuộc tính của pi . Đối tượng phân lớp ở đây là các pi.

Phân vùng ảnh X chính là phân lớp tập X thành các lớp Ci sao cho từ Ci phát triển thành các vùng Ri. Chỉ tiêu phân lớp ở đây chính là độ đồng đều (tương tự) về thuộc tính của các điểm ảnh.

Quá trình phân lớp có thể sử dụng các phương pháp học máy và quyết định phân lớp.

b) Phân lớp điểm ảnh trong không gian thuộc tính một chiều.

Trong phần này sẽ giới thiệu một thuật toán vùng dựa trên sự phân lớp các điểm ảnh trên nguyên tắc phân tích tự tổ chức theo nguyên tắc lặp (ISODATA – Interactive Seft Organization DATa Analysis).

Thuật toán ISODATA trong phân vùng ảnh:

Đầu vào: X={pi},i[1,N.M], A(pi) là gia trị mức xám của pi.

Đầu ra : Số vùng ảnh

Phương pháp:

1. Khởi tạo: (t=0)

 ƒ Đoán nhận số vùng K (số lớp) trên cơ sở lượt đồ phân bố mức xám (histogram). Trong đó lmin là giá trị mức xám thấp nhất và lmax là mức xám giá trị cao nhất của ảnh X.

 ƒ Chọn các giá trị ngưỡng ban đầu của các lớp theo nguyên tắc sau:

T0=lmin, TK=lmax và Ti(t)= 𝑖.𝑙𝑚𝑎𝑥−𝑙𝑚𝑖𝑛

𝐾 + 𝑇0 , với i=1…K-1

2. Bước lặp

 ƒ Thực hiện phân lớp điểm theo các ngưỡng Ti(t-1)

PiCk nếu Ti(t-1) ≤ A(pi)≤Ti+1(t-l),k[l,K]

 ƒ Tính giá trị trung bình của mỗi lớp tại thời điểm t

𝑚𝑘 𝑡 = 1 (adsbygoogle = window.adsbygoogle || []).push({});

𝐶𝑎𝑟𝑑 𝐶𝑘 𝐴(𝑝𝑖) 𝑃𝑖∈𝐶𝑘

𝑇𝑖 𝑡 = 𝑚𝑖(𝑡) − 𝑚𝑖+1(𝑡) 2

 ƒ Kiểm tra điều kiện lặp

- Nếu Ti(t)Ti(t-1) thì dừng hoặc mi(t)mi(t-1) thì dừng

3. Phân lớp các lớp Ck theo các Ti , i=1..K-1 đã ổn định. Hình thành các vùng Rk từ các lớp Ck. Gán nhãn các vùng theo giá trị trung bình của lớp và hiển thị ảnh các vùng đã phân bố.

1.2.2.5 Phân vùng dựa vào lý thuyết đồ thị.

Trong thời gian gần đây, các nhà nghiên cứu đã đưa ra một số phương pháp phân vùng dựa trên những hướng tiếp cận mới, trong đó có hướng tiếp cận phân vùng dựa trên đồ thị. Đối với phương pháp này, hình ảnh sẽ được mô tả như một đồ thị với các đỉnh của đồ thị là các điểm ảnh và các cạnh trên đồ thị nối các điểm ảnh lân cận với nhau.

Từ trước đến nay, các phương pháp phân vùng dựa trên đồ thị chỉ dừng lại ở việc lựa chọn các cạnh từ một đồ thị để thực hiện việc phân vùng ảnh. Trong phần này, chúng tôi sẽ giới thiệu phương pháp phân vùng ảnh dựa trên lý thuyết đồ thị. Khác với các phương pháp phân vùng dựa trên đồ thị khác, phương pháp phân vùng dựa trên lý thuyết đồ thị thực hiện việc phân vùng dựa trên mức độ biến thiên giữa các vùng lân cận trong ảnh. Cụ thể, phương pháp này so sánh sự khác nhau trong nội tại của một vùng so với sự khác nhau của vùng đó so với các vùng khác.

a) Biểu diễn ảnh nhƣ là một đồ thị.

Kỹ thuật phân vùng ảnh dựa trên lý thuyết đồ thị biểu diễn ảnh như là một đồ thị G = (V, E). Trong đó, V là tập hợp các đỉnh và E là tập hợp các cạnh của đồ thị. Mỗi đỉnh vi ∈ V tương ứng với các điểm ảnh và các cạnh (vi , vj) ∈ E tương ứng là cạnh kết nối các cặp điểm ảnh lân cận. Mỗi cạnh (vi , vj) ∈ E có một trọng số tương ứng là sự khác nhau về màu sắc, cường độ giữa hai điểm ảnh lân cận vi, vj và được ký hiệu là w(vi,vj).

V : Tập đỉnh

E : Tập các cạch kết nối

Ảnh = {Điểm ảnh} Điểm ảnh tương tự

Hình 1.7 Biểu diễn ảnh dƣới dạng một đồ thị

Đỉnh liền kề.

Hai đỉnh vi và vj của đồ thị G được gọi là kề nhau nếu (vi,vj) là cạnh của đồ thị G. Nếu e = (vi, vj) là cạnh của đồ thị ta nói cạnh này nối đỉnh vi và đỉnh vj, đồng thời các đỉnh vi và vj sẽ được gọi là các đỉnh đầu của cạnh (vi, vj). Khi đó, bậc deg(v) của đỉnh v là số cạnh nối với nó. Đỉnh bậc 0 được gọi là đỉnh cô lập, còn đỉnh bậc 1 gọi là đỉnh treo.

Đồ thị con và đồ thị riêng.

Đồ thị G’ = (V’, E’) được gọi là đồ thị con của đồ thị G nếu V’⊆ V và E’= E ∩ (V’ × V’).

Đồ thị G”= (V, E”) với E” ⊆ E, được gọi là đồ thị riêng của đồ thị G.

Mỗi tập con các đỉnh V’ của đồ thị tương ứng duy nhất với một đồ thị con, do vậy để xác định một đồ thị con ta chỉ cần nêu tập đỉnh của nó.

Còn đồ thị riêng là đồ thị giữ nguyên tập đỉnh và bỏ bớt đi một số cạnh.

Cây bao trùm tối thiểu.

trên cây gọi là lá, và tất cả các cạnh được gọi là cành. Một cây được gọi là cây bao trùm của đồ thị G nếu cây đó chứa tất cả các đỉnh của đồ thị G. Hay nói cách khác, cây đó là một đồ thị riêng của đồ thị G.

Một cây được gọi là cây bao trùm tối thiểu của đồ thị G nếu chứa tất cả các đỉnh của G và trọng số mỗi cạnh kết nối với một đỉnh bất kì là cạnh có trọng số nhỏ nhất trong số các cạnh kết nối với đỉnh đó trong đồ thị G.

a) Đồ thị G b) Cây bao trùm tối thiểu của G

Hình 1.8 Minh họa cây bao trùm tối thiểu của một đồ thị.

Phân vùng ảnh trên đồ thị.

Một phân vùng S của ảnh trên đồ thị là tập hợp các vùng mà mỗi vùng C ϵ S tương ứng với một thành phần liên thông G’ = (V’, E’), với V’⊆V, E’ ⊆ E trong đồ thị sao cho các cạnh nối giữa hai đỉnh trong một vùng có trọng số nhỏ và các cạnh nối giữa hai đỉnh trong hai vùng khác nhau có trọng số lớn.

b) Một số định nghĩa và tính chất liên quan.

Tính chất so sánh vùng. (adsbygoogle = window.adsbygoogle || []).push({});

Trong phần này, chúng ta định nghĩa một tính chất D, để đánh giá có hoặc không có một ranh giới giữa hai vùng trong một phân vùng. Tính chất này được xác định nhờ việc so sánh sự khác nhau giữa hai vùng dọc theo ranh giới với sự khác nhau giữa các điểm ảnh trong mỗi vùng. Chúng ta định nghĩa sự khác biệt nội bộ

của một vùng C ⊆ V dựa vào trọng số cạnh lớn nhất trong cây bao trùm tối thiểu MST(C, E) của thành phần trong đồ thị tương ứng với vùng đó:

Int(C)=maxeMST(C,E)w(e)

Sự khác nhau giữa hai vùng C1, C2 ⊆ V được định nghĩa bằng trọng số cạnh nhỏ nhất kết nối hai vùng. Đó là,

Dif(C1,C2)=minviC1,vjC2,(vi,vj)EW(vi,vj)

Nếu không có cạnh nối C1, C2 thì chúng ta có Dif( C1, C2) = ∞. Như vậy, giữa hai vùng lân cận sẽ có một ranh giới nến sự khác biệt giữa hai vùng Dif( C1,C2) là lớn hơn sự khác biệt nội bộ ít nhất một trong hai vùng, Int(C1) và Int(C2).

Chúng ta định nghĩa sự khác biệt nội bộ tối thiểu của hai vùng lân cận C1,C2 như sau:

Mint(C1,C2)=min(Int(C1)+T(C1), Int(C2)+T(C2))

với T(C) = k / |C|. Trong đó k là một số không đổi, |C| là kích thước của vùng C. Lúc này, tính chất so sánh cặp vùng C1 và C2, ký hiệu là D(C1, C2) được định nghĩa như sau:

D(C1,C2)=

1, Nếu Dif C1, C2 > 𝑀𝑖𝑛𝑡 C1, C2 0, Trong trường hợp ngược lại

Trong thực tế, giá trị của k là không cố định, tùy thuộc vào người thực hiện phân vùng nhưng nói chung là không nhỏ hơn kích thước của vùng nhỏ nhất. Nếu k lớn thì kích thước các vùng kết quả sẽ lớn, còn k nhỏ thì kích thước vùng kết quả sẽ nhỏ. Hay nói cách khác, kích thước của vùng kết quả tỷ lệ thuận với giá trị của k.

Một số định nghĩa.

Trong phần này sẽ giới thiệu một số định nghĩa là cơ sở nền tảng cho thuật toán thực hiện việc phân vùng theo tính chất so sánh vùng D được định nghĩa ở phần.

ƒ Định nghĩa 1.

Một phân vùng S được gọi là quá mịn nếu trong mỗi vùng kết quả C∈S bất kỳ ta lấy một số cặp vùng bất kỳ C1, C2∈ C mà không tìm thấy ranh giới giữa chúng. ƒ Định nghĩa 2.

Để bổ sung cho định nghĩa một phân vùng quá thô, chúng tôi sẽ giới thiệu khái niệm tinh chỉnh (refinement) của một phân vùng.

Cho S và T là hai phân vùng kết quả của cùng một ảnh, ta nói rằng T là một tinh chỉnh của S khi mỗi vùng trong phân vùng S chứa một số vùng trong phân vùng T. Ngoài ra, chúng ta nói T là một tinh chỉnh đúng (proper refinement) khi T

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát (Trang 35 - 80)