Phƣơng pháp biểu diễn kết cấu dựa vào mô hình phụ thuộc nhiều vào việc xây dựng một mô hình cho ảnh để đặc tả kết cấu. Các tham số của mô hình phải thể hiện đƣợc đặc tính của kết cấu thể hiện. Phƣơng pháp biểu diễn dựa vào mô hình này đƣợc sử dụng nhiều trong các ứng dụng về tổng hợp kết cấu. Các mô hình dựa trên việc phân tích các điểm, xem ảnh nhƣ một tập các điểm ảnh. Mô hình mặt (Facet) là một ví dụ của mô hình dựa trên việc phân tích các điểm. Mô hình này không quan tâm đến sự tƣơng tác không gian của các điểm ảnh lân cận. Hàm cƣờng độ sáng mà chúng sử dụng đƣợc coi nhƣ một hàm của một đa thức xác định nào đó và các nhiễu không mong muốn. Các mô hình dựa trên việc phân tích các miền xem ảnh nhƣ một tập các mẫu (Patterns) con đƣợc sắp đặt theo một quy tắc đã cho nào đó. Mô hình dựa vào phân tích miền ảnh miền ảnh là một ví dụ của các mô hình khảm (Mosaic) ngẫu nhiên, thƣờng dùng cho các ứng dụng tổng hợp kết cấu. Mô hình này chia ảnh thành các miền và gán các mức xám tới các miền dựa theo một hàm mật độ xác suất nào đó đƣợc định nghĩa trƣớc.
Trong phƣơng pháp biểu diễn dựa vào mô hình, mô hình trƣờng ngẫu nhiên (Random Field Model) và các biến thể của nó hay là các mô hình xem ảnh nhƣ một hàm mẫu của một mảng các biến ngẫu nhiên, là một trong những kỹ thuật đƣợc sử dụng nhiều nhất để mô hình hóa kết cấu. Ngoài ra một số mô hình
dựa vào Fractal cũng đƣợc áp dụng trong các ứng dụng phân tích kết cấu. Mô hình trƣờng ngẫu nhiên phân tích sự biến đổi không gian theo hai chiều của ảnh.
Trƣờng ngẫu nhiên Markov (MRFs) là một mô hình trƣờng ngẫu nhiên cục bộ đƣợc sử dụng phổ biễn để mô hình ảnh hay kết cấu vì chúng có khả năng lấy thông tin theo ngữ cảnh không gian cục bộ trong một ảnh. Trong khi đó trƣờng ngẫu nhiên Gibbs là một mô hình trƣờng ngẫu nhiên toàn bộ, với toàn bộ ảnh đựoc xem nhƣ một trƣờng ngẫu nhiên và hàm mật độ xác suất đƣợc gán cho toàn bộ ảnh của đối tƣợng.
Hình 2.3: (a) Kết cấu gốc, (b) Tổng hợp kết cấu với mô hình MRF, (c) Tổng hợp kết cấu với MRF đa độ phân giải
Một số biểu diễn kết cấu dựa vào mô hình phổ biến đƣợc công bố: Trƣờng ngẫu nhiên Markov
Mô hình trƣờng ngẫu nhiên Markov là một phƣơng pháp biểu diễn kết cấu hay đƣợc sử dụng nhất của phƣơng pháp biểu diễn kết cấu dựa vào mô hình. Nó đƣợc sử dụng nhiều trong các ứng dụng tạo và tổng hợp kết cấu. Mức xám tại mỗi điểm của ảnh phụ thuộc nhiều vào mức xám của các điểm ảnh lân cận trừ khi ảnh là các nhiễu ngẫu nhiên. MRF là một mô hình biểu diễn chính xác sự phụ thuộc này. Mô hình này giả sử rằng độ sáng của mỗi điểm ảnh phụ thuộc vào độ sáng của các lân cận duy nhất.
Giả sử Np(i,j) là lân cân của điểm (i,j), với p=5 thì lân cận này có thể biểu diễn nhƣ hình 2.4.
Hình 2.4: Lân cận bậc 5 cho MRF
Nếu chúng ta giả sử khoảng cách giữa các đỉnh của đồ thị liền kề là một đơn vị, khi đó MRF bậc một tƣơng ứng với hình dạng bao bốn lân cận gần nhất có nhãn là 1 nhƣ trong hình vẽ. MRF bậc hai tƣơng ứng với các điểm lân cận có bán kính là hai bao gồm cả các điểm đƣợc gán nhãn là 2 nhƣ trên hình vẽ. Các MRF bậc cao hơn đƣợc định nghĩa một cách tƣơng tự.
Nếu Y(i,j) là mức xám của một điểm trên lƣới L có kích thƣớc N*N. Để đơn giản ta đánh nhãn của Y(i,j) là Y(i) với i = 1,2,...,N*N. Một số định nghĩa bổ sung để thể hiện cách biểu diễn kết cấu theo mô hình MRF.
Định nghĩa 1: Cho L là một lƣới N*N, màu của L (màu của L với G mức xám) đƣợc biểu diễn bởi Y là một hàm từ một điểm của L tới tập <0,1...,G-1>. Ký hiệu 0 biểu thị hàm này gán mỗi điểm của lƣới L các giá trị bằng không.
Định nghĩa 2: Điểm ảnh j gọi là láng giềng của điểm ảnh i nếu xác suất có điều kiện P(Y(i)|Y(2),Y(2),Y(i-1),..,Y(N*N)) phụ thuộc vào Y(j). Định nghĩa này không có nghĩa là lân cận của một điểm thì gần về khoảng cách nào đó, tuy nhiên đây là những trƣờng hợp dễ nhận thấy.
Định nghĩa 3: Một MRF là mật độ xác suất chung trên tập tất cả các màu có thể của Y của lƣới L, tùy thuộc vào những điều kiện dƣới đây:
2. Tính Markov: P(Y(i) | tất cả các điểm trên lƣới trừ i) = P(Y(i) | các lân cận của i).
3. Tính thuần nhất: P(Y(i) | các lân cận của i) phụ thuộc chỉ vào hình dạng của các láng giềng và không thay đổi với việc dịch chuyển. Mô hình của ảnh đƣợc cho bởi công thức:
Ở đây Nr là lân cận đƣợc xác định của điểm ảnh r, (r) là nhiễu Gaussian với trung bình bằng không và hàm tự tƣơng quan đƣợc cho bởi:
khác N v r v r r p 0 / ) ( 2 2
Với là vector tham số của mô hình ƣớc lƣợng đƣợc sử dụng làm độ đo kết cấu. Tuy nhiên việc ƣớc lƣợng các tham số này sẽ mất một lƣợng chi phí tính toán. Thay vì nhƣ vậy những thống kê hiệu quả định nghĩa trƣớc một tập các tham số sẽ đƣợc ƣớc lƣợng. Những thống kê hiệu quả là những giá trị có thể đặc tả mô hình đã biết một cách đầy đủ. Những thống kê hiệu quả có thể đƣợc tính toán bằng cách sử dụng các cliques [23]. Đây là một đồ thị mà các đỉnh của nó là tập hợp các đỉnh mà mỗi đỉnh là lân cận của các đỉnh khác.
Các đặc trƣng Wold
Một cách tiếp cận dựa vào mô hình để biểu diễn kết cấu là sử dụng phân tích Wold. Phân tích Wold có 3 thành phần độ hài hoà, độ phai mờ và độ bất định tƣơng ứng với các đặc điểm tính chu kỳ, tính định hướng và tính ngẫu nhiên
của kết cấu bề mặt.
Các kết cấu có tính chu kỳ có thành phần độ hài hoà cao, các kết cấu có tính định hƣớng cao có thành phần độ phai mờ lớn còn các kết cấu có tính cấu trúc ít hơn thì thành phần độ bất định lớn hơn. Đối với trƣờng ngẫu nhiên đồng
đều thuần nhất {y(m,n), (m,n)Z2} thì phép phân tích Wold 2D sẽ cho 3 thành phần trực giao từng đôi một:
y(m,n) = u(m,n) + d(m,n) = u(m,n) + h(m,n) + e(m,n)
Trong đó u(m,n) là thành phần bất định còn d(m,n) là thành phần tất định. Thành phần tất định lại đƣợc phân tích thành các thành phần độ hài hoà h(m,n) và độ phai mờ e(m,n). Trong miền tần số ta cũng xây dựng đƣợc các công thức tƣơng ứng đƣợc tính nhƣ sau: ) , ( ) , ( ) , ( ) , ( ) , ( ) , ( u d u h e y F F F F F F Trong đó Fy(,),Fu(,),Fd(,),Fh(,),Fe(,) tƣơng ứng là các hàm phân bố phổ (SDF) của {y(m,n)}, {u(m,n)}, {d(m,n)}, {h(m,n)} và {e(m,n)}
Trong miền không gian, 3 thành phần trực giao có thể tính toán đƣợc bằng phép ƣớc lƣợng khả năng tối đa (MLE) liên quan đến việc điều chỉnh qui trình tự thoái lui (AR) bậc cao, tối thiểu hàm định giá và giải hệ các phƣơng trình tuyến tính. Trong miền tần số, có thể tính toán đƣợc các thành phần Wold bằng cách đặt ngƣỡng tổng thể cho các biên độ phổ Fourier của ảnh.
Simultaneous Auto-Regressive Model:
Mô hình SAR là một biến thể của trƣờng ngẫu nhiên Markov, đƣợc sử dụng rất hiệu quả để mô hình hoá kết cấu ảnh trong những năm gần đây. So với những mô hình MRF khác, SAR sử dụng ít tham số hơn. Trong mô hình SAR, độ chói của các điểm ảnh đƣợc coi nhƣ các biến ngẫu nhiên. Độ chói g(x,y) của điểm ảnh (x,y) đƣợc coi nhƣ là một tổ hợp tuyến tính của đội chói của điểm ảnh liền kề g(x’,y’) và mẫu nhiễu dƣơng (x,y) tức là:
D y x y x y x g y x y x g ) ' ,' ( ) , ( ) ' , ' ( ) ' , ' ( ) , (
trong đó là giá trị sai lệch xác định bởi giá trị trung bình trên toàn ảnh;
D là tập các điểm ảnh lân cận của (x,y); (x’,y’) là tập các trọng số của các điểm ảnh lân cận; (x,y) là biến ngẫu nhiên Gauss độc lập với trung bình và biến thiên 2
Các tham số và đƣợc sử dụng để đo kết cấu. Ví dụ, giá trị cao hơn thể hiện kết cấu mịn hơn, đỡ thô hơn; các giá trị (x,y+1) và (x,y-1) lớn hơn cho biết ảnh có tính định hƣớng theo chiều dọc. Kỹ thuật sai số bình phƣơng tối thiểu (LSE) hoặc phƣơng pháp ƣớc lƣợng khả năng tối đa (MLE) thƣờng đƣợc sử dụng để ƣớc lƣợng các tham số của mô hình SAR.