Ngưỡng động và ngưỡng toàn cục tối ưu

Một phần của tài liệu Tìm hiểu phương pháp phân đoạn ảnh màu và ứng dụng (Trang 32 - 35)

1.3.3. Phân đoạn dựa vào ngưỡng biên độ

1.3.3.5 Ngưỡng động và ngưỡng toàn cục tối ưu

Trong phần này chúng ta sẽ trình bày phương pháp để tính được những ngưỡng mà tạo ra lỗi phân đoạn trung bình (error segmentation average) nhỏ nhất. Như vậy, phương pháp sẽ được áp dụng cho 1 vấn đề mà đòi hỏi lời giải của nhiều vấn đề quan trọng phát sinh trong các ứng dụng thực tế của tạo ngưỡng.

Ta giả sử rằng 1 bức ảnh chỉ bao gồm 2 vùng mức xám chính. Kí hiệu các giá trị mức xám là z. Chúng ta có thể xem các giá trị này như các con số ngẫu nhiên, và histogram của chúng có thể coi như 1 xấp xỉ của hàm mật độ xác suất (probability density function – PDF) p(z) của chúng. Hàm mật độ tổng thể này là tổng hoặc là hợp của 2 hàm mật độ khác: một cái của những vùng sáng và một cái của những vùng tối trong bức ảnh. Hơn nữa các hệ số hợp (mixture parameters) có sự tương ứng với các phần giao của các vùng sáng và tối. Nếu hình dạng của hàm mật độ được biết hoặc được giả thuyết là có 1 hình dạng quen thuộc nào đó thì chúng ta có khả năng xác định 1 ngưỡng tối ưu cho việc phân đoạn 1 bức ảnh thành 2 vùng rời nhau.

Hình 1.24 biểu diễn 2 hàm mật độ xác suất. Giả sử rằng PDF lớn hơn tương ứng với mức xám của nền và PDF nhỏ hơn miêu tả cho mức xám của vật thể trong bức ảnh. Hàm mật độ hỗn hợp miêu tả cho sự dao động của mức xám trên toàn bức ảnh là : p(z)=P ( )1 1p z + P p z2 2( ) (1-11)

Với P1 và P2 được xác định như sau : P1 là xác suất 1 pixel ngẫu nhiên là pixel của vật thể, còn P2 là xác suất mà 1 pixel ngẫu nhiên là pixel của nền. Chúng ta đang xét trường hợp ảnh chỉ có vật thể và nền nên 1 pixel bất kỳ thì hoặc thuộc nền hoặc thuộc vật thể, do đó :

P P1+ 2 = 1 1-12)

Bức ảnh của chúng ta được phân đoạn bằng cách xem tất cả các pixel với mức xám lớn hơn ngưỡng T là nền, còn lại là vật thể. Do đó nhiệm vụ chính của chúng ta là làm sao xác định giá trị T sao cho sai số trung bình nảy sinh trong quá trình quyết định 1 pixel là nền hay vật thể là bé nhất.

Xác suất 1 biến ngẫu nhiên có giá trị nằm trong khoảng [a,b] là tích phân của hàm mật độ từ a tới biên, tức là diện tích của đường cong PDF giữa 2 đầu mút. Vì vậy xác suất phân loại sai lầm 1 pixel nền thành 1 pixel vật thể là :

1( ) 2( )

T

E T p z dz

−∞

= ∫ (1-13)

Đây là diện tích của vùng nằm dưới đường cong p2 và nằm bên trái ngưỡng T.

Hình 1.24 Biểu diễn 2 hàm mật độ xác suất

Tương tự, ta cũng có xác suất phân loại sai lầm 1 pixel vật thể thành 1 pixel nền:

2( ) 1( )

T

E T p z dz

= +∞∫ (1-14)

Tức là diện tích của vùng nằm bên dưới đường cong p1và nằm bên phải ngưỡng T. Như vậy xác suất sai lầm toàn cục là :

E T ( ) = P E T2 1( ) + PE T1 2( ) (1-15)

Chú ý rằng các con số E1 và E2 được nhân thêm 1 lượng P1 và P2 theo thứ tự ngược lại ( E1 nhân với P2 và ngược lại). Điều này cũng dễ hiểu : xét 1 pixel A bất kỳ. Xác suất để phân loại sai A gồm có sai lầm loại 1: A là pixel nền nhưng lại phân loại A là vật thể và sai lầm loại 2 là ngược lại. Để có sai lầm loại 1 thì A phải là pixel nền (xác suất của điều này là P2) và phải phân loại A là vật thể (xác suất này là E1), tức là xác suất sai lầm loại 1 xảy ra với pixel bất kỳ A là P2E1. Tương tự, xác suất sai lầm loại 2 xảy ra với pixel bất kỳ A là P1E2. Và ta có công thức 1-15.

Nếu các pixel nền và vật thể có xác suất suất hiện giống nhau thì P1 = P2 = 0.5.

Để tìm ra 1 ngưỡng mà E nhỏ nhất cần đạo hàm E theo T và cho đạo hàm này bằng 0 ( dùng phương pháp tìm cực trị) thì thu được:

P1p1(T) = P2p2(T) (1-16)

Giải phương trình biến T này để tìm ra ngưỡng tối ưu. Chú ý là nếu P1 = P2 thì ngưỡng tối ưu là vị trí mà tại đó 2 đường cong p1(z) và p2(z) giao nhau (Hình 1.24).

Để có 1 biểu thức giải tích cho giá trị T đòi hỏi chúng ta phải biết phương trình của 2 PDF. Tuy nhiên việc ước lượng những hàm mật độ này không phải luôn làm được trong thực tế, do đó 1 phương pháp thường được dùng là sử dụng các hàm mật độ có các hệ số dễ tính toán đã biết. Một trong các hàm mật độ chính được sử dụng trong phương pháp này là hàm mật độ Gauss, hàm mật độ mà được mô tả hoàn toàn thông qua 2 hệ số: giá trị trung bình và phương sai. Cụ thể là ta coi p1 và p2 đều là hàm phõn phối chuẩn. Khi đú ta đặt à1và σ12là giỏ trị trung bỡnh và phương sai của phân phối Gauss của 1 lớp pixels (trong trường hợp này ta lấy là lớp các pixel vật thể, tức là ứng với p1), cũn à1 và σ12là giỏ trị trung bỡnh và phương sai của phõn bố Gauss của 1 lớp pixels còn lại (ứng với p2). Khi đó công thức 1-11 viết lại là:

2 2

1 2

2 2

1 2

( ) ( )

2 2

1 2

1 2

P P

p(z)=

2 2

z z

e e

à à

σ σ

πσ πσ

− −

− −

+ (1-17)

Kết hợp 1-16 và 1-17 ta có thu được:

AT2 + BT + C = 0

Với: A = σ12 − σ22

B = 2( à σ1 22 − à σ2 12) (1-18) C = à σ22 12 − à σ12 22 + 2 σ σ12 22ln( σ2 1p / σ1 2p )

Bởi vì một phương trình bậc 2 có thể có 2 nghiệm nên 2 nghiệm này đều có thể là ngưỡng tối ưu.

Nếu 2 phương sai là bằng nhau: σ2 =σ12 =σ22 thì phương trình chỉ có 1 nghiệm:

2

1 2 2

1 2 1

T = + ln( P )

2 P

à à σ

à à +

(1-19)

Nếu p1 = p2hoặc σ =0 thì ngưỡng thích hợp là giá trị trung bình của 2 phương sai. Đối với các phân bố khác (như ta đã biết dạng của hàm mật độ, như phân bố Raleigh và log-normal), cũng có thể xác định ngưỡng tối ưu 1 cách tương tự.

Thay thế cho việc giả định dạng hàm số của p(z), chúng ta có thể dùng phương pháp sai số bình phương trung bình nhỏ nhất (minimum mean-square-error approach) để ước lượng PDF mức xám hỗn hợp của 1 bức ảnh từ histogram của bức ảnh đó. Ví dụ sai số trung bình bình phương giữa hàm mật độ hỗn hợp p(z) (có dạng liên tục) và histogram h(zi) (có dạng rời rạc) là:

n 2

ms

i=1

e = 1 [ ( ) ( )]

n ∑ p zih zi (1-20)

Với n là số lượng các mức xám suất hiện trên bức ảnh. Nguyên nhân chính cần phải ước lượng hàm mật độ một cách đầy đủ là để xác định xem có tồn tại các dạng chiếm ưu thế (dominant modes) trong PDF hay không.

Nói chung việc xác định 1 cách giải tích những hệ số mà làm cho sai số trung bình bình phương này trở nên bé nhất không phải là 1 vần đề dễ. Ngay cả đối với phân bố Gauss, thì các tính toán không quá phức tạp trong việc lập nên các phương trình đạo hàm riêng bằng 0 cũng dẫn tới việc giải 1 hệ các phương trình siêu việt;

mà việc giải các phương trình siêu việt này thường chỉ được thực hiện bằng các thủ tục số như phương pháp gradient liên hợp hay phương pháp Newton cho hệ phương trình phi tuyến.

Một phần của tài liệu Tìm hiểu phương pháp phân đoạn ảnh màu và ứng dụng (Trang 32 - 35)

Tải bản đầy đủ (DOC)

(88 trang)
w