3.3. SỰ PHÂN ĐOẠN (SEGMENTATION)
3.3.3. Sự phân đoạn ảnh
Phân đoạn ảnh nói đến việc phân hoạch một bức ảnh số thành nhiều.
. Việc phân đoạn bức ảnh dựa trên cơ sở là một tập hợp các pixel trong một vùng là giống nhau theo tiêu chí thuần nhất nào đó ví dụ như màu sỉ cường độ hoặc bố cục ... là cái giúp cho việc định vị và nhận dạng các đối tượng hoặc các đường biên trong một bức ảnh.
Phân đoạn ảnh cũng có nghĩa là gán nhãn cho mỗi pixel trong bức ảnh
ó cùng nhãn thì có cùng đặc điểm thị giác. Phân đoạn ảnh
ảnh của các công việc xử lý ảnh được dễ dàng hơn. Nói chung, có nhiều cách dé phan đoạn một bức ánh.
Có nhiều kỹ thuật khác nhau có thể dùng được để thực hiện phân đoạn ảnh. Hiện thời phương pháp phân đoạn ảnh, dựa trên hai thuộc tính của ảnh, được phân thành hai loại:
~ Dựa vào điểm gián đoạn (Discontinuities)
Phân đoạn ảnh dựa vào điểm gián đoạn có nghĩa là phân hoạch bức ảnh dựa trên sự thay đổi đột ngột về cường độ. Loại nảy bao gồm các giải thuật
đoạn ảnh giống như dò tìm phát hiện cạnh (Edge Detection),
~ Dựa vào sự đồng dạng (Similarity)
Phân đoạn ảnh dựa vào sự đỏng dạng có nghĩa là phân hoạch bức ảnh thành các vùng thuần nhất theo tập hợp c chi đã được định nghĩa. Lị này bao gồm phân đoạn ảnh như phân ngưỡng (Thresholding), mở rộng vùng (Region Growing), chia nhỏ và trộn vùng (Region Spliting and Merging), nude ding (Watershed).
Về mặt toán học sự phân đoạn một bức ảnh được định nghĩa như sau:
Cho một bức ảnh I có độ phân giải (m x n), sự phân đoạn bức ảnh I theo vi tir
xác định tính thuần nhất H là một sự phân hoạch I thành một tập hợp các vùng liờn thụng R,,R¿... R„ trong ẽ sao cho:
1. RịaRj=ỉ Vij I<i#j<k
I=R, UR,V....UR,
3. H(Rj)=true Ví I<i<k
4. Với mỗi
ap (i,j) 1<izj<k, nếu RjC2R, là một vùng liên
thông thì H(R, UR, )= false
Vídụ
Xem một bức ảnh đơn giản (4x4), mức đen trắng v của mỗi cell được cho như Hình 3.4:
4 | 010 | 0.25 | 0.50 | 0.50
3 | 0.05 | 0.30 | 0.60 | 0.60
2 | 0.35 | 0.30 | 0.55 | 0.80
1 | 0.60 | 0.63 | 0.85 | 0.90 1 2 3 4
Hình 3.4 Ví dụ mức đen trắng của một ảnh
Xét vị từ xác định tính thuần nhất H®"®'”„ xác định rằng vùng liên
thông Ÿ† được xem là thuần nhất khi và chỉ khi tồn tại số r sao cho với mỗi
celle Ÿ có mức den trắng v thì |v=r|< 0.03
Theo vị từ xác định tính thuần nhất này thì bức ảnh trên có thể được phân đoạn thành § vùng thuẫn nhất như Hình 3.5.
1 2 3 4
Hình 3.5 Vùng liên thông thuần nhất
Trong Hình 3.5, các vùng Ri được xác định như sau:
RI= (1), 2.1} RS= (3,2). 3,3), (4,3)}
R2= (4.1). (4.1)} R6= {(4,2)}
R3= {(1,2)} R7= { (1,3), (14)}
RA4= {(2,2), (2,3), (2,4)} R§= (G44), (449)
3.3.4. Giải thuật phân đoạn chia nhỏ và trộn vùng.
Sự phân đoạn một bức ảnh được chia thành hai bước (Hình 3.6):
~_ Chia nhỏ (SpliÐ: trong bước này, người ta bắt đầu với toàn bộ bức ảnh. Nếu nó là một vùng thuần nhất thi bức ảnh là hợp lệ cho sự
phân đoạn. Ngược lại, chúng ta chia bức ảnh thành bốn phản, và lặp.
lại đệ quy quá trình này cho đến khi nhận được một tập hợp các
vùng thuần nhất.
~_ Trộn (Merge): Gộp các các vùng lân cận thuần nhất lại.
Hình 3.6 Minh họa giải thuật phân đoạn ảnh
Giải thuật phân đoạn
function segment (I: image);
SOL = 6;
check_split (I);
merge (SOL);
end function
function check_split(R);
if H(R)= “true” then addsol (R) else
( X = split(R);
check_split (X.part1);
check_sp1it (X.parE2) 7 end function )
procedure addsol (R);
SOL = SOL U {R}
end procedure
funetion merge (8);
while S 4 © do (
Pick some Cand in §¿
merged = false;
S = S - {Cand};
Enumerate § as Cl, .., Ck;
while i <= k do
{ if adjacent (Cand, Ci) then { Cand = Cand U Ci;
$= 8 - (Ci);
merged = true;
else (1 =1 +1; }
if merged then S = 5 U {Cand};
merged = false;
} } end function }
3.4 TIM ANH DUA TREN SU’ TUONG TY"
3.4.1 Cách tiếp cận vấn đề
Xột cỏc bức ảnh trong Hỡnh 3,7; chủng ta bắt đầu từ cõu hỏi ô bức ảnh
nào trong số cỏc bức ảnh đó ộho là tương tự hay giống với ảnh khỏc? ằ. Đề
trả lời câu hỏi này, người ta có thé sử dụng một trong hai cách tiếp cận sau:
1. Tiếp cân theo độ đo (Metric Approach).
Giả sử có một độ đo khoảng cách d, là cái có thể so sánh hai đối tượng, ảnh bắt kỳ. Hai đối tượng ảnh gần nhau theo khoảng cách, càng gần nhau thì chúng được xem như là càng giống nhau. Cho một bức ảnh đầu vào I, tim lân
cận gần nhất của I trong bộ lưu trữ ảnh. Đây là cách tiếp cận được sử dụng
một cách rộng rãi trong lĩnh vực cơ sở dữ liệu.
2. Tiếp cận theo pháp biến đổi (Transfbrmation Approach)
Tiếp cận theo độ đo giả sử rằng khái niệm về sự giống nhau là có định, tức là với bất kỳ ứng dụng nào thì cũng chỉ có một khái niệm về sự giống.
nhau, mặc dù các ứng dụng khác nhau có thể sử dụng các khái niệm khác nhau.
về sự tương tự. Việc tính toán chỉ phí (Cost) để biên đổi một bức ảnh thành một bức ảnh khác dựa trên các hàm tính chỉ phí đo người dùng đặc tả cũng có thể là cách cho phép xác định sự giống nhau của hai bức ảnh, chỉ phí càng thấp thì càng giống nhau.
a. Tinh tỉnh b. Đười ươi
c. Cá mập hỗ d. Cá mập sọc trắng.
Hình 3.7 Ví dụ về ảnh tương tự
3.4.2. Tiếp cận theo độ đo
Như được giới thiệu trong phần 3.4.1, tiếp cận theo độ đo sử dụng khoảng cách đẻ đo sự tương tự giữa hai ảnh. Vì vậy, hàm khoảng cách d can phải được xác định. Hàm d từ tích Descartes X x X đến đoạn [0,1] được gọi là
hàm khoảng cách (Distance Funetion) nếu nó thỏa các tiên đề sau với
Vx,y,ZzeX:
d(x,y) = d(y,x)
d(x,2) <d(x,y) + d(y,z)
d(x,x)=0
Vídụ
Xột tập hợp ỉ#ÿ gồm cỏc bức ảnh (n x n) pixel, mỗi pixel cú cỏc thuộc.
tính {red, green, blue}, mỗi thuộc tính có thể nhận các giá trị {0,1.2,3,4,
5,6,7}. Hàm khoảng cách đọ; trên tập hợp Obj được định nghĩa như sau:
>> (aitr, in ja
+ diff,
i)+ diff, [i
Yoi,o; e Obj : dọy(6,,o;
với:
ditt, [i, j]= (0, [i, j}red — 0, i, jJred)?
sith fi, j]=(6,fiiJereen ~ o,f, Jereen)
diff, [i, j)=(0, i, j}blue - 0, [i, j}blue?
Như vậy, với ba đối tượng ảnh với độ phân giải 4x4 được cho trong.
Bang 3.3, ta có thé tính được doy (0,,0))=V425 và doy;(0,,0;)= V167 Như vậy có thể nói rằng o; giống với o¡ hơn o;.
Bang 3.3. Ví dụ tính sự tương tự ảnh dựa theo tiếp cận độ đo
I Ol [ 92 ỉ3
red_| green green | bị green_| blue
3 2
pixel
Ị |
La Lú+
La La
Le [ay
| 23)
| |
| |
| |
| [
0 2 4 2 0 6 (24) | 3 5 0 1 3 2 0 1 s 5
tofusf—lafufe
Gl) (32)
(33) (34) (4.1) (42) (43) (44)
#|e|—l+|+|s|—|+|— =l=lels|a|+lslels|l+|—|>|+|ls|e|> #|ơ|al=|¿|al=|elsl-l¿|+le|=l=lalg =2 | |s|ơa|+|ls|e|sla|le|s|+|—|>
Với cách tính như trên, chúng ta có thẻ nl ằng một
công thức tính sự tương tự của ảnh theo tiếp cận độ đo đó chính là toán quá công kênh.
3.4.3 Tiếp cận theo phép biến đối
Đổ hạn chế nhược điểm của tiếp cận theo độ đo, tiếp cận theo phép bién đổi được sử dụng. Cách tiếp cận này dựa trên nguyên lý cho rằng: cho hai đối tượng o¡ và o2, mức độ giống nhau giữa chúng tỷ lệ nghịch với chỉ phí của việc biến đổi o: thành o; hoặc ngược lại. Sự biến đổi này thường là tổ hợp của các phép biến hình. Một số phép biến hình thông dụng là phép tịnh tiến (Translation), phép quay (Rotaion), tỷ lệ hóa đồng nhất và không đồng nhất (Scaling), phép chon phan (Excision).
Dinh nghĩa phép biến đỗi
¡ TS biến đổi đối tượng o thành đối tượng ơ' là một bộ hình toi, toa, .... toa và một bộ gồm n-l các đối tượng
. Phép biến
gồm n các phép bị Oi;O2,....0,¡ SaO cho:
1. toj(6) =0)
2.t0i(0¡-I)=0¡ (i=1,2,....-1)
3. ton (Op—1)
Chỉ phí của phép biến đổi
Giả sử rằng mỗi phép biến hình to, có một chỉ phí tương ứng là
cost(to,), chỉ phí. của phép biến đổi TS được ký hiệu và tính bởi công thức:
cost(TS) eo títo,) Sự khác
Gọi TSeq(o,o') là tập hợp tắt cả các phép biến đổi biến đổi o thành o”. Sự khỏc biệt (Dissimilarity) giữa o va o, ký hiệu dis(o, ứ'), được cho bởi công thức:
dis(o,o')= min{eost(TS)/TS e (TSeq(o,o')2TSeq(o',o))}
Như vậy nếu dis(o,o')< dis(o,o") thì o' giống o hơn o"
Vídụ
Hình 3.8 minh họa cho các phép biến đổi để biển o, thành o;
M
oO:
Hình 3.8 Phép biến đổi oị thành o2
Quá trình biến đổi o, thành o; có thể được thực hiện bằng cách dùng.
một trong hai phép biến đổi TS1 hoặc TS2 được mô tả như sau:
Phép biển đối TS1 (Hình 3.9a) bao gôm các phép biến hình như sau:
1. Phép tỷ lệ hóa không đồng nhất: tỷ lệ hóa phần B (xanh dương) của oi giảm xuống 50% theo hướng thăng đứng từ dưới lên, hướng nằm ngang không thay đôi.
2. Phép tỷ lệ hóa không đồng nhất: tỷ lệ hóa phần G (xanh lá cây) của o¡ tăng lên 100% theo hướng thẳng đứng từ trên xuống, hướng nằm ngang không thay đôi.
3. Phép toán thứ ba là phép tô
tàu, tô hai ô màu G thành màu M (tím).
Phép biến đổi TS2 (Hình 3.9b) bao gồm các phép bin hình như sau: