Chương 2: MỘT SỐ KỸ THUẬT TRA CỨU BIỂN BÁO GIAO THÔNG
2.3. TRA CỨU ẢNH DỰA TRÊN HÌNH DẠNG
2.3.1. Biên và các phương pháp phát hiện biên
Nếu đã biết là một đối tượng có một biên rời rạc bao quanh và có thể tìm được một điểm nằm trên biên đó thì từ điểm đó có thể đi theo đường biên bao quanh đối tượng và quay trở lại điểm xuất phát. Dò biên là một thao tác rất quan trọng, đặc biệt là khi cần xác định xem một điểm ảnh có nằm trong một vùng ảnh nào đó hay không.
Một điểm ảnh được gọi là biên nếu ở đó có sự thay đổi đột ngột về mức xám.
Tập hợp các điểm biên tạo thành biên của ảnh.
2.3.1.1. Phương pháp phát hiện biên trực tiếp [3, 11]
Phương pháp này làm nổi biên dựa vào sự biến thiên độ xám của ảnh. Kỹ thuật chủ yếu dùng để phát hiện biên là kỹ thuật đạo hàm.
a. Kỹ thuật phát hiện biên Gradient
Gradient là một vec tơ f(x, y) có các thành phần biểu thị tốc độ thay đổi mức xám của điểm ảnh (theo hai hướng x, y trong bối cảnh xử lý ảnh hai chiều)
Trong đó, dx, dy là khoảng cách (tính bằng số điểm) theo hướng x và y. Tuy ta nói là lấy đạo hàm nhưng thực chất chỉ là mô phỏng và xấp xỉ đạo hàm bằng các kỹ thuật nhân chập vì ảnh số là tín hiệu rời rạc nên đạo hàm không tồn tại (thực tế chọn dx= dy=1).
Theo định nghĩa về Gradient, nếu áp dụng nó vào xử lý ảnh, việc tính toán sẽ rất phức tạp. Để đơn giản mà không mất tính chất của phương pháp Gradient, người ta sử dụng kỹ thuật Gradient dùng cặp mặt nạ H1, H2 trực giao (theo 2 hướng vuông góc).
ỉ Mặt nạ Prewitt
- Kỹ thuật sử dụng 2 mặt nạ nhập chập xấp xỉ đạo hàm theo 2 hướng x và y là:
- Tính I Ä Hx + I Ä Hy để ra được kết quả - Ví dụ:
ỉ Mặt nạ Sobel
- Kỹ thuật sử dụng 2 mặt nạ nhân chập xấp xỉ đạo hàm theo 2 hướng x và y là:
- Tính I Ä Hx + I Ä Hy để ra được kết quả.
ỉ Kỹ thuật la bàn
- Kỹ thuật sử dụng 8 mặt nạ nhân chập theo 8 hướng 00, 450, 900, 1350, 1800, 2250, 2700, 3150.
- Kết quả thu được bằng cỏch tớnh ồ
= 8 Ä
1 i
Hi
I
b. Kỹ thuật phát hiện biên Laplace
Toán tử Laplace được định nghĩa như sau:
Ta có:
( ( 1, ) ( , ))
2 2
y x f y x x f x
f x x
f + -
ả
ằ ả
ữứ ỗ ử è ổ
ả
ả
ả
= ả
ả
ả
[ ] [ ]
) , 1 ( ) , ( 2 ) , 1 (
) , 1 ( ) , ( )
, ( ) , 1 (
y x f y x f y x f
y x f y x f y x f y x f
- +
- +
ằ
- -
- -
+
ằ
Tương tự
2 2 2 2 2
y f x
f f
ả + ả
ả
= ả ẹ
( ( , 1) ( , ))
2 2
y x f y
x y f y
f y y
f + -
ả
ằ ả
ữữứ ỗỗ ử è ổ
ả
ả
ả
= ả
ả
ả
[ ] [ ]
) 1 , ( ) , ( 2 ) 1 , (
) 1 , ( ) , ( ) , ( ) 1 , (
- +
- +
ằ
- -
- -
+
ằ
y x f y x f y
x f
y x f y x f y x f y
x f
Vậy: ẹ2 f= f(x+1,y) + f(x,y+1) - 4f(x,y) + f(x-1,y) + f(x,y-1) Dẫn tới
Trong thực tế, người ta thường dùng nhiều kiểu mặt nạ khác nhau để xấp xỉ rời rạc đạo hàm bậc hai Laplace. Dưới đây là ba kiểu mặt nạ thường dùng:
c. Kỹ thuật phát hiện biên Canny
Đây là một thuật toán tương đối tốt, có khả năng đưa ra đường biên mảnh, và phát hiện chính xác điểm biên với điểm nhiễu.
Ta có thuật toán như sau:
- Bước 1: Làm trơn ảnh Tính I Ä H, với:
úú úú úú
û ù
êê êê êê
ở é
=
2 4 5 4 2
4 9 12 9 4
5 12 15 12 5
4 9 12 9 4
2 4 5 4 2
115 H 1
Gọi G là kết quả lọc nhiễu: G= I Ä H
- Bước 2: Tính gradient của ảnh bằng mặt nạ Prewitt, kết quả đặt vào Gx,Gy. Gx = G Ä Hx, Gy = G Ä Hy
- Bước 3: Tính gradient hướng tại mỗi điểm (i,j) của ảnh. Hướng này sẽ được nguyên hóa để nằm trong 8 hướng [0..7], tương đương với 8 lân cận của một điểm ảnh.
- Bước 4: Dùng ràng buộc “loại bỏ những điểm không phải là cực đại” để xóa bỏ những điểm không là biên. Xét (i,j), q là gradient hướng tại (i,j).
I1, I2 là hai điểm lân cận của (i,j) theo hướng q.
Theo định nghĩa điểm biên cục bộ thì (i,j) là biên nếu I(i,j) cực đại địa phương theo hướng gradient à Nếu I(i,j) > I1 và I(i,j) > I2 thì mới giữ lại I(i,j), ngược lại xóa I(i,j) về điểm ảnh nền.
- Bước 5: Phân ngưỡng. Với các điểm được giữ lại, thực hiện lấy ngưỡng gradient biên độ lần cuối để xác định các điểm biên thực sự.
.
Hình 2.4 – Minh họa xác định điểm biên
1.3.1.2. Phương pháp phát hiện biên gián tiếp [2, 11]
Nếu bằng một cách nào đó ta phân được ảnh thành các vùng thì ranh giới giữa các vùng là đó chính là biên. Kỹ thuật dò biên và kỹ thuật phân vùng ảnh là hai bài toán đối ngẫu nhau bởi vì dò biên để thực hiện phân lớp đối tượng mà khi đã phân lớp xong thì có nghĩa là đã phân vùng được ảnh và ngược lại khi đã phân vùng được ảnh tức là đã phân lớp được thành các đối tượng do đó ta có thể phát hiện được biên.
ỉ Kỹ thuật dũ biờn giỏn tiếp đơn giản
Giả sử đã tìm được một vị trí (x, y) nằm trên biên của một vùng ảnh hoặc đối tượng ảnh nào đó.
Đánh dấu điểm đó là "đã sử dụng" (để điểm đó không bị sử dụng lại) và đánh giá tất cả giá trị gradient Sobel 3×3 (hoặc lớn hơn) có trung tâm lần lượt là các điểm trong 8 điểm lân cận với (x, y).
Chọn ra ba điểm có biên độ gradient tuyệt đối lớn nhất. Đẩy vị trí của ba điểm đó vào một mảng có 3 cột, mỗi cột tương ứng với vị trí của một điểm, sắp xếp thành từng hàng theo độ lớn của biên độ gradient. Chọn điểm có biên độ gradient lớn nhất.
Bây giờ điểm này sẽ là một trong 8 hướng từ 0 đến 7 xung quanh điểm (x, y) sắp xếp theo mô hình sau (trong đó * là vị trí điểm (x, y)):
4 5 6
3
* 7
2 1 0
Ví dụ, nếu biên độ gradient cực đại đã tìm được bằng toán tử Sobel với trung tâm là điểm (x+1, y) thì hướng sẽ là 3. Gọi hướng của dịch chuyển là d.
Giả sử là hình dạng của đối tượng không quá đặc biệt, lặp lại thuật toán trên nhưng thay vì xem xét tất cả các điểm xung quanh điểm mới thì chỉ cần xem xét hướng a, (d+1)mod 8 và (d-1)mod 8. Nếu không tìm thấy một giá trị biên độ
gradient nào đủ lớn thì loại bỏ điểm đó ra khỏi danh sách và chọn một trong ba điểm đã được sắp xếp. Nếu tất cả ba điểm đều bị loại bỏ ra khỏi danh sách thì dịch chuyển lên một hàng và chọn điểm tốt nhất tiếp theo từ hàng trước. Việc dò biên kết thúc khi gặp lại điểm xuất phát hoặc việc dò đã diễn ra quá lâu hoặc số hàng trong danh sách là quá lớn.
Đây là một kỹ thuật dò biên đơn giản, tuy nhiên vấn đề có thể xảy ra là thời gian tiêu tốn khá lớn.
ỉ Kỹ thuật dũ biờn giỏn tiếp bằng cỏch xỏc định chu tuyến của đối tượng ảnh.
Kỹ thuật này chỉ xét với ảnh nhị phân vì mọi ảnh đều có thể đưa về ảnh nhị phân bằng kỹ thuật phân ngưỡng.
Ký hiệu F là tập các điểm vùng (điểm đen), F' là tập các điểm nền.
- Định nghĩa chu tuyến:
Chu tuyến của một đối tượng ảnh là dãy các điểm ảnh của đối tượng p0, p1, ..., pn sao cho:
+ "i, $Q không thuộc đối tượng ảnh là 4-láng giềng của pi. + pi và pi+1 là các 8-láng giềng của nhau
+ p0 trùng với pn
- Định nghĩa chu tuyến đối ngẫu
Chu tuyến c = <p1, p2, ..., pn>, c^ = <Q1, Q2,..., Qm> được gọi là đối ngẫu của nhau nếu:
+ "i, $j, k sao cho:
1. Qj là 4-láng giềng của pi 2. Qk là 8-láng giềng của pi+1
3. Qj và Qk là 8-láng giềng của nhau.
+ Nếu pi là nền thì Qj là vùng và ngược lại.
+ Các điểm Qj nằm về một phía với pi. - Thuật toán dò biên tổng quát như sau:
o Bước 1: Xác định cặp nền-vùng xuất phát: cặp nền-vùng xuất phát được xác định bằng cách duyệt ảnh lần lượt từ trên xuống dưới, từ trái sang phải và kiểm tra theo định nghĩa cặp nền-vùng.
o Bước 2: Xác định cặp nền-vùng tiếp theo.
o Bước 3: Lựa chọn điểm biên
o Bước 4: Nếu gặp lại cặp xuất phát thì dừng, nếu không quay lại bước 2.