1.3. Trích chọn đặc trưng ảnh
1.3.1. Phương pháp trích chọn đặc trưng ảnh theo hướng hình học (Gradient)
Tìm ra đặc trưng về hướng của các điểm biên trong ảnh. Với phương pháp này ta có thể tìm các điểm biên của ảnh một cách dễ dàng cũng như xác định xem chúng thuộc vào miền ảnh nào.
Vectơ gradient: Gradient là một vectơ có các thành phần biểu thị tốc độ thay đổi giá trị điểm ảnh theo hai hướng x và y (trích dẫn trong [1] trang 109). Với ảnh có giá trị mức xám của các điểm ảnh được biểu diễn bởi hàm f(x,y) thì vectơ gradient tại điểm có toạ độ (x,y) được tính như trong công thức (2.3.1):
f =
Gy Gx =
y fx f
(2.3.1)
Biên độ của vectơ gradient tại điểm (x,y) được tính bởi công thức:
r(x,y)= mag (f) = [Gx2 + Gy2 ] ẵ (2.3.2)
Hướng của vectơ gradient tại điểm (x,y) được tính bởi công thức:
(x,y) = tan-1
Gy
Gx (2.3.3)
Khi tại vị trí (x,y) của ảnh là một điểm biên ảnh thì hướng của vectơ gradient tại điểm ảnh đó được coi là hướng của biên ảnh tại vị trí (x,y).
Phương pháp trích chọn đặc trưng theo hướng hình học trích chọn ra các đặc trưng về hướng tới các điểm biên ảnh. Yếu tố cơ bản nhất của trích chọn đặc trưng
theo hướng hình học là tìm tần suất xuất hiện theo hướng của điểm biên ảnh trong một vùng nhất định. Tư tưởng cơ bản của phương pháp này được miêu tả như sau:
Bước 1: Tìm hình bao của ảnh đầu vào và bao ảnh bởi hình bao này. Việc làm này được thực hiện bằng cách: ban đầu lấy hình bao là đường bao toàn bộ ảnh.Co dần đường bao này về phía tâm của ảnh cho tới khi nó tiếp xúc với một đường biên nào đó Kết quả của quá trình này được thể hiện như hình 1.5:
Tác dụng của việc bao ảnh là loại bỏ khoảng trống xung quanh phần ảnh mang thông tin thực sự nhằm loại bỏ các thông tin không cần thiết, đồng thời giảm thời gian tính toán của chương trình
Hình 1.5: Ảnh ban đầu và ảnh sau khi đƣợc bao
Bước 2: tính bản đồ Gradient và biên độ và hướng tại mỗi điểm ảnh theo toán tử Sobel. Cách tính bản đồ này như sau:
• Ảnh đầu vào được cho dưới dạng ma trân mức xám I(x,y) với kích thước D1*D2. Mặt nạ của toán tử Sobel theo toạ độ X (nằm ngang) và tọa độ Y (thẳng đứng) được biểu diễn bởi hai ma trận trong bảng 1.2:
-1 0 1 -2 0 2 -1 0 1
1 2 1
0 0 0
-1 -2 -1
Bảng 1.2: Mặt nạ Sobel theo hai hướng X và Y
• Với điểm ảnh có toạ độ (i, j), ta quan tâm đến giá trị mức xám tới điểm ảnh này và
• Các vectơ thành phần GX và GY của vectơ gradient tại điểm ảnh có tọa độ (i, j) khi đó sẽ được tính dựa trên mặt nạ của toán tử Sobel theo hướng X và hướng Y như sau:
GX(i, j) = I (i - 1, j + 1) + 2I (i, j + 1) + I (i + 1, J + 1) - - I (i - 1, j - 1) - 2I (i, j - 1) - I (i + 1, J - 1) (2.3.4) GY(i, j) = I (i - 1, j - 1) + 2I (i - 1, j) + I (i - 1, J + 1) -
- I (i + 1, j - 1) - 2I (i + 1, j) - I (i + 1, J + 1) (2.3.5)
• Sau khi tính được GX, GY ta tính biên độ và hướng của vectơ gradient tại điểm ảnh này theo công thức:
o Biên độ: Gradient_Manitude r(i, j) = Gx2(i,j)Gy2(i, j) (2.3.6) o Hướng: Gradient_Direction (i,j) = tan-1 Gx i jGy i j( , )( , ) (2.3.7)
Từ đó, ta xây dựng bản đồ biên độ và bản đồ hướng của ảnh tương ứng là tập hợp biên độ và hướng của vectơ gradient tại tất cả các điểm ảnh.
Bước 3: Từ bản đồ biên độ, ta tìm các điểm biên của ảnh bằng cách chọn một ngưỡng θ, và xét r(i, j). Nếu r(i, j) > θ thì điểm ảnh tại (i, j) là điểm biên.
Bước 4: Đối với hướng của mỗi điểm biên: (i,j) có giá trị trong khoảng từ 0o đến 360onên nếu ta lượng tử hoá các giá trị ( 0o– 30o; 30o– 60o; … 330o– 360o) bởi các giá trị tương ứng (0, 1, …, 11) thì bản đồ hướng của ảnh sẽ nhận các giá trị trong khoảng 0..11
Bước 5: sau khi tính được bản đồ biên độ và bản đồ hướng của ảnh, chia ảnh thành 4*4 phần bằng nhau. Với mỗi phần ảnh k (k = 0…15) ta làm như sau:
• Dựa vào bản đồ biên độ và bản đồ hướng để tính tổng số điểm biên có giá trị hướng lần lượt là 0, …, 11. Giả sử thu được bộ 12 giá trị ai với i = 0…11 và ai là tổng số điểm biên có giá trị hướng bằng i. Với ngưỡng η được chọn trước (áp dụng cho tất cả các phần của ảnh) ta xác định lại giá trị ai như sau:
nếu ai > η thì ai = 1; ngược lại ai = 0;
• Kết quả.: phần ảnh k sẽ có 12 bit đặc trưng có giá trị 0 hoặc 1 (tương ứng với các giá trị ai) thể hiện các đặc trưng về hướng của các điểm biên trong phần ảnh này.
Như vậy, sẽ đặc trưng theo hướng của toàn bộ ảnh sẽ là: 4*4*12 = 192 và được thực hiện dưới dạng bit nhị phân (0 hoặc 1).
Thuật toán miêu tả chi tiết phương pháp trích chọn đặc trưng theo hướng như sau:
INPUT : ảnh đầu vào, giá trị ngưỡng threshold OUTPUT : Vectơ đặc trưng của ảnh (192 bít) PROCESS :
1. Xác định hình bao ảnh
2. Tính bản đồ Gradient về biên độ và hướng tới mỗi điểm ảnh
3. Xác định các điểm biên và lượng tử hướng của chúng về 12 giá trị: 0…11.
4. Chia ảnh làm 4*4 phần bằng nhau 5. Trong mỗi phần:
• Tính 12 giá trị ai tương ứng là tổng số điểm biên có giá trị 0…11.
• Nếu ai > threshold thì ai = 1, ngược lại ai = 0
6. Xác định vectơ đặc trưng là tập hợp các giá trị ai (i = 0…11) trong tất cả các phần.
Thuật toán 1-3: Thuật toán trích chọn đặc trưng theo hướng
Ví dụ: với η = 5, bảng 1.3 minh hoạ cho các kết quả thu được khi ta tìm 12 đặc trưng về hướng của các điểm biên cho phần ảnh thứ 8 trong hình 1.6.
Hình 1.6: Ảnh đƣợc chia ra làm 4*4 phần
Bảng 1.3: Kết quả thu được khi tìm đặc trưng về hướng cho phần thứ 8 của ảnh
Nhận xét: Phương pháp trích chọn đặc trưng ảnh theo hướng hình học sẽ giúp ta tìm được đặc trưng về hướng của các điểm biên trong ảnh. Kết quả ta thu được 192 bít thể hiện giá trị đặc trưng cho toàn bộ ảnh. Tuy nhiên, phương pháp này chỉ tìm đặc trưng của các điểm ảnh rời rạc chứ chưa có sự liên kết với các điểm lân cận nên những đặc trưng được tìm ra không phải lúc nào cũng thể hiện được hết đặc điểm của toàn bộ ảnh. Vì vậy ta nên áp dụng phương pháp này khi muốn giảm số kích thước đầu vào để tăng tốc độ học cho hệ nhận dạng và tăng độ giống nhau của dữ liệu vào đối với những ảnh của một loại chữ cái. Còn nếu muốn tăng thêm nữa độ chính xác của hệ nhận dạng, ta nên sử dụng kết hợp phương pháp trích chọn đặc trưng này với các phương pháp khác.