Chương 2. MỘT SỐ KỸ THUẬT TRA CỨU ẢNH DỰA VÀO NỘI DUNG
2.4. Phương pháp tra cứu ảnh sử dụng dấu hiệu nhị phân
2.4.4. Độ đo tương tự
Độ đo tương tự là một trong những mục chính trong quá trình tra cứu ảnh mà quyết định độ chính xác và tốc độ của kỹ thuật tra cứu.
Một khi các chuỗi dấu hiệu nhị phân cho mỗi hình ảnh trong tập dữ liệu đƣợc tính toán và lưu trữ vào cơ sở dữ liệu. Khi ta đưa một ảnh vào để thực hiện tra cứu trong cơ sở dữ liệu ảnh, đầu tiên ảnh đầu vào cũng đƣợc xác định chuỗi dấu hiệu nhị phân của nó. Tiếp theo chuỗi đó sẽ đƣợc so sánh với tập các chuỗi dấu hiệu nhị phân trong cơ sở dữ liệu. Nó là cơ bản việc tính toán độ tương tự giữa các chuỗi dấu hiệu nhị phân của hình ảnh truy vấn người dùng chỉ định và tất cả các hình ảnh khác trong cơ sở dữ liệu. Ngay từ đầu, tôi sử dụng các phương pháp sau đây để tính độ tương tự giữa ảnh truy vấn và ảnh trong cơ sở dữ liệu:
n
j
j I j
Q pos B
B pos I
Q d
1
0( , ) ( ( ) ( ) (2-11) Đầu vào: Ảnh I
Đầu ra: Chuỗi dấu hiệu nhị phân của ảnh I
1. Mỗi hình ảnh trong cơ sở dữ liệu lƣợng tử hóa thành một số cố định của màu sắc n, C = (c1, c2, ...,cn).
2. Mỗi phần tử màu cj sau đó sẽ đƣợc rời rạc hóa vào bin nhị phân t (Bj (b1j,b2j,....,btj) các bin có sức chứa bằng nhau hoặc khác nhau, được gọi là kích thước – bin.
3. Một hình ảnh bao gồm n màu sắc và t bin nhị phân của hình ảnh này, sau đó sẽ đƣợc biểu diễn bởi chuỗi bit sau: S =
n t n 2 n 1 2 t 2 2 2 1 1
t 1
2 1
1b ...b b b ...b b b ...b
b b11 b12 ... b1t b21b22 ...b2t bn1bn2 ... bnt,
j
bi biểu diễn bin thứ i liên quan đến thành phần màu cj
Ở đây, pos(BQj ), pos(BIj) là các vị trí của các bit đƣợc thiết lập trong chuỗi dấu hiệu nhị phân của ảnh Q và I (hay các bin đƣợc thiết lập) bin Bj của hình ảnh Q và I. Ví dụ, sử dụng hình ảnh trong hình 2.11.
Chúng tôi có pos(B1A= 2, pos(B2A) = 1,và pos(B3A) = 8. Tuy nhiên phương pháp này không mạnh mẽ và không thể hiện đƣợc sự khác biệt rõ ràng của các ảnh.
Chúng ta hãy xem xét các chuỗi dấu hiệu nhị phân của hình ảnh X, Y và Z.
Bảng 2.3: Chuỗi dấu hiệu nhị phân minh họa sự giống và khác nhau của ảnh
Bin màu sắc đƣợc thiết lập
Mật độ màu
Dấu hiệu nhị phân
b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 Ảnh X
c1/B1X 30% 0 0 0 1 0 0 0 0 0 0
c2/B2X 30% 0 0 0 1 0 0 0 0 0 0
c3/B3X 40% 0 0 0 0 1 0 0 0 0 0
Ảnh Y
c1/B1Y 39% 0 0 0 1 0 0 0 0 0 0
c2/B2Y 39% 0 0 0 1 0 0 0 0 0 0
c3/B3Y 22% 0 0 1 0 0 0 0 0 0 0
Ảnh Z
c1/B1Z 29% 0 0 1 0 0 0 0 0 0 0
c2/B2Z 29% 0 0 1 0 0 0 0 0 0 0
c3/B3Z 42% 0 0 0 0 1 0 0 0 0 0
Kiểm tra đơn giản của mật độ màu (cột thứ hai trong bảng), rõ ràng rằng hình ảnh X và Z là tương tự như nhau hơn so với hình ảnh X và Y. Tuy nhiên, chúng ta có:
d0(X, Y) = (4 - 4) + (4-4) + (5 - 3) = 2 và d0 (X, Z) = (4 - 3) + (4-3) + (5-5) = 2, điều này cho thấy rằng cả ảnh Y và Z đều có giá trị như nhau tương tự như ảnh X, do đó trái ngược với trực giác. Nhưng nếu chúng ta bình phương khoảng cách giữa các bộ bin, chúng ta có thể có thấy đƣợc sự khác biệt rõ ràng của các hình ảnh. Và khoảng cách giữa các bộ bin là:
d(Q, I)=
n
j1
[pos (BQj ) – pos (BIj)]2 (2-12) Ta có thuật toán tính độ tương tự giữa hai ảnh Q và I
Sử dụng định nghĩa mới về khoảng cách trên ví dụ thảo luận ở trên, chúng ta có:
d (X, Y) = 4 và d (X, Z) = 2, trong đó phản ánh nhận thức giả định chặt chẽ của chúng ta về hình ảnh X, Y, Z. Cuối cùng, bằng cách sử dụng các khoảng cách tương tự thu
Thuật toán tính độ tương tự giữa hai ảnh Q và I Đầu vào: Các chuỗi dấu hiệu nhị phân của ảnh Q và I Đầu ra: Khoảng cách d(Q, I)
1. Tìm Pos(BQj ) và Pos(BIj)
Pos(BQj ) và Pos(BIj) là các vị trícủa các bit đƣợc thiết lập trong chuỗi dấu hiệu nhị phân của ảnh Q và I (hay các bin đƣợc thiết lập) bin Bj của hình ảnh Q và I
2. Tính khoảng cách d(Q, I) d(Q, I)=
n
j 1
[pos (BQj ) – pos (BIj)]2 3. Return d(Q, I)
đƣợc, các thiết lập hình ảnh sau đó đƣợc sắp xếp lại đối với khoảng cách tăng dần của các ảnh trong cơ sở dữ liệu ảnh (so với hình ảnh truy vấn) và ảnh nào có khoảng cách tương tự so với ảnh truy vấn nhỏ nhất, nó chính là ảnh giống với ảnh truy vấn nhất.
Tóm lại trong chương này tôi đã trình bày các phương pháp tra cứu ảnh, nhấn mạnh đến phương pháp tra cứu ảnh dựa vào màu sắc và đi sâu tìm hiểu kỹ thuật tra cứu ảnh sử dụng dấu hiệu nhị phân. Kỹ thuật này gồm các bước: xác định vector đặc trưng của mỗi pixel màu trội, xác định chuỗi dấu hiệu nhị phân của ảnh và tính tổng tất cả các khoảng cách giữa các ảnh theo bin để tìm ra ảnh gần giống nhau nhất.
Chương 3