Hình 2.4: (a) khoảng cách Ơ cơ lit, (b) khoảng cách Cosin, (c) khoảng cách L1
Nhƣ có thể thấy: khoảng cách Ơcơlit có đƣợc tính đến cả góc lẫn chiều dài vector để tính toán. Trong khi khoảng cách Cosin chỉ tính đến góc đó khi tính toán. Nhƣ kết quả: Q1 và Q sẽ có khoảng cách giống nhƣ đối với T.
dcos(Q, T) = dcos(Q1, T) .
Khoảng cách tính toán d1 giữa mỗi kích thƣớc của vector đặc trƣng (hình 2.4)
2.2.1.4. Thông tin thống kê
(Thông tin thống kê) đƣợc định nghĩa nhƣ sau :
( 2.29 )
Chất lƣợng các phép đo này là việc phân bố không chắc chắn nhƣ từ các biểu diễn thông dụng bởi các kết quả khác.
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
1
Đƣờng giao biểu đồ đƣợc đề xuất bởi Swain và Ballard tìm thấy những đối tƣợng bên trong các bức ảnh một cách khách quan bằng việc sử dụng biểu đồ màu sắc. Nó cũng có thể vận dụng đối sánh cục bộ. Khi kích thƣớc đối tƣợng ( với đặc trƣng Q) nhỏ hơn kích thƣớc ảnh ( với đặc trƣng trong T). Định nghĩa gốc của khoảng cách biểu đồ cho bởi công thức:
( 2.30) Mở rộng trong khoảng cách đo đƣợc có công thức nhƣ :
( 2.31 )
2.2.1.6. Khoảng cách bậc hai
Những khoảng cách đƣợc tính toán từ phép đo khoảng cách đƣợc mô tả ở trên chỉ tính toán sự tƣơng ứng giữa mỗi kích thƣớc và không làm cho thông tin sử dụng thông qua các kích thƣớc [3]. Vấn đề này nhận ra trong sự thích ứng của biểu đồ. Khoảng cách bậc hai đƣợc đề xuất để tính toán đến sự giống nhau thông qua kích thƣớc. Nó cung cấp nhỉều kết quả hơn là sự đối sánh duy nhất giữa các biểu đồ mẫu. Khoảng cách mẫu bậc hai giữa hai vector đặc trƣng Q và T đƣợc tính:
( 2.32 )
ở đây A [aij] ma trận N*N là hệ số giống nhau giữa những chỉ số kích thƣớc i và j. aijđƣợc tính:
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
( 2.33 )
2.2.1.7. Khoảng cách Mahalanobis
Khoảng cách Mahalanobis là một trƣờng hợp đặc biệt của phép đo khoảng cách dạng bậc hai. ở đó ma trận chuyển đổi có đƣợc nhờ ma trận hiệp phƣơng sai thu đƣợc từ một tập học của các vector đặc trƣng đó là A = Σ-1. Để áp dụng khoảng cách Mahalanobis, vector đặc trƣng đƣợc coi nhƣ không gian biến
X = [x0 , x1 ,...xN -1 ] Sau đó ma trận hiệp phƣơng sai lấy từ R, ở đây R = [rij] với
rij = E {xi, yj }.E {y} đƣợc lấy từ không gian biến y. Sau đó ma trận hiệp phƣơng sai
Khoảng cách Mahalanobis giữa hai vector đặc trƣng Q và T thu đƣợc bằng
XQ = Q và XT = T.
( 2.34 )
Trong trƣờng hợp đặc biệt khi xi độc lập thống kê nhƣng xác suất không bằng nhau, Σ là ma trận đƣờng chéo:
Trong trƣờng hợp này, khoảng cách Mahalanobis đƣợc tính lại có dạng tƣơng đƣơng sau :
( 2.35 ) Nó là một khoảng cách có trọng số L2 . Nó đem lại trọng số nhiều đối với
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
kích thƣớc biến đổi nhiều hơn [4].
2.2.2.Thực hiện phép đo
Để định lƣợng các giải thuật khác nhau cho tìm kiếm ảnh, một phép đo hiệu quả thực hiện là cần thiết [4]. Các phép đo hiệu quả thực hiện đã đƣợc đề xƣớng, phép đo sự thực hiện thƣờng dựa trên việc thống kê các bƣớc thử chủ quan. Các phép đo sự thực hiện khác thƣờng sử dụng các phép thử chủ quan khác, dẫn đến các định nghĩa khác nhau về sự chính xác trong tìm kiếm ảnh. Các phép đo sự thực hiện khác nhau đƣợc thảo luận trong phần này.
2.2.2.1. Độ nhạy và độ chính xác (RPP).
RPP là phép đo sự thực hiện tìm kiếm ảnh đƣợc sử dụng rộng rãi nhất trong các bài giảng. Về cơ bản nó dựa trên sự đối sánh tuyệt đối. Trong phƣơng pháp này, CSDL đƣợc chuyển thành tập nhị phân theo sự phù hợp hoặc không hợp với truy vấn dựa trên phép thử chủ quan. Trong các phép thử chủ quan, mỗi một đối tƣợng lựa chọn một tin tức tƣơng ứng với dạng truy vấn từ CSDL. Các mục đích đƣợc lựa chọn cho mỗi truy vấn sát với các đối tƣợng có sẵn đƣợc xem xét thích hợp tới truy vấn. Ngƣợc lại, chúng đƣợc coi là không thích hợp. Độ chính xác và độ nhạy đƣợc định nghĩa nhƣ sau:
( 2.36)
Độ chính xác đo bằng tìm kiếm ảnh chính xác trong khi độ nhạy đo bằng khả năng tìm kiếm mục đích thích hợp từ CSDL. Độ chính xác và độ nhạy có mối hệ ngƣợc nhau. Sự chính xác thông thƣờng giảm tƣơng ứng sự gia tăng độ nhạy (cái này tăng thì cái kia giảm) [5].
2.2.2.2. Tỷ lệ trọng số thành công
r : Số lƣợng các ảnh tìm kiếm phù hợp n1 : Số lƣợng ảnh đƣợc tìm kiếm
n2 : Tổng số lƣợng các ảnh thích hợp trong CSDL
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Trọng số thành công tƣơng đƣơng nhƣ phép đo độ nhạy. Phép thử chủ quan giống nhƣ độ chính xác, đó là mỗi đối tƣợng lựa chọn một vài mục phù hợp với truy vấn từ CSDL. Tuy nhiên thay vì việc đo độ nhạy dựa trên giá trị nhị phân phù hợp nhƣ trong RPP, PWH gán một trọng số thích hợp wi cho mỗi Iterm wi tƣơng ứng.
Vì vậy PWH đƣợc định nghĩa nhƣ sau:
(2.37)
ở đây, n là số iterm trả lại và N là tổng các iterm trong CSDL. Độ nhạy là tƣờng hợp đặc biệt của PWH khi wi nhận các giá trị 0 và 1.