Cơ sở lý thuyết

Một phần của tài liệu (TIỂU LUẬN) PHƯƠNG PHÁP TRÍCH CHỌN đặc TRƯNG ẢNH TRONG THUẬT TOÁN học máy t ếm ẢNH áp ìm KI DỤNG v ếm sản PHẨM (Trang 37 - 42)

Chương 4 Mô hình k láng giềng gần nhất sử dụng bộ lượng tử hóa

4.2. Cơ sở lý thuyết

4.2.1. Các ký hiệu và khái niệm

4.2.1.1. Lượng tử hóa vector

Về mặt hình thức, một bộ lượng tử hóa vector (quantization) là một hàm q ánh xạ

một vector D

xR thành một vector q x( ) Cc ii; Ivới tập chỉ mục I được giả định là hữu hạn: I={0…..k-1}, D là số chiều của không gian vector đang xét. Các giá trị ci

gọi là “trọng tâm (centroids)” và tập các giá trị C gọi là codebook. Chúng ta giả thiết rằng các chỉ số nhận giá trị là các số nguyên liên tiếp từ 0 đến k-1.

29

Tập các vector Vi được ánh xạ tới một chỉ số i được gọi là một “ô Voronoi” (Voronoi cell), được định nghĩa:

D: ( ) 

i i

VxR q xc (23)

k "ô" của bộ lượng tử xác định một phân vùng của D

R . Theo định nghĩa, tất cả các

vector nằm trong cùng một “ô” Vi được đặt trong cùng một trọng tâmci. Chất lượng của một bộ lượng tử hóa được đo bằng giá trị lỗi bình phương trung bình (Mean Square error MSE) giữa vector đầu vào x và giá trị sau khi được lượng tử hóa của nó

q(x):

2 2

( ) X ( , ) ( ) ( ( ), )

MSE qE d x x  p x d q x x dx (24)

Với d x y( , ) xy là khoảng cách Ơclit giữa x và y, và p(x) là hàm phân phối xác

xuất tương ứng với biến ngẫu nhiên chung X.

Bộ lượng tử hóa tối ưu khi nó mãn hai thuộc tính cịn gọi là điều kiện Lloyd: - Thứ nhất: các vector x phải được lượng ử hóa tới trọng tâm codebook gần t

nhất của nó, thể hiện qua khoảng cách Ơclit:

( ) arg min ( , )i

i I

q x d x c

 (25)

- Thứ hai: Giá trị biến đổi phải là một vector nằm trong ô Voronoi:

[ | ] ( )

i

i X v

cE x i  p x x (26)

Bộ lượng tử hóa Lloyd tương ứng với giải thuật phân cụm K Means. Phương pháp của - Hervé Jégouvà cộng sự sử dụng sẽ học bộ lượng tử sử dụng K-Means.

4.2.1.2. Bộ lượng tử hóa tích

Vector đầu vào x được chia thành m vector con phân biệt nhau x x1, ,...,2 xj

1 j mvới số chiều D*D m/ , với D là bội số của m. Những vector con này được

được lượng tử hóa một cách riêng biệt sử dụng m bộ lượng tử hóa khác nhau. Vì vậy,

vector đầu vào x được ánh xạ như sau:

* * 1 1 1 1 1 ( ) ( ) ,..., ,..., ,..., ( ( )),..., ( ( )) m D m m D D D u x u x x x x   xq u x q u x   (27)

Với qjlà bộ lượng tử ấp (low complexity quantizier) tương thích với vector th - con thứ j. Với bộ lượng tử qjtương ứng với tập chỉ mục Ij, codebook Cj và giá trị biến đổi tương ứng cj i, .

30

Giá trị biến đổi ủa bộ lượng tử c tích được xác định bởi một phần tử của tập chỉ

mục tích I   I1 I2 ... Im. Vì vậy, codebook được định nghĩa như là tích Đêcác:

1 2 ... m

CCC  C (28)

Trọng tâm của tập này chính là các trọng tâm ủa các bộ lượng tử hóa con ghép lại với c nhau. Giả sử rằng, tất cả các bộ lượng tử hóa con có k* hữu hạn các giá trị biến đổi, như vậy, tổng số trọng tâm ẽ l s à:

*

( )m

kk (29)

Với m = D, th ất cả các thì t ành phần của vector x được lượng tử hóa một cách riêng biệt, với trường ợp m=1, bộ lượng tử hóa tích ở thh tr ành codebook k-means thơng

thường. Ưu điểm của bộ lượng tử hóa tích là tập trọng tâm lớn được sinh ra ừ tập các t

trọng tâm nhỏ hơn tương ứng với bộ lượng tử con. Trong khi học bộ lượng tử con sử

dụng giải thuật Lloyd có sử dụng một tập giới hạn các vector nhưng codebook vẫn

thích nghi được với sự phân bố dữ liệu biểu diễn.

4.2.2. Tìm kiếm sử dụng lượng tử hóa

Việc tìm kiếm láng giềng ần nhất phụ thuộc duy nhất vào khoảng cách giữa g vector truy vấn và vector của cơ sở dữ liệu, hay tương đương với bình phương khoảng

cách. Phần này trình bày phương pháp tìm kiếm sử dụng lượng tử hóa (Searching with quantization)[12] để so sánh khoảng cách giữa hai vector dựa vào chỉ số lượng tử hóa

của chúng.

4.2.2.1. Tính tốn khoảng cách sử dụng m được lượng tử ã hóa

Hervé Jégou và cộng sự[12] sử dụng hai phương pháp để tính khoảng cách

Ơclit ấp xỉ giữa hai vector truy vấn x và vector cơ sở dữ liệu y x : phương pháp tính

tốn đối xứng (Symmetric distance computation SDC) và phương pháp tính tốn bất đối xứng. (Asymmetric distance computation ADC)

 Phương pháp tính tốn đối xứng : Vector x và y được biểu diễn thành các tr ng ọ

tâm riêng bi t q(x) và q(y). kho ng cách ệ ả d(x,y) được tính xấp xỉ bằng khoảng

cách giữa q(x) và q(y) : 2 ( , ) ( ( ), ( )) ( ( ), ( ))j j j d x y d q x q y  d q x q y (30) Với khoảng cách 2 ( ( ), ( ))j j

d q x q y được lấy ừ bảng t t ìm kiếm liên kết với bộ lượng tử

31

 Phương pháp tính tốn bất đối x ng : Vector truy vứ ấn x được giữ nguyên,

vector trong cơ sở ữ ệu được lượ d li ng t hóa thành q(y), kho ng cách gi a x và ử ả ữ y được tính xấp xỉ bằng : 2 ( , ) ( , ( )) ( ( ), ( ( )))j j j j d x y d x q y  d u x q u y (31) Với 2 , ( ( ),j j i)

d u x c : j=1,…,m và i=1,…,k* được tính trước để tìm ki m. ế

4.2.3. Tìm kiếm khơng tồn bộ

Trong phần trên trình bày phương pháp tìm kiếm láng giềng gần nhất sử dụng

bộ lượng tử hóa với hai phương pháp tính tốn đối xứng và tính tốn bất đối xứng.

Phương pháp này sử dụng m phép tính cộng cho mỗi lần tính khoảng cách. Tuy nhiên,

việc tìm kiếm vẫn phải diễn ra trên tồn bộ tập vector đặc trưng. Đối với các hệ thống

đa truy vấn, v ử dụng tập vector đặc trưng cục bộ cho để biểu diễn ảnh, th ố lượng à s ì s

vector đặc trưng là rất nhiều, việc tìm kiếm tốn rất nhiều bộ nhớ và thời gian. Hervé

Jégou và cộng sự ới thiệu phương pháp tính tốn khoảng cách bất đối xứng ựa tr gi d ên chỉ mục ngược (inverted file asymmetric distance computation (IVFADC)) để tránh

việc tìm kiếm trên tồn bộ tập vector đặc trưng.

4.2.3.1. Lượng tử hóa thơ, danh sách chỉ mục ngược

Bộ lượng tử hóa thơ là một mảng các danh sách : L1....Lk'. Nếu Y l ập vector à t cần đánh chỉ mục, danh sách Li sẽ tương ứng với trọng tâm ci của qclưu trữ tập: yY q y: ( )cci. Với một danh sách chỉ mục ngược, truy vấn được gán vào w vị trí chỉ mục phù hợp với w láng giềng gần nhất của x trong codebook qc. Tất cả các danh sách chỉ mục ngược phù hợp được xem xét.

4.2.3.2. Xác định cục bộ m ượng ã l tử tích

Gọi r(x) là vector dư (residual vector) được lượng tử hóa từ trọng tâmq xc( )tương ứng

với vector x, r(x) được định nghĩa :

( ) c( )

r x  x q x (32)

Gọi qplà bộ lượng tử hóa tích để m hóa vector dư r(x), vector x được biểu diễn bởi ã tuple ( ( ),q x q r xc p( ( ))), với q r xp( ( ))được lưu trong danh sách chỉ mục ngược tương ứng

với x. Khoảng cách giữa vector truy vấn x và vector trong cơ sở dữ liệu y được tính xấp xỉ: 2 2 ( , ) ( ( ( )), ( ( ( )))) i j c p j c j d x y d u x q xq u yq y (33)

32 Với

i

p

q là bộ lượng tử hóa con thứ i. Cũng giống như phương pháp ADC, với mỗi bộ

lượng tử hóa con

i

p

q , khoảng cách giữa vector dư u x q xj(  c( )và tất cả các trọng tâm

,

j i

c của

i

p

q được tính tốn sơ bơ và lưu trữ lại.

4.2.3.3. Cấu trúc chỉ mục và thuật tốn tìm kiếm

 Đánh chỉ mục vector y :

1. Lượng t hóa y thành ử q yc( )

2. Tính tốn vector dư r y( ) y q yc( )

3. Lượng tử hóa vector dư r(y) thành q r yp( ( ))để th c hiự ện lượng t hóa ử

tích b ng cách gán ằ u yj( ) thành q u yj( ( ))j v i j = 1, …,m ớ

4. Lưu trữ các vector đặc trưng và mã biểu diễn chỉ mục lượng tử hóa tích trong m t m c c a danh sách ch mộ ụ ủ ỉ ục ngược.

 Tìm ki m các láng giế ềng g n nh t c a truy v n x : ầ ấ ủ ấ

1. Lượng t hóa x thành w láng gi ng gử ề ần nh t trong codebook q ấ c

2. Tính tốn bình phương khoảng cách 2

,

( ( ( )),j j i)

d u r x c cho mỗi lượng tử

hóa con j và m i tr ng tâm ỗ ọ cj i, c a nó. ủ

3. Tính bình phương khoảng cách giữa r(x) và tất cả các vector chỉ m c ụ

trong danh sách ch mỉ ục ngược.

4. Lựa ch n k lân c n gọ ậ ần nhất c a x dủ ựa vào đánh giá khoảng cách s ử

33 Mơ hình hệ thống IVFADC :

Hình 14. Mơ hình hệ thống IVFADC

Hệ thống bên trái: chèn một vector vào danh sách chỉ mục ngược; hệ thống bên phải: tìm kiếm k láng giềng gần nhất.

Một phần của tài liệu (TIỂU LUẬN) PHƯƠNG PHÁP TRÍCH CHỌN đặc TRƯNG ẢNH TRONG THUẬT TOÁN học máy t ếm ẢNH áp ìm KI DỤNG v ếm sản PHẨM (Trang 37 - 42)

Tải bản đầy đủ (PDF)

(55 trang)