Kỹ thuật biểu diễn và tra cứu ảnh hiệu quả

Một phần của tài liệu nghiên cứu phương pháp biểu diễn và tra cứu ảnh hiệu quả ứng dụng trong tra cứu ảnh phong cảnh (Trang 44 - 73)

2.4.1 Lƣợc đồ màu dải

Với ảnh đƣợc lƣợng hoá thành C màu (trong không gian màu RGB) và ảnh chia thành m x m khối ảnh có kích thƣớc bằng nhau. Một lƣợc đồ màu theo màu c (0< c<=C) là một tập hợp m x m dải. Ở đây, dải của lƣợc đồ màu khối là số điểm ảnh trong 1 khối ảnh mà có chung màu và các giá trị dải đƣợc mô tả bởi hàm

p(bk) =

n nk

Với bk là khối ảnh thứ k của ảnh (0<k<m x m). nk là số các điểm ảnh có màu c trong khối bk. n là tổng các điểm trong ảnh.

Trong cách biểu diễn này, một ảnh đƣợc cấu tạo bởi  màu sẽ đƣợc mô tả bởi

 lƣợc đồ màu khối, mỗi lƣợc đồ màu khối mô tả phân bố không gian của một màu trong ảnh. Nếu một màu không xuất hiện trong một ảnh thì không có lƣợc đồ màu khối đƣợc lƣu trữ.

So sánh điều này với trƣờng hợp sử dụng cách tiếp cận dựa vào lƣới, ở đây cách tiếp cận cần lƣu trữ IJ lƣợc đồ, mỗi lƣợc đồ có C dải, không để ý tới bao nhiêu màu xuất hiện thực tế trong ảnh. Cả CCH và cách tiếp cận dựa vào lƣới có thể lƣu trữ cùng lƣợng thông tin, nhƣng lƣợng lƣu trữ đòi hỏi bởi CCH là nhỏ hơn nhiều so với cách tiếp cận dựa vào lƣới. Hình 2.2 minh hoạ cho điều này, chỉ ra một ảnh ba màu với lƣới 3 x 3 và CCH tƣơng ứng của nó.

Xác định khoảng cách giữa hai ảnh:

Khoảng cách giữa 2 ảnh truy vấn hI1 và ảnh CSDL hI2 đƣợc xác định dựa trên độ đo khoảng cách L1 D ( hI 1[i], hI 2[i]) =          m m j I I i j h i j h 1 2 1 (2-3) Ở đây: hI  i j 1 và hI   i j

2 biểu diễn dải thứ j của lƣợc đồ màu khối thứ i đƣợc sử dụng để biểu diễn ảnh truy vấn hI1và ảnh CSDL hI2.

Để chuẩn hoá kết quả thu đƣợc với khoảng cách L1, kết quả thu đƣợc sẽ đem chia cho tổng diện tích của các vùng đƣợc mô tả bởi mỗi lƣợc đồ (aI  i

1 + aI  i

2 ).

Các diện tích này cũng đƣợc chuẩn hoá với các cỡ của ảnh. Khoảng cách đƣợc chuẩn hoá Dn :

Dn(hI 1[i], hI 2[i]) =      i a  i a i h i h D I I I I 2 1 2 1 , ) (  (2-4)

2.4.2 Phƣơng pháp tra cứu dựa vào lƣợc đồ màu khối 2.4.2.1 Giới thiệu 2.4.2.1 Giới thiệu

Lƣợc đồ màu toàn cục GCH là một kỹ thuật áp dụng các đặc trƣng màu đơn giản và hiệu quả. Kỹ thuật này có ƣu điểm bất biến với quay, tỷ lệ và tính toán rất đơn giản. Tuy nhiên, kỹ thuật này chỉ đem sự phân bố của các màu vào bản miêu tả ảnh mà không quan tâm đến các quan hệ của các màu và vị trí không gian của các màu trong ảnh [30, 31, 32, 33].

Để khắc phục hạn chế của GCH, lƣợc đồ màu cục bộ LCH đã đƣợc đề xuất. Với LCH, một ảnh đƣợc chia thành một số khối có kích cỡ bằng nhau và khoảng cách giữa hai ảnh là tổng các khoảng cách lƣợc đồ của các khối tƣơng ứng. Tuy nhiên, phƣơng pháp này sử dụng nhiều không gian để lƣu trữ các lƣợc đồ màu biểu diễn ảnh và không có khả năng xử lý đối với các biến đổi hình học nhƣ quay và dịch chuyển [34] và biến đổi vị trí không gian.

Để giảm chi phí không gian lƣu trữ các lƣợc đồ màu biểu diễn ảnh của LCH, phƣơng pháp CCH [26] đƣợc đề xuất. Tuy nhiên, phƣơng pháp này cũng không có khả năng xử lý đối với các biến đổi hình học nhƣ quay và dịch chuyển, do CCH chỉ so sánh mỗi khối ảnh của ảnh truy vấn với khối ảnh cùng màu và cùng vị trí trong ảnh CSDL. Vì vậy, khi ảnh bị quay hoặc dịch chuyển, nó không cho kết quả tốt. Ví dụ 2.1 ở dƣới minh họa cho điều này.

Ví dụ 2.1. Xét ảnh I và ảnh I’ đƣợc cho trong Hình 2.3, ảnh I’ là kết quả của việc điều chỉnh ảnh I quay một góc 900.

a/ Ảnh I b/ Ảnh I’

Hình 2.3. Ảnh I và ảnh I’.

Phƣơng pháp CCH thực hiện tính khoảng cách giữa hai ảnh II’ nhƣ sau: Đầu tiên, lƣợc đồ màu khối theo màu black và white của ảnh II’ đƣợc tính nhƣ đƣợc chỉ ra trong Hình 2.4 và Hình 2.4 tƣơng ứng.

Hình 2.4. Lƣợc đồ màu khối theo màu black và white biểu diễn ảnh I.

Tiếp theo, khoảng cách giữa ảnh II’ theo màu black và white đƣợc thực hiện nhƣ chỉ ra trong Hình 2.6 và Hình 2.7.

Hình 2.6. Tính khoảng cách của ảnh I và I’ theo màu black. (adsbygoogle = window.adsbygoogle || []).push({});

Tính khoảng cách của ảnh II’ theo màu black. Khoảng cách này có giá trị:

0.5 | 0 - 0.25 | | 0.25 - 0 | | 0.25 - 0 | | 0 - 0.25 | ) I' (I, Dn black     2 .

Hình 2.7. Tính khoảng cách của ảnh I và I’ theo màu white.

Tính khoảng cách của ảnh II’ theo màu white. Khoảng cách này có giá trị:

0.5 2 | 0.25 - 0 | | 0 - 0.25 | | 0 - 0.25 | | 0.25 - 0 | ) I' (I, Dn white    

Khoảng cách giữa ảnh II’: Dn(I,I' )Dn(I,I" )blackDn(I,I" )white1

2.4.2.2 Phƣơng pháp tra cứu HG

Phƣơng pháp [25] tính lƣợc đồ màu khối đối với mỗi màu của ảnh truy vấn và ảnh CSDL. Sau đó, tính khoảng cách của ảnh truy vấn và ảnh CSDL theo mỗi màu thông qua đồ thị hai phía có trọng số. Trong đồ thị này, mỗi đỉnh ở phía bên trái của đồ thị là một dải của lƣợc đồ màu khối theo màu của ảnh truy vấn, mỗi đỉnh ở phía bên phải của đồ thị là một dải của lƣợc đồ màu khối có màu tƣơng ứng của ảnh CSDL. Cuối cùng, tính tổng khoảng cách của ảnh truy vấn và ảnh CSDL theo tất cả các màu và giá trị này đƣợc coi là khoảng cách giữa hai ảnh.

Nội dung thuật toán HG:

Thuật toán HG[25] trả lại khoảng cách của hai ảnh I1I2.

Trong thuật toán HGở trên, tham số C1 là số màu của ảnh I1, C2 là số màu của ảnh I2C là số màu của hai ảnh I1I2. H(I1, c1, n) là lƣợc đồ màu khối theo màu

c1 của ảnh I1 gồm n×n dải. H(I2, c2, n) là lƣợc đồ màu khối theo màu c2 của ảnh I2

gồm n×n dải. G(X, Y, E, c) là đồ thị gồm 2n2 đỉnh, trong đó n2 đỉnh ở phía bên trái tƣơng ứng với n×n dải của lƣợc đồ màu khối H(I1, c, n) và n2 đỉnh ở phía bên phải

Thuật toán HG(I1, I2, n)

Vào: ảnh I1I2 với cỡ n×n khối ảnh

Ra: D - khoảng cách giữa hai ảnh I1I2

1. For mỗi c1 in C1 do 1.1 Tính H(I1, c1, n) 2. For mỗi c2 in C2 do 2.1 Tính H(I2, c2, n) 3. For mỗi c in C do 3.1 Xây dựng đồ thị G(X, Y, E, c) gồm 2n2 đỉnh 3.2 DD + MCM(G(X, Y, E, c), n) 4. Trả lại giá trị D

tƣơng ứng với n×n dải của lƣợc đồ màu khối H(I2, c, n). Hàm MCM( , ) trả lại khoảng cách giữa hai ảnh theo màu c đã cho.

Đầu tiên, thuật toán HG lƣợng hoá các màu của ảnh truy vấn và ảnh CSDL và tập màu này đƣợc ký hiệu là C. Sau đó HG chia ảnh thành các khối ảnh có kích cỡ bằng nhau, xây dựng lƣợc đồ màu khối cho mỗi màu c (0<cC). Trong lƣợc đồ màu khối này, mỗi dải của lƣợc đồ màu khối theo màu c chỉ ra số điểm ảnh có màu c

trong khối ảnh tƣơng ứng. Khi xây dựng đồ thị hai phía có trọng số G(X,Y,E,c) theo màu c, mỗi dải của lƣợc đồ màu khối tƣơng ứng với một đỉnh. Trong đồ thị G(X,Y,E,c), trọng số của mỗi cạnh nối hai đỉnh là khoảng cách giữa hai đỉnh và khoảng cách giữa hai ảnh theo màu c là giá trị đối sánh cực tiểu trên đồ thị này. Do đó, khoảng cách giữa hai ảnh có thể đƣợc tính bằng tổng tất cả các khoảng cách giữa hai ảnh của tất cả các màu cC. Chẳng hạn, nếu ảnh truy vấn và ảnh CSDL đƣợc lƣợng hoá thành ba màu (black, gray và white) và mỗi ảnh đƣợc chia thành bốn khối ảnh thì chúng ta sẽ thu đƣợc ba đồ thị hai phía có trọng số G(X,Y,E,black), G(X,Y,E,gray) và G(X,Y,E,white) tƣơng ứng. Mỗi đồ thị này sẽ gồm tám đỉnh, bốn đỉnh ở phía bên trái của đồ thị tƣơng ứng với bốn dải của lƣợc đồ màu khối của ảnh truy vấn và bốn đỉnh ở phía bên phải tƣơng ứng với bốn dải của lƣợc đồ màu khối của ảnh CSDL. Tiếp theo, để tính khoảng cách giữa ảnh truy vấn và ảnh CSDL, chúng ta lần lƣợt tính khoảng cách của từng màu black, gray và white thông qua các đồ thị G(X,Y,E,black), G(X,Y,E,gray) và G(X,Y,E,white) tƣơng ứng và tính tổng khoảng cách theo các màu black, gray và white này.

Đầu tiên, hàm MCM tính trọng số của tất cả các cạnh trong đồ thị G(X,Y,E,c).

Sau đó, hàm tìm giá trị đối sánh cực tiểu của đồ thị G(X, Y, E, c) thông qua thuật toán Hungarian [27]. Cuối cùng, hàm tính tổng giá trị các cạnh thuộc đối sánh và khoảng cách này là khoảng cách của ảnh I1I2 theo màu c.

Trong hàm MCM có sử dụng công thức:

w(i,j) h [c][i] h [c][j]

2

1 I

I  (2-5)

Trong công thức này [ ][ ]

1 c i

hI biểu diễn dải thứ i của lƣợc đồ theo màu c của ảnh truy vấn I1 và [ ][ ] (adsbygoogle = window.adsbygoogle || []).push({});

2 c j

hI biểu diễn dải thứ j của lƣợc đồ theo màu c của ảnh CSDL I2.

2.5 Kết luận chƣơng 2

Đóng góp chính của chúng tôi trong chƣơng này là sự biến đổi đơn giản nhƣng rất hiệu quả. Theo cách hiểu của chúng tôi, nó là bản gốc theo cách mà các tính năng thị giác đƣợc mã hóa. Động lực của chúng tôi là giảm chi phí không gian của các phƣơng pháp tiếp cận dựa trên phân vùng. Trên thực tế là chỉ có một số lƣợng tƣơng đối thấp của các giá trị riêng biệt của một tính năng thị giác có mặt trong hầu

Hàm MCM (G(X, Y, E, c), n)

Vào: G(X, Y, E, c)- đồ thị theo màu c của ảnh I1I2 gồm 2n2 đỉnh

Ra: costc - khoảng cách theo màu c giữa ảnh I1I2

1. For i1 to n× n do For j1 to n× n do w(i,j)  [ ][ ] [ ][ ] 2 1 c i h c j hII

2. MGiá trị đối sánh cực tiểu của G(X, Y, E, c)

3. For mỗi (i,j)M do

costccostc + w(i,j) 4. Trả lại giá trị costc

hết các hình ảnh. Đặc biệt, chúng tôi sử dụng các tính năng màu sắc để xác minh ý tƣởng. Chúng tôi cũng đề xuất một số liệu tƣơng tự dựa trên các số liệu từ xa.

Các kết quả thử nghiệm chúng tôi có đƣợc xác nhận tiềm năng và tính linh hoạt của cách tiếp cận CCH, HG so với phƣơng pháp tiếp cận truyền thống toàn cầu và các phân vùng trên lƣới để có thể nhấn mạnh hiệu quả thu hồi, giảm chi phí không gian.

CHƢƠNG 3. HỆ THỐNG TRA CỨU ẢNH DỰA VÀO NỘI DUNG SỬ DỤNG BIỂU DIỄN HIỆU QUẢ

3.1 Giới thiệu bài toán tra cứu ảnh phong cảnh

Ngày nay với sự phát triển mạnh mẽ của công nghệ thông tin ngƣời ta đã có thể thu thập đƣợc bộ ảnh phong cảnh theo mục đích nào đó. Tuy nhiên khi cơ sở dữ liệu trên Internet có kích cỡ cực lớn thì việc thu thập này trở nên cực kỳ khó khăn. Để giải quyết vấn đề này chúng ta có thể sử dụng công nghệ tra cứu ảnh dựa vào nội dung để tìm ra những ảnh phong cảnh tƣơng tự với ảnh truy vấn nhất. Các kết quả tìm đƣợc sẽ giúp ngƣời sử dụng nhanh chóng thực hiện đƣợc mục tiêu của mình. Vấn đề làm thế nào xác định đƣợc một tập các ảnh phong cảnh tƣơng tự với một ảnh mà ngƣời sử dụng đã biết là không dễ dàng, ngay cả việc số lƣợng ảnh trong tập ảnh cơ sở dữ liệu không lớn.

Mặt khác, hiện nay hầu hết các quốc gia đều coi phát triển du lịch là một trong các ƣu tiên lớn. Trong phát triển dịch vụ du lịch, các quốc gia phải quảng bá về phong cảnh của các di tích lịch sử, các bãi biển, các hang động, ….trên internet. Khi một du khách có nhu cầu đi tham quan du lịch, họ phải tìm kiếm các nơi có phong cảnh phù hợp với sở thích. Nếu có một công cụ cho phép tìm kiếm trong các cơ sở dữ liệu ảnh của các danh lam thắng cảnh những ảnh tƣơng tự với ảnh mẫu nhất thì công cụ đó sẽ có thể giúp tìm ra những nơi mà du khách có thể lựa chọn dễ dàng hơn.

Từ những thực tế trên đặt ra một bài toán tra cứu ảnh phong cảnh nhƣ sau: tìm trong một cơ sở dữ liệu ảnh phong cảnh những ảnh có nội dung (màu sắc, hình dạng, kết cấu) giống với một ảnh phong cảnh mẫu nhất, sau đó phân hạng theo thứ tự giảm dần của độ tương tự.

Với mục đích là lƣu trữ hình ảnh của các phong cảnh nên thông thƣờng mỗi ảnh phong cảnh thƣờng có nhiều vùng và có màu sắc khá phong phú.

Chúng ta cũng nhận thấy rằng để so sánh, phân loại ảnh phong cảnh thì hai đặc điểm quan trọng nhất là màu sắc và thông tin không gian của các vùng trong ảnh.

Từ những phân tích trên có thể áp dụng một số giới hạn sau với bài toán tra cứu ảnh phong cảnh:

Nhiệm vụ của bài toán là xây dựng hệ thống tra cứu ảnh phong cảnh có một số các chức năng sau:

o Khi ngƣời sử dụng cung cấp một ảnh phong cảnh mẫu cần tra cứu. Hệ thống có nhiệm vụ tìm kiếm trong một cơ sở dữ liệu ảnh đã có và cho ra một danh sách tất cả các ảnh tƣơng tự nhƣ ảnh mẫu theo thứ tự ảnh nào tƣơng tự với ảnh mẫu hơn thì đƣợc phân hạng ở phía trên.

o Ngƣời sử dụng có thể thiết lập khoảng cách ngƣỡng tƣơng tự cho từng lần tra cứu (chƣơng trình chỉ trả lại các kết quả mà khoảng cách giữa ảnh kết quả và ảnh mẫu không vƣợt quá ngƣỡng).

Hoặc ngƣời sử dụng có thể qui định số lƣợng ảnh kết quả trả lại.

3.3 Thiết kế hệ thống

Hệ thống đƣợc mô tả tổng quát nhƣ sau:

Từ một cơ sở dữ liệu ảnh cho trƣớc, ta tiến hành trích rút các đặc trƣng của các ảnh và lƣu trữ trong cơ sở dữ liệu đặc trƣng.

Ngƣời sử dụng đƣa vào một ảnh truy vấn, các đặc trƣng của ảnh truy vấn này đƣợc tập hợp thành các véc tơ đặc trƣng. Sau đó, hệ thống tiến hành so sánh các véc tơ đặc trƣng này với các đặc trƣng trong cơ sở dữ liệu đặc trƣng để từ đó tìm ra độ tƣơng tự. Tra cứu nào cho độ tƣơng tự cao nhất thì chúng ta đƣợc kết quả tốt nhất. Tức là kết quả tìm đƣợc là giống nhất với ảnh truy vấn ban đầu.

Hình 3.1 Mô hình hệ thống tra cứu ảnh hiệu quả. (adsbygoogle = window.adsbygoogle || []).push({});

3.4 Mô tả chƣơng trình

3.4.1 Khái quát về chƣơng trình

Chƣơng trình đƣợc xây dựng với mục đích tra cứu ảnh phong cảnh dựa trên đặc trƣng màu. Phƣơng pháp HG đƣợc sử dụng nhằm mục đích tra cứu hiệu quả nhất.

Không gian màu sử dụng trong chƣơng trình là không gian màu RGB, do khuôn dạng của không gian màu RGB là định dạng phổ biến nhất của ảnh số. Với việc lƣợng hóa 3 kênh màu R (Red), G (Green), B (Blue) từ 256 giá trị giảm xuống còn 3 giá trị cho mỗi kênh màu tƣơng ứng tạo thành 27 màu đơn tổ hợp từ 3 kênh màu đó sẽ làm giảm không gian lƣu trữ trong cơ sở dữ liệu và tăng tốc độ tra cứu của hệ thống. Cơ sở dữ liệu đặc trƣng Trích rút đặc trƣng Xác định tƣơng tự đặc trƣng Ảnh truy vấn Véc tơ đặc trƣng Các ảnh đƣợc tra cứu Cơ sở dữ liệu

Một phần của tài liệu nghiên cứu phương pháp biểu diễn và tra cứu ảnh hiệu quả ứng dụng trong tra cứu ảnh phong cảnh (Trang 44 - 73)