Biểu diễn và trích rút đặc trƣng

Pha tiếp theo là trích rút đặc trƣngmỗivùng trong ảnh, nơi mà các ảnh sau khi đã phân cụm đã đƣợc phân tích và dựa vào đó ta xây dựng đƣợc một véc tơ đặc trƣngcho mỗi vùng. Vị trí không gian, màu đặc trƣng và cỡ của các vùng ảnh đƣợc bao gồm trong véc tơ đặc trƣng.

2.3.3.1 Trích rút màu

Một trong những đặc trƣng hiệu quả nhất trợ giúp trong việc phân biệt một ảnh với ảnh khác là màu. Nhƣ đã đƣợc đề cập ở phần trên, vấn đề với thuật toán phân cụm hay phân đoạn là một tập các tham số nên không thể áp dụng đối với tất cả các ảnh trong cơ sở dữ liệu, đặc biệt khi xét tập ảnh thuần nhất. Vấn đề càng quan trọng nếu một số đối tƣợng có biểu diễn chi tiết hơn các đối tƣợng còn lại. Biểu diễn đặc trƣng màu của từng vùng bởi các giá trị R, G, B tƣơng ứng của từng vùng là các giá trị R, G, B xuất hiện nhiều nhất trong vùng đó.

2.3.3.2 Trích rút các đặc trƣng khác

Ngoài màu, các đặc trƣng khác của vùng trong ảnh cũng đƣợc trích rút. Vị trí không gian của mỗi vùng đƣợc biểu thị bởi trọng tâm của mỗi vùng. Các toạ độ x và y

Cỡ của mỗi vùng là tổng số các pixel trong vùng. Sau đó, cỡ đƣợc chuẩn hoá theo cỡ của ảnh gốc. Cỡ của mỗi vùng i trong ảnh I là một giá trị giữa 0 và 1 đƣợc biểu thị là A(i).

2.4 Độ đo tƣơng tự

Tiếp theo chúng ta so sánh ảnh mẫu truy vấn với các ảnh trong cơ sở dữ liệu, muốn so sánh các ảnh thì phải dựa vào độ đo khoảng cách giữa các đặc trƣng đã trích rút của ảnh mẫu với tập ảnh cơ sở dữ liệu.Độ đo khoảng cách là một trong những mục chính trong quá trình tra cứu ảnh mà quyết định độ chính xác và tốc độ của kỹ thuật tra cứu ảnh.

Trong trƣờng hợp tra cứu sử dụng các vùng của ảnh, quan trọng là để chọn một độ đo tƣơng tự mà mạnh đối với phân cụmcó thể chƣachính xác,và độ đo đồng hành với tƣơng nhận thức của con ngƣời và có thể dễ tính toán. Do các ảnh đƣợc phân rã thành các vùng tƣơng ứng của chúng, sự tƣơng tự giữa hai ảnh trong thực tế là sự tƣơng tự giữa các vùng hợp thành của chúng. Nhƣ đã đề cập trong phần trƣớc, mỗivùng đƣợc biểu diễn bởi vị trí không gian, màu và cỡ. Do đó, để so sánh hai vùng, các đặc trƣng tƣơng ứng của nó sẽ đƣợc so sánh.

Khoảng cách giữa các thành phầnmàu và vị trí không gian của hai vùngi của ảnh

A và j của ảnh B, đƣợc tính toán bằng khoảng cách Euclid giữacác màu, tâm của hai vùng. Điều này đƣợc chỉ ra nhƣ sau:

2 2 )) ( ) ( ( )) ( ) ( ( ) , (i j X i X j Y i Y j DS    

Ở đây X(i) và Y(i) là các toạ độ x và y của các tâm vùng.

2 2 2 )) ( ) ( ( )) ( ) ( ( )) ( ) ( ( ) , (i j R i R j G i G j B i B j DC      

R(i), G(i), B(i) là các giá trị xuất hiện nhiều nhất trong vùng của các thành phần màu R, G, B.

Áp dụng các công thức đã trình bày ở trên ta đã đo đƣợc khoảng cách giữa vị trí không gian và màu từng vùng của ảnh. Nhƣng để phân biệt sự sai khác giữa các vùng, chúng ta cần một độ đo khoảng cách chung (có thể thu đƣợc bởi việc kết hợp hai khoảng cách này). Khoảng cách giữa hai vùng i và j của các ảnh A và Blà 𝑅𝑑 𝐴, 𝐵, 𝛼 đƣợc định nghĩa bởi:

𝑅𝑑 𝐴, 𝐵, 𝛼 = 𝛼 × 𝐷𝑐 + 1 − 𝛼 × 𝐷𝑆

𝐷𝑐 là khoảng cách màu giữa hai vùng

𝐷𝑠 là khoảng cách vị trí không gian giữa hai vùng

Để đo khoảng cách giữa hai ảnh, đối sánh vùng tích hợp (IRM) đƣợc đề xuất trong [7] đƣợc sử dụng trong hệ thống. Ý tƣởng chính của độ đo IRM là để đối sánh các ảnh hoàn chỉnh. Các khoảng cách vùng giữa tất cả các cặp vùng trong hai ảnh đƣợc tính. Hai vùng tƣơng tự nhất (khoảng cách vùng trong ảnh đƣợc so sánh là tối thiểu) đƣợc đối sánh hoàn chỉnh, nếu các vùng có cùng cỡ, ngƣợc lại đối sánh một phần xuất hiện và phần chƣa đối sánh đƣợc đối sánh với vùng khác. Quá trình này đƣợc lặp cho đến khi tất cả các vùng đƣợc đối sánh hoàn chỉnh. Độ đo IRM tính toán khoảng cách d(A, B,𝛼 ) giữa hai ảnh A với m vùng và B với n vùng đƣợc tính nhƣ sau:

Thuật toán tính khoảng cách giữa hai ảnh A và B

Đầu vào: Các véc tơ đặc trưng vùng của ảnh A và B

Đầu ra: Khoảng cách d(A, B, α )

1. For mỗi cặp vùng 𝑨𝒊 ∈ 𝑨 và 𝑩𝒋 ∈ 𝑩

1.1 𝐴𝑖. 𝑠𝑡𝑎𝑡𝑢𝑠 = 0

1.2 𝐵𝑗. 𝑠𝑡𝑎𝑡𝑢𝑠 = 0

1.3Tính khoảng cách 𝐷𝐴𝑖𝐵𝑗 = 𝑅𝑑 𝐴, 𝐵, 𝛼

2. Sắp xếp tất cả các khoảng cách theo thứ tự tăng dần 3. 𝜷 = 𝟎 4. For tất cả các khoảng cách 𝑫𝑨𝒊𝑩𝒋đã đƣợc sắp xếp do If 𝐴𝑖. 𝑠𝑡𝑎𝑡𝑢𝑠 = 𝐵𝑗. 𝑠𝑡𝑎𝑡𝑢𝑠 = 0 If 𝐴𝑖. 𝑠𝑖𝑧𝑒 < 𝐵𝑗. 𝑠𝑖𝑧𝑒 𝜔 = 𝐴𝑖. 𝑠𝑖𝑧𝑒 𝐵𝑗. 𝑠𝑖𝑧𝑒 = 𝐵𝑗. 𝑠𝑖𝑧𝑒 − 𝐴𝑖. 𝑠𝑖𝑧𝑒 𝐴𝑖. 𝑠𝑡𝑎𝑡𝑢𝑠 = 1 Else 𝜔 = 𝐴𝑖. 𝑠𝑖𝑧𝑒 𝐵𝑗. 𝑠𝑖𝑧𝑒 = 𝐵𝑗. 𝑠𝑖𝑧𝑒 − 𝐴𝑖. 𝑠𝑖𝑧𝑒 𝐵𝑗. 𝑠𝑡𝑎𝑡𝑢𝑠 = 1 If 𝐴𝑖. 𝑠𝑖𝑧𝑒 = 0 then B𝑗. 𝑠𝑡𝑎𝑡𝑢𝑠 = 1

Hình2.5: Thuật toán tính khoảng cách giữa hai ảnh

Quá trình tính toán độ đo IRM đòi hỏi thời gian bậc hai do cần so sánh tất cả các vùng ảnh của ảnh A với tất cả các vùng của ảnh B. Với mỗi ảnh truy vấn, các đặc trƣng vùng đã trích rút đƣợc so sánh với siêu dữ liệu của tất cả các ảnh trong cơ sở dữ liệu sử dụng công thức khoảng cách và sau đó sử dụng độ đo IRM, các độ đo khoảng cách ảnh đƣợc tính. Sau khi thu nhận các độ đo khoảng cách, các ảnh cơ sở dữ liệu đƣợc phân hạng theo thứ tự độ đo khoảng cách tăng dần.

Kỹ thuật phân cụm ảnh