Quá trình lập chỉ mục và truy vấn

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Tra cứu ảnh dựa trên lưới và ứng dụng (Trang 48 - 52)

3.3.2.1 Chỉ mục màu sắc

Nhằm cung cấp (cách thức) truy cập dễ dàng và nhanh chóng, các siêu dữ liệu nói chung phải được lưu trữ trong các cấu trúc chỉ mục phù hợp. Cấu trúc logic được sử dụng để lưu diện tích tiêu chuẩn và khoảng không giữa các vùng hoặc đối tượng trong ảnh. Trước tiên chúng ta sẽ tìm hiểu về cấu trúc chỉ số đa chiều.

Cấu trúc chỉ mục chỉ mục đa chiều đa mức dựa trên việc phân đoạn và cấu trúc cây R-tree được sử dụng để lưu trữ hình ảnh. Cấu trúc này sử dụng kĩ thuật cắt tỉa để tăng tốc độ tìm kiếm. hình 3.10 mô tả cấu trúc hai mức đầy đủ như sau:

Hình 3.10: Cấu trúc chỉ mục.

Mức đầu tiên là phân loại (phân lớp) vùng trội. Ảnh vớii các vùng màu trội tương tự được đưa vào cùng một phân vùng. Nó cho phép tỉa ảnh thuộc các lớp sẽ không bao giờ thỏa mãn một truy vấn để thu hẹp không gian tra cứu. Tổng số các mẫu/lớp được đưa ra bởi công thức:

! )! ( ! k k n n Ck n   (3.5)

Với n là số lượng các vùng hoặc các đối tượng (khác nhau), k là số lượng vùng màu/đối tượng trội được lựa chọn.

Mức thứ hai là một cấu trúc cây đa R-tree đa chiều được dùng để cắt tỉa các vùng trong ảnh trong một phân đoạn dựa trên mối quan hệ không gian. Mỗi nút chứa các đặc trưng trong một vùng đoạn cùng với hình chữ nhật bao quanh vùng đó. Một nút là trỏ tới một địa chỉ trong cơ sở dữ liệu chứa dữ liệu hình ảnh. Dữ liệu hình ảnh chứa định danh (ID) của một đối tượng và các tham số cần thiết khác cho truy vấn.

Từ đó ta đi xác định chỉ số màu sắc như sau:

Một chỉ số tổng hợp được tạo từ các chỉ số trong bảng tra cứu màu. Chúng ta lựa chọn bảng màu gồm 25 màu. Một chỉ số duy nhất được hình thành dựa trên 25 màu và được tính toán như sau:

    ni n i C Index 1 1 25 * (3.6)

Trong đó, n là số lượng vùng màu trội, Ci là các chỉ số đại diện cho vùng màu trội thứ i.

Giả sử C1, C2, C3 là các chỉ số màu sắc của 3 vùng màu trội được tìm thấy trong ảnh; với C1 đại diện cho vùng màu trội thứ nhất, C2 đại diện cho vùng màu trội thứ hai và C3 đại diện cho vùng màu trội thứ ba.

Khi đó, chỉ số được đưa ra bởi công thức: 0 3 1 2 2 1*25 C *25 C *25 C Index   (3.7)

Các đặc trưng như các thành phần màu (RGB), diện tích chuẩn của vùng và vị trí tương đối của vùng được lưu trữ cùng với chỉ mục ảnh. Các ảnh với chỉ mục tương tự đều được nhóm lại với nhau và lưu trữ như một loạt các ảnh.

Sự giống nhau và khác nhau phụ thuộc vào sự khác biệt trong các độ đo nổi bật hay các đặc trưng được lưu trữ cùng với ảnh. Một ví dụ về xây dựng bảng băm được chỉ ra trong hình 6. Giả sử chỉ mục là “28”, tất cả các ảnh với các vùng chứa màu thứ nhất và màu thứ 3 trong bảng tra cứu màu tương ứng được ánh xạ và lưu trữ như một cụm ảnh. Mỗi ảnh được lưu giữ lại đường dẫn ảnh và hai trường thông tin.

Hình 3.11: Ví dụ về bảng băm.

3.3.2.2 Chỉ mục hình dạng

Với mỗi vùng màu được tìm thấy ở trên, ta thực hiện tính toán: 1. Tìm trục chính và trục phụ của mỗi vùng màu.

2. Xoay vùng hình dạng để đưa trục chính về trục X để đạt được góc xoay chuẩn và co dãn sao cho độ dài trục chính không quá 192 điểm ảnh.

3. Phủ lưới có kích thước cố định (96*96 điểm ảnh) lên vùng màu chuẩn và lấy chuỗi nhị phân bằng cách gán giá trị 1 và 0 tương ứng.

4. Sử dụng chuỗi nhị phân, tính toán véc tơ tổng theo số hàng và số cột. Véc tơ tổng cùng với độ lệch tâm tạo ra chỉ mục hình dạng cho vùng.

3.3.2.3 Truy vấn

Đối với một ảnh truy vấn, áp dụng chung một quy trình để đạt được các đặc trưng màu sắc và hình dạng. Để gán màu sắc tương ứng, sử dụng cả truy vấn bằng mẫu và truy vấn bằng đặc trưng. Các mô-đun gán tương thích hình dạng chỉ hỗ trợ truy vấn bằng mẫu. Dựa trên các chỉ mục màu của hình ảnh truy vấn, một danh sách các hình ảnh phù hợp được tìm từ cấu trúc băm. Sau đó, các bộ mô tả hình ảnh được sử dụng để tìm kiếm các ảnh phù hợp từ tập khởi tạo này để tìm kiếm các hình ảnh cuối cùng phù hợp cả về màu sắc và hình dạng.

Quy trình truy vấn được thực hiện qua các bước:

1. Ảnh truy vấn được xử lý để có được danh sách các ảnh phù hợp với đặc trưng màu sắc.

2. Với mỗi vùng màu trong ảnh truy vấn ta biểu diễn vùng hình dạng. Cần lưu lại chỉ mục của 4 ảnh tương ứng với vùng hình dạng khi thực hiện quay 180 độ và lật theo chiều ngang, lật theo chiều dọc.

3. So sánh chỉ mục vùng của ảnh truy vấn với danh sách các ảnh nhận được dựa vào màu sắc.

4. Chỉ các vùng có độ lệch tâm thỏa mãn ngưỡng T nào đó mới được so sánh độ tương tự hình dạng.

5. Các ảnh phù hợp được xếp thứ tự phụ thuộc vào độ khác biệt của tổng độ khác biệt trong các véc tơ hàng và cột giữa hình ảnh truy vấn và hình ảnh tương thích tìm được.

3.3.2.4 Độ đo tương tự

Giả sử R và R’mô tả các vecto hàng của ảnh kiểm tra và ảnh truy vấn tương ứng. C và C’ mô tả vectơ cột của ảnh kiểm tra và ảnh truy vấn tương ứng. Độ đo tương tự được tính toán như sau:

1. Tính các véc tơ hàng và cột của tất cả các vùng trong ảnh truy vấn.

2. Tìm độ khác biệt hàng và cột giữa các vùng hình ảnh truy vấn và các vùng trong hình ảnh được kiểm tra sử dụng công thức:

   i i i d R R R *( ' ) (3.8)    i i i d C C C *( ' ) (3.9)

Trong đó Rd và Cd lần lượt là độ khác biệt hàng và cột giữa vùng ảnh truy vấn và vùng ảnh kiểm tra, Ri và Ci lần lượt là bit thứ i của véc tơ hàng và cột trong ảnh; R’i

và C’i lần lượt là bít thứ i của véc tơ hàng và cột trong ảnh truy vấn. 3. Nếu (Rd + Cd) < T (ngưỡng) thì ảnh phù hợp và được đưa ra.

3.4 Kết luận

Tra cứu ảnh dựa trên lưới là một cách tiếp cận mới dựa trên hình dạng. Đây là phương pháp tra cứu hiệu quả với các tra cứu dựa trên hình dạng. Với ảnh đưa vào, chúng ta thực hiện trích chọn đặc trưng cho ảnh để được xâu bít nhị phân làm chỉ mục cho việc tra cứu. Để trích chọn được đặc trưng cho ảnh, trước tiên chúng ta phải tách được biên đối tượng có trong ảnh, sau đó phủ lưới để tìm ra chuỗi đặc trưng của ảnh. Cuối cùng là sử dụng khoảng cách Hamming để đo độ tương tự giữa các ảnh hay thực chất là tìm sự sai khác giữa các bít trong véc tơ đặc trưng.

Tra cứu ảnh dựa trên lưới có thể kết hợp với đặc trưng màu sắc nhằm tăng hiệu quả tra cứu. Thực chất là tra cứu dựa trên chỉ mục kết hợp giữa màu sắc và hình dạng. Quá trình tra cứu này được thực hiện tìm kiếm dựa trên màu sắc để được các vùng ảnh tương tự, từ các vùng ảnh tương tự này chúng ta tính toán độ tương tự giữa vùng ảnh truy vấn với các vùng ảnh đó để có được kết quả tra cứu tốt hơn.

Chƣơng 4: THIẾT KẾ VÀ CÀI ĐẶT CHƢƠNG TRÌNH MÔ PHỎNG TRA CỨU ẢNH DỰA TRÊN LƢỚI

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Tra cứu ảnh dựa trên lưới và ứng dụng (Trang 48 - 52)

Tải bản đầy đủ (PDF)

(57 trang)