QBIC của IBM

Một phần của tài liệu nghiên cứu phương pháp biểu diễn và tra cứu ảnh hiệu quả ứng dụng trong tra cứu ảnh phong cảnh (Trang 30 - 32)

QBIC, chuẩn cho truy vấn bởi nội dung ảnh, là hệ thống tra cứu ảnh dựa vào nội dung thƣơng mại đầu tiên. Các kỹ thuật và khuôn khổ đã ảnh hƣởng sâu sắc lên các hệ thống tra cứu ảnh về sau. QBIC hỗ trợ chính các truy vấn dựa vào các ảnh mẫu, các phác thảo và các bản vẽ đƣợc ngƣời sử dụng xây dựng, và các mẫu kết cấu và màu đƣợc lựa chọn.

Trong quá trình đánh chỉ số ảnh, QBIC đã sử dụng các phƣơng pháp phân đoạn không giám sát tự động hoàn toàn cùng với mô hình tiền cảnh/hậu cảnh để

nhận biết các đối tƣợng trong một lớp các ảnh đƣợc giới hạn. Các thuật toán mạnh đƣợc yêu cầu trong lĩnh vực này do có các hậu cảnh có kết cấu và đa dạng. QBIC cũng có các công cụ bán tự động để nhận biết các đối tƣợng. QBIC là kỹ thuật flood-fill tăng cƣờng. Các phƣơng pháp flood-fill bắt đầu từ một pixel đối tƣợng đơn và lặp việc thêm các pixel liền kề có giá trị trong ngƣỡng đã cho nào đó của pixel gốc. Một công cụ phác thảo để trợ giúp những ngƣời sử dụng theo dõi các điểm biên đối tƣợng dựa trên khái niệm ―snakes‖ đƣợc phát triển trong nghiên cứu thị giác máy tính. Công cụ này nhận một đƣờng cong phác thảo của ngƣời sử dụng và căn lề tự động nó với các điểm biên ảnh gần cạnh. Nó tìm đƣờng cong cực đại hoá độ lớn gradient ảnh dọc đƣờng cong. Sau khi nhận biết đối tƣợng, QBIC sẽ tính toán các đặc trƣng của mỗi đối tƣợng và ảnh. Các đặc trƣng nhƣ sau:

 Màu:

Đặc trƣng màu đƣợc sử dụng trong QBIC là trung bình (R,G,B), (Y,I,Q), (L,a,b), và các toạ độ MTM, và một lƣợc đồ màu k thành phần [5].

 Kết cấu:

Đặc trƣng kết cấu của QBIC là một phiên bản đƣợc cải tiến của biểu diễn kết cấu Tamura; tức là các kết hợp của tính thô, tƣơng phản, và hƣớng. Với các ảnh màu, các độ đo này đƣợc tính toán trên dải sáng, nó đƣợc tính toán từ ba dải màu. Đặc trƣng thô mô tả tỷ lệ kết cấu và đƣợc tính toán hiệu quả sử dụng di chuyển các cửa sổ có các cỡ khác nhau. Đặc trƣng tƣơng phản mô tả tính chói của mẫu, và là một hàm biến đổi của lƣợc đồ cấp xám. Đặc trƣng hƣớng mô tả dù ảnh có hƣớng hay không, hoặc nó có đẳng hƣớng hay không, và là một độ đo của ―chóp‖ của phân bố của các hƣớng gradient trong ảnh.

 Hình dạng:

Các đặc trƣng hình trong QBIC đƣợc dựa trên sự kết hợp của diện tích, hình tròn, độ lệch tâm, và hƣớng trục chính, thêm một tập các bất biến mômen đại số

[4]. Tất cả các hình đƣợc giả thiết là các hình có mặt phẳng không chặt cho phép mỗi hình đƣợc biểu diễn nhƣ một ảnh nhị phân.

 Phác thảo:

QBIC cho phép các ảnh đƣợc tra cứu dựa trên một phác thảo thô của ngƣời sử dụng. Đặc trƣng cần để hỗ trợ tra cứu này gồm một bản đồ biên độ phân giải thu gọn của mỗi ảnh. Để tính toán các bản đồ biên, QBIC chuyển mỗi ảnh màu tới một dải sáng đơn, tính toán ảnh biên nhị phân và giảm ảnh biên đến cỡ 64 x 64.

Ngay khi các đặc trƣng đƣợc mô tả, các độ đo tƣơng tự đƣợc sử dụng để nhận các ảnh tƣơng tự. Trong bƣớc tìm kiếm, QBIC phân biệt giữa ―các cảnh‖ (hoặc các ảnh) và ―các đối tƣợng‖. Một cảnh là một ảnh màu đầy đủ hoặc frame đơn của video và một đối tƣợng là một phần của cảnh. QBIC tính toán các đặc trƣng sau:

 Các đối tƣợng: màu trung bình, lƣợc đồ màu, kết cấu, hình, vị trí.

 Các ảnh: màu trung bình, lƣợc đồ màu, kết cấu, vị trí các biên (phác thảo), vị trí màu (vẽ).

QBIC là một trong số ít các hệ thống nhận vào bản miêu tả đánh chỉ số đặc trƣng nhiều chiều [4]. Trong đánh chỉ số hệ thống con của nó. KLT đƣợc sử dụng đầu tiên để thực hiện giảm chiều và sau đó R*

-tree đƣợc sử dụng nhƣ cấu trúc đánh chỉ số nhiều chiều. Trong hệ thống mới của nó tìm kiếm từ khoá dựa vào văn bản có thể đƣợc kết hợp với tìm kiếm tƣơng tự dựa vào nội dung. Bản demo trực tuyến QBIC có tại website http://wwwqbic.almaden.ibm.com.

Một phần của tài liệu nghiên cứu phương pháp biểu diễn và tra cứu ảnh hiệu quả ứng dụng trong tra cứu ảnh phong cảnh (Trang 30 - 32)