Gán trọng số

2. Một cách tiếp cận cho CBIR sử dụng thuật toán phân lớp K-Means và đặc trƣng hình

2.9. Gán trọng số

Chúng tôi thử nghiệm bằng việc triển khai hệ thống CBIR cho thấy rằng các sơ đồ gán trọng số ƣu tiên biên/nền cho kết quả tốt hơn sơ đồ gán trọng số bình đẳng, ƣu tiên vùng nổi bật, và ƣu tiên vùng trung tâm.

Gán trọng số đƣợc áp dụng trƣớc khi so sánh các centroids sử dụng thƣớc đo đọ tƣơng tự (công thức (3.10)) bằng cách nhân các chiều khác nhau của cˆi với một

thừa số tỷ lệ tuyến tính. Trọng số 1 cho các đặc trƣng màu sắc và 0,5 đối với các đặc trƣng hình dạng các đã cho kết quả tốt với lƣợc đồ trọng số cân bằng.

2.10. Thực nghiệm

Chúng tôi triển khai một hệ thống bằng cách sử dụng JAVA 1.6 chạy trên một máy tính với bộ xử lý Celeron 1,3 GHz/1.2GB bộ nhớ RAM và một máy tính Pentium Dual Core 3 GHz/1GB Ram với hệ điều hành Windows XP. Trong các thử nghiệm, chúng tôi sử dụng cơ sở dữ liệu chứa 772 hình ảnh chụp của tác giả trong đó có một số ảnh lớp học trong nhà, ngoài trời, chân dung, phong cảnh, núi, biển, bãi biển và dƣới điều kiện ánh sáng khác nhau (gần nhƣ có tất cả các ảnh trong các điều kiện ngày/đêm, ánh sáng nhân tạo). Tất cả các hình ảnh đã đƣợc thu nhỏ xuống kích thƣớc 384x265 hoặc 265x384.

Đầu tiên, một cơ sở dữ liệu tạo, phân đoạn và lƣu các thông tin có liên quan (nhỏ hơn 1kb cho mỗi ảnh). Mỗi phiên làm việc hệ thống thực hiện việc này 1 lần. Với bộ xử lý Celeron 1.3GHz, thời gian tính toán cho mỗi ảnh là gần 5.3s (4s trên bộ xử lý 3GHz).

Hình 3.6: Hệ thống CBIR được thực hiện với Java 1.6

Hình 3.6 là hình ảnh giao diện chƣơng trình khi thực hiện. Kết quả trả ra là một danh sách đƣợc sắp xếp theo thƣớc đo độ tƣơng tự. Mặc dù phải so sánh ảnh với toàn bộ cơ sở dữ liệu nhƣng quá trình truy vấn khá nhanh với ~ 0.1sec trên bộ xử lý Celeron 1.3GHz. Trong thử nghiệm này chúng tôi không thực hiện tối ƣu hóa các cấu trúc dữ liệu cho cơ sở dữ liệu.

Hình 3.7: 12 kết quả đầu tiên, ảnh truy vấn ở góc trên bên trái, mức độ tương tự trong [1..0.94]

Hình 3.7 là kết quả truy vấn với ảnh truy vấn ở góc trên bên trái. Hệ thống tìm 8 trong 10 hình ảnh trong cơ sở dữ liệu một trăm ảnh lúc mặt trời mọc tại đảo Cát Bà. Một trong những ảnh của tập này đã đƣợc chụp trong lúc hoàng hôn, nó xuất hiện trong kết quả là hợp lý. Trong khi đó, 2 ảnh thuộc loại này (ban ngày, ở bãi biển) nhƣng không thực sự thích hợp và là một trong những hình ảnh đƣợc tìm thấy (rìa phải, hàng 2) là sai so với quan điểm ngữ nghĩa.

Trích rút đặc trƣng

Thuật toán phân lớp dữ liệu K-means