a. Tập dữ liệu thử nghiệm
Chúng tôi thử nghiệm tìm kiếm trên các ảnh vẽ và đánh nhãn các ảnh bằng tay. Các ảnh trong tập cơ sở dữ liệu được lấy từ cơ sở dữ liệu SIFT flow [26] gồm 2688 bức ảnh tự nhiên được chia làm 8 cảnh tự nhiên (coast, forest, mountain, highway, street, open country, tall building, inside city).
b. Cách thử nghiệm và đánh giá
Chúng tôi sử dụng hai phương pháp để cùng tìm 1 ảnh và kiểm tra xem kết quả có bao nhiêu khái niệm nhỏ được tìm thấy. Chúng tôi sử dụng chỉ số Recall để đánh giá
4.6.2. Kết quả thử nghiệm
Kết quả, xem Hình 4.6, Bảng 4.1 cho thấy phương pháp của chúng tôi tìm được nhiều các khái niệm nhỏ trong ảnh.
Cảnh
Khái niệm nhỏ
trong ảnh Recall (Euclidean)
Recall (Hamming) coast-sun-sea sun 0.166666667 0.533333333 coast-boat-sea boat 0.066666667 0.2 highway-tree-car car 0.2 0.833333333 Avarage Recall 0.144444444 0.522222222
Bảng 4.1. Chỉ số Avarage Recall khi sử dụng khoảng cách Euclidean và Hamming
(a) Sử dụng khoảng cách Euclideanan (b) Sử dụng khoảng cách Hamming
Hình 4.6: Kết quả trên các ảnh vẽ. (a) Sử dụng khoảng cách Euclideanan. (b) Sử dụng khoảng cách Hamming.
4.7. Kết luận
Trong chương này, luận văn đã trình bày được phương pháp tìm kiếm ảnh dựa trên lược đồ khái niệm của Vogel và Shielle 2004.
Luận văn cũng đưa ra hai đề xuất cho phương pháp này.
- Thứ nhất là đề xuất về giao diện tìm kiếm. Luận văn dựa trên việc thêm tương tác vào ảnh phác thảo cộng với sử dụng các ảnh đã được đánh nhãn để tăng tính hiệu quả của thuật toán tìm kiếm. Kết quả tìm được sẽ phù hợp hơn về
mặt ngữ nghĩa so với ảnh chỉ dùng các đặc trưng vật lý (màu sắc, cạnh).
- Thứ hai là đề xuất về phương pháp so sánh các lược đồ khái niệm bằng cách sử dụng khoảng cách Hamming nhằm tăng khả năng tìm thấy các khái niệm có diện tích nhỏ trong ảnh. Kết quả đạt được cho thấy phương pháp của luận văn có nhiều khả năng tìm thấy các khái niệm có diện tích nhỏ trong ảnh hơn.