CHƯƠNG 2 PHÁT HIỆN ĐỐI TƯỢNG TRONG VIDEO
2.2.3.1. Dữ liệu và cấu hình hệ thống kiểm thử
Các giải thuật được cài đặt trên môi trường C/C++ và thực nghiệm được tiến hành một máy tính cấu hình phần cứng chuẩn gồm: RAM 16GB, chip Intel Core (Dual-Core) i7 2.1 GHz, được cài hệ điều hành Windows 7.
Bảng 2.4. Các tập dữ liệu đặc trưng Số lượng
huấn luyện Số bản ghi Số truy vấn Số chiều
ANN_SIFT 100,000 1,000,000 10,000 128
ANN_GIST 500,000 1,000,000 1000 960
VGG 100,000 500,000 1000 4096
Để chứng minh tính hiệu quả của chất lượng mã hóa và giải thuật tìm kiếm, luận án đã tiến hành một số thực nghiệm trên các các tập dữ liệu chuẩn
ANN_SIFT [38], ANN_GIST [38] và VGG [74] đều có kích thước và số chiều
lớn (số liệu cụ thể được minh họa trong bảng 2.4). Đây là những tập dữ liệu thông dụng cho việc ước lượng hiệu năng thực thi tìm kiếm ANN trong khơng gian vector đặc trưng, đặc biệt là tập dữ liệu đặc trưng VGG có số chiều tương đương với tập dữ liệu đặc trưng của bài toán đang nghiên cứu.
Độ đo ước lượng được sử dụng để đánh giá chất lượng mã hóa dữ liệu là chỉ số Recall@R. Đây là chỉ số dùng để đo tỷ lệ kết quả đúng từ một tập danh sách gồm R phần tử. Trong khi để ước lượng, đánh giá tốc độ tìm kiếm mối tương quan giữa tốc độ và độ chính xác (biểu đồ speedup/precision) được sử
dụng. Tốc độ được so sánh tương đối với tìm kiếm tuần tự nhằm bỏ qua sự tác
động về cấu hình của máy tính. Với phương pháp 𝐴, tốc độ của nó 𝑆𝐴 được tính như sau:
𝑆𝐴 = 𝑡𝐴
𝑡𝑆𝑒𝑞 (2.10)
Trong đó 𝑡𝐴 là thời gian đáp ứng của phương pháp A cho một truy vấn cụ thể, và 𝑡𝑆𝑒𝑞 là thời gian đáp ứng của phương pháp tìm kiếm tuần tự cho cùng truy vấn này. Độ chính xác tìm kiếm là tỷ lệ số truy vấn cho kết quả đúng trên tổng số truy vấn được thực hiện. Cả tốc độ và độ chính xác tìm kiếm được tính là trung bình trên 1000 truy vấn.
(a) 1M 128D ANN_SIFT
(c) 500K 4096D VGG
Hình 2.8. Chất lượng mã hóa PSVQ