6 Tổng kết
5.1 Vị trí các máy quay và các góc quay trong tập dữ liệu MTA[17]
5.1.2 Tập dữ liệu THD
Như đã đề cập ở mục 2.2.1, các tập dữ liệu của bài toán truy vết đối tượng trên nhiều máy quay rất hạn chế về cả số lượng lẫn chất lượng. Sau khi khảo sát tất cả các tập dữ liệu có sẵn, đề tài chỉ chọn được tập dữ liệu MTA [17] dùng cho kiểm thử mơ hình đề xuất của nhóm. Tuy nhiên, tập dữ liệu MTA không gồm dữ liệu về khuôn mặt của các đối tượng nên tập dữ liệu này chỉ được dùng để đánh giá mô-đun theo dấu và tập dữ liệu này được tạo ra ở mơi trường mơ phỏng thay vì đời thật nên dẫn đến sự khác biệt kết quả khi mơ hình của nhóm áp dụng vào dữ liệu thực tế. Vì vậy, nhóm có tạo ra một tập dữ liệu để có thể đánh giá cả mơ-đun theo dấu và mơ-đun nhận diện khuôn mặt. Tập dữ liệu THD được tạo ra bởi 3 máy quay và được quay ở ký túc xá của trường Trung học phổ thông chuyên Trần Hưng Đạo (Bình Thuận). Hệ thống 3 máy quay này bao gồm 2 máy quay có sẵn của ký túc xá và 1 máy quay lắp thêm để tăng độ nhận diện khuôn mặt. Vị trí và các thơng số lần lượt như sau:
• Máy quay 1: có góc quay từ tầng 1 xuống bậc tam cấp của cầu thang giữa tầng 1 và tầng trệt. Máy quay này có độ phân giải 960×1080 và tốc độ số khung hình trên một giây (FPS) là 30.
• Máy quay 2: có góc quay từ trần của tầng trệt xuống bậc tam cấp. Máy quay này có độ phân giải 960×1080 và tốc độ số khung hình trên một giây (FPS) là 30.
• Máy quay 3: có góc quay từ cửaa ra vào của tầng trệt hướng tới cầu thang giữa tầng 1 và tầng trệt. Máy quay này có độ phân giải 1920×1080 và tốc độ số khung hình trên một giây (FPS) là 30.
Hình 5.2 sẽ biểu diễn rõ hơn vị trí của các máy quay. Dựa vào 3 máy quay này, nhóm đã quay và gán nhãn (label) 3 đoạn video khác nhau tương ứng với 3 Testcase khác nhau để kiểm thử mơ hình của luận văn:
• Testcase 1: Gồm 3 đối tượng, trong đó có một đối tượng có quỹ đạo đường đi đi qua cả 3 góc quay của máy quay với tốc độ di chuyển dường như không đổi. Đây là trường hợp đơn giản để kiểm tra mơ hình đề xuất có hoạt động tốt khi chỉ thực hiện theo dấu một người trên nhiều máy quay. Đoạn video ở mỗi máy quay của trường hợp này dài 21 giây với tổng cộng tất cả 1866 khung hình và 1182 khung bao đóng đã được gán nhãn ứng với từng đối tượng khác nhau.
• Testcase 2: Gồm 9 đối tượng trong đó đối tượng chính là nhóm 3 học sinh nam đi qua góc quay của cả 3 máy quay với tốc độ di chuyển biến đổi nhiều. Mục đích của trường hợp này để quan sát độ chính xác của mơ hình khi số đối tượng trong hệ thống máy quay tăng lên. Đoạn video ở mỗi máy quay của trường hợp này dài 29 giây với tổng cộng tất cả 2580 khung hình và 5055 khung bao đóng đã được gán nhãn ứng với từng đối tượng khác nhau.
• Testcase 3: Gồm 7 đối tượng trong đó đối tượng chính là nhóm 5 học sinh nam đi qua góc quay của cả 3 máy quay. Đây là trường hợp phức tạp vì các đối tượng chính đi gần với nhau và liên tục che khuất nhau trong khung hình và được dùng để kiểm tra độ chính xác của mơ hình đề xuất khi gặp trường hợp khó của bài tốn truy vết. Đoạn video ở mỗi máy quay của trường hợp này dài 33 giây với tổng cộng tất cả 3003 khung hình và 6611 khung bao đóng đã được gán nhãn ứng với từng đối tượng khác nhau.
Ngồi 3 đoạn video nói trên, tập dữ liệu cịn gồm 255 ảnh mặt và mã số của 255 học sinh để có thể kiểm thử mơ-đun nhận diện khn mặt của hệ thống.