Lọc theo mức độ tương quan của hàm nhân

Một phần của tài liệu (LUẬN văn THẠC sĩ) hệ thống điểm danh tự động học sinh trung học phổ thông qua camera trong lớp học (Trang 38 - 40)

Theo dõi đối tượng là một vấn đề quan trọng trong thị giác máy tính và có nhiều ứng dụng như tương tác máy tính như giám sát giao thông, phương tiện không người lái [23], [24]. Nhiệm vụ chính của theo dõi đối tượng là phân tích chuỗi video nhằm mục đích thiết lập vị trí của mục tiêu trên một chuỗi các khung hình bắt đầu từ hộp giới hạn được đưa ra trong khung đầu tiên [23]. Mặc dù trong thời gian qua công nghệ đã tiến bộ vượt bậc nhưng việc thiết kế một thuật toán theo dõi đủ mạnh vẫn là một việc khó khăn do đối tượng bị che khuất, biến dạng, chuyển động nhanh, thay đổi ánh sáng, v.v….

Gần đây, bộ theo dõi dựa trên bộ lọc theo mức độ tương quan mang lại kết quả cao về độ chính xác, độ mạnh và tốc độ [25], [26], [27], [28]. Đặc biệt, lọc theo mức độ tương quan của hàm nhân (Kernelized Correlation Filter – KCF) thực hiện ở hàng trăm khung hình mỗi giây. Các thuật toán này giả định các mẫu huấn luyện và các mẫu phát hiện ứng viên là thay đổi theo chu kỳ.

Thuật toán huấn luyện một bộ lọc theo mức độ tương quan từ một tập hợp các mẫu là các thay đổi theo chu kỳ từ mẫu cơ sở và sử dụng bộ lọc theo mức độ tương quan được huấn luyện để tìm vị trí của mục tiêu trong phần phát hiện. Các mẫu được phát hiện cũng là những thay đổi theo chu kỳ so với mẫu cơ sở. Giả thiết này cho phép huấn luyện và phát hiện hiệu quả bằng cách sử dụng phép biến đổi Fourier [26]. Tuy nhiên, nó có một số nhược điểm do sử dụng các thay đổi theo chu kỳ của mẫu cơ sở nên có thể các mẫu huấn luyện không thể thể hiện chính xác nội dung hình ảnh, đặc biệt là khi mục tiêu chuyển sang vùng ranh giới của phần tìm kiếm, hình 2.12. Chính vì vậy, các mẫu được huấn luyện này làm giảm việc dự đoán các đối tượng từ mô hình đã học. Trong phần phát hiện, kết quả nhận được chính xác khi đối tượng ở gần trung tâm của vùng tìm kiếm vì sử dụng các thay đổi tuần hoàn của mẫu ban đầu làm mẫu ứng viên nên rất hạn chế khu vực tìm kiếm mục tiêu.

Danelljan et al. [26] đề xuất hàm chuẩn hóa về không gian vào các bộ lọc theo mức độ tương quan phân biệt (Discriminatively Correlation Filters - DCF) hay còn gọi là chuẩn hóa bộ lọc theo mức độ tương quan phân biệt (Spatially Regularized Discriminatively Correlation Filters- SRDCF) và cải thiện đáng kể hiệu suất của DCF [26]. Tuy nhiên, việc đưa thêm hàm chuẩn hóa về không gian dẫn đến việc tính toán cũng phức tạp hơn. SRDCF sử dụng một loạt các phương pháp tối ưu hóa để cải thiện hiệu quả của thuật toán. Tuy nhiên, SRDCF rất phức tạp và chậm. Dựa theo SRDCF , KCF sử dụng một ma trận được chuẩn hóa không gian bằng công thức hồi quy ridge. Với công thức hồi quy ridge mới có thể được giải quyết một cách hiệu quả bằng cách áp dụng tính chất của ma trận tuần hoàn và trong bộ lọc theo mức độ tương quan sẽ huấn luyện nhanh hơn.

Trong khi đó, các mẫu huấn luyện và mẫu phát hiện ứng cử viên có thể được thể hiện ở khu vực rộng hơn. Từ đó, có nhiều mẫu huấn luyện tốt dẫn đến mô hình phát hiện đối tượng tốt hơn khắc phục được hạn chế khi mục tiêu thay đổi. Và nhiều mẫu phát hiện ứng cử viên cho phép nhận được diện tích lớn hơn độ chính xác cao hơn gần trung tâm của phần tìm kiếm và điều này cũng mang lại lợi ích cho việc đối tượng bị che khuất, có chuyển động nhanh.

KCF chuẩn hóa không gian trong công thức hồi quy ridge có thể giải quyết một số vấn đề xảy ra khi các mẫu thay đổi tuần hoàn và sử dụng tính chất của ma trận tuần hoàn để tính toán bằng công thức hồi quy ridge mang lại hiệu quả cao cho bộ lọc theo mức độ tương quan.

(a) là mẫu cơ sở. Với sự thay đổi (a) theo [−100 −100] và [−50 −50] riêng biệt nhận được (b1) và (b2). (c1) và (c2) là các thay đổi của (a) bằng [ − 100 −100] và [−50 −50]. So sánh (a), (b1) và (c1), chúng ta có thể thấy mục tiêu trong (b1) được chia thành hai phần và mẫu huấn luyện giả sử là (c1). So sánh (a), (b2) và (c2) nền của mẫu huấn luyện phải là nền của (c2).

Một phần của tài liệu (LUẬN văn THẠC sĩ) hệ thống điểm danh tự động học sinh trung học phổ thông qua camera trong lớp học (Trang 38 - 40)

Tải bản đầy đủ (PDF)

(77 trang)