Phân loại dựa theo hình dạng

Một phần của tài liệu PHÁT HIỆN VÀ GIÁM SÁT ĐỐI TƯỢNG CHUYỂN ĐỘNG TRONG VIDEO (Trang 28 - 29)

Các đặc trưng chung được sử dụng trong phân chia các đối tượng theo hình dạng là tạo các hình chữ nhật bao quanh, tạo các vùng, hình chiếu và độ nghiêng của các vùng chứa đối tượng được phát hiện.

Hướng tiếp cận này sử dụng độ dài các đường nét của hình chiếu và vùng thông tin để phân loại các đối tượng đã được phát hiện và đưa nó vào thành 3 nhóm: người, xe cộ và các đối tượng khác [9]. Phương pháp này phụ thuộc vào các giả định, chẳng hạn như, nếu là con người thì sẽ nhỏ hơn xe cộ và có bóng phức tạp. Mức độ rải rác (dispersedness) được dùng như là một ma trận phân loại và nó được định nghĩa trong các giới hạn của các vùng của đối tượng và độ dài đường viền (chu vi) như sau:

Mức độ rải rác =

vùng vi chu 2

(1.5)

Việc phân loại được thực hiện ở mỗi frame và kết quả lưu lại thường được tận dụng để đảm bảo việc phân loại theo thời gian.

Phương pháp phân loại này phát triển bởi Collins [4] sử dụng cách nhìn dựa theo các đặc trưng của thị giác để huấn luyện một mạng nơ ron các đối tượng phân loại thừa nhận các lớp: con người, nhóm người, xe cộ và sự hỗn loạn. Đầu vào của mạng nơ ron là mức độ rải rác, các miền, tỉ lệ tương quan của các vùng đối tượng và độ phóng đại của camera. Cũng như phương pháp trước, việc phân loại được thực hiện trên mỗi frame và các kết quả được đưa vào biểu đồ để duy trì sự phân loại theo thời gian.

Saptharishi đề xuất một sự phối hợp phân loại sử dụng chiều dài của việc huấn luyện của mạng nơ ron với việc “học” khác nhau để thừa nhận hai lớp: Xe cộ và con người [15]. Papageorgion đưa ra một phương pháp sử dụng sự phân loại của máy hỗ trợ véc tơ huấn luyện nhờ các đặc trưng biến đổi sóng nhỏ của đối tượng trong các ảnh của Video từ một cơ sở dữ liệu mẫu đơn giản [14]. Phương pháp này được sử dụng để thừa nhận các vùng chuyển động tương tự như con người.

Một phương pháp khác được đưa ra bởi Brodsky [5] sử dụng phép phân loại Radial Basis Function (RBF), phương pháp này như sau: có một kiến trúc tương tự như 3 tầng mạng nhân giống lại. Đầu vào của phương pháp này là gradient ảnh của các vùng đối tượng đã được phát hiện.

Một phần của tài liệu PHÁT HIỆN VÀ GIÁM SÁT ĐỐI TƯỢNG CHUYỂN ĐỘNG TRONG VIDEO (Trang 28 - 29)

Tải bản đầy đủ (PDF)

(78 trang)