Phân loại đối tượng là gì

2. Mục đích nghiên cứu

2.1.1. Phân loại đối tượng là gì

Phân loại đối tượng là quá trình phân lớp đối tượng chuyển động thuộc lớp sự vật nào (người, phương tiện, …). Các vùng chuyển động phát hiện được (trong bước phát hiện đối tượng chuyển động) trong video tương ứng

với các đối tượng khác nhau như người bộ hành, xe cộ, … Nhận biết kiểu (loại) của một đối tượng phát hiện được để theo dõi tin cậy và phân tích hành động của nó một cách chính xác là rất quan trọng. Module này là phần thứ hai trong mô hình xử lý hình ảnh. Hiện tại, có hai cách tiếp cận chủ yếu:

- Phương pháp dựa trên hình dạng (shape)

- Phương pháp dựa trên sự chuyển động (motion) .

Các phương pháp dựa trên hình dạng sử dụng thông tin không gian hai chiều của đối tượng trong khi đó các phương pháp dựa trên sự chuyển động sử dụng các đặc trưng thuộc thời gian đã được theo dõi của các đối tượng cho giải pháp phân loại.

a. Phân loại dựa trên hình dạng (Shape- based Classification)

Các đặc trưng thông thường được sử dụng trong việc phân loại dựa trên hình dạng là hình bao, diện tích, hình chiếu, và gradient của các vùng đối tượng phát hiện được.

Cách tiếp cận sử dụng độ dài đường viền hình chiếu của đối tượng và thông tin về diện tích để phân loại các đối tượng phát hiện được vào ba nhóm: người, xe cộ, và các loại khác. Phương pháp xuất phát từ giả thuyết người nhỏ hơn các phương tiện (xe cộ) và có các hình dạng phức tạp. Độ phân tán (dispersedness) được sử dụng như độ đo phân loại và nó được định nghĩa dưới dạng diện tích và độ dài (chu vi) đường viền như sau:

Area Perimeter ess

Dispersedn = (2.1)

Việc phân loại được thực hiện tại mỗi khung hình và các kết quả theo dõi đuợc sử dụng để cải thiện sự nhất quán thời gian của việc phân loại.

Phương pháp phân loại phát triển bởi Collins sử dụng các đặc trưng trực quan phụ thuộc của các đối tượng để huấn luyện một bộ lọc mạng nơron nhận biết bốn lớp đối tượng: người, nhóm người, xe cộ và các loại khác. Đầu

vào của mạng nơron là độ phân tán, diện tích và tỉ lệ bề ngoài của vùng đối tượng và độ phóng đại của camera. Giống như phương pháp trước, việc phân loại được thực hiện tại mỗi khung hình. Các kết quả được giữ trong một lưu đồ (histogram) để cải thiện sự nhất quán thời gian của việc phân loại.

b.Phân loại dựa trên chuyển động (Motion- based Classification)

Một vài phương pháp chỉ sử dụng các đặc trưng chuyển động thuộc thời gian của đối tượng nhằm nhận biết lớp của chúng. Thông thường, chúng được dùng để phân biệt các đối tượng linh động (non-rigid) (ví dụ: người) với các đối tượng không linh động (ví dụ: xe cộ). Phương pháp đề cập trong dựa trên sự tự tương đồng mang tính thời gian của một đối tượng chuyển động. Bởi vì một đối tượng thể hiện sự tiến triển mang tính chu kỳ của chuyển động, các độ đo sự tự tương đồng của nó cũng chỉ ra một chuyển động mang tính chu kỳ. Phương pháp khai thác đầu mối này để phân loại đối tượng chuyển động sử dụng tính chu kỳ.

Sự phân tích luồng quang học cũng có ích để phân biệt các đối tượng linh động và không linh động (rigid và non-rigid). A.J.Lipton đề xuất một phương pháp sử dụng luồng quang học cục bộ phân tích các vùng đối tượng. Các đối tượng linh động như người được trông đợi sẽ có luồng thặng dư (residual) trung bình cao trong khi đó các đối tượng không linh động như xe cộ sẽ có luồng thặng dư thấp. Theo đó, luồng thặng dư sinh ra bởi chuyển động của người sẽ có một tính chu kỳ. Bằng cách sử dụng phương pháp này, chuyển động của người, vì vậy người, có thể được phân biệt với các đối tượng khác như xe cộ.

Hai cách tiếp cận thông thường được đề cập ở trên, gọi tên là phân loại dựa trên hình dạng và phân loại dựa trên chuyển động có thể được kết hợp một cách có hiệu quả cho việc phân loại đối tượng chuyển động. Hơn nữa, Stauffer đề xuất một phương phương pháp dựa trên ma trận thời gian đồng sự

kiện (co-occurrence matrix) để phân loại một cách phân cấp cả các đối tượng và hành vi. Bằng cách sử dụng thêm các đặc trưng như màu và vận tốc phương pháp này được mong đợi sẽ cho kết quả phân loại chính xác hơn.

Tóm lại, phân loại đối tượng trong các hình ảnh video là một vấn đề đối tượng tương đối khó. Mỗi phương pháp có ưu và nhược điểm riêng phù hợp với từng hoàn cảnh, bài toán khác nhau. Để đạt được hiệu quả tốt, ta cần phân tích bài toán, hoàn cảnh cụ thể và lựa chọn phương pháp thích hợp. Trong bài toán theo dõi giám sát giao thông tôi lựa chọn phương pháp phân loại dựa trên hình chiếu.

Một số phương pháp phân loại phổ biến

Theo vết đối tượng là gì?