Cấu trúc của hệ bám mục tiêu di động gồm hai phần chính. Phần thứ nhất là phần
xử lý ảnh dựa vào chuỗi hình ảnh thu được từ webcam để nhận dạng và tính toán vị trí
của đối tượng quan tâm.
Phần thứ hai là phần điều khiển, dựa vào thông tin vị trí đối tượng nhận được
trong mặt phẳng ảnh, tính toán tín hiệu điều khiển rô bốtsao cho đối tượng di chuyển
được duy trì ở một vị trí nhất định trên mặt phẳng ảnh và ở một khoảng cách nhất định.
Để giảm ảnh hưởng của nhiễu và giảm khối lượng tính toán trong xử lý ảnh nên
các bước xử lý ảnh nhận dạng, thích nghi cũng được sử dụng. Các bước này sẽ được
trình bày lần lượt như dưới đây.
Nhận dạng mục tiêu là bước quan trọng đầu tiên trong hệ thống bám mục tiêu di
động. Mục tiêu của quá trình này là lưu giữ các giá trị thuộc tính của đối tượng đã
được chọn như đã nói ở trên các thuộc tính đó như cạnh, góc, các thuộc tính về màu
sắc v..v. Trên cơ sở đó để so sánh nhằm phân biệt mục tiêu với nền và các mục tiêu
khác. Qua đó xác định được vị trí của mục tiêu trên mặt phẳng ảnh. Trong quá trình
tìm kiếm ta chia bức ảnh thành tập hợp các pixel bao gồm hai thành phần hoặc thuộc
đối tượng hoặc thuộc nền. Qua đó ta tiến hành xử lý các giá trị thuộc tính của đối tượng trong vị trí mới và tìm nhận dạng được đối tượng cần theo dõi.
Mặt phẳng ảnh là mặt phẳng có gốc nằm phía trên bên trái, trục x là trục nằm
ngang, trục y là trục thẳng đứng như hình vẽ.
Yahoo:thoi_chao_em_12325 Email:xuanducdhcn@gmail.com 25
Căn cứ vào vị trí dịch chuyển của đối tượng trên mặt phẳng ảnh so với gốc toạ độ
mà ta tính toán các khả năng di chuyển của rô bốt sao cho đối tượng nằm ở một vị trí
bất kỳ trên mặt phẳng ảnh.
Tính toán vị trí của mục tiêu di động trong môi trường có nhiễu sử dụng thuật
toán CamShift. Căn cứ vào kết quả thu được về giá trị tâm của đối tượng qua thuật toán CamShift đề xuất thuật toán di chuyển như sau.
Hình vẽ sau mô tả các vị trí tương ứng của đối tượng trên mặt phẳng ảnh với điều
kiện di chuyển.
Hình 14: Biểu diễn đối tượng di chuyển trên mặt phẳng ảnh