Để xác định vận tốc, mỗi điểm được lựa chọn phù hợp trên khung hình đầu tiên mà phương tiện xuất hiện lần đầu cần được tìm thấy ở khung hình tiếp theo. Trong trường hợp lý tưởng, một điểm được lựa chọn phù hợp phải là cùng một điểm trên khung hình tiếp theo. Để tìm được điểm tương ứng, không có thông tin nào khác ngoài bản thân điểm đó và dường như là không thể tìm được một cách chính xác vị trí của nó. Vì ta chỉ sử dụng một camera nên không thểđịnh nghĩa một vùng tìm kiếm trên khung hình tiếp theo vì nó bị giới hạn không gian tìm kiếm bởi một vài ràng buộc hình học. Do đó, có thể nói rằng không khả thi khi dùng các tiếp cận đối chiếu hình ảnh nổi. Thay vì thế, nếu ta giả sử mỗi ảnh trong mỗi khung hình là một luồng với khoảng thời gian rất ngắn và do đó sự thay đổi vị trí trong luồng khiến ta có thể sử dụng một mô hình để mô hình sự kiện luồng này. Loại mô hình luồng này được gọi là "luồng quang học" hay "optical flow".
Đặt p(x,y) là một điểm góc trong một không gian ảnh 2D, với (x,y) là các tọa độ ảnh của điểm p. I(t) là một khung hình video được chụp ở thời điểm t. Khi đó một điểm trên khung hình này với tên gọi p ∈ I(t) có thể được biểu diễn bởi véc tơ vị trí của nó là p(x,y,t). Dựa trên công thức biểu diễn này, tất cảcác điểm pi(xi,yi,t)
∈ I(t) có thể biểu diễn bởi các véc tơ vị trí với các điểm bắt đầu nằm trên gốc tọa độ của hình ảnh và các điểm kết thúc là các điểm pinhư hình 1.9 dưới đây:
22
Hình 1.10: Frame ảnh tại thời điểm t trước và sau khi vẽ các véc tơ có hướng[34]
Từ hình 1.9 ta dễ dàng thấy, các véc tơ vận tốc tức thời của các điểm nhận được bởi tỷ lệ các véc tơ dịch chuyển Δp với thời gian di chuyển Δt. Vì các dịch chuyển Δp là theo hai chiều, các véc tơ vận tốc là véc tơ hai chiều hay nói cách khác, một véc tơ vận tốc v có hai thành phần (vx, vy). Từ giải thích ở trên, ta thấy rằng sau khi hai khung hình kế tiếp được xử lý, mỗi điểm được theo vết được gán một véc tơ vận tốc hoặc một véc tơ dịch chuyển tương đương. Nếu phép gán véc tơ vận tốc cho các điểm không chỉ thực hiện trên các điểm được lựa chọn mà cho mọi điểm trong ảnh thì được gọi là luồng quang học dày. Trong trường hợp này, trường véc tơ vận tốc của toàn bộảnh được quan sát. Phương pháp Horn và Schunck là một trong những ví dụđầu tiên dựa trên luồng quang học dày để tìm véc tơ vận tốc của toàn bộcác điểm trong ảnh. Tuy nhiên, có một sốlượng rất lớn các điểm ảnh trong ảnh, đặc biệt với các ảnh kích thước lớn (khi camera có độ phân giải cao), khiến cho việc tính toán toàn bộcác điểm ảnh này tốn rất nhiều chi phí thời gian. Do đó, luồng quang dày này không phù hợp cho việc ước lượng vận tốc phương tiện trong thời gian thực. Thay vào đó, các véc tơ vận tốc chỉđược tính toán cho các điểm được lựa chọn và chúng sẽ là khá thưa, tiếp cận này được gọi là luồng quang học thưa. Chương 2 của luận văn sẽ trình bày các thuật toán sử dụng tiếp cận theo cả hai phương pháp luồng quang học dày và thưa.