TỔ NG QUAN V Ề CÁC K Ỹ THU Ậ T THEO V Ế T VÀ XÁC ĐỊ NH V Ậ N T Ố C C ỦA ĐỐI TƯỢ NG
Phát hi ệ n và theo v ết đối tượ ng
1.1.1 Phát hiện đối tượng chuyển động trong Video
Việc phát hiện đối tượng chuyển động trong video là bước quan trọng để xác định vận tốc của chúng Sau khi phát hiện, hệ thống sẽ chuyển sang các bước xử lý tiếp theo Tuy nhiên, video từ camera thường gặp nhiều nhiễu như sự thay đổi ánh sáng, thời tiết và chuyển động của lá, gây khó khăn trong việc phát hiện chính xác Các công nghệ phổ biến cho việc này bao gồm phép trừ nền, phương pháp tĩnh, sự khác biệt về thời gian và optical flow.
Hình 1.1: Lược đồ chung cho các thuật toán xử lý đối tượng chuyển động
1.1.1.1 Phép trừ nền Để có thể theo dõi được các đối tượng, những mô tảđặc điểm của đối tượng là rất quan trọng Những đặc điểm của đối tượng sẽ được mô tả thông qua các thống kê phân bố của vùng quan sát được chia thành foreground (FG) hoặc background (BG) Mô hình trộn Gaussian được sử dụng rộng rãi để mô tả vùng quan sát và là một phần không thể thiếu của các thuật toán nhận dạng, theo dõi trong CV
Mô hình trộn Gaussian với m thành phần được mô tả như là tổng của m phân bố xác suất Gaussian:
Trong đó, kỳ vọng và phương sai của thành phần thứ i lần lượt được ký hiệu là ai và δi, I là ma trận đơn vị, và πi là trọng số của thành phần thứ i, với tổng các trọng số này bằng 1.
Bằng cách sử dụng thuật toán Estimation-Maximization (EM) ta có thể ước lượng được tham số cho mô hình
Tách foreground (FG) khỏi background (BG) là bước quan trọng đầu tiên, ảnh hưởng trực tiếp đến độ chính xác của hầu hết các hệ thống thị giác máy tính (CV) hiện nay FG được hiểu là miền chuyển động, trong khi BG là miền tĩnh trong vùng quan sát.
Thuật toán mô hình hỗn hợp nền thích ứng (Adaptive Background Mixture Models) được sử dụng rộng rãi trong việc tách đối tượng chính (FG) nhờ vào độ chính xác và tốc độ xử lý nhanh Thuật toán này có khả năng thích ứng linh hoạt với sự thay đổi của môi trường, giúp cải thiện hiệu quả theo dõi trong thời gian thực.
“Adaptive background mixture models for real-time tracking” của Chris Stauffer và W.E.L Grimson [38]
Phương pháp truyền thống để tách đối tượng foreground (FG) là lấy trung bình các bức ảnh trong một khoảng thời gian để xấp xỉ background (BG), hiệu quả khi có đối tượng chuyển động liên tục và BG xuất hiện lâu Tuy nhiên, phương pháp này gặp khó khăn khi có nhiều đối tượng chuyển động chậm hoặc khi ánh sáng môi trường thay đổi Thay vì chỉ ra mô hình cụ thể cho tất cả các giá trị điểm ảnh với phân bố xác suất xác định, chúng ta cần xây dựng một mô hình linh hoạt hơn.
Mô hình trộn Gaussian mô tả các giá trị của điểm ảnh, phân tích sự ổn định và biến đổi của từng thành phần để xác định màu sắc của nền (BG) Những giá trị điểm ảnh không phù hợp với phân bố của BG sẽ được xác định là đối tượng nổi bật (FG).
Hệ thống này hoạt động hiệu quả trong các điều kiện ánh sáng thay đổi, xử lý tốt các chuyển động lặp lại, nhận diện các đối tượng chuyển động chậm, và quản lý việc thêm hoặc loại bỏ các đối tượng trong vùng quan sát.
Phương pháp này bao gồm hai tham số chính: hằng số học α và xác suất nhỏ nhất T của BG trong miền quan sát Hệ thống hoạt động hiệu quả cả trong nhà lẫn ngoài trời mà không cần điều chỉnh các tham số này Trong phương pháp, giá trị của một điểm ảnh cụ thể được xem là một quy trình điểm ảnh, tức là chuỗi thời gian của các giá trị điểm ảnh, như giá trị thực cho ảnh xám và vector cho ảnh màu Các giá trị của điểm ảnh cho đến thời điểm t được biểu diễn một cách cụ thể.
{X1, X2, …, Xt} = {I (x0, y0, i) : 1 ≤ i ≤ t} (1.2) Trong đó I là một chuỗi các ảnh
{X1, X2, …, Xt} - recent history của mỗi điểm ảnh được mô tả bởi K phân bốGaussian Mixture Xác suất của quan sát giá trịđiểm ảnh hiện tại là: p(Xt) = ∑ i =1
K là số phân bố, trong khi ωi,t đại diện cho trọng số của thành phần Gaussian thứ I trong mô hình tại thời điểm t Điều này có nghĩa là ωi,t thể hiện xác suất để Xt có phân bố η(Xt, μi,t, ∑i,t).
Giá trị trung bình của thành phần Gaussian thứ I trong mô hình tại thời điểm t được ký hiệu là μ_i,t, trong khi ∑ i,t là ma trận hiệp phương sai tương ứng của thành phần này Hàm mật độ xác suất Gaussian được biểu diễn bằng η.
K được xác định tùy thuộc vào dung lượng bộ nhớ hiện có và sức mạnh tính
7 toán của hệ thống, thông thường K từ3 cho đến 5 Cũng vì lý do tính toán, ma trận hiệp phương sai ∑ i , t giả thiết có dạng:
Giả thiết cho rằng các giá trị điểm ảnh đỏ, xanh lá và xanh dương là độc lập và có cùng phương sai, mặc dù không hoàn toàn chính xác trong thực tế, nhưng được chấp nhận để đơn giản hóa quá trình tính toán ma trận nghịch đảo.
Do mọi điểm ảnh trong ảnh được mô tả bởi mô hình trộn Gaussian, việc áp dụng thuật toán Expectation-Maximization (EM) trên vùng dữ liệu gần đây sẽ có độ phức tạp tính toán cao Thay vào đó, chúng ta sẽ sử dụng thuật toán xấp xỉ K-means trực tuyến, trong đó mỗi giá trị điểm ảnh mới sẽ được kiểm tra lại.
Giá trị điểm ảnh được coi là phù hợp với phân bố Gaussian khi nó không vượt quá 2.5 lần độ lệch tiêu chuẩn của phân bố đó Việc xác định phân bố phù hợp là rất quan trọng trong quá trình phân tích dữ liệu.
Khi giá trị điểm ảnh không phù hợp với bất kỳ phân bố nào của mô hình hỗn hợp, phân bố kém phù hợp sẽ được thay thế bằng một phân bố mới Trong phân bố mới này, giá trị điểm ảnh hiện tại sẽ trở thành giá trị trung bình, trong khi phương sai sẽ được khởi tạo với một giá trị lớn và trọng số của phân bố sẽ được gán một giá trị nhỏ.
Các trọng số của K phân bố tại thời điểm t sẽđược hiệu chỉnh như sau: ω k,t = (1-α)ω k,t-1 + α(M k,t ) (1.6)
Xác đị nh v ậ n t ốc phương tiệ n
1.2.1 Mô hình vật lý đểđo vận tốc xe cộ trong một Video Camera Để xác định được vận tốc của một phương tiện bởi một camera quan sát, chúng ta cần phải xác định được sựthay đổi vị trí của các điểm tham khảo nằm trên phương tiện đó theo thời gian như thếnào Vì các điểm này là cố định trên phương tiện nên khi phương tiện chuyển động thì các điểm này cũng chuyển động với vận tốc tương tự và theo một hướng tương tự như phương tiện Trong luận văn, do các camera quan sát được đặt cố định nên vận tốc di chuyển của các phương tiện do camera quan sát được cũng chính bằng vận tốc di chuyển thực tế của các phương tiện trên đường Đểxác định được vận tốc phương tiện, các khung hình kế tiếp của camera cần được sử dụng Trong trường hợp này, chỉ xác định được vận tốc tức thời
Vận tốc tức thời được tính toán theo công thức sau:
Công thức vận tốc tức thời được biểu diễn bằng v = ∆p/∆t, trong đó v là véc tơ vận tốc tức thời của một điểm trong không gian 2 chiều (2D) khi sử dụng camera Véc tơ dịch chuyển ∆p của điểm đó cũng nằm trong không gian 2D.
𝑅𝑅 2 Véc tơ dịch chuyển thể hiện sự dịch chuyển trong không gian của một điểm trong suốt một khoảng thời gian ∆𝑡𝑡 Ởđây ∆𝑡𝑡 bằng thời gian chuyển giữa hai khung hình video liên tiếp và bằng với tốc độ thu hình của camera Phương trình (1.14) cho ta vận tốc tức thời của một điểm được đánh dấu trên phương tiện và được lựa chọn cho việc bám sát Để xác định được vận tốc của phương tiện, các tiếp cận cục bộđược sử dụng Nếu xảy ra một số lỗi trong bước lựa chọn này, véc tơ vận tốc tính toán được này sẽ bị ảnh hưởng bởi các lỗi này và do đó vận tốc tính toán được cũng sẽ bị sai Do nguyên nhân này, đểước lượng vận tốc của một phương tiện, có nhiều hơn một điểm trên phương tiện được lựa chọn và tất cả các véc tơ vận tốc tức thời của chúng được tính toán Sau đó bằng cách lấy trung bình các véc tơ vận tốc tức thời của toàn bộ các điểm đã lựa chọn này, sẽ cho ta véc tơ vận tốc tức thời của phương tiện Để biểu diễn dưới dạng công thức, ta giả sử xét n điểm trên phương tiện và đặt vi(t) (i = 1, , n) biểu diễn các véc tơ vận tốc tức thời của mỗi điểm
Trong thời điểm t, chúng ta đã lựa chọn 16 điểm để phân tích Bằng cách sử dụng các véc tơ vận tốc tức thời tại những điểm này, chúng ta có thể xác định véc tơ vận tốc của phương tiện theo công thức đã được thiết lập.
Vận tốc tức thời của phương tiện tại thời điểm t được tính theo công thức 𝑣𝑣𝑢𝑢𝑢𝑢(𝑡𝑡) = 1/n ∑ 𝑣𝑣 𝑢𝑢(𝑡𝑡), trong đó 𝑣𝑣 𝑢𝑢(𝑡𝑡) là véc tơ vận tốc tức thời của điểm thứ i trên phương tiện, và n là số lượng điểm được chọn Việc loại bỏ các véc tơ sai là rất quan trọng vì nếu có véc tơ không chính xác, kết quả tính toán vận tốc tức thời cũng sẽ bị ảnh hưởng Sau khi khử các véc tơ sai, giá trị n sẽ giảm và độ lệch chuẩn của n vận tốc mẫu có thể được sử dụng để đánh giá độ chính xác Hai yếu tố chính ảnh hưởng đến sai số của vận tốc cần được xem xét kỹ lưỡng.
Một trong những phương pháp quan trọng là đối chiếu các điểm di chuyển không mong đợi trên hình nền và các điểm bóng của phương tiện Chúng ta áp dụng phương pháp trừ ảnh để loại bỏ nền, từ đó xác định các đối tượng chuyển động giữa các khung hình liên tiếp Các đối tượng chuyển động sẽ hiển thị trên ảnh sai khác, trong khi các đối tượng cố định không bị ảnh hưởng Ví dụ như phương tiện di chuyển, bóng của nó, cỏ dao động và cây rung đều xuất hiện trong ảnh sai khác và là các đặc trưng để bám sát Ngoài ra, sự thay đổi về điều kiện chiếu sáng cũng có thể được phát hiện như một đối tượng chuyển động Để khử những nền không mong muốn và loại bỏ các điểm bóng, chúng ta sử dụng thuật toán biểu đồ ngưỡng.
Hình 1.5: Các véc tơ vận tốc trước khi lọc các ngoại lai [34]
Hình 1.6: Các véc tơ vận tốc sau khi bỏ các ngoại lai [34]
Vận tốc trung bình của phương tiện từ khi xuất hiện đến khi rời khỏi khung hình camera có thể được tính toán dựa trên các vận tốc tức thời đã được xác định Gọi I(t1), …, I(tm) là các khung hình của phương tiện tại thời điểm tj, với m là số khung hình mà phương tiện xuất hiện Sử dụng các vận tốc tức thời 𝑣𝑣𝑢𝑢𝑢𝑢(𝑡𝑡𝑗𝑗) giữa các khung hình I(tj) và I(tj+1) (j = 1, , m), ta có thể tính toán vận tốc trung bình của phương tiện trong khoảng thời gian này.
Vận tốc trung bình của phương tiện được tính bằng công thức 𝑣𝑣𝑎𝑎𝑢𝑢𝑛𝑛 = 𝑚𝑚 1 ∑ 𝑛𝑛 𝑗𝑗=1 𝑣𝑣𝑢𝑢𝑢𝑢(𝑡𝑡𝑗𝑗), trong đó 𝑣𝑣 𝑎𝑎𝑢𝑢𝑛𝑛 là vận tốc trung bình, 𝑣𝑣 𝑢𝑢𝑢𝑢(𝑡𝑡𝑗𝑗) là vận tốc tức thời tại thời điểm 𝑡𝑡𝑗𝑗, và 𝑚 là số khung ảnh mà phương tiện xuất hiện.
1.2.2 Chỉnh lưu các khung hình ảnh với các điểm triệt tiêu Để xác định được các giá trị tuyệt đối của các véc tơ dịch chuyển hay các véc tơ vận tốc trong không gian đối tượng, các véc tơ được tính toán trong hệ thống tọa độ hình ảnh video sẽ được chuyển đổi sang hệ thống tọa độ đối tượng nằm bên trong không gian đối tượng Với mục đích trên, ta giả sử khung ảnh quan sát là phẳng Trong trường hợp lý tưởng, khung hình phẳng là các mặt phẳng thẳng đứng như trong hình 1.7 Các khoảng cách từ camera tới các mặt phẳng này là khác nhau do độ sâu của chúng khác nhau Sự khác nhau này khiến các mặt phẳng có tỷ lệ khác nhau trong mặt phẳng ảnh Với chỉ một camera và một hình ảnh, không thể nào xác định được độ sâu và các tỷ lệ của các mặt phẳng trên hình ảnh một cách gián tiếp
Để giải quyết bài toán tỷ lệ, chúng ta đo hai khoảng cách trong không gian đối tượng bằng một thước đo, nằm trên hai mặt phẳng thẳng đứng và dọc theo các biên đường Phương tiện di chuyển từ trái sang phải hoặc ngược lại, được thể hiện qua phương tiện 1 và phương tiện 2 trong hình 1.7 Trong trường hợp lý tưởng, mặt phẳng ảnh song song với mặt phẳng đứng, cho phép xác định hệ số tỷ lệ Nếu phương tiện di chuyển từ trái sang phải, mặt hiển thị gần mặt phẳng Π1 với tỷ lệ λ1, và các tỷ lệ tương ứng được tính qua d1, d2 và các khoảng cách trên mặt phẳng ảnh Ngược lại, khi phương tiện di chuyển từ phải qua trái, tỷ lệ được tính bằng λ = (λ1 + λ2)/2 Các giả thiết này giúp xác định giá trị tuyệt đối của các véc tơ vận tốc trong cấu hình lý tưởng.
19 thể nhận được bằng các sử dụng các hệ số tỷ lệtương ứng
Trong trường hợp lý tưởng, bất kỳ đường thẳng nào song song với mặt phẳng đứng cũng sẽ song song với mặt phẳng ảnh, và tương tự đối với mặt phẳng ngang Tuy nhiên, nếu mặt phẳng ảnh không lý tưởng, các đường thẳng này sẽ không còn song song, dẫn đến việc chúng giao nhau tại các điểm gọi là điểm triệt tiêu Bằng cách sử dụng các điểm triệt tiêu và mặt phẳng triệt tiêu tương ứng, ảnh có thể được chỉnh lưu để thể hiện trường hợp lý tưởng Để tìm các đường triệu tiêu, chúng ta áp dụng biến đổi Hough và tính toán các giao điểm, từ đó xác định tọa độ của các điểm triệu tiêu trong hệ tọa độ hình ảnh Các điểm này được sử dụng để chỉnh lưu hình ảnh bằng cách tạo ra các đường triệt tiêu song song với các đường còn lại Hình 1.8 dưới đây minh họa các đường thẳng triệt tiêu đã được tính toán bằng biến đổi Hough.
Hình 1.8: Các đường thẳng triệt tiêu được tìm thấy nhờ biến đổi Hough (ảnh bên trái) và ảnh được chỉnh lưu (bên phải) [34]
Trong hệ thống thu nhận hình ảnh, camera được cố định tại một vị trí Khi các tham số chỉnh lưu được tính toán lần đầu, chúng sẽ được duy trì cho đến khi camera thay đổi vị trí Do đó, khi bắt đầu ước lượng vận tốc, việc tính toán các tham số chỉnh lưu là cần thiết và chúng sẽ được áp dụng trong suốt thời gian camera không di chuyển.
Trong bài toán ước lượng chuyển động, sau khi xác định được các tham số chỉnh lưu, không cần thiết phải chỉnh lưu toàn bộ hình ảnh Thay vào đó, chỉ những điểm được chọn lọc và theo dõi mới cần được thực hiện chỉnh lưu.
1.2.3 Tựđộng lựa chọn các điểm để giám sát trên hình ảnh của phương tiện Đểgiám sát các đối tượng chuyển động với các hình ảnh video, các điểm được giám sát nằm trên đối tượng trên các khung hình liên tiếp cần được lựa chọn một cách tự động Các đặc trưng tốt để giám sát đó là các điểm góc với độ nghiêng không gian lớn theo hai hướng vuông góc Vì các điểm góc có thể không nằm trên một cạnh, bài toán mở không xảy ra Một trong những định nghĩa được sử dụng thường xuyên nhất của một điểm góc được đưa ra bởi Harris, C Stephens, M.A trong bài báo [17] Định nghĩa này định nghĩa một điểm góc bởi một ma trận được biểu diễn bởi các đạo hàm cấp 2 Các đạo hàm này là đạo hàm từng phần của cường độ điểm ảnh trên một ảnh và là ∂ 2 x, ∂ 2 y và ∂x∂y Bằng việc tính các đạo hàm cấp 2 của các điểm ảnh trong ảnh, một ảnh mới được tạo ra Ảnh mới này được gọi là ảnh
Hessian Tên Hessian xuất phát từ ma trận Hessian để tính toán xung quanh một điểm [7] Ma trận Hessian trong không gian 2D được định nghĩa như sau:
Shi và Tomasi trong [35] đề xuất tiêu chí lựa chọn đặc trưng dựa trên trị riêng nhỏ nhất của ma trận đạo hàm không gian, yêu cầu trị riêng này không được nhỏ hơn một số ngưỡng xác định trước Tiêu chí này đảm bảo rằng ma trận đạt chất lượng tốt, vượt qua mức nhiễu của ảnh, từ đó tránh việc nghịch đảo ma trận khuếch đại nhiễu một cách không hợp lý theo những hướng quan trọng.
K ế t lu ận chương
Trong chương này, tác giả đã tổng hợp và trình bày các phương pháp phát hiện và theo dõi đối tượng chuyển động trong video Những phương pháp này giúp nhận diện và phân tích hành vi của các đối tượng trong các đoạn video thu nhận được.
23 camera quan sát sử dụng các phép trừ nền, phương pháp tĩnh, sự khác biệt theo thời gian và luồng quang học để xác định vận tốc chuyển động của đối tượng trong ảnh Đây là bước quan trọng giúp nâng cao độ chính xác trong việc phân tích chuyển động.
Chương này trình bày phương pháp xác định vận tốc của phương tiện trong video quan sát, với trọng tâm là tiếp cận luồng quang học Đây là kiến thức nền tảng cần thiết để áp dụng trong việc xác định vận tốc của các phương tiện trong phần mô phỏng và thực nghiệm ở chương 3 của luận văn.
CÁC THU Ậ T TOÁN XÁC ĐỊ NH V Ậ N T Ố C XE C Ộ
Các thu ậ t toán vi phân
Các thuật toán vi phân tính toán vận tốc dựa trên các đạo hàm không gian và thời gian của cường độ sáng trong ảnh hoặc các phiên bản ảnh đã được lọc, sử dụng bộ lọc thông thấp hoặc thông dải Những phương pháp đầu tiên sử dụng đạo hàm bậc nhất và tập trung vào các ảnh tịnh tiến.
Công thức II(x,t) = II(x - vt, 0) (2.1) thể hiện mối quan hệ giữa cường độ sáng tại hai thời điểm khác nhau, trong đó v = (v,t)T Từ khai triển Taylor của công thức này, hoặc từ giả thiết rằng cường độ sáng được bảo tồn với dI(x,t)/dt = 0, ta có thể suy ra phương trình ràng buộc gradient một cách dễ dàng.
∇𝐼𝐼(𝑥𝑥,𝑡𝑡) ∙ 𝑣𝑣+ 𝐼𝐼 𝑡𝑡 (𝑥𝑥,𝑡𝑡) = 0 (2.2) trong đó 𝐼𝐼 𝑡𝑡 (𝑥𝑥,𝑡𝑡) là ký hiệu đạo hàm theo thành phần thời gian của 𝐼𝐼(𝑥𝑥,𝑡𝑡),
∇𝐼𝐼(𝑥𝑥,𝑡𝑡) = (𝐼𝐼 𝑥𝑥 (𝑥𝑥,𝑡𝑡),𝐼𝐼 𝜕𝜕 (𝑥𝑥,𝑡𝑡)) 𝑇𝑇 và ∇𝐼𝐼 ∙ 𝑣𝑣 là phép toán tích số thông thường Để đạt hiệu quả, (2.2) cung cấp thành phần pháp tuyến của chuyển động các chu tuyến thưa với cường độ sáng không đổi, được biểu diễn bằng vận tốc chính tắc 𝑣𝑣𝑛𝑛 = 𝑠𝑠𝑠𝑠 Vận tốc chính tắc s và n chỉ hướng chính.
25 tắc được cho bởi các công thức:
Trong phương trình (2.2), có hai thành phần chưa xác định của v, được liên kết bởi một phương trình tuyến tính Các ràng buộc sau đó cần được giải quyết dựa trên các thành phần này của v.
Các phương pháp vi phân cấp hai sử dụng các đạo hàm cấp hai (Hessian của I) cho ràng buộc vận tốc 2-d:
Phương trình (2.4) có thể được suy ra từ (2.1) hoặc từ sự bảo toàn của ∇𝐼𝐼(𝑥𝑥,𝑡𝑡), với điều kiện 𝑑𝑑∇𝐼𝐼(𝑥𝑥,𝑡𝑡)/𝑑𝑑𝑡𝑡= 0 Sự bảo toàn này chỉ ra rằng biến dạng cường độ sáng ban đầu, như phép quay hoặc giãn nở, không được thể hiện, từ đó tạo ra giới hạn mạnh hơn (2.2) cho các trường chuyển động có thể chấp nhận Để đo vận tốc ảnh, giả sử 𝑑𝑑∇𝐼𝐼(𝑥𝑥,𝑡𝑡)/𝑑𝑑𝑡𝑡 = 0, các ràng buộc trong (2.4) có thể được áp dụng riêng lẻ hoặc kết hợp với (2.2) để hình thành một hệ các phương trình tuyến tính.
Nếu bài toán mở rộng chiếm ưu thế trong khu vực địa phương với cường độ sáng một chiều, thì độ nhạy của vi phân số học khiến cho các đạo hàm cấp hai thường không được đo chính xác Hệ quả là, vận tốc ước lượng từ phương pháp đạo hàm cấp hai thường thưa hơn và kém chính xác so với ước lượng từ các phương pháp đạo hàm cấp một.
Một cách hiệu quả để ràng buộc v(x) là kết hợp các ước lượng cục bộ của thành phần vận tốc và/hoặc vận tốc 2-d qua không gian và thời gian, tạo ra một ước lượng mạnh mẽ hơn cho v(x) Có hai phương pháp phổ biến: phương pháp đầu tiên liên kết các độ đo địa phương với một mô hình cục bộ cho vận tốc 2-d, thường sử dụng mô hình đa thức bậc thấp và áp dụng kỹ thuật tối thiểu hóa bình phương hoặc biến đổi Hough Mặc dù v(x) thường được giả định là không đổi, nhưng các mô hình tuyến tính cho v(x) cũng đã được áp dụng thành công Phương pháp thứ hai sử dụng các ràng buộc trơn toàn cục, trong đó trường vận tốc được định nghĩa một cách tường minh.
26 dưới dạng cực tiểu của một hàm đã định nghĩa trên ảnh
Một yêu cầu quan trọng của các kỹ thuật vi phân là I(x, t) phải khả vi, điều này đòi hỏi việc làm trơn tạm thời tại các bộ cảm biến để ngăn ngừa sai số Các phép vi phân số học cần được thực hiện một cách cẩn thận Hạn chế của các kỹ thuật dựa trên gradient là chúng yêu cầu cường độ ảnh gần như tuyến tính và vận tốc nhỏ hơn 1 điểm ảnh/khung hình, điều này phát sinh từ việc sử dụng hai khung hình Khi sai số lấy mẫu không được ngăn ngừa trong ảnh thu nhận, một giải pháp là áp dụng các kỹ thuật vi phân theo phương pháp thô-tinh, với ước lượng thô trước và ước lượng tinh sau.
Horn - Schunck [21] kết hợp ràng buộc gradient (2.2) với một công thức làm trơn toàn cục để ràng buộc trường vận tốc được ước lượng v(x, t) = (u(x, t), v(x, t)), cực tiểu hóa
Trong bài viết này, chúng tôi định nghĩa phương trình (2.5) trên miền D, trong đó độ lớn của 𝜆 phản ánh ảnh hưởng của độ trơn Chúng tôi chọn 𝜆 = 0.5 thay vì 𝜆 = 100 như khuyến nghị trong tài liệu [21], vì lựa chọn này mang lại kết quả tốt hơn trong hầu hết các trường hợp thử nghiệm Tiếp theo, chúng tôi lặp lại các phương trình được sử dụng để cực tiểu hóa (2.5) và thu được vận tốc ảnh.
∝ 2 +𝐼𝐼𝑥𝑥 2+𝐼𝐼𝜕𝜕 2 trong đó k ký hiệu số lần lặp, 𝑢𝑢 0 và 𝑣𝑣 0 là khởi tạo vận tốc ước lượng, được thiết lập ban đầu bằng 0, và 𝑢𝑢� 𝑘𝑘 , 𝑣𝑣̅ 𝑘𝑘 là các giá trị trung bình của u k , v k
Phương pháp nguyên bản được trình bày trong [21] sử dụng vi phân cấp một để ước lượng độ lớn các đạo hàm Tuy nhiên, vì đây là một dạng tương đối thô của vi phân số, có thể gây ra sai số Do đó, chúng tôi áp dụng phương pháp làm trơn không gian và thời gian với mặt nạ hệ số 12 1 (−1, 8, 0,−8, 1) để cải thiện độ chính xác.
Sử dụng bộ tiền lọc Gaussian theo miền không gian và thời gian với độ lệch chuẩn 1.5 điểm ảnh trong không gian và 1.5 khung hình trong thời gian (1.5 pixels-frames) giúp cải thiện chất lượng hình ảnh và video, giảm thiểu nhiễu và làm mượt các chuyển động.
Thuật toán Lucas-Kanade là phương pháp ước lượng chuyển động dựa trên sự khác biệt giữa hai khung hình liên tiếp trong chuỗi khung hình Thuật toán này hoạt động dựa trên một số điều kiện nhất định để đảm bảo tính chính xác trong việc phân tích chuyển động.
• Cường độ sáng của điểm ảnh không đổi theo thời gian
• Các điểm ảnh lân cận cũng chuyển động cùng vận tốc
Thuật toán Lucas – Kanade gồm 2 bước:
Bước 1: Xây dựng 1 tháp Gaussian của 2 frame liên tiếp
Bước này thực chất là thực hiện thuật toán resize ảnh theo công thức:
Công thức I L−1 (2x+1,2y+1) (2.7) mô tả giá trị của điểm ảnh tại tọa độ (x,y), trong đó ảnh gốc được ký hiệu là I 0 và các ảnh sau mỗi lần thay đổi kích thước lần lượt là I 1, I 2, I 3, Hình 2.1, 2.2 và 2.3 minh họa các ảnh đã được thay đổi kích thước ở các mức 0, 1 và 2.
Bước 2: Xác định véc tơ vận tốc tại mỗi mức
Vector vận tốc tại mức L:d L phải làm cực tiểu hàm bình phương lỗi:
Vector vận tốc tại mức 0 (ảnh gốc) được xác định theo công thức:
Dựa trên phương pháp Lucas-Kanade, chúng ta thực hiện một bình phương tối tiểu có trọng số để phù hợp với các ràng buộc bậc một, đồng thời áp dụng một mô hình bất biến của v trong mỗi không gian lân cận nhỏ Ω thông qua quá trình cực tiểu hóa.
Hàm cửa sổ W(x) trong (2.10) có ảnh hưởng lớn đến các ràng buộc tại trọng tâm của các lân cận, thay vì ở vùng ngoại vi Lời giải cho phương trình (2.10) được trình bày như sau:
𝐴𝐴 𝑇𝑇 𝑊𝑊 𝑡𝑡 𝐴𝐴𝑣𝑣 =𝐴𝐴 𝑇𝑇 𝑊𝑊 𝑡𝑡 𝑏𝑏 (2.11) trong đó, với n điểm 𝑥𝑥 𝑢𝑢 ∈ Ω tai một thời điểm t,
Lời giải của (2.11) là v = [𝐴𝐴 𝑇𝑇 𝑊𝑊 2 𝐴𝐴] −1 𝐴𝐴 𝑇𝑇 𝑊𝑊 2 𝑏𝑏được giải ở dạng đóng khi
𝐴𝐴 𝑇𝑇 𝑊𝑊 2 𝐴𝐴 là không suy biến, do đó nó là ma trận 2x2:
� 𝑊𝑊 2 (𝑥𝑥)𝐼𝐼 𝜕𝜕 (𝑥𝑥)𝐼𝐼 𝑥𝑥 (𝑥𝑥) � 𝑊𝑊 2 (𝑥𝑥)𝐼𝐼 𝜕𝜕 2 (𝑥𝑥) �(2.12) trong đó tất cả tổng là tính trên các điểm trong lân cận Ω
Các thu ậ t toán d ự a trên so kh ớ p vùng
Độ chính xác của phép lấy vi phân số có thể bị ảnh hưởng bởi nhiễu và lỗi trong quá trình thu nhận ảnh, dẫn đến việc các phương pháp vi phân không còn phù hợp Trong những trường hợp này, cần chuyển sang phương pháp so khớp vùng để đạt được kết quả chính xác hơn Các tiếp cận này định nghĩa vận tốc v là độ di chuyển 𝑑𝑑 = (𝑑𝑑𝑥𝑥,𝑑𝑑𝜕𝜕), nhằm tối ưu hóa sự phù hợp giữa các vùng ảnh ở các thời điểm khác nhau.
Tìm kiếm sự khớp nhất để tối đa hóa một chỉ số tương tự, như tương quan chéo chuẩn hóa, hoặc để tối thiểu hóa một chỉ số khoảng cách, chẳng hạn như tổng bình phương sai phân (SSD), là một quá trình quan trọng trong phân tích dữ liệu.
=𝑊𝑊(𝑥𝑥)∗[𝐼𝐼 1 (𝑥𝑥)− 𝐼𝐼2(𝑥𝑥+𝑑𝑑)] 2 , (2.18) trong đó W ký hiệu một hàm cửa sổ rời rạc 2 chiều, và 𝑑𝑑 = (𝑑𝑑𝑥𝑥,𝑑𝑑𝜕𝜕) là các giá trị nguyên
Độ đo khoảng cách SSD, độ đo tương tự tương quan chéo và các kỹ thuật vi phân có mối liên hệ chặt chẽ Việc tối thiểu hóa giá trị khoảng cách SSD nhằm tối đa hóa tích số \(I_1(x)I_2(x+d)\) Hơn nữa, sự sai khác trong (2.18) có thể được hiểu như là trung bình trọng số của phép xấp xỉ cấp một đối với đạo hàm theo thời gian của \(I(x, t)\).
Kỹ thuật so khớp đầu tiên được Anandan đề xuất, sử dụng hình chóp Laplacian và chiến lược điều chỉnh thô-tinh giá trị SSD Hình chóp Laplacian hỗ trợ tính toán các dịch chuyển lớn giữa các khung hình, đồng thời mở rộng cấu trúc ảnh hiệu quả.
Chúng tôi bắt đầu quá trình điều chỉnh thô đến độ chính xác điểm ảnh bằng cách tính toán các giá trị SSD trong không gian tìm kiếm kích thước 3x3.
𝑑𝑑 𝑥𝑥 ,𝑑𝑑 𝜕𝜕 nhận các giá trị -1, 0 và 1 pixel/frame), sử dụng ma trận Gaussian 5x5 cho W(x) Các độ dịch chuyển điểm ảnh tiếp theo được tính toán bằng cách tìm cực tiểu
Trong nghiên cứu về bề mặt SSD, giá trị cực tiểu SSD được xác định thông qua 32 độ dịch chuyển nguyên d Theo Anandan, các phép toán Beaudet được áp dụng để ước lượng các tham số của bề mặt toàn phương Các độ đo tin cậy cmin và cmax được suy ra từ đường cong nguyên lý, giúp xác định Cmin và Cmax của bề mặt SSD cực tiểu.
𝑘𝑘1+𝑘𝑘1𝑆𝑆𝑚𝑚𝑢𝑢𝑛𝑛+𝑘𝑘3𝐶𝐶𝑚𝑚𝑢𝑢𝑛𝑛(2.19) trong đó k1, k2, k3 là các hằng số chuẩn hóa, và Smin là giá trị SSD nhỏ nhất
Anandan cũng thực hiện một ràng buộc làm trơn trên ước lượng vận tốc, quan tâm tới cmin và cmax bằng cách cực tiểu:
Trong phương trình (2.20), \( cc \, mm \, uu \, nn \) được xác định bởi công thức \( (v \cdot e \, mm \, uu \, nn - v_0 \cdot e \, mm \, uu \, nn)^2 \), trong đó \( e_{max} \) và \( e_{min} \) biểu thị các hướng của độ cong cực đại và cực tiểu trên bề mặt SSD Ký hiệu \( v_0 \) đại diện cho độ dịch chuyển lan truyền từ mức cao trong hình chóp Anandan đã áp dụng phương pháp lặp Gauss-Seidal để suy ra phương trình liên quan.
𝑐𝑐 𝑚𝑚𝑢𝑢𝑛𝑛 + 1[(𝑣𝑣 0 − 𝑣𝑣 −𝑘𝑘 )∙ 𝑒𝑒 𝑚𝑚𝑢𝑢𝑛𝑛 ]𝑒𝑒 𝑚𝑚𝑢𝑢𝑛𝑛 (2.21) trong đó 𝑣𝑣̅ 𝑘𝑘 là trung bình lân cận của v k được tính bằng cách sử dụng mặt nạ:
Khởi tạo ban đầu, 𝑣𝑣̅ 0 được thiết lập bằng v0 Anandan cho phép 10 lần lặp để nhận được sự hội tụ
Khớp và làm trơn diễn ra ở mỗi cấp độ của hình chóp Laplacian Khi chuyển từ các mức thô sang tinh, vùng tìm kiếm SSD kích thước 3x3 được xác định bằng cách chiếu ước lượng từ mức thô đến tất cả các điểm trong vùng 4x4 ở mức tinh chỉnh cao hơn, từ đó mỗi điểm ảnh ở mức tinh chỉnh cao được dự đoán giá trị khởi tạo Chúng ta sử dụng hình chóp Laplacian để thực hiện quá trình này.
Chúng ta xem xét 33 với hai hoặc ba mức tốc độ trong chuỗi ảnh Mục tiêu là trích xuất các tập con của ước lượng dựa trên ngưỡng độ tin cậy được Anandan đề xuất, cụ thể là cmin và cmax.
Thuật toán Singh là một phương pháp so khớp hai giai đoạn, trong đó giai đoạn đầu tiên tập trung vào việc tính toán các giá trị SSD bằng cách sử dụng ba ảnh kề nhau đã được lọc thông dải, bao gồm I-1, I0 và I+1.
𝑆𝑆𝑆𝑆𝐷𝐷 0 (𝑥𝑥,𝑑𝑑) = 𝑆𝑆𝑆𝑆𝐷𝐷 0,1 (𝑥𝑥,𝑑𝑑) + 𝑆𝑆𝑆𝑆𝐷𝐷 0,−1 (𝑥𝑥,−𝑑𝑑), (2.22) trong đó SSD i,j được cho bởi công thức (2.13) Sau đó Singh biến đổi SSD0 thành một phân bố xác suất sử dụng:
𝑅𝑅𝑐𝑐(𝑑𝑑) = 𝑒𝑒 −𝑘𝑘𝑘𝑘𝑘𝑘𝐷𝐷 0 (2.23) trong đó k = -ln(0.95)/(min(SSD 0 )) Vận tốc v c = (uc, v c) được tính bằng trung bình của phân tán này:
Singh đề xuất một chiến lược tinh chỉnh thô-tinh sử dụng hình chóp Laplacian để tối ưu hóa bề mặt SSD, đảm bảo rằng 𝑅𝑅 𝑐𝑐 (𝑑𝑑) gần đối xứng với vận tốc thực, giúp cải thiện hiệu suất trong các trường hợp vận tốc lớn và tiết kiệm chi phí tính toán Cuối cùng, ông cho rằng các trị riêng của ma trận nghịch đảo hiệp phương sai có thể được sử dụng như các độ đo mức tin cậy, với ma trận hiệp phương sai được xác định rõ.
Khi thực hiện bước 1, chúng ta sử dụng phân giải đơn để tính toán bề mặt SSD trong phạm vi di chuyển với số nguyên từ −2N đến 2N, trong đó N có độ lớn là 4 điểm ảnh Theo Singh, một cửa sổ đồng nhất W được áp dụng với độ rộng 5 Từ bề mặt SSD có kích thước (4N+1) x (4N+1), chúng ta trích xuất một vùng con nhỏ nhất có kích thước (2N+1) x (2N+1) nằm trong trọng tâm của cửa sổ tìm kiếm gốc.
Mục tiêu của bài viết là trích xuất mặt phẳng SSD nhỏ nhất từ N tới N, nhằm cải thiện giả thiết đối xứng cho phân bố đã đề cập Khi N bằng 4, chúng ta thu được SSD kích thước 9 x 9 từ mặt phẳng SSD gốc kích thước 17 x 17 Thuật toán lan truyền vận tốc sử dụng các ràng buộc lân cận trong bước thứ hai để tối ưu hóa quá trình này.
Vận tốc ước lượng bình phương tối thiểu có trọng số vn (un, vn) có thể được suy ra từ các vận tốc vi = (ui, vi) trong khu vực lân cận cục bộ có kích thước (2w + 1) x (2w + 1).
Hàm Gaussian 𝑅𝑅𝑛𝑛(𝒗𝒖𝒖) trong công thức (2.26) phụ thuộc vào khoảng cách giữa trọng tâm của lân cận và vị trí ước lượng 𝒗𝒖𝒖 Mặc dù Singh đã sử dụng trọng số w=1, nhưng thực nghiệm cho thấy kết quả cải thiện đáng kể khi sử dụng w=2 Ma trận hiệp phương sai tương ứng cũng được xác định dựa trên trọng số này.
Cuối cùng, vận tốc ước lượng, v = (u, v) được chọn để cực tiểu hàm:
Thu ậ t toán d ựa trên năng lượ ng - Thu ậ t toán Heeger
Lớp kỹ thuật luồng quang học thứ ba sử dụng năng lượng đầu ra từ các bộ lọc điều chỉnh vận tốc, được biết đến như các phương pháp tần suất trong thiết kế bộ lọc điều chỉnh vận tốc trong miền Fourier.
[1, 13, 32] Biến đổi Fourier của một mẫu chuyển dịch 2-d là:
𝐼𝐼̂(𝑘𝑘,𝜔𝜔) = 𝐼𝐼̂ 0 (𝑘𝑘)𝛿𝛿(𝜔𝜔 + v 𝑇𝑇 𝑘𝑘) (2.30), trong đó 𝐼𝐼̂0(𝑘𝑘) là biến đổi Fourier của I(x, 0), 𝛿𝛿(𝑘𝑘) là hàm delta Dirac, 𝜔𝜔 là tần suất thời gian và k = (kx, ky) là tần số không gian Phương pháp được phát triển bởi Heeger [18, 19] sử dụng hàm bình phương tối thiểu phù hợp của năng lượng theo không-thời gian tới một mặt phẳng trong không gian tần suất Năng lượng cục bộ được trích xuất thông qua 12 bộ lọc năng lượng Gabor, điều chỉnh theo các tỷ lệ không gian, hướng không gian và tần số thời gian khác nhau Trong chuyển động thông thường, phản hồi của các bộ lọc này tập trung vào một mặt phẳng trong không gian tần suất Heeger suy ra phản hồi kỳ vọng R(u, v) của bộ lọc năng lượng Gabor điều chỉnh thành tần suất (kx, ky, 𝜔𝜔) cho chuyển dịch không nhiễu như một hàm số của vận tốc.
Trong công thức (𝑢𝑢𝜎𝜎𝑥𝑥𝜎𝜎𝑡𝑡)² + (𝑢𝑢𝜎𝜎𝜕𝜕𝜎𝜎𝑡𝑡)² + (𝜎𝜎𝑥𝑥𝜎𝜎𝜕𝜕)², các ký hiệu 𝜎𝜎 𝑥𝑥, 𝜎𝜎 𝜕𝕕 và 𝜎𝜎 𝑡𝑡 đại diện cho độ lệch chuẩn của các thành phần Gaussian trong bộ lọc Gabor Để tìm ra lời giải của Heeger, ký hiệu Mi (1≤ 𝑖 ≤12) là tập hợp các bộ lọc với sự hiệu chỉnh đồng hướng, trong khi 𝑚𝑚𝑢𝑢 và 𝑅𝑅𝑢𝑢 lần lượt đại diện cho tổng năng lượng đo được và dự đoán, mj và Rj từ các bộ lọc j trong tập Mi.
(2.32) Ước lượng bình phương tối thiểu cho (u,v) cực tiểu sai khác giữa các năng lượng chuyển động dựđoán và đo được được cho bởi cực tiểu của:
Cácthu ậ t toán d ự a trên pha
Lớp kỹ thuật thứ tư của phương pháp luồng quang học được gọi là dựa trên pha, vì vận tốc được xác định thông qua pha của các đầu ra bộ lọc thông dải.
2.4.1 Thuật toán Waxman, Wu và Bergholm
Waxman, Wu và Bergholm đã áp dụng các bộ lọc không-thời gian kết hợp với ánh xạ cạnh nhị phân nhằm theo dõi các cạnh trong thời gian thực Phương pháp này cho phép phát hiện và xử lý các cạnh một cách hiệu quả, nâng cao khả năng phân tích dữ liệu động.
E(x, t) dựa trên một điểm về không DOG [29], được làm trơn bởi bộ lọc Gaussian để tạo mộtkích hoạt quy ước A(x, t):
Chu trình của A(x, t) được theo dõi bằng các phương pháp vi phân, tuy nhiên, do gradient không gian của A(x, t) bằng không tại các vị trí biên, nên cần áp dụng một tiếp cận bậc hai Phương pháp này sử dụng các ràng buộc trong (2.4) với A(x, t) để tính toán Các vận tốc ước lượng tại vị trí biên được xác định dựa trên phương pháp này.
𝐴𝐴 𝑥𝑥𝑥𝑥 𝐴𝐴 𝜕𝜕𝜕𝜕 − 𝐴𝐴 𝑥𝑥𝜕𝜕 2 (2.35) Để sử dụng cho thực nghiệm, trọng tâm Gaussian của DOG có độ lệnh chuẩn là 1.5 pixels-frames và tỷ lệ tới trọng tâm là 1.6 Với A(x, t) ta sử dụng:
Waxman và cả nhóm cũng đề xuất một phương pháp đa 𝜎𝜎 trong đó nó cố gắng lựa chọn vận tốc tốt nhất trên một vị trí biên
Cho các giá trị 𝜎𝜎 𝑥𝑥 = 𝜎𝜎 𝜕𝜕 khác nhau (1.0, 1.5 và 2.0)ta lựa chọn vận tốc để cực đại hàmsau:
Waxman đã đề xuất sử dụng giá trị Hessian của A để đánh giá độ tin cậy của các vận tốc Nếu giá trị Hessian đạt hoặc vượt quá ngưỡng 𝜏𝜏, điều này cho thấy mức độ tin cậy cao trong các kết quả vận tốc.
37 dụng 𝜏𝜏 = 0.5), thì vận tốc toàn phần được tính ở vị trí biên Nếu nó nhỏ hơn ngưỡng 𝜏𝜏 ta có thể sử dụng tính toán vận tốc chính tắc:
Phương pháp của Fleet và Jepson định nghĩa thành phần vận tốc như là chuyển động tức thời chuyển hóa sang các chu tuyến ở mức pha trong các bộ lọc thông dải điều chỉnh vận tốc Các bộ lọc này tách tín hiệu đầu vào dựa trên tỷ lệ, vận tốc và hướng, với mỗi đầu ra bộ lọc tạo ra các giá trị phức tạp có thể được diễn đạt qua một công thức cụ thể.
Trong công thức 𝑅𝑅(𝐱𝐱,𝑡𝑡) =𝜌𝜌(𝐱𝐱,𝑡𝑡) exp[𝑖𝑖∅(𝒙𝒙,𝑡𝑡)], 𝜌𝜌(𝐱𝐱,𝑡𝑡) và ∅(𝒙𝒙,𝑡𝑡) đại diện cho các phần biên độ và pha của R Thành phần vận tốc 2-d từ dạng chiều tới chu tuyến pha được mô tả bởi công thức vn = sn, trong đó vận tốc chính tắc và chiều được xác định rõ ràng.
Trong công thức (2.39), đại lượng ‖∇∅(𝐱𝐱,𝑡𝑡)‖ được xác định bởi ∇∅(𝐱𝐱,𝑡𝑡) =�∅ 𝑥𝑥 (𝐱𝐱,𝑡𝑡),∅𝜕𝜕(𝐱𝐱,𝑡𝑡)� 𝑇𝑇 Để đạt hiệu quả tối ưu, việc áp dụng kỹ thuật vi phân nên tập trung vào pha thay vì cường độ Các đạo hàm pha có thể được tính toán theo công thức đã nêu.
|𝑅𝑅(𝐱𝐱,𝑡𝑡)| 2 (2.40) trong đó 𝑅𝑅 ∗ là liên hợp phức của R
Việc sử dụng pha trong các đầu ra của bộ lọc thông dải được khuyến khích vì tính ổn định cao hơn so với thành phần biên độ khi có sự dịch chuyển nhỏ trong hình ảnh Tuy nhiên, pha cũng có thể trở nên không ổn định do những bất ổn xảy ra ở các khu vực lân cận của suy biến pha Những bất ổn này có thể được xác định thông qua một ràng buộc trực tiếp trên tần số tức thời của đầu ra bộ lọc và sự biến thiên biên độ của nó trong không-thời gian.
Trong nghiên cứu này, tần số không-thời gian của bộ lọc đã được hiệu chỉnh là (k, 𝜔𝜔), với 𝜎𝜎 𝑘𝑘 đại diện cho độ lệch chuẩn của biên độ sử dụng và 𝜏𝜏 là ngưỡng loại bỏ các thành phần không đáng tin cậy trong đo vận tốc Khi 𝜏𝜏 giảm, đầu ra bộ lọc sẽ bị ràng buộc chặt chẽ hơn, giúp phát hiện các vùng lân cận suy biến lớn hơn Trong thực nghiệm, giá trị 𝜏𝜏 được thiết lập là 1.25, và ràng buộc thứ hai trên biên độ phản hồi được áp dụng để đảm bảo tỷ lệ tín hiệu trên nhiễu hợp lý.
Cuối cùng, sau khi nhận được các ước lượng thành phần vận tốc từ các kênh lọc sai khác, một mô hình vận tốc tuyến tính được tính phù hợp cho từng vùng cục bộ Các ước lượng này đảm bảo tính ổn định và tuân thủ các ràng buộc về tỷ lệ tín hiệu trên nhiễu (SNR) từ các vùng lân cận 5x5, nhằm xác định mô hình vận tốc tuyến tính tốt nhất Để đảm bảo thông tin đầy đủ cho việc ước lượng vận tốc tin cậy, các tác giả đã đưa ra các ràng buộc trên hệ thống tuyến tính và lỗi dư thừa tuyến tính Fleet và Jepson chỉ xem xét các độ đo vận tốc hai chiều với số điều kiện nhỏ hơn 10.0 và lỗi dư thừa nhỏ hơn 0.5 để chứng minh các kết quả.
Thành l ậ p công th ứ c tính v ậ n t ố c th ậ t c ủa phương tiệ n
Sơ đồ quy chiếu từ video sang thực tế cung cấp cái nhìn trực quan về công thức tính toán vận tốc thực tế của phương tiện giao thông, giúp người đọc dễ dàng hiểu và áp dụng.
Hình 2.4: Sơ đồ quy chiếu từ video sang thực tế
Để xây dựng công thức liên hệ giữa vận tốc thực tế của một điểm chuyển động trên đường và số lượng điểm ảnh chuyển động qua hai khung hình liên tiếp, cần thực hiện các bước phân tích và tính toán cụ thể.
Để tính toán vận tốc thực của xe, việc xác định kích thước của đoạn đường mà camera có khả năng quan sát là điều cần thiết.
Khi áp dụng các thuật toán luồng quang học, chúng ta có thể thu thập thông tin về tọa độ của các vật thể trong khung hình trước và khung hình hiện tại, và lưu trữ chúng trong các mảng.
Để phân tích sự dịch chuyển của một điểm trên vật thể trong hai khung hình liên tiếp, ta xem xét tọa độ của điểm đó Ở khung hình thứ nhất, tọa độ là (x1, y1), trong khi ở khung hình thứ hai, tọa độ là (x2, y2) Độ dịch chuyển theo chiều x và y lần lượt được tính toán dựa trên sự khác biệt giữa hai tọa độ này.
Để xác định độ dịch chuyển thực tế của một điểm trên mặt đất, ta có thể sử dụng kích thước khung hình video là 320x240, tuy nhiên, kích thước này có thể thay đổi và cần được điều chỉnh phù hợp với giá trị thực tế.
• Độ di chuyển của xe trên thực tế:
Để tính toán vận tốc di chuyển của xe, ta cần xác định độ dịch chuyển giữa hai khung hình liên tiếp và nhân với tốc độ khung hình R (fps).
K ế t lu ận chương
Chương này của luận văn trình bày 9 kỹ thuật dựa trên luồng quang học, bao gồm các phương pháp vi phân, so khớp vùng, và dựa trên năng lượng và pha, với các thuật toán như Horn and Schunck, Lucas and Kanade, Uras, Nagel, Anandan, Singh, Heeger, Waxman và Fleet and Jepson Cuối chương, phương pháp xác định vận tốc thực của phương tiện được giới thiệu, sử dụng các véc tơ vận tốc thu nhận dưới dạng điểm ảnh từ các thuật toán trên Phương pháp này là cơ sở để cài đặt và thực nghiệm chương trình xác định vận tốc chuyển động của các phương tiện trong video từ hệ thống camera giao thông.