Kĩ thuật miền tần số

Trong phần này chúng ta xem xét vấn đề xác định ước tính chuyển động thông qua một biến đổi Fourier xây dựng. Xem xét một chuỗi f (x, y, t) = 0,1, ..., K - 1, K khung ảnh kỹ thuật số kích thước MxN được tạo ra bởi một máy ảnh cố định. Chúng tôi bắt đầu phát triển bằng cách giả định rằng tất cả các khung hình có một nền tảng đồng nhất của cường độ không. Trường hợp ngoại lệ là một duy nhất 1 điểm ảnh đối tượng, đơn vị cường độ đang chuyển động với vận tốc không đổi. Giả sử cho một khung (t = 0) mặt phẳng ảnh được chiếu lên trục x, đó là cường độ điểm ảnh được tổng hợp trên các cột. Hoạt động này mang lại một mảng 1 chiều với M phần đó là 0, ngoại trừ tại địa điểm mà đối tượng được dự tính. Nhân các thành phần của mảng bởi exp[j2a1x∆t] [j2πa1xΔt], x = 0,1, 2, .... M - 1, với các đối tượng ở tọa độ (x ', y') tại khoảnh khắc

của thời gian, tạo ra bằng exp [j2a1x’∆t] . Trong ký hiệu này a1 là một số nguyên dương, và Δt là khoảng thời gian giữa khung hình.

Giả sử rằng trong khung hai (t = 1) đối tượng đã di chuyển đến tọa độ (x '+ 1, y'), có nghĩa là, nó đã di chuyển 1 pixel song song với trục x. Sau đó lặp đi lặp lại các thủ tục dự thảo luận trong đoạn trước bằng tổng exp[j2a1(x’+1)∆t] . Nếu đối tượng tiếp tục di chuyển 1 pixel vị trí mỗi khung hình, sau đó, bất cứ lúc nào ngay lập tức số nguyên của thời gian, kết quả là exp[j2a1(x’+ t)∆t , trong đó, sử dụng công thức Euler, có thể được thể hiện như

= cos [j2a1(x’+ t)∆t] + j sin [j2a1(x’+ t)∆t] ( 10.6.5)

cho t = 0,1, ..., K-1. Nói cách khác, phương pháp này mang lại một hình sin phức tạp với tần số a1. Nếu đối tượng đã được di chuyển υ1 pixel (trong phương x) giữa khung hình, các hình sin sẽ có tần số υ1a1 . Vì t thay đổi từ 0 và K-1 trong gia số nguyên, hạn chế a1 các giá trị số nguyên gây ra Fourier rời rạc biến đổi của hình sin phức tạp để có hai đỉnh núi - một nằm ở tần số υ1a1 và khác ở K - υ1a1 . Đỉnh cao sau này là kết quả của sự đối xứng trong các biến đổi Fourier rời rạc, như đã thảo luận trong phần 4.6, và có thể được bỏ qua. Vì vậy, một tìm kiếm đỉnh cao trong quang phổ Fourier sản lượng

υ1a1 . Phân chia số lượng này bằng cách υ1 và a1 , là thành phần vận tốc trong x- hướng, như tỷ lệ khung hình được giả định là được biết đến. Một lập luận tương tự sẽ mang lại υ2, các thành phần của tốc độ truyền theo y hướng

Một chuỗi các khung hình trong đó không có chuyển động diễn ra tạo điều kiện mũ giống hệt nhau, có biến đổi Fourier sẽ bao gồm một đỉnh cao duy nhất ở tần số từ 0 (một thuật ngữ dc duy nhất). Do đó, vì các hoạt động thảo luận cho đến nay là tuyến tính, trường hợp tổng quát liên quan đến một hoặc nhiều đối tượng chuyển động trên nền tĩnh tùy ý sẽ có một biến đổi Fourier với một đỉnh tại dc tương ứng với các thành phần hình ảnh tĩnh và đỉnh núi tại các địa điểm tỷ lệ thuận với vận tốc của các đối tượng.

Những khái niệm này có thể được tóm tắt như sau. Đối với một chuỗi các hình ảnh kỹ thuật số K có kích thước M x N, tổng các hình chiếu lên trục x tại bất kỳ số nguyên lần là :

gx (t, a1) = t = 0,1, …., K-1 (10.6-6)

Tương tự như vậy, tổng theo trục y là

gy (t, a2) = t = 0,1, …., K-1 (10.6-7)

V ới a1 và a2 là số nguyên dương :

Gx(u1 ,a1) = u1 = 0,1, …., K-1 (10.6-8)

và

Gy(u2 ,a2) = u2 = 0,1, …., K-1 (10.6-9)

Trong thực tế, tính toán của các biến đổi được thực hiện bằng cách sử dụng một thuật toán FFT, như đã thảo luận trong phần 4.6.

Mối quan hệ tần số - vận tốc là: u1 = υ1a1 (10.6- 10) và u2 = υ2a2 (10.6- 11)

Trong công thức này đơn vị vận tốc là trong tổng số điểm ảnh mỗi khung thời gian. Ví dụ, υ1 = 10 được xem như là một chuyển động của 10 điểm ảnh trong K khung. Đối với khung được thực hiện thống nhất, tốc độ vật lý thực tế phụ thuộc vào tỷ lệ khung hình và khoảng cách giữa các điểm ảnh. Vì vậy, nếu υ1 = 10, K = 30, tỷ lệ khung hình là hai hình ảnh mỗi giây, và khoảng cách giữa các điểm ảnh là 0,5 m, sau đó tốc độ thực tế vật chất trong phương x được

Các dấu hiệu của thành phần x của vận tốc thu được bằng tính toán

Và

Vì gx là hình sin, nó có thể được hiển thị (vấn đề 10.47) rằng S1x và S2x sẽ có dấu hiệu tương tự tại một điểm tùy ý trong thời gian, n, nếu các thành phần vận tốc V1 là tích cực. Ngược lại, dấu hiệu ngược lại trong S1x và S2x chỉ ra một thành phần tiêu cực. Nếu một trong hai S1x và S2x là không, chúng tôi xem xét các điểm gần nhất tiếp theo trong thời gian, t = n ± Δt. Nhận xét tương tự áp dụng trong việc tính toán dấu của V2.

Ví dụ 10.21: Phát hiện một đối tượng chuyển động nhỏ qua miền tần số.

Hinhf10.51 qua 10.54 minh họa cho tính hiệu quả của phương pháp tiếp cận chỉ có nguồn gốc. Hình 10.51 cho thấy một trong một chuỗi 32 khung hình ảnh LANDSAT được tạo ra bằng cách thêm nhiễu trắng để hình ảnh tham khảo. Trình tự chứa một mục tiêu chồng di chuyển ở mức 0.5 điểm ảnh cho mỗi khung hình trong phương x và 1 điểm ảnh cho mỗi khung hình trong hướng y. Mục tiêu thể hiện vòng tròn

Fig.10.52, có phân bố cường độ Gauss trải rộng trên một nhỏ (9 - pixel) và khu vực là không dễ dàng thấy rõ bằng mắt thường. Kết quả được tính. Eqs(10,6-8) và (10,6-9) với a1= 6 và a2 = 4 được thể hiện trong hình 10.53 và 10.54, tương ứng. Đỉnh cao tại u1 = 3 trong hình. 10.53 hiệu suất υ1 = 0,5 từ biểu thức. (10,6-10). Tương tự như vậy, đỉnh cao ở trong hình. 10,54 hiệu suất υ2 = 1,0 từ biểu thức. (10,6-11).

Hướng dẫn cho việc lựa chọn của a1 và a2 có thể được giải thích với sự trợ giúp của Hình. 10.53 và 10.54. Ví dụ, giả sử rằng chúng ta đã dùng a2 = 15 thay vì a2 = 4. Trong trường hợp đó các đỉnh trong hình. 10.54 bây giờ sẽ là lúc u2 = 15 đến 17 vì υ2 = 1,0, đó sẽ là một kết quả thật sự nghiêm túc. Như đã thảo luận tại mục 2.4.4, thật sự là do dưới mẫu (quá ít khung hình trong các cuộc thảo luận hiện nay, như phạm vi của nó được xác định bởi K). Vì u = aυ, một khả năng là để lựa chọn một là số nguyên gần nhất với a= umax/υmax , nơi umax là tần số thật sự được thiết lập bởi K và υmax là vận tốc đối tượng dự kiến tối đa

Tóm tắt

Phân vùng ảnh là một bước đầu quan trọng trong hầu hết các tự động nhận dạng mẫu ảnh và các vấn đề phân tích cảnh. Như được chỉ ra bởi một loạt các ví dụ được trình bày trong các phần trước, sự lựa chọn của một kỹ thuật phân chia nhỏ hơn khác được quyết định chủ yếu là do tính chất đặc thù của vấn đề đang được xem xét. Các phương pháp thảo luận trong chương này, mặc dù khá đầy đủ, và tiêu biểu của các kỹ thuật thường được sử dụng trong thực tế. Các tài liệu tham khảo sau đây có thể được sử dụng làm cơ sở để nghiên cứu thêm về chủ đề này.

Thuật toán phân vùng biên

Sử dụng chuyển động trong phân vùng ảnh