Kỹ thuật trừ nền

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu kỹ thuật phân tích đám đông trong giám sát tự động dựa vào thị giác máy (Trang 35 - 41)

6. Cấu trúc luận văn

2.1.2. Kỹ thuật trừ nền

Kỹ thuật trừ nền là một cách tiếp cận được sử dụng rộng rãi để phát hiện các đối tượng chuyển động trong video từ máy ảnh tĩnh. Cơ sở tiếp cận là phát hiện các đối tượng chuyển động từ sự khác biệt giữa hệ quy chiếu hiện tại và hệ quy chiếu, thường được gọi là "hình nền" hoặc "mô hình nền". Như một cơ bản, hình nền phải là đại diện của cảnh không có vật thể chuyển động và phải được giữ thường xuyên cập nhật để thích ứng với các mức giá khác nhau điều kiện và cài đặt hình học. Các mô hình phức tạp hơn đã mở rộng khái niệm "nền tảng phụ" ngoài nghĩa đen của nó [19].

Phát hiện đối tượng có thể đạt được bằng cách xây dựng một đại diện của cảnh được gọi là mô hình nền và sau đó tìm độ lệch khỏi mô hình cho mỗi khung hình đến. Bất kỳ thay đổi đáng kể nào trong vùng hình ảnh so với mô hình nền đều biểu thị sự chuyển động vật. Các pixel cấu thành các vùng đang thay đổi được đánh dấu để biết xử lý, tiến trình này được gọi với một tên chung là tách nền. Thông thường, một thuật toán thành phần được kết nối được áp dụng để có được các vùng tương ứng với các đối tượng. Quy trình tổng quan của kỹ thuật trừ nền [20].

26

Hình 2.3. Quy trình trừ nền

Các thay đổi chính đối với nền được phân loại thành: - Theo sự thay đổi độ sáng (illumination changes)

+ Thay đổi độ sáng từ từ do nguồn sáng (mặt trời) chuyển động.

+ Thay đổi độ sáng đột ngột do nguồn sáng bị thay đổi: trời chuyển giữa mưa và nắng, đèn trong phòng chuyển từ bật sang tắt hoặc ngược lại.

+ Ảnh hưởng của nguồn sáng tới bóng của vật trên nền. - Thay đổi chuyển động (motion changes)

+ Hình ảnh thay đổi do camera dịch chuyển.

+ Chuyển động trong các thành phần của nền như cành cây đung đưa, nước chảy…

27

- Thay đổi được báo trước: Chuyển động của chiếc ô tô từ từ dời khỏi điểm đỗ, người di chuyển ra khỏi phòng….

Hình 2.4. Kỹ thuật trừ nền

Một số phương pháp để thực hiện kỹ thuật trừ nền được miêu tả dưới đây. Tất cả các phương pháp này đều cố gắng ước tính hiệu quả mô hình nền từ trình tự thời gian của khung. Cách tiếp cận đơn giản, nhằm tối đa hóa tốc độ và hạn chế yêu cầu bộ nhớ, đến phức tạp hơn. Phương pháp tiếp cận, nhằm đạt được mức cao nhất có thể độ chính xác trong mọi trường hợp có thể. Tuy nhiên, các phương pháp tiếp cận nhằm vào hiệu suất thời gian thực, do đó một giới hạn thấp hơn về tốc độ luôn tồn tại [18].

Một số mô hình trừ nền:

2.1.2.1. Running Gausian Average (RGA):

Lập mô hình hóa nền độc lập tại mỗi vị trí pixel (i,j). Các mô hình dựa

trên lý tưởng phù hợp với xác suất Gaussian hàm mật độ (pdf ) trên giá trị n pixel cuối cùng [19]. Theo thứ tự để tránh lắp pdf từ đầu vào mỗi khung mới thời gian t, mức trung bình đang chạy (hoặc tích lũy trực tuyến) được tính dưới dạng:

28

trong đó I, là giá trị hiện tại của pixel và u, là giá trị trước đó Trung bình cộng; a là trọng số thực nghiệm thường được chọn làm đánh đổi giữa sự ổn định và cập nhật nhanh chóng. Mặc dù không được nêu rõ ràng trong phần theo dõi thời gian thực của cơ thể con người, tham số khác của Gaussian pdf, độ lệch chuẩn Ϭ1, có thể được tính tương tự. Ngoài tốc độ, lợi thế của trung bình nmning được đưa ra bởi yêu cầu bộ nhớ thấp: đối với mỗi pixel, điều này bao gồm hai tham số (µ1, Ϭ1) thay vì các bộ đệm với cuối n giá trị pixel.

Tại mỗi thời gian khung hình t, giá trị pixel I1 sau đó có thể là được phân loại là pixel nền trước nếu sự bất bình đẳng:

nắm giữ; nếu không thì, It sẽ được phân loại là nền. Các phép trừ tên nền thường được sử dụng để chỉ ratập hợp các kỹ thuật này thực sự bắt nguồn từ đối tượng chuyển động trong video.

Trong phần hướng tới mạnh mẽ phân tích cảnh giao thông tự động trong thời gian thực nhận xét rằng mô hình trong (Hình 2.4) là cũng được cập nhật quá mức khi xảy ra giá trị tiền cảnh. Vì lý do này, họ đề xuất sửa đổi bản cập nhật mô hình như:

trong đó, giá trị nhị phân M là 1 tương ứng với giá trị nền trước và 0 nếu không. Cách tiếp cận này cũng được gọi là cập nhật nền có chọn lọc .

Như mô hình theo dõi thời gian thực của cơ thể con người đã được đề xuất cho cường độ hình ảnh, phần mở rộng có thể được thực hiện cho nhiều thành phần không gian màu như (R, G, B), (Y, U, V) và các không gian màu khác.Hơn nữa, nếu các yêu cầu thời gian thực hạn chế tải tính toán, tốc độ cập

(2.2)

29

nhật của một trong hai , µ hoặc Ϭ có thể được đặt thành nhỏ hơn tỷ lệ (khung) mẫu. Tuy nhiên, tỷ lệ cập nhật của mô hình nền càng thấp, ít hơn một hệ thống sẽ được thể để nhanh chóng đáp ứng với những thực tế động nền.

2.1.2.2. Temporal median filter (TMF):

Sử dụng giá trị trung bình trong số n khung cuối cùng làm mô hình nền. Trong phát hiện vật thể chuyển động, giá trị trung bình như vậy cung cấp mô hình nền phù hợp ngay cả khi n khung là phụ được lấy mẫu đối với tốc độ khung hình gốc theo một hệ số 10. Ngoài ra, phát hiện vật thể chuyển động tính toán trung vị trên một bộ giá trị đặc biệt chứa n cuối cùng, được lấy mẫu con khung và w lần giá trị trung bình được tính gần đây nhất. Điều này sự kết hợp làm tăng tính ổn định của nền mô hình.

Nhược điểm chính của phương pháp tiếp cận dựa trên trung vị là tính toán của nó yêu cầu một bộ đệm với giá trị pixel. Hơn nữa, bộ lọc trung vị không phù hợp với một mô tả thống kê chặt chẽ và không cung cấp một thước đo độ lệch để điều chỉnh ngưỡng trừ.

2.1.2.3.Sequential Kernel Density Spproximation (SKDA):

Các kỹ thuật vector dịch chuyển trung bình gần đây đã được sử dụng cho các vấn đề nhận dạng khác nhau như phân đoạn và theo dõi hình ảnh. Vector dịch chuyển trung bình là một kỹ thuật tăng độ dốc hiệu quả có thể để phát hiện trực tiếp từ dữ liệu mẫu với một tập hợp các giả định. Vectơ dịch chuyển trung bình chỉ được sử dụng cho một khởi tạo mô hình ngoại tuyến. Trong bước này, đầu bộ chế độ Gaussian của pdf nền được phát hiện từ tập mẫu ban đầu. Cập nhật mô hình thời gian thực là thay vào đó được cung cấp bởi phương pháp phỏng đoán đơn giản đối phó với chế độ thích ứng, sáng tạo và hợp nhất. So sánh pdf thu được với phương pháp KDE qua video thử nghiệm 500 khung hình, tìm lỗi bình phương tích hợp thấp theo thứ tự 10-4. Qua video

30

thử nghiệm ở phần SKDA ứng dụng vào mô hình nền, số lượng các cấp độ cho thấy thay đổi từ 3 đến 11, với mức trung bình trong số 8.

2.1.2.4.Cooccurrence of image varitions (CIV):

Thay vì hoạt động ở độ phân giải pixel, CIV hoạt động trên các khối trong số N*N pixel được coi là vectơ thành phần N2. Điều này thay đổi độ phân giải với tốc độ và độ ổn định tốt hơn. Đối với mỗi khối, một số mẫu thời gian nhất định, giá trị trung bình theo thời gian được tính lần đầu tiên và sự khác biệt giữa các mẫu và mức trung bình là được gọi là các biến thể hình ảnh. Các N2

*N2 ma trận phương sai được tính với mức trung bình và một phép biến đổi eigenvector là đã áp dụng giảm kích thước của các biến thể hình ảnh từ N2

đến K.

2.1.2.5.Eigenbackgrounds:

Dựa trên sự phân hủy eigenvalue, nhưng lần này được áp dụng cho toàn bộ hình ảnh thay vì các khối. Như một miền không gian mở rộng có thể khám phá rộng rãi không gian tương quan và tránh hiệu ứng lát của khối phân vùng.

- Một mẫu gồm n hình ảnh được thu thập, mỗi hình ảnh có p điểm ảnh; hình ảnh trung bình µB, sau đó được tính toán và tất cả hình ảnh có nghĩa là bị trừ;

- Ma trận phương sai được tính toán và M eigenvector tốt nhất được lưu trữ trong ma trận eigenvector ΦMb, của kích thước M*p.

- Mỗi khi một hình ảnh mớiI có sẵn, nó được chiếuvào eigenspace như là I' = ΦMb (I - Mb);

- I’chiếu trở lại không gian hình ảnh như là I”=ΦTMbI’+µb. Vì eigenspace là một mô hình tốt cho các phần tĩnh của cảnh, nhưng không cho các chuyển động nhỏ đối tượng, I” sẽ không chứa bất kỳ đối tượng nào như vậy;

31

- Các điểm tiền cảnh cuối cùng được phát hiện tại các vị trí I - I”│>T.

Bảng 2.1. Phân tích hiệu suất các mô hình trừ nền.

Phƣơng pháp Yêu cầu Tốc độ Bộ nhớ Độ chính xác

Running Gausian average 1 1 L/M

Temporal median filter ns ns L/M

Mixture of Gaussians M M H

Kernel density estimation N N H

Sequential Kernel Density approximation m + 1 M M/H Cooccurrence of image varitions 8n/N2 nK/N2 M

Eigenbackgrounds M N M

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu kỹ thuật phân tích đám đông trong giám sát tự động dựa vào thị giác máy (Trang 35 - 41)

Tải bản đầy đủ (PDF)

(69 trang)