Phương pháp trừ nền background subtraction

5 3.1K 79
Phương pháp trừ nền  background subtraction

Đang tải... (xem toàn văn)

Thông tin tài liệu

Phương pháp trừ nền background subtraction là một trong những phương pháp xử lý ảnh. Phương pháp trừ nền background subtraction là một trong những phương pháp xử lý ảnh.Phương pháp trừ nền background subtraction là một trong những phương pháp xử lý ảnh

Phát Hiện Mật Độ Xe Trên Đường Dùng Phương Pháp Trừ Nền Subtitle as needed (paper subtitle) Le Huu Duc University Ho Chi Minh City of Technology and Education. Lehuuduc11119114@gmail.com Chu Nguyen Duc Long University Ho Chi Minh City of Technology and Education. chulong11119126@gmail.com Tran Dinh Trong University Ho Chi Minh City of Technology and Education. trandinhtrong@gmail.com Tóm tắt—Trong đề tài này trình bày về vấn đề phát hiện mật độ xe trên đường thông từ dữ liệu thu bằng camera hoặc máy ảnh lắp đặt trên đường, sử dụng phương pháp trừ nền. Phương pháp trừ nền là phương pháp. Với phương pháp này nhóm làm đề tài đã xác định được lượng xe trên đường qua dữ liệu thu được xử lý khi nào mật độ xe lưu thông ít khi nào mật độ xe lưu thông đông, từ đó đưa thông tin đã xử lý hiển thị lên màn hình và đưa ra thông báo cảnh báo cho các phương tiện khác biết được ở đoạn đường nào có mật độ xe như thế nào để thuận tiện cho việc lưu thông trên đường. Từ khóa—Phương pháp trừ nền; mật độ xe. I. GIỚI THIỆU Việc giám sát trực tiếp bằng các thiết bị giám sát hiện đại (camera) là một trong những chủ đề được phát triển và nghiên cứu rất nhiều trong những năm gần đây. Dựa vào sự phát triển không ngừng của kĩ thuật xử lý hình ảnh đã giúp cho con người dễ dàng hơn trong việc triển khai các hệ thống giám sát tự động thông minh hơn điển hình như nó có phát hiện đối tượng chuyển động, phân loại đối tượng, bám đối tượng chuyển động, dự đoán các hành vi của đối tượng…Vì những lý do đó mà các hệ thống giám sát được ứng dụng ngày một rộng rãi hiện nay trong nhiều lĩnh vực của đời sống xã hội. Đề tài này được đưa ra để giúp một hệ thống giám sát có thể nhận về mật độ lưu thông từ đó hệ thống sẽ đưa ra các tín hiệu cảnh báo cho các tài xế. Đề tài dựa trên việc phát hiện chuyển động của xe trên đường từ đó đưa ra đánh giá về mật độ sau khi đã loại bỏ nền đường Việc phát hiện đối tượng chuyển động không chỉ giúp ích trong việc theo dõi các đối tượng chuyển động để phát hiện mật độ xe trên một hệ thống giám sát trực tiếp mà còn mang lại nhiều ứng dụng trong cuộc sống. Các đối tượng được phát hiện nhờ những thông tin trong một frame ảnh. Có rất nhiều hướng tiếp cận để giải quyết vấn đề trên sử dụng nhiều thuật toán và phương pháp khác nhau. Một số công trình nghiên cưu đã được thực hiện như là: • Ashwani Aggarwal, Susmit Biswas, Sandeep Singh, Shamik Sural, and A.K. Majumdar [1] Object Tracking Using Background Subtraction and Motion Estimation in MPEG Videos • Mahamuni P. D, R. P. Patil, H.S. Thakar [2] Moving Object Detection Using Background Subtraction Algorithm Using Simulink • Mark Smids [3] Background Subtraction for Urban Traffic Monitoring using Webcams Trong bài báo này, để phát hiện vật thể chuyển động nhóm thực hiện đề tài sử dụng phương pháp đơn giản nhất cũng như được sử dụng nhiều nhất là Background Subtraction (trừ nền).Thuật toán Background Subtraction là một trong những thuật toán được sử dụng phổ biến nhất trong lĩnh vực Thị giác máy tính (Computer Vision). Thuật toán được sử dụng nhằm xác định những pixel thuộc những vật chuyển động trong video hay còn được gọi là Foreground (FG), còn những vật không chuyển động được gọi là Background (BG). Sau đó đưa ra các đánh giá về mật độ pixels của FG từ đó đưa ra nhận xét về mật độ xe di chuyển trên đường. Trong các phần tiếp theo, bài báo này sẽ trình bày những vấn đề sau: II. Trình bày các phương pháp và thuật toán được sử dụng trong đề tài. III. Kết quả của đề tài được thể hiện trong phần 3. IV. Trình bày những kết luận của đề tài. II. PHƯƠNG PHÁP THỰC HIỆN A. Tài liệu và phương pháp Để xác định được lượng mật độ xe trên đường, phương pháp thực hiện được trình bày trong sơ đồ: Bước 1: Lấy từng khung hình từ video quay từ video. Hình 1: Một khung hình lấy từ video Bước 2: Khởi tạo background. Bước này lúc đầu sẽ lấy khung hình đầu tiên để làm background. Hình 2: Background đã được cập nhật Bước 3: Tìm sự khác biệt giữa background và foreground. Trừ các giá trị giữa ảnh khung hình và ảnh nền để tìm được ảnh khác biệt. Hình 3: Ảnh khác biệt thu được bằng phương pháp trừ nền Bước 4: Xử lý đưa ra ảnh nhị phân. Sau khi tìm được ảnh khác biệt thì tiến hành chuyển đổi ảnh gray, tìm ngưỡng bằng phương pháp Otsu và đưa ra ảnh nhị phân. Hình 4: Ảnh mức xám chuyển từ ảnh khác biệt Hình 5: Ảnh nhị phân xác định dùng phương pháp Otsu Bước 5: Đếm số pixel trắng tương ứng với xe đang lưu thông sau đó chia phần trăm theo số pixel của đường ta được mật độ xe lưu thông. Frame 336 of 3433. 100 200 300 400 500 600 100 200 300 400 Adaptive Background Binarized Difference Image 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1 Frame 335 co mat do 3.938802e+00. Hình 6: Mật độ xe đang lưu thông Bước 6: Do ảnh hưởng của các yếu tố thay đổi bên ngoài cần cập nhật background và sau đó quay lại bước 3 B. Công thức tính toán 1. Khởi tạo Background Để tìm đối tượng chuyển động sử dụng phương pháp trừ nền, bước đầu tiên phải xây dựng mô hình background tại thời điểm bắt đầu của video. Nhóm giả sử trường hợp tại thời điểm bắt đầu không có đối tượng di chuyển. Nhóm sử dụng phương pháp chọn lọc để khởi tạo background ban đầu: 1 ( , ) ( , ) N m m N I x y BM x y N = = ∑ Với ( , ) N BM x y là giá trị tại pixel (x,y) của background, ),( yxI m là giá trị của pixel (x,y) của khung thứ m, và N là số khung sử dụng để xây dựng background. Nó được đưa ra rằng N=100 là tốt nhất cho giá trị N [10]. 2. Background Subtraction Sau khi thu được background từ bước khởi tạo, chúng ta cần tìm ra sự khác nhau giữa khung hình hiện tại và background. 1 ( , ) | ( , ) ( , ) | t t t D x y I x y BM x y − = − Với ( , ) t BM x y là cường độ của pixel (x,y) của background tại thời điểm t, và ),( yxI t là cường độ của pixel (x,y) trong khung hình hiện tại tại thời điểm t. Sự khác biệt ),( yxD t được so sánh với một ngưỡng ad Th để phân loại giữa foreground với background, phần tính toán ngưỡng ad Th sẽ được trình bày ở phần Tìm ngưỡng Otsu. ad Th sẽ được xác định lặp đi lặp lại tại mỗi ),( yxD t khác nhau với sự thay đổi của background. Nếu ),( yxD t < ad Th , thì pixel đó thuộc về phần background. Nếu ngược lại ),( yxD t > ad Th thì pixel đó thuộc về foreground: ( , ) ( , ) if ( , ) t ad t ad foreground if D x y Th x y background D x y Th ≥   ⊂  <   3. Mô hình cập nhật Background Vì do các yếu tố động của background như độ sáng, độ tương phản, các yếu tố ngoại cảnh như bóng mấy, cây cối Nên các background phải liên tục cập nhật mỗi khi nhảy qua fame mới. Nhóm đề xuất một phương pháp dùng để cập nhật Background trong từng kiểu pixel, mỗi pixel sẽ có một tỉ lệ học thích hợp, ),( , yx tad α được định nghĩa bên dưới. Công thức cập nhật background: , , 1 ( , ) ( , ) ( , ) (1 ( , )) ( , ) t ad t t ad t t BM x y x y I x y x y BM x y α α − = + − Với , 0 ( , ) 1 ad t x y α ≤ ≤ . Tỉ lệ học ),( , yx tad α sẽ phụ thuộc vào hai trọng số, 1 α và 2 α : , 1 1 2 2 ( , ) ad t x y α ωα ω α = + Với 1 w và 2 w là hai trọng số tương ứng với 1 α và 2 α , và 1 w + 2 w 1≤ . Thông số thứ nhất 1 α phụ thuộc vào độ lớn của ),( yxD t . Một giá trị lớn hơn cho 1 α thì được gán cho giá trị nhỏ hơn ),( yxD t . 2 2 1 ( , )1 2 1 ( , ) 0 t D x y t ad e if D x y Th otherwise σ α −   < =    Với 1 σ là 5 ad Th . 1 σ là một hàm số phụ thuộc ad Th để đảm bảo rằng các phần của các điểm ảnh với ),( yxD t giá trị nhỏ nhất và cao hơn 1 α . Thông số thứ hai 2 α thu được phụ thuộc vào thời gian tồn tại của pixel đó trong background. Giả sử còn một điểm ảnh là ở trong background, thì ổn định hơn và đáng tin cậy là một điểm ảnh nền. Sự ổn định và độ tin cậy được đo bằng background count tạm thời bg C . Theo công thức: ' 2 max ( ) 1 2 min 2 , 0 bg C bg e if C otherwise ζ ζ α − −   ≥ =    Với 2 max min 15, 150, 30and σ ζ ζ = = = đã được xác định bằng thực nghiệm, và 1 ( , ) ( , ) N m m N I x y BM x y N = = ∑ ' max min( , ) bg bg C C ζ = . Nếu một điểm ảnh vẫn còn là một điểm ảnh nền cho nhiều hơn min ζ khung, thì một giá trị khác không sẽ được gán cho 2 α . Thông số thứ hai 2 α tăng với bg C cho đến khi bg C lớn hơn max ζ . Tham số này giúp loại bỏ các đối tượng không đáng kể với chuyển động nhỏ và lặp đi lặp lại như vẫy lá cây và những gợn sóng nước mà có thể dẫn đến kết quả sai. Nó hoạt động dưới sự giả định rằng nếu một pixel chuyển đổi giữa trạng thái foreground và background thường xuyên (có nghĩa là pixel không được giữ lại ở trạng thái của background nhiều hơn min ζ khung). Do đó nó rất có thể là một pixel của background. Lưu ý rằng bg C sẽ được gán lại bằng 0 khi có một pixel tìm thấy thuộc foreground. 4. Tìm ngưỡng Ostu Sau khi thống kê mức xám trên ảnh ban đầu, chúng ta sẽ nhận được một đồ thị biểu diễn mức xám có hai đỉnh, một đỉnh biểu diễn cho những vùng là foreground, đỉnh còn lại biểu diễn cho những vùng là Background của ảnh. Theo Otsu, ngưỡng k* tốt nhất được chọn là giá trị mà tại đó nó làm cho sự chênh lệch 2 b σ giữa hai đoạn trên đồ thị đạt cực đại. Giá trị 2 b σ được định nghĩa như sau: 2 22 2 11 2 )()( ttb mmamma −+−= σ , Thay 2211 mamam t += , 1 21 =+ aa , ta được: 2 2121 2 )( mmaa b −= δ , Trong đó 1 m và 2 m biểu diễn giá trị trung bình tương ứng với đoạn 1 và đoạn 2, a 1 và a 2 là tần suất xuất hiện của m 1 và m 2 . Tỷ lệ j a của diện tích đoạn j với tổng diện tích được tính như sau: ,2,1, == ∑ ∈ jpa j Ci ij : tổng xác suất trên đoạn j Trong đó i p là thương của số lần xuất hiện của mức xám thứ i và tổng số lần xuất hiện của tất cả các mức xám cho nên, ,1 1 0 = ∑ − = I i i p Với I biểu diễn tổng số những mức xám. Thông thường, đối với ảnh văn bản, I có giá trị là 256. 1 C ( 2 C ) biểu diễn tập hợp tất cả những điểm có giá trị nhỏ hơn hoặc bằng (lớn hơn) ngưỡng k. Chú ý rằng, giá trị trung bình j m được tính như sau: ∑ ∈ =⋅= j Ci jij japim .2,1, mức xám trung bình trên đoạn j Ngưỡng k* tốt nhất sẽ được xác định bằng cách tìm ra đỉnh của 2 b σ . III. KẾT QUẢ VÀ THẢO LUẬN Sau khi tiến hành chạy ứng dụng và nhóm đã thu được kết quả xác định được mật độ xe trong video tại mỗi thời điểm từ đó đưa ra nhận định lưu lượng xe nhiều hay ít tại mỗi thời điểm khác nhau. Đối với Video: http://www.wimp.com/needslights/ Số pixel của Backpround: 184320 (Pixel). Thì có bảng thông kê mật độ xe như sau: Thời điểm (frame) Số pixel trong foreground Mật độ (%) 100 5891 3.195 107 6332 3.435 124 6325 3.432 242 4124 2.237 564 5537 3.004 805 8188 4.442 A. Nhận xét kết quả Kết quả thu được còn chưa khách quan do nhiều hạn chế của cách triển khai phương pháp trừ nền này Đề tài còn tồn tại nhiều khuyết điểm và một số ưu điểm. Khai thác những khía cạnh dễ hiểu của phương pháp trừ nền, ứng dụng thành công phương pháp này. Hạn chế: 1. Phụ thuộc vào góc quay của camera. 2. Không xác định hết được các pixel của phương tiện lưu thông. 3. Cách xác định mật độ trên đường chưa chính xác B. So sánh với những phương pháp khác So sánh với phương pháp Motion Vector thì phương pháp trừ nền dễ thực hiện hơn, bên cạnh đó việc thu thập dữ liệu cho phương pháp trừ nền khó hơn tại vì nếu dữ liệu hình ảnh thì phải có 2 ảnh được chụp không có độ sai lệch pixel. Còn phương pháp Motion Vector có thể khác phục được hạn chế đó. IV. KẾT LUẬN After LỜI CẢM ƠN Lời đầu tiên nhóm xin gửi lời cảm ơn sâu sắc và chân thành nhất đến thầy Ngô Quốc Cường, người đã tận tình giúp đỡ nhóm thực hiện đề tài trong thời gian qua. Nhóm xin cám ơn trường Đại học Sư Phạm Kỷ Thuật Thành phố Hồ Chí Minh đã tạo môi trường học tập và nghiên cứu để hoàn thành tốt đề tài. Bên cạnh đó nhóm xin cảm ơn các bạn thành viên trong lớp 111190 đã giúp đỡ trong quá trình thực hiện đề tài TÀI LIỆU THAM KHẢO Trong đề tài nhóm đã sử dụng một số tài liệu tham khảo như sau: [1] Ashwani Aggarwal, Susmit Biswas, Sandeep Singh, Shamik Sural, and A.K. Majumdar, Object Tracking Using Background Subtraction and Motion Estimation in MPEG Videos [2] Mahamuni P. D, R. P. Patil, H.S. Thakar, Moving Object Detection Using Background Subtraction Algorithm Using Simulink [3] Mark Smids, Background Subtraction for Urban Traffic Monitoring using Webcams [4] K. K. Ng and E. J. Delp, “Object tracking initialization using automatic moving object detection,” Pro-ceedings of SPIE/IS&T Conference on Visual Information Processing and Communication, vol. 7543, SanJose, CA, January 2010. [5] S K. Wang, B. Qin, Z H. Fang, and Z S. Ma, “Fast shadow detection according to the moving region,”Proceedings of the International Conference on Machine Learning and Cybernetics, vol. 3, August 2007, pp.1590–1595. . Object Tracking Using Background Subtraction and Motion Estimation in MPEG Videos • Mahamuni P. D, R. P. Patil, H.S. Thakar [2] Moving Object Detection Using Background Subtraction Algorithm. sử dụng phương pháp đơn giản nhất cũng như được sử dụng nhiều nhất là Background Subtraction (trừ nền).Thuật toán Background Subtraction là một trong những thuật toán được sử dụng phổ biến nhất. từ video Bước 2: Khởi tạo background. Bước này lúc đầu sẽ lấy khung hình đầu tiên để làm background. Hình 2: Background đã được cập nhật Bước 3: Tìm sự khác biệt giữa background và foreground.

Ngày đăng: 05/04/2015, 14:37

Mục lục

    II. Phương Pháp Thực Hiện

    A. Tài liệu và phương pháp

    B. Công thức tính toán

    III. Kết Quả Và Thảo Luận

    A. Nhận xét kết quả

    B. So sánh với những phương pháp khác

Tài liệu cùng người dùng

Tài liệu liên quan