Phương pháp trừ nền background subtraction là một trong những phương pháp xử lý ảnh. Phương pháp trừ nền background subtraction là một trong những phương pháp xử lý ảnh.Phương pháp trừ nền background subtraction là một trong những phương pháp xử lý ảnh
Trang 1Phát Hiện Mật Độ Xe Trên Đường Dùng Phương
Pháp Trừ Nền
Subtitle as needed (paper subtitle)
Le Huu Duc
University Ho Chi Minh City of
Technology and Education
Lehuuduc11119114@gmail.com
Chu Nguyen Duc Long University Ho Chi Minh City of Technology and Education
chulong11119126@gmail.com
Tran Dinh Trong University Ho Chi Minh City of Technology and Education trandinhtrong@gmail.com
Tóm tắt—Trong đề tài này trình bày về vấn đề phát
hiện mật độ xe trên đường thông từ dữ liệu thu bằng
camera hoặc máy ảnh lắp đặt trên đường, sử dụng phương
pháp trừ nền Phương pháp trừ nền là phương pháp Với
phương pháp này nhóm làm đề tài đã xác định được lượng
xe trên đường qua dữ liệu thu được xử lý khi nào mật độ
xe lưu thông ít khi nào mật độ xe lưu thông đông, từ đó
đưa thông tin đã xử lý hiển thị lên màn hình và đưa ra
thông báo cảnh báo cho các phương tiện khác biết được ở
đoạn đường nào có mật độ xe như thế nào để thuận tiện
cho việc lưu thông trên đường
Từ khóa—Phương pháp trừ nền; mật độ xe.
I GIỚI THIỆU
Việc giám sát trực tiếp bằng các thiết bị giám sát hiện đại
(camera) là một trong những chủ đề được phát triển và nghiên
cứu rất nhiều trong những năm gần đây Dựa vào sự phát triển
không ngừng của kĩ thuật xử lý hình ảnh đã giúp cho con
người dễ dàng hơn trong việc triển khai các hệ thống giám sát
tự động thông minh hơn điển hình như nó có phát hiện đối
tượng chuyển động, phân loại đối tượng, bám đối tượng
chuyển động, dự đoán các hành vi của đối tượng…Vì những
lý do đó mà các hệ thống giám sát được ứng dụng ngày một
rộng rãi hiện nay trong nhiều lĩnh vực của đời sống xã hội
Đề tài này được đưa ra để giúp một hệ thống giám sát có
thể nhận về mật độ lưu thông từ đó hệ thống sẽ đưa ra các tín
hiệu cảnh báo cho các tài xế Đề tài dựa trên việc phát hiện
chuyển động của xe trên đường từ đó đưa ra đánh giá về mật
độ sau khi đã loại bỏ nền đường
Việc phát hiện đối tượng chuyển động không chỉ giúp ích
trong việc theo dõi các đối tượng chuyển động để phát hiện
mật độ xe trên một hệ thống giám sát trực tiếp mà còn mang lại nhiều ứng dụng trong cuộc sống Các đối tượng được phát hiện nhờ những thông tin trong một frame ảnh Có rất nhiều hướng tiếp cận để giải quyết vấn đề trên sử dụng nhiều thuật toán và phương pháp khác nhau Một số công trình nghiên cưu
đã được thực hiện như là:
•Ashwani Aggarwal, Susmit Biswas, Sandeep Singh, Shamik Sural, and A.K Majumdar [1] Object Tracking Using Background Subtraction and Motion Estimation in MPEG Videos
•Mahamuni P D, R P Patil, H.S Thakar [2] Moving Object Detection Using Background Subtraction Algorithm Using Simulink
•Mark Smids [3] Background Subtraction for Urban Traffic Monitoring using Webcams
Trong bài báo này, để phát hiện vật thể chuyển động nhóm thực hiện đề tài sử dụng phương pháp đơn giản nhất cũng như được sử dụng nhiều nhất là Background Subtraction (trừ nền).Thuật toán Background Subtraction là một trong những thuật toán được sử dụng phổ biến nhất trong lĩnh vực Thị giác máy tính (Computer Vision) Thuật toán được sử dụng nhằm xác định những pixel thuộc những vật chuyển động trong video hay còn được gọi là Foreground (FG), còn những vật không chuyển động được gọi là Background (BG) Sau đó đưa ra các đánh giá về mật độ pixels của FG từ đó đưa ra nhận xét về mật
độ xe di chuyển trên đường
Trong các phần tiếp theo, bài báo này sẽ trình bày những vấn đề sau:
II Trình bày các phương pháp và thuật toán được sử dụng trong đề tài
III Kết quả của đề tài được thể hiện trong phần 3
Trang 2IV Trình bày những kết luận của đề tài.
II PHƯƠNG PHÁP THỰC HIỆN
A Tài liệu và phương pháp
Để xác định được lượng mật độ xe trên đường, phương
pháp thực hiện được trình bày trong sơ đồ:
Bước 1: Lấy từng khung hình từ video quay từ video
Hình 1: Một khung hình lấy từ video
Bước 2: Khởi tạo background Bước này lúc đầu sẽ lấy khung
hình đầu tiên để làm background
Hình 2: Background đã được cập nhật
Bước 3: Tìm sự khác biệt giữa background và foreground Trừ các giá trị giữa ảnh khung hình và ảnh nền để tìm được ảnh khác biệt
Hình 3: Ảnh khác biệt thu được bằng phương pháp trừ nền
Bước 4: Xử lý đưa ra ảnh nhị phân Sau khi tìm được ảnh khác biệt thì tiến hành chuyển đổi ảnh gray, tìm ngưỡng bằng phương pháp Otsu và đưa ra ảnh nhị phân
Hình 4: Ảnh mức xám chuyển từ ảnh khác biệt
Hình 5: Ảnh nhị phân xác định dùng phương pháp Otsu
Trang 3Bước 5: Đếm số pixel trắng tương ứng với xe đang lưu thông
sau đó chia phần trăm theo số pixel của đường ta được mật độ
xe lưu thông
Frame 336 of 3433.
100
200
300
400
Adaptive Background Binarized Difference Image
0 0.2 0.4 0.6 0.8 1
Frame 335 co mat do 3.938802e+00.
Hình 6: Mật độ xe đang lưu thông
Bước 6: Do ảnh hưởng của các yếu tố thay đổi bên ngoài cần
cập nhật background và sau đó quay lại bước 3
B Công thức tính toán
1 Khởi tạo Background
Để tìm đối tượng chuyển động sử dụng phương pháp trừ
nền, bước đầu tiên phải xây dựng mô hình background tại thời
điểm bắt đầu của video Nhóm giả sử trường hợp tại thời điểm
bắt đầu không có đối tượng di chuyển Nhóm sử dụng phương
pháp chọn lọc để khởi tạo background ban đầu:
1 ( , ) ( , )
N m m N
I x y
BM x y
N
=
Với BM x yN( , ) là giá trị tại pixel (x,y) của background,
)
,
( y x
Im là giá trị của pixel (x,y) của khung thứ m, và N là
số khung sử dụng để xây dựng background Nó được đưa ra
rằng N=100 là tốt nhất cho giá trị N [10]
2 Background Subtraction
Sau khi thu được background từ bước khởi tạo, chúng ta
cần tìm ra sự khác nhau giữa khung hình hiện tại và
background
1
( , ) | ( , ) ( , ) |
D x y = I x y − BM − x y
Với BM x yt( , )là cường độ của pixel (x,y) của
background tại thời điểm t, và It( y x , ) là cường độ của pixel
(x,y) trong khung hình hiện tại tại thời điểm t
Sự khác biệt Dt( y x , ) được so sánh với một ngưỡng
ad
Th để phân loại giữa foreground với background, phần tính
toán ngưỡng Thad sẽ được trình bày ở phần Tìm ngưỡng
Otsu Thad sẽ được xác định lặp đi lặp lại tại mỗi Dt( y x , ) khác nhau với sự thay đổi của background Nếu Dt( y x , ) <
ad
Th , thì pixel đó thuộc về phần background Nếu ngược lại
) ,
( y x
Dt > Thad thì pixel đó thuộc về foreground:
( , ) ( , )
if ( , )
x y
≥
3 Mô hình cập nhật Background
Vì do các yếu tố động của background như độ sáng, độ tương phản, các yếu tố ngoại cảnh như bóng mấy, cây cối Nên các background phải liên tục cập nhật mỗi khi nhảy qua fame mới Nhóm đề xuất một phương pháp dùng để cập nhật Background trong từng kiểu pixel, mỗi pixel sẽ có một tỉ lệ học thích hợp, αad,t( x , y ) được định nghĩa bên dưới
Công thức cập nhật background:
( , ) ( , ) ( , ) (1 ( , )) ( , )
BM x y = α x y I x y + − α x y BM− x y
Với 0 ≤ αad t,( , ) 1 x y ≤ Tỉ lệ học αad,t( x , y ) sẽ phụ thuộc vào hai trọng số, α1 và α2:
,( , ) 1 1 2 2
ad t x y
Với w1 và w2 là hai trọng số tương ứng với α1 và α2,
và w1 + w2 ≤ 1 Thông số thứ nhất α1 phụ thuộc vào độ lớn của
) ,
( y x
Dt Một giá trị lớn hơn cho α1 thì được gán cho giá trị nhỏ hơn Dt( y x , )
2 2
( , ) 1 2
0
t
D x y
otherwise
σ
α
−
=
Với σ1 là
5
ad
Th
σ1 là một hàm số phụ thuộc Thad để đảm bảo rằng các phần của các điểm ảnh với Dt( y x , ) giá trị nhỏ nhất và cao hơn α1
Thông số thứ hai α2 thu được phụ thuộc vào thời gian tồn tại của pixel đó trong background Giả sử còn một điểm ảnh là ở trong background, thì ổn định hơn và đáng tin cậy là một điểm ảnh nền Sự ổn định và độ tin cậy được đo bằng background count tạm thời Cbg Theo công thức:
Trang 4' 2 max
( ) 1
2
min
0
bg C
bg
otherwise
ζ
ζ α
−
−
=
Với σ2 = 15, ζmax = 150, and ζmin = 30đã
được xác định bằng thực nghiệm, và
1 ( , ) ( , )
N m m N
I x y
BM x y
N
=
'
max
min( , )
C = ζ C Nếu một điểm ảnh vẫn còn là
một điểm ảnh nền cho nhiều hơn ζmin khung, thì một giá trị
khác không sẽ được gán cho α2 Thông số thứ hai α2 tăng
với Cbg cho đến khi Cbg lớn hơn ζmax Tham số này giúp
loại bỏ các đối tượng không đáng kể với chuyển động nhỏ và
lặp đi lặp lại như vẫy lá cây và những gợn sóng nước mà có
thể dẫn đến kết quả sai Nó hoạt động dưới sự giả định rằng
nếu một pixel chuyển đổi giữa trạng thái foreground và
background thường xuyên (có nghĩa là pixel không được giữ
lại ở trạng thái của background nhiều hơn ζmin khung) Do
đó nó rất có thể là một pixel của background Lưu ý rằng Cbg
sẽ được gán lại bằng 0 khi có một pixel tìm thấy thuộc
foreground
4 Tìm ngưỡng Ostu
Sau khi thống kê mức xám trên ảnh ban đầu, chúng ta sẽ
nhận được một đồ thị biểu diễn mức xám có hai đỉnh, một
đỉnh biểu diễn cho những vùng là foreground, đỉnh còn lại
biểu diễn cho những vùng là Background của ảnh Theo Otsu,
ngưỡng k* tốt nhất được chọn là giá trị mà tại đó nó làm cho
sự chênh lệch σb2 giữa hai đoạn trên đồ thị đạt cực đại Giá trị
2
b
σ được định nghĩa như sau:
2 2 2
2 1 1
2 ( t) ( t)
b = a m − m + a m − m
Thay mt = a1m1+ a2m2, a1+ a2 = 1, ta được:
2 2 1
2
1
2 a a ( m m )
δ , Trong đó m1 và m2 biểu diễn giá
trị trung bình tương ứng với đoạn 1 và đoạn 2, a1 và a2 là tần
suất xuất hiện của m1 và m2 Tỷ lệ aj của diện tích đoạn j
với tổng diện tích được tính như sau:
, 2 , 1
∈
j p a
j C i
i
j : tổng xác suất trên đoạn j
Trong đó pi là thương của số lần xuất hiện của mức xám thứ
i và tổng số lần xuất hiện của tất cả các mức xám cho nên,
, 1
1 0
=
=
I
i i
p
Với I biểu diễn tổng số những mức xám Thông thường, đối với ảnh văn bản, I có giá trị là 256 C1 (C2) biểu diễn tập hợp tất cả những điểm có giá trị nhỏ hơn hoặc bằng (lớn hơn) ngưỡng k Chú ý rằng, giá trị trung bình mj được tính như sau:
∑
∈
=
⋅
=
j C i
j i
mức xám trung bình trên đoạn j Ngưỡng k* tốt nhất sẽ được xác định bằng cách tìm ra đỉnh của σb2
III KẾT QUẢ VÀ THẢO LUẬN
Sau khi tiến hành chạy ứng dụng và nhóm đã thu được kết quả xác định được mật độ xe trong video tại mỗi thời điểm từ
đó đưa ra nhận định lưu lượng xe nhiều hay ít tại mỗi thời điểm khác nhau
Đối với Video: http://www.wimp.com/needslights/
Số pixel của Backpround: 184320 (Pixel)
Thì có bảng thông kê mật độ xe như sau:
Thời điểm (frame)
Số pixel trong foreground
Mật độ (%)
A Nhận xét kết quả
Kết quả thu được còn chưa khách quan do nhiều hạn chế của cách triển khai phương pháp trừ nền này
Đề tài còn tồn tại nhiều khuyết điểm và một số ưu điểm
Trang 5Khai thác những khía cạnh dễ hiểu của phương pháp trừ
nền, ứng dụng thành công phương pháp này
Hạn chế:
1 Phụ thuộc vào góc quay của camera
2 Không xác định hết được các pixel của phương tiện
lưu thông
3 Cách xác định mật độ trên đường chưa chính xác
B So sánh với những phương pháp khác
So sánh với phương pháp Motion Vector thì phương pháp
trừ nền dễ thực hiện hơn, bên cạnh đó việc thu thập dữ liệu
cho phương pháp trừ nền khó hơn tại vì nếu dữ liệu hình
ảnh thì phải có 2 ảnh được chụp không có độ sai lệch pixel
Còn phương pháp Motion Vector có thể khác phục được
hạn chế đó
IV KẾT LUẬN
After
LỜI CẢM ƠN
Lời đầu tiên nhóm xin gửi lời cảm ơn sâu sắc và chân
thành nhất đến thầy Ngô Quốc Cường, người đã tận tình giúp
đỡ nhóm thực hiện đề tài trong thời gian qua
Nhóm xin cám ơn trường Đại học Sư Phạm Kỷ Thuật
Thành phố Hồ Chí Minh đã tạo môi trường học tập và nghiên
cứu để hoàn thành tốt đề tài
Bên cạnh đó nhóm xin cảm ơn các bạn thành viên trong lớp 111190 đã giúp đỡ trong quá trình thực hiện đề tài
TÀI LIỆU THAM KHẢO
Trong đề tài nhóm đã sử dụng một số tài liệu tham khảo như sau:
[1] Ashwani Aggarwal, Susmit Biswas, Sandeep Singh, Shamik Sural, and A.K Majumdar, Object Tracking Using Background Subtraction and Motion Estimation in MPEG Videos
[2] Mahamuni P D, R P Patil, H.S Thakar, Moving Object Detection Using Background Subtraction Algorithm Using Simulink
[3] Mark Smids, Background Subtraction for Urban Traffic Monitoring using Webcams
[4] K K Ng and E J Delp, “Object tracking initialization using automatic moving object detection,” Pro-ceedings
of SPIE/IS&T Conference on Visual Information Processing and Communication, vol 7543, SanJose, CA, January 2010
[5] S.-K Wang, B Qin, Z.-H Fang, and Z.-S Ma, “Fast shadow detection according to the moving region,”Proceedings of the International Conference on Machine Learning and Cybernetics, vol 3, August 2007, pp.1590–1595