Giải thuật Kanade-Lucas-Tomasi tracker KLT tracker chạy trên mô hình optical flow đã được sử dụng trong phân tích chuyển động của đám đông bao gồm xác định đường đi của đối tượng, kết hợ
TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU
Phát hiện và phân tích chuyển động của đám đông
Nghiên cứu của B Zhou [11] đề xuất một phương pháp là thiết kế một bộ lọc liên kết để phát hiện chuyển động liên kết từ những nhóm đám đông Bộ lọc liên kết phát hiện tốt các nhóm chuyển động lộn xộn của đám đông Các nhóm chuyển động liên kết được phát hiện tương ứng với nhiều hành vi và hoạt động Tuy nhiên, rất khó để đánh giá, định lƣợng các hành vi này từ các chuyển động liên kết đƣợc phát hiện vì nó là khó khăn để có đƣợc sự chính xác trên mặt đất
Hình 2.9- Kết quả phát hiện chuyển động cúa các nhóm đám đông [11]
Bên cạnh đó, nghiên cứu của K Lim [12] chỉ ra vùng nổi bật của đám đông và phân tích vận động của vùng này bằng cách sử dụng cấu trúc Global similarity Qua dó xác định các vùng đám đông, vùng không ổn định ( vận động bất thường) và vùng có mật độ thấp
Hình 2.10 - Một kết quả phân tích trong nghiên cứu của K Lim [12]
Theo hình 2.10 vùng tập trung nhiều màu đỏ chính là vùng đặc trƣng của đám đông (Crowding), vùng có chuyển động bất thường Phương pháp này không hiệu quả đối với các ảnh có cường độ chiếu sáng mạnh
Nghiên cứu của R Mehran [13] nhận diện bất thường trong đám đông bằng cách sử dụng mô hình Social Force Một mạng lưới các hạt được đặt trên hình ảnh và nó đƣợc vận động với không gian và thời gian trung bình của dòng chảy quang học
Bằng cách xử lý các hạt chuyển động như các cá thể, lực tương tác của chúng có thể phân tích để nhận biết được chuyển động bất thường trong đám đông
(a) Tập hợp các hạt đặt lên ảnh (b) Tập hợp các lực tương tác
Hình 2.11- Mô tả mô hình Social Force [13]
Ngược lại, nghiên cứu của S Biswas [14] sử dụng phương pháp mô hình Optical Flow để theo dõi các thành phần riêng lẻ và tính toán phát hiện sự bất thường của đám đông Với kỹ thuật này, mỗi video đầu vào đƣợc trình bày bằng cách sử dụng các ma trận điểm ảnh bắt giữ bản chất của hoạt động diễn ra trong khi duy trì cấu trúc không gian và thời gian của video Các ma trận đặc trƣng đƣợc phân tách thành các thành phần bậc thấp và thưa thớt, ở đó thành phần thưa thớt tương ứng với các hoạt động bất thường
(a) Ảnh đầu vào (b) bản đồ Optical Flow
Hình 2.12- Kết quả tính toán của mô hình Optical Flow [14] Ưu điểm của phương pháp này là nó có thể không cần phải tranning Tuy nhiên, phương pháp này có độ chính xác không cao khi thực nghiệm trên các bộ dữ liệu trên web (web dataset)
Nghiên cứu của H Ullah [15] đã sử dụng phương pháp phân đoạn chuyển động trên cơ sở kết hợp mô hình Crowd motion và Optical flow để phân tích những chuyển động của những thành phần trong đám đông và phát hiện những bất thường của đám đông
Hình 2.13- Một kết quả phân tích trong nghiên cứu của H.Ulla [15]
Theo hình 2.13 nhóm đầu tiên bên trái là hình ảnh đầu vào Tiếp theo là hình ảnh phân tích chuyển động theo mô hình Optical Flow, các hướng chuyển động của các điểm ảnh được tô màu theo mẫu bên dưới Kế tiếp là các hình ảnh có hoạt động bất thường Cuối cùng, bên phải ta có kết quả phân tích dựa trên mô hình Crow-
Motion và phát hiện sự bất thường (các ô màu trắng) trong đám đông Tuy nhiên, với đám đông có mật độ cao và chuyển động phức tạp, phương pháp này lại khó phân tích chính xác đƣợc
Nghiên cứu của H Idrees [16] đã trình bày phương pháp giám sát đám đông dày đặc bằng kỹ thuật sử dụng đặc trưng và sự vận động lân cận động tương đồng
Phương pháp này có thể vẽ ra được đường di chuyển của từng thành phần trong đám đông
Hình 2.14 - Kết quả phân tíchtheo dõi chuyển động tronng đám đông theo H Idrees[16]
Hạn chế của phương pháp này là gặp khó khăn trong việc giám sát các đám đông có chuyển động lộn xộn không cùng theo một hướng.
CƠ SỞ LÝ THUYẾT LIÊN QUAN ĐẾN ĐỀ TÀI
Phương pháp loại bỏ nền
Phương pháp loại bỏ nền là tạo cảnh nền và so sánh nó với khung hiện tại để phát hiện chuyển động của các đối tƣợng, tức là những khu vực trên khung ảnh nơi có những thay đổi đáng kể xảy ra Do đó, thuật toán loại bỏ nền là tách các đối tƣợng di chuyển, tức là phần tiền cảnh từ phần tĩnh của khung, nghĩa là nền Có nhiều phương pháp để loại bỏ nền tĩnh trong đó phương pháp trừ nền (Background subtraction) được xem là kỹ thuật phổ biến nhất đƣợc sử dụng để phát hiện một vật thể chuyển động trong đoạn video bằng cách trừ khung hiện tại (pixel theo pixel) từ một hình ảnh tham chiếu gọi là nền, thường được tìm thấy bằng hình ảnh quá trình lựa chọn, được thực hiện trong thời gian khởi tạo Vấn đề với kỹ thuật này là sự thay đổi ánh sáng đột ngột gây ra khó khăn trong việc phát hiện vật chuyển động, bởi vì nó ảnh hưởng đến hình nền gốc Và cũng rất khó xác định đƣợc khoảng thời gian nào nền nên đƣợc cập nhật khi xem xét một trường hợp với một video thời gian thực Để khắc phục hạn chế của phương pháp trừ nền tác giả M Mahesh [17] đề xuất phương pháp khung khác biệt, mục tiêu của phương pháp là tiếp cận để phát hiện các vật chuyển động từ sự khác biệt giữa khung hiện tại và khung tham chiếu Phương pháp này sử dụng sự khác biệt dựa trên điểm ảnh để tìm đối tƣợng chuyển động
Hình 3 1 - Sơ đồ khối cách sử dụng phương pháp khung hình khác biệt trích từ [17]
Theo hình 3.1 khung đầu tiên đƣợc chụp qua video liên tục và đƣợc chuyển đổi thành hình ảnh mức xám Sự khác biệt tuyệt đối đƣợc tính giữa các khung liên tiếp và hình ảnh khác biệt được lưu trữ Hình ảnh khác biệt được dịch sang các hình ảnh nhị phân theo ngƣỡng tối ƣu
I n Khung hiện tại Ảnh khác
Ngƣỡng tối ƣu Đối tƣợng chuyển động
Cho hình ảnh đầu vào được biễu diễn dưới dạng F(x, y, t) và hình ảnh khác biệt có dạng K(x, y, t) tại thời điểm t Vùng ảnh quan tâm đƣợc phát hiện nhƣ sau:
Theo công thức (3.2) ta có ε là ngƣỡng nhị phân tối ƣu, nếu giá trị pixel của K(x, y, t) lớn hơn hoặc bằng ngƣỡng thì nó đƣợc xem nhƣ là một pixel mới khi đó vùng quan tâm có giá trị 1 đƣợc gán cho tiền cảnh Ngƣợc lại vùng quan tâm có giá trị 0 khí đó vùng quan tâm là nền Ƣu điểm của kỹ thuật này có thể chống lại sự can thiệp của ánh sáng đến một mức độ nào đó khi so sánh với kỹ thuật trừ nền cơ bản Đây là phương pháp đơn giản dễ thực hiện, dễ thích nghi với môi trường động.
Phương pháp mẫu nhị phân cục bộ
Gần đây,phương pháp LBP [7] đã được ứng dụng nhiều trong xử lý ảnh và thị giác máy tính, đặc biệt, nó đã đƣợc liên quan rộng rãi đến các lĩnh vực nhận dạng khuôn mặt Ƣu điểm của việc sử dụng LBP là tính năng chiếc xuất của nó là một mô tả mạnh mẽ đặc trƣng cho cấu trúc của các kết cấu hình ảnh cục bộ là rất phù hợp với mật độ đám đông LBP đƣợc thực hiện dựa trên nhãn các điểm ảnh của một hình ảnh bằng tạo ngƣỡng 3 x 3 gần của mỗi điểm ảnh với giá trị trung tâm và xem xét các kết quả nhƣ là một chữ số nhị phân Sau đó, một số nhị phân thu đƣợc bằng cách kết hợp tất cả các giá trị nhị phân trong một chiều kim đồng hồ, bắt đầu từ những điểm gần trên bên trái Nhƣ vậy, đối với một điểm ảnh đƣợc đƣa ra tại (𝑋 𝑐 , 𝑌 𝑐 ) vị trí, mã LBP ở dạng thập phân đƣợc định nghĩa là:
Với 𝑖 𝑐 và 𝑖 𝑃 biểu thị, tương ứng, các giá trị màu xám của điểm ảnh trung tâm và P điểm ảnh xung quanh S đề cập đến một hàm tạo ngƣỡng định nghĩa là:
Hình 3 2 - Ví dụ minh họa phương pháp Mẫu nhị phân cục bộ (LBP) trích từ [7]
Với phương pháp trên mỗi vùng ảnh được không gian chia thành nhiều khối không chồng chéo mà từ đó các mã LBP đƣợc tính Sau đó, biểu đồ của mỗi khối đƣợc chiết xuất bằng cách thu thập sự xuất hiện của mã LBP Cuối cùng, các mảnh biểu đồ tính toán từ các khối khác nhau đƣợc nối thành một chuỗi biểu đồ duy nhất để đại diện cho một vùng hình ảnh nhất định.
Phương pháp Gray-Level Co-Occurence Matrix (GLCM)
GLCM là một ma trận M x M có thể hiển thị tính chất nhất định về sự phân bố không gian của mức độ màu xám trong cấu trúc hình ảnh Nó đƣợc xác định bởi Haralick vào năm 1973 Mỗi phần tử (i, j) của ma trận GLCM là số lần xuất hiện của các cặp pixel có cùng giá trị cường độ sáng i và j với ở một khoảng cách tương đối d và một góc θ xác định Các mối quan hệ không gian giữa hai điểm ảnh lân cận có thể đƣợc quy định trong nhiều cách có hiệu số khác nhau và góc xác định cũng khác nhau, trong đó các hệ số góc 0 0 ; 45 0 ; 90 0 và 135 0 đã đƣợc quy định và sử dụng rộng rãi Về mặt toán học, cho một ảnh I(x,y) có kích thước K × K, thì có thể tạo ra nhiều ma trận đồng mức xám M CO cho một vector chuyển động d (dx, dy) đƣợc định nghĩa theo công thức sau:
(00000111) 2 = 7 Ảnh nền Ma trận hệ số khối Ma trận 3x3 Ngƣỡng 159 Mẫu nhị phân
Hình 3.3 - Mô tả phương pháp GLCM
Hình 3.3 cho thấy xây dựng GLCM dựa trên (a) hình ảnh thử nghiệm cùng bốn hướng có thể (b) 0° (c) 45° (d) 90° và (e) 135° với một khoảng cách d = 1 để tạo ra 4 ma trận đồng hiện mức xám GLCM
Hình 3.4 - Cách tạo ra 4 ma trận GLCM
Hình 3.4 minh họa các chi tiết của quá trình để tạo ra bốn ma trận đồng hiện mức xám
Chúng ta xem xét một hình ảnh 4 × 4 đại diện với bốn giá trị mức xám từ 0 đến 3 Đối với ví dụ này, chúng ta xác định điểm ảnh lân cận (d = 1) cùng bốn hướng như {[0 1] cho 0 0 ; [-1 1] cho 45 0 ; [-1 0] cho 90 0 và [-1 -1] cho 135 0 ]}
Haralick đã đƣa ra một tập hợp gồm 14 đặc trƣng có thể tính toán đƣợc từ ma trận đồng hiện mức xám GLCM có thể dùng để phân lớp cấu trúc hình ảnh Một số tính năng quan trọng có thể kể đến như năng lượng (energy), độ tương phản (contrast), entropy, tính đồng nhất (homogeneity),
Công thức này đo lường tính đồng nhất cục bộ trong ảnh Giá trị của công thức S energy là cao khi ảnh có tính đồng đều về giá trị mức độ xám và nó sẽ có giá trị thấp nếu ảnh không đồng đều về mức độ xám Giá trị của S energy nằm trong khoảng từ 0 đến 1 Nếu
S energy = 1 thì ảnh có giá trị mức xám đều
Công thức này cho chúng ta biết đƣợc số lƣợng điểm ảnh có mức độ xám biến đổi cục bộ trong ảnh Vì vậy, giá trị của S contrast cao thường tập trung dọc theo đường chéo của ma trận GLCM Đối với ảnh có giá trị mức xám đều thì giá trị độ tương phản là bằng 0, đây là giá trị tối thiểu của độ tương phản Nếu ảnh không có sự đồng đều về giá trị mức xám càng nhiều thì giá trị độ tương phản càng tăng Giá trị S contrast nằm trong khoảng [0 (size(GLCM,1)-1) 2 ]
Entropy đo lường tính ngẫu nhiên của các phần tử của ma trận GLCM Giá trị của entropy là tối đa bằng 1 khi các phần tử trong ma trận bằng nhau, entropy bằng 0 nếu tất cả các giá trị trong ma trận là khác nhau
(3.9) Đặc trưng độ đồng nhất là đo lường tính khít hoặc tính dày đặc được phân bố trong không gian của ma trận GLCM Đặc trƣng về độ đồng nhất bằng 0 khi sự phân bố của ma trận GLCM là không đồng đều và bằng 1 khi sự phân bố chỉ xuất hiện trên đường chéo của ma trận GLCM.
Phương pháp Kanade – Lucas – Tomasi tracker (KLT tracker)
Phương pháp KLT tracker [18] được đề xuất bởi Lucas và Kanade vào năm
1981 Các tác giả đã xây dựng một thuật toán để theo dõi chuyển động của các điểm ảnh trong luồng hình ảnh (Optical Flow) Phương pháp này thực hiện phân tích sự chuyển động của các frame ảnh liên tiếp nhau từ đó giúp cho ta xác định đƣợc luồng di chuyển của đám đông và vẽ ra được đường đi của các đối tượng
Thuật toán KLT tracker áp dụng trên Optical flow đƣợc mô tả nhƣ sau:
Gọi I và J là ảnh mức xám thu nhỏ lần thứ nhất và lần thứ 2, I(x,y): giá trị xám của I nhƣ [x y] T Đặt u=[u x u y ] T là một điểm đầu tiên trên ảnh I Mục tiêu là tìm v trên ảnh J, khi I(u) và J(v) là giống nhau thỏa điều kiện: v=u+d=[u x +d x u y +d y ]T 3.10) Trong đó d=[d x d y ] T là vecto ảnh của u hay là Optical flow của u Định nghĩa một hàm kết hợp𝜀(d)
Hình 3.5 - Mô tả cách xác định điểm ảnh của 2 khung hình I và J
Cửa sổ mô tả giá trị w x và w y tại hình 3.5với thông số kích thước của cửa sổ là:
- Xây dựng vòng lặp kim tự tháp I 0 →I 1 →I 2 →I 3 →I 4… →I Lm - Với I 0 =I là ảnh thứ 0; I L-1 là ảnh thứ L-1 Một điểm u trong I, tìm vị trí tương ứng của nó là v=u+d Một điểm tương đồng của u(u 0 ) trên kim tự tháp ảnh I L là u L
Ta có thuật toán theo dõi kim tự tháp nhƣ sau:
Hình 3 6 - Mô hình kim tự tháp của thuật toán KLT tracker được trích từ [18]
- Đặt g L = [g x L , g y L ] T đƣợc đoán ở mức L Khi đó g L là giá trị từ mức L m đến mức L m+1
- Hoán vị vecto điểm ảnh dƣ d L = [d x L , d 𝑦 𝐿 ] L - Cực tiểu hóa hình ảnh phù hợp với hàm kết hợp ε L 𝜀 𝐿 𝑑 L = 𝜀 𝐿 𝑑 𝑥, 𝐿 𝑑 𝑦 𝐿 = (𝐼 𝐿 𝑥, 𝑦 − 𝐽 𝐿 (𝑥 + 𝑔 𝑥 𝐿
Kích thước cửa sổ (2𝑤 𝑥 + 1)X(2𝑤 𝑦 + 1) là hằng số cho tất cả kim tự tháp.𝑔 𝐿 được sử dụng để dịch chuyển những điểm trên ảnh thứ 2 J Khi đó 𝒅 𝐿 là nhỏ và dễ dàng tính bằng giải thuật KLT
Giả sử rằng 𝒅 𝐿 đƣợc tính là một ƣớc lƣợng mới ban đầu 𝑔 𝐿−1 ở mức L-1
𝑔 𝐿−1 =2(𝑔 𝐿−1 +d L ) (3.13) - Ƣớc lƣợng ban đầu Lm ở mức thấp nhất Khi đó 𝑔 𝐿 𝑚 =[0 0] T
- Tìm cách giải quyết Optical flow d
𝑑 𝐿𝑚−1 đƣợc tính với ƣớc lƣợng
Tiếp tục thực hiện đến mức 0
Mục tiêu là tìm hàm 𝒅 𝐿 để cực tiểu hóa hàm kết hợp ε L Cùng thực hiện cho tất cả các mức L, đƣa chỉ số L lên mức trên và xác định các ảnh mới A và B
Chúng ta thay đổi vectơ hoán vị và vectơ điểm
𝑣 = 𝑣 𝑥 𝑣 𝑦 T = 𝒅 𝐿 𝑝 = 𝑝 𝑥 𝑝 𝑦 T = 𝒖 𝐿 Mục tiêu là tìm 𝑣 để cực tiểu hóa hàm kết hợp
Thay thế B(x+𝑣 𝑥 , 𝑦 + 𝑣 𝑦 ) bằng biến đổi Taylor mở rộng bậc 1 về điểm 𝑣 = [0 0] T
Thay các giá trị vào ta đƣợc
Ta đƣợc công thức sau: 𝑣 𝑜𝑝𝑡 = 𝐺 −1 𝑏 (3.21) Tìm điểm u của ma trận G là ma trận không suy biến Cực tiểu hóa giá trị riêng của G phải lớn hơn một ngƣỡng
Do đó việc xác định điểm ảnh giữa 2 khung ảnh đƣợc thực hiện theo trình tự nhƣ sau:
Tính ma trận G và cực tiểu hóa giá trị riêng 𝜆 𝑚 của mọi điểm ảnh trên ảnh I
Gọi 𝜆 𝑚𝑎𝑥 là giá trị cực đại của 𝜆 𝑚 trên toàn bộ bức ảnh
Giữ lại các pixel hình ảnh có giá trị 𝜆 𝑚 lớn hơn ngƣỡng
Giữ lại vị trí các pixel có giá trị lớn (một pixel đƣợc giữ nếu giá trị 𝜆 𝑚 của nó lớn hơn bất kỳ điểm ảnh nào xung quanh lận cận 3x3 của nó )
Giữ tập con của những điểm ảnh sao cho khoảng cách tối thiểu giữa bất kỳ cặp điểm ảnh nào lớn hơn một khoảng cách ngƣỡng nhất định.
Phân tích độ nhất quán (collectiveness) của đám đông
Một cảnh đông người [19] có thể được chia thành hai loại: cấu trúc và không có cấu trúc Trong những cảnh đông đúc có cấu trúc là trong một khung cảnh chật hẹp, đám đông di chuyển theo hướng chung, và hướng chuyển động không thay đổi theo thời gian Tức là, mỗi vị trí không gian của cảnh chỉ có một hành vi của đám đông chính theo thời gian Chẳng hạn, đoạn video của cuộc chạy đua marathon tƣợng trƣng cho một cảnh đông người có cấu trúc bởi vì tất cả vận động viên chạy dọc theo con đường, do đó tạo ra một hành vi của đám đông có hướng di chuyển theo mô hình cố định ở mỗi vị trí của con đường Trong cảnh đông đúc không có cấu trúc, chuyển động của đám đông dường như ngẫu nhiên, với những người tham gia khác nhau di chuyển theo những hướng khác nhau ở những thời điểm khác nhau Đó là, trong những cảnh như vậy, mỗi vị trí không gian hỗ trợ nhiều hơn một hoặc nhiều phương thức, hành vi của đám đông
(a) Cảnh đám đông có cấu trúc (b) Cảnh đám đông không có cấu trúc
Hình 3 7- Minh họa cấu trúc cảnh đông đúc Định nghĩa đám đông [20] là của một nhóm lớn các cá nhân trong cùng một môi trường vật lý như nhau, chia sẻ mục tiêu chung (ví dụ: những người tham gia chương trình nhạc rock hoặc trận đấu bóng đá) Các cá nhân trong một đám đông có thể hành động theo cách khác với khi họ ở một mình hoặc trong một nhóm nhỏ Mỗi nhóm có hành vi chung của người tham gia, nhưng các hành vi riêng lẻ được tạo ra bởi một quy trình ngẫu nhiên thông qua hành vi nhóm Điều này có nghĩa là có một xu hướng được chia sẻ bởi tất cả các cá nhân trong cùng một nhóm bởi vì họ có một hành vi chung được xác định trước.
3.5.2 Mô hình động lực của đám đông Động lực đám đông là sự tương tác của các cá nhân trong đám đông với nhau dẫn đến những ảnh hưởng lên tình trạng đám đông Có 2 cách tiếp cận chính cho mô hình tính toán của các hành vi đám đông: là tiếp cận liên tục và tiếp cận dựa trên các tác nhân
- Phương pháp dựa trên tiếp cận liên tục, đám đông được coi là một chất lỏng vật lý với các hạt, do đó có rất nhiều phương pháp phân tích từ cơ học thống kê và nhiệt động lực học…Phương pháp này hoạt động tốt đối với đám đông vừa và cao
- Phương pháp tiếp cận dựa trên các tác nhân, cá nhân trong đám đông được coi là tác nhân tự trị, tích cực cảm nhận được môi trường và đưa ra một số quy tắc được xác định trước
Mô hình lực lƣợng xã hội (SFM) đƣợc đề xuất bởi Helbing và Molnár [21] đã cho thấy lực tương tác giữa những người đi bộ với nhau và chứng tỏ rằng đó là một tính năng quan trọng cho việc phân tích hành vi của đám đông SFM xây dựng trên công thức sau:
𝜏 𝑖 + 𝐹𝑖𝑛𝑡 (3.22) Trong đó 𝑚 𝑖 là khối lƣợng của các cá nhân, 𝑣 𝑖 là vận tốc thực tế của cá nhân nó cỏ thể thay đổi theo sự thay đổi trong cảnh, 𝜏 𝑖 là một tham số thư giãn, 𝐹 𝑖𝑛𝑡 là lực tương tác phát sinh do cá nhân và đƣợc xác định là tổng số lực hút và lực đẩy, 𝑣 𝑖 𝑝 là vận tốc mong muốn của cá nhân
3.5.3 Đo độ nhất quán trong chuyển động của đám đông 3.5.3.1 Tổng quan Độ nhất quán trong chuyển động là sự mô tả mức độ hoạt động giống nhau của các cá nhân hoạt động nhƣ một nhóm trong chuyển động tập thể Nó phụ thuộc vào nhiều yếu tố nhƣ mật độ, sự điều khiển của cá nhân đứng đầu… Phép đo này đóng vai trò quan trong trong nhiều ứng dụng nhƣ giám sát quá trình biển động của một hệ thống đám đông hỗn loạn cho các trạng thái ra lệnh, nghiên cứu sự tương quan giữa thuộc tính đám đông và mật độ dân số, và so sánh độ nhất quán trong chuyển động của các đám đông khác nhau
3.5.3.2 Tính nhất quán về hành vi trong vùng lân cận
Một đám đông không chỉ là sự tập hợp của các cá nhân [22] Trong những trường hợp nhất định, các cá nhân trong đám đông được tổ chức thành một sự thống nhất với các cấp độ khác nhau của các chuyển động tập thể Nhƣ vậy, sự tập trung của đám đông phải đƣợc xác định bởi sự tập hợp của các cá thể cấu thành, phản ánh sự tương đồng về hành vi của cá nhân với những cá nhân khác trong cùng một hệ thống đám đông
Trước tiên khảo sát sự tương đồng của các hành vi cá nhân trong một khu vực lân cận Theo tác giả Bolei Zhou [22] sự tương đồng của các hành vi lân cận xảy ra khi một cá nhân j là lân cận của i và j∈ 𝓝(𝑖) tại thời điểm t, đƣợc định nghĩa nhƣ sau:
Với 𝐶 𝑡 𝑖, 𝑗 là hàm tương quan vận tốc của i và j tại thời điểm t 𝓝 được định nghĩa là số lƣợng K các lân cận xung quanh
Hình 3.8- Mô tả không gian cấu trúc nhất quán
3.5.3.3 Tính nhất quán về hành vi trên nhiều tập hợp khác nhau
Trong các hệ thống đám đông, các đường dẫn có vai trò quan trọng trong việc truyền tải thông tin và truyền thông giữa các cá thể cấu thành Vì vậy, sự tương đồng dựa trên đường dẫn có thể đặc trưng tốt hơn tính cách hành vi nhất quán giữa các cá nhân trong một đám đông
Gọi W là ma trận trọng số của đồ thị liên kết với tập hợp đám đông C có biên 𝑤 𝑡 𝑖, 𝑗 là lân cận tương đồng giữa cá thể i và j và được định nghĩa theo biểu thức (3.23) Đặt 𝛾 𝑙 = 𝑝 0 → 𝑝 1 → ⋯ → 𝑝 𝑙 với (𝑝 0 = 𝑖, 𝑝 𝑙 = 𝑗) biểu thị một đường dẫn có độ dài l thông qua các nút p 0 , p 1 , … , p l trên W giữa cá thể i và j
Do đó 𝑣 𝛾 𝑙 = 𝑙 𝑘=0 𝑤 𝑡 (𝑝 𝑘, 𝑝 𝑘+1 ) được định nghĩa là đường dẫn tương đồng trên một đường dẫn cụ thể 𝛾 𝑙 Đặt một tập hợp 𝑃 𝑙 chứa tất cả các đường dẫn có chiều dài 𝑙 giữa điểm i và j
Thì chiều dài đường dẫn tương đồng 𝑙 được định nghĩ như sau:
𝑖, 𝑗 (3.24) 𝑣 𝛾 𝑙 (𝑖, 𝑗) đƣợc tác giả Zhou [22] tính theo định lý 1 Định lý 1: 𝑣 𝛾 𝑙 (𝑖, 𝑗) là phần tử thứ i,j của ma trận trọng số W 𝑙
3.5.3.4 Sự kết hợp của những cá thể từ đường dẫn tương đồng
Khi 𝑙 đường dẫn tương đồng 𝑣 𝑙 (𝑖, 𝑗) đo hành vi chắc chắn xảy ra của i và j như tỉ lệ đường dẫn 𝑙 Chúng ta định nghĩa tập hợp hành vi cá nhân của cá thể i là tỉ lệ đường dẫn 𝑙 như sau:
Giá trị trung bình 𝜙 𝑙 tăng theo cấp số nhân với 𝑙, bởi vì số lượng các đường dẫn giữa hai nút trong một đồ thị kết nối tăng theo cấp số nhân với chiều dài đường dẫn chẳng hạn nhƣ {𝜙 1, … , 𝜙 𝑙 … , … 𝜙 ∞ } Tuy nhiên độ nhất quán trong chuyển động cá nhân ở các đường khác nhau thì không thể cập nhật trực tiếp được Do đó theo [22] vấn đề đặt ra là cần phải xây dựng một toán học để tích hợp cho tất cả các đường
3.5.3.5 Độ nhất quán đám đông theo hợp thức
PHÁT HIỆN VÀ PHÂN TÍCH CHUYỂN ĐỘNG CỦA ĐÁM ĐÔNG
Tổng quan các bước thực hiện luận văn
Một đám đông không chỉ là sự tụ tập của các cá nhân mà còn là sự thống nhất khác nhau của các chuyển động tập thể Nhiệm vụ của luận văn là phát hiện và phân tích vận động của đám đông, việc thực hiện đƣợc chia ra làm hai giai đoạn riêng biệt nhau và cụ thể nhƣ sau:
Giai đoạn 1: Phát hiện và ƣớc lƣợng mật độ đám đông gồm các quá trình phân tích nhƣ sau:
Hình 4.1 -Lưu đồ giải thuật phát hiện và ước lượng mật độ đám đông Ảnh đầu vào Bắt đầu
Chia ảnh thành các ô lớn
Chia các ô lớn thành các ô nhỏ
Sử dụng GLCM phát hiện đám đông trên ô nhỏ
Tổng hợp kết quả trên tất cả các ô nhỏ
Phát hiện và ƣớc lƣợng đám đông trên ô lớn
Phát hiện và ƣớc lƣợng mật độ đám đông
Hình 4.2- Lưu đồ giải thuật phân tích chuyển động của đám đông
4.2 Phát hiện và ƣớc lƣợng mật độ đám đông 4.2.1 Phát hiện vùng đám đông Để phát hiện vùng đám đông luận văn sẽ sử dụng phương pháp phân tích GLCM (Gray Level Co-occurrence Matrix) để phân tích ảnh đầu vào với ảnh trong ví dụ trên là cảnh giao thông tại một ngã tƣ ở Hà nội Quá trình phân tích lần lƣợt theo trình tự nhƣ sau:
Bức ảnh đƣợc đƣa về mức xám và nhân với Mask của nó để loại bỏ các thành phần tĩnh không cần thiết
Hình 4.3- Minh họa bước tạo ảnh mức xám sau khi loại bỏ thành phần tĩnh
Chuỗi khung ảnh đầu vào Bắt đầu
Sử dụng KLT để phân tích chuyển động của đám đông trên ô nhỏ
Cụm cá thể đƣợc gắn hạt và chuyển động giống nhau
Kết thúc Tính độ nhất quán và gom nhóm đám đông
Bức ảnh mức xám vừa tìm được ở bước trên có kích thước 750x500 được phân thành các ô nhỏ có kích thước 25x25 và phân tích GLCM từng ô
Hình 4.4- Minh họa kết quả phân tích GLCM trên ô nhỏ không có đối tượng xe cộ hay người
Hình 4.5- Minh họa kết quả phân tích GLCM trên ô nhỏ có đối tượng là xe ô tô
Hình 4.6- Minh họa kết quả phân tích GLCM trên ô nhỏ có đối tượng là xe mô tô
Từ kết quả GLCM trên các ô nhỏ, ta tính toán chỉ số Homogeneity theo công thức (3.9) Với những ô có đám đông xuất hiện, chỉ số Homogeneity sẽ thấp Vì vậy ta sẽ quyết định một ô có sự xuất hiện của đám đông bằng công thức sau:
Việc sử dụng phương pháp GLCM trong phân tích để phát hiện vùng đám đông cho thấy ở những ô không có xe cộ hay người thì những chấm sáng trắng đặc trưng cho ma trận đồng hiện có giá trị nhỏ nên vùng chấm trắng xuất hiện ít, ở những ô có người hay xe cộ thì ma trận đồng hiện có giá trị lớn những ô đó thể hiện vùng chấm sáng trắng lớn Dựa vào đặc trƣng của ma trận GLCM giúp ta phát hiện vùng đám đông dễ dàng hơn
4.2.2 Ƣớc lƣợng mật độ đám đông
Từ kết quả phân tích GLCM tại các ô nhỏ ở mục (4.2.1) chúng ta sẽ tiếp thực hiện ƣớc lƣợng mật độ đám đông nhƣ sau:
Phân khung ảnh phân tích thành các ô lớn là bội số của các ô nhỏ đã phân tích GLCM ở phần trên
Hình 4.7 - Minh họa cách chia khung ảnh ra thành các ô lớn
Tính tổng các ô nhỏ có phát hiện đám đông trong ô lớn để xác định đƣợc giá trị
T M Mật độ đám đông của các ô lớn đƣợc xác định theo T M nhƣ sau:
Trong đó a1, a2, a3 lần lƣợt là các mức ngƣỡng cho các mật độ hạn chế, dày đặc và kẹt cứng với (a1< a2