Rút trích hình chiếu của đối tượng

Cả trong bước ngoại tuyến lẫn trực tuyến của thuật toán phân loại, bóng của các vùng đối tượng được phát hiện được trích từ bản đồ điểm ảnh cận cảnh bằng cách sử dụng thuật toán lần vết đường nét được trình bày trong [19]. Hình 2.16 cho ta thấy các vùng đối tượng mẫu trên nền (cận cảnh) phát hiện được và các bóng “rút trích” được.

2.2.2. Cơ sở dữ liệu hình chiếu khuôn mẫu

Cơ sở dữ liệu mẫu về các bóng được tạo ngoại tuyến bằng cách rút trích một số đường nét đối tượng từ các cảnh quay khác nhau. Vì lược đồ phân loại sử dụng sự tương đồng đối tượng, nên những hình dạng của các đối tượng trong cơ sở dữ liệu này cần phải là các tư thế có tính đại diện cho các chủng loại đối tượng khác nhau. Sau khi xem xét chủng loại người, chúng tôi thêm vào các hình dạng người với những tư thế khác nhau vào cơ sở dữ liệu mẫu nhằm tăng cơ hội cho một đối tượng truy vấn trong chủng loại người có thê được phân loại một cách đúng đắn. Chẳng hạn như, nếu tất cả chúng ta đều có dạng người ở vị trí thẳng đứng, chúng ta có thể bỏ sót việc phân loại một người đang ngồi trên ghế. Hoặc là nếu chúng ta có bóng của mấy chiếc xe, tất cả đều được quan sát theo chiều ngang từ camera, thì chúng ta có thể bỏ sót việc phân loại các chiếc xe di chuyển theo chiều thẳng đứng đối với góc quay của camera. Hình 2.18 cho ta thấy một cơ sở dữ liệu mẫu kích thước 24 gồm những tư thế khác nhau cho người, nhóm người và xe cộ.

Trần Xuân Linh - K11T2 Trang 68

Hình 2.17 mẫu các vùng đối tượng cận cảnh phát hiện được và các bóng rút trích được

Trong bước phân loại, phương pháp được đưa ra không sử dụng các bóng ở định dạng thô, mà là so sánh những tín hiệu khoảng cách bóng đã được chuyển đổi. vì vậy, trong cơ sở dữ liệu mẫu này, mà chỉ lưu trữ tín hiệu khoảng cách của bóng và các thông tin về chủng loại tương ứng dành cho tính hiệu quả lưu trữ và tính toán trên máy tính.

Cho S = {p1, p2, …., pn} là bóng của một đối tượng gồm n điểm được xếp theo thứ tự từ tâm trên của vùng được phát hiện theo chiều kim đồng hồ, và cm là tâm của khối đối tượng O. Tín hiệu khoảng cách DS = {d1, d2, …. , dn} được phát sinh bằng cách tính khoảng cách giữa cm và mỗi pi, bắt đầu từ 1 đến n như sau:

] .. 1 [ ), , (c p i n Dist di  m i   (2.25)

Trong đó hàm Dist () là khoảng cách Euclide giữa 2 điểm a và b:

2 2 ) ( ) ( ) , (a b xa xb ya yb Dist     (2.26)

Trần Xuân Linh - K11T2 Trang 69

Hình 2.18: Cơ sở dữ liệu mẫu về các bóng, có tên kèm theo.

Các đối tượng khác nhau có các hình dạng khác nhau trong video, vì thế bóng của chúng cũng có kích thước khác nhau. Thậm chí cùng một vật cũng có những kích thước về hình dạng khác nhau theo từng khung hình. Để so sánh những tín hiệu của các đối tượng có kích thước khác nhau một cách chính xác và để làm cho tiêu chuẩn so sánh bất biến về tỉ lệ, chúng tôi cố định kích thước của tín hiệu khoảng cách. Cho N là kích thước tín hiệu khoảng cách DS và cho C là hằng số của chiều dài tín hiệu đã được cố định. Tín hiệu khoảng cách cố định ^DS khi đó được tính bằng cách thử cận dưới hoặc thử cận trên tín hiệu gốc DS như sau:

] .. 1 [ ], * [ ] [ i C C N i DS i DS    (2.27)

Trần Xuân Linh - K11T2 Trang 70 Ở bước tiếp theo, tín hiệu khoảng cách có tỉ lệ ^DS được chuẩn hóa để có được một diện tích là số nguyên. Tín hiệu được chuẩn hoá DS được tính theo công thức sau:     n i DS i DS i DS 1 [] ] [ ] [ (2.28)

Hình 2.18 cho ta thấy một cái bóng mẫu cùng với các tín hiệu khoảng cách ban đầu và sau khi được căn chỉnh tỉ lệ của nó.

2.2.3. Sự phân loại theo hệ mét

Tiêu chuẩn dùng để phân loại được dựa trên sự tương đồng của hình dạng đối tượng. Có nhiều phương pháp trong tập tài liệu này để so sánh các hình dạng đối tượng [43, 7, 42, 3, 22]. đặc biệt, độc giả có thể xem [47, 31] để có được các bài thảo luận hay nói về những kỹ thuật khác nhau.

Các đòi hỏi quan trọng của một tiêu chuẩn phân loại hình dạng là: tỉ lệ, sự bất biến trong tịnh tiến và quá trình quay. Phương pháp đưa ra đáp ứng được cả 3 thuộc tính này.

Trần Xuân Linh - K11T2 Trang 71 (b)

(c)

Hình 2.19: Bóng đối tượng mẫu và các tín hiệu khoảng cách đã được căn tỉ lệ và nguyên gốc tương ứng của nó.

a) Bóng đối tượng b) Tín hiệu khoảng cách

c) Tín hiệu khoảng cách đã được căn tỉ lệ

1. Sự bất biến về tỉ lệ: Vì chúng ta chỉ dùng một chiều dài cố định cho các tín hiệu khoảng cách các hình dạng đối tượng nên tín hiệu khoảng cách được chuẩn hóa và được căn tỉ lệ hầu như sẽ như nhau đối với 2 tình trạng khác nhau (trong các tì lệ khác nhau) của cùng tư thế một đối tượng.

Trần Xuân Linh - K11T2 Trang 72 2. Sự bất biến trong tịnh tiến: tín hiệu khoảng cách là không phụ thuộc vào vị trí hình học của hình dạng đối tượng vì tín hiệu khoảng cách được tính theo tâm của khối đối tượng. Do một sự thật hiển nhiên là sự tịnh tiến của hình dạng đối tượng sẽ không làm thay đổi vị trí tương đối của tâm vị trí khối đối tượng so với đối tượng đó nên tiêu chuẩn so sánh sẽ không bị ảnh hưởng bới sự tịnh tiến.

3. Sự bất biến trong quá trình quay: Trong luận văn không sử dụng thuộc tính bất biến trong quá trình quay của tiêu chẩn phân loại của mình vì chúng tôi muốn phân biệt cả các tư thế khác nhau của một đối tượng đơn cho các bước sau nay trong hệ thống giám sát. Tuy vậy, bằng cách chọn điểm khởi đầu khác nhau ps trên bóng đối tượng trong bước lần vết đường nét, chúng tôi đã có thể tính được các tín hiệu khoảng cách của đối tượng cho một số dạng biến đổi xoay khác nhau cho mỗi điểm bắt đầu ps.

Tiêu chuẩn phân loại được đưa ra so sánh sự tương đồng giữa các hình dạng của 2 đối tượng, A và B, bằng cách tìm ra khoảng cách giữa các tín hiệu khoảng tương ứng của chúng, DSA và DSB. Khoảng cách giữa 2 tín hiệu khoảng cách được chuẩn hóa và được căn tỉ lệ, DSA và DSB, được tính như sau:

    n i B A AB DS i DS i Dist 1 ] [ ] [ (2.29)

Để tìm ra chủng loại TO của đối tượng O, chúng ta so sánh tín hiệu khoảng cách của nó, DSO, với tất cả tín hiệu khoảng cách của những đối tượng trong cơ sở dữ liệu mẫu. Chủng loại TP của đối tượng mẫu P sẽ được gán, như là đối tượng truy vấn O, TO = TP, trong đó P thoả điều kiện sau đây:

OP Dist

Dist  , object In the template database (2.30) Hình 2.19 cho ta thấy các bóng, các tín hiệu bóng, và các khoảng cách tín hiệu của một đối tượng truy vấn mẫu và các đối tượng cơ sở dữ liệu mẫu cho việc phân loại chủng loại.

Trần Xuân Linh - K11T2 Trang 73

2.2.4. Sự thống nhất theo thời gian

Sự thể hiện của phương pháp phân loại đối tượng phụ thuộc vào chất lượng đầu ra của bước phân đoạn đối tượng. Do các yếu tố về môi trường, chẳng hạn như đối tượng bị che khuất bởi các đối tượng cận cảnh tĩnh (ví dụ như hàng rào hay một cây cột đứng trước camera) hoặc vì một phần đối tượng bị rơi vào cảnh quay, nên hình dạng của vùng phát hiện được không phản ánh đúng bóng thật sự của một đối tượng. Trong những trường hợp như thế, thuật toán phân loại không thể gọi tên được chủng loại đối tượng một cách chính xác. Chẳng hạn như, một phần của chiếc xe rơi vào cảnh quay có thể trông giống như một người, hay một người bị che khuất một phần có thể trông giống như một nhóm người. Vì vậy, chúng tôi dùng một lược đồ đa giả thuyết [29] để tăng độ chính xác trong phương pháp phân loại.

Trong tiến trình này, một hình đồ chủng loại HT được khởi tạo và duy trì cho một đối tượng được phát hiện trong cảnh quay. Kích thước của hình đồ này bằng với số lượng chủng loại đối tượng khác nhau (ví dụ như, 3 trong hệ thống của chúng tôi tượng trưng cho người (H), nhóm người (HG), và xe cộ (V)), còn mỗi bin i của hình đồ này giữ số lần đối tượng O được tìm thấy cho chủng loại Ti (một trong H, HG, V). Hình 2.21 cho thấy một đối tượng mẫu và hình đồ chủng loại của nó cho 3 khung hình khác nhau.

Với sự giúp đỡ của lược đồ đa giả thuyết này, các chủng loại có thể có của một vật có thể được thu thập suốt một thời gian được định nghĩa trước và chúng ta có thể quyết định đúng chủng loại của nó một cách chính xác hơn bằng cách chọn loại bin có giá trị lớn nhất làm chủng loại đối tượng.

Trần Xuân Linh - K11T2 Trang 74 (b)

Hình 2.20: Mẫu phân loại đối tượng

a) đối tượng truy vấn mẫu

b) các vật liệu cơ sở dữ liệu mẫu với các tín hiệu kích thước. Chủng loại của mỗi đối tượng (H: Người, HG: Nhóm người, V: Xe cộ) và khoảng cách (D) giữa đối tượng truy vấn với mỗi đối tượng cơ sở dữ liệu được trình bày bên dưới các đối tượng

Trần Xuân Linh - K11T2 Trang 75

(a) (b)

(e) (f)

Hình 2.21 Hình đồ chủng loại đối tượng cho một đối tượng mẫu được phát hiện.

((a), (c), (e)) đối tượng được phát hiện

((b), (d), (f)) hình đồ chủng loại đối tượng tương ứng

2.3. Phát hiện cháy

Các hệ thống giám sát được dùng không chỉ để phát hiện các hành động cố ý phá hoại do con người gây ra mà còn để phát hiện các sự kiện có tính hủy hoại, chẳng hạn như cháy, để bảo vệ các khu vực nhạy cảm về mặt an ninh.

Trần Xuân Linh - K11T2 Trang 76 Thông thường, chúng ta sử dụng các bộ cảm biến lửa và khói có khả năng cảm nhận một số hạt do khói và lửa phát ra bằng cách ion hóa hay trắc quang học. Các bộ cảm biền truyền thống chỉ nhằm mục đích cảm nhận được các hạt, vì thế một yếu điểm quan trọng của các máy phát hiện này là chúng bị giới hạn khoảng cách và không có tác dụng trong các không gian mở và rộng lớn.

Sức mạnh của việc sử dụng video trong việc phát hiện cháy là khả năng đáp ứng được các không gian mở và rộng lớn cũng như các môi trường trong nhà. Các thuật toán phát hiện lửa đang được sử dụng được dựa trên việc sử dụng màu sắc và thông tin về sự chuyển động trong đoạn video [23, 30]. Một yếu điểm gặp phải trong [23] là: các đối tượng di chuyển có màu sắc như lửa hay các đối tượng di chuyển phía trước các nền có màu sắc như lửa được phát hiện như các vùng hoả hoạn trong những khoảng thời gian ngắn, điều này dẫn đến việc báo động sai. Trong nghiên cứu được đưa ra trong luận văn, xuất phát từ công việc được trình bày ở [23], ngoài ra không những phát hiện được các vùng có màu như cháy hay như đám lửa mà còn phân tích được các chuyển động chi tiết để làm giảm tỉ lệ báo động sai. Ai cũng biết rằng những đám lửa lớn thì thường lung linh. Vì thế, lược đồ phát hiện hoả hoạn có thể được làm cho mạnh mẽ hơn bằng cách phát hiện hành vi có độ thường xuyên cao về mặt không gian và mang tính chu kì trong các điểm ảnh có màu lửa, so với các hệ thống phát hiện cháy hiện có.

Trần Xuân Linh - K11T2 Trang 77

Hình 2.22: Biểu đồ hệ thống phát hiện cháy

Lược đồ phát hiện cháy gồm có 6 bước, được minh họa trong hình 2.22 và được liệt kê sơ lược như sau:

1. phát hiện các điểm ảnh có màu lửa: các điểm ảnh có màu lửa trong một hình ảnh được phát hiện bằng cách sử dụng một sự phân bố xác suất màu lửa được tính toán trước.

2. phân tích sự thay đổi về mặt thời gian: những vùng cháy cho thấy những thay đổi cường độ không ổn định, vì vậy làm phát sinh sự thay đổi về mặt thời gian rất lớn. Những đối tượng rắn thường không gây ra sự biến đổi lớn về mặt thời gian.

3. phân tích chu kì thời gian: trong một số trường hợp, các vùng có màu lửa có thể cho thấy sự biến đổi lớn về mặt thời gian. Bằng cách kiểm tra sự dao động trong màu lửa, chúng ta phân biệt các vùng cháy với các vùng đối tượng bình thường tốt hơn.

4. phân tích sự biến đổi về không gian: các vùng cháy không những phát sinh sự thay đổi về thời gian mà còn cho thấy sự biến đổi cao về mặt không gian. Ở bước này, sự biến đổi về không gian của những vùng có thể có cháy được kiểm tra để loại bỏ các báo động sai.

Trần Xuân Linh - K11T2 Trang 78 5. mở rộng vùng cháy: các kiểm tra trên có thể lọc ra những điểm ảnh só cháy thật sự. Để phát hiện vùng cháy chính xác, chúng tôi mở rộng kết quả thu được của các bước trước bằng cách sử dụng sự phân bố màu lửa. 6. kiểm tra sự tồn tại dai dẳng và kiểm tra sự mở rộng: Mặc dù tất cả các

cuộc kiểm tra đã được thực hiện trong các bước trước, nhưng báo động sai vẫn có thể xảy ra. Chúng tôi loại bỏ các báo động sai bằng cách kiểm tra sự dai dẳng của những vùng cháy và sự mở rộng của chúng vì các vùng cháy không kiểm soát được có thể bùng phát bất cứ lúc nào.

Các bước 1, 2 và 5 tương tự như phương pháp trình bày trong [23] trong khi các bước 3. 4 và 6 là những phần mở rộng mới mẻ để làm giảm tỉ lệ báo động sai.

2.3.1. Dò tìm màu sắc

Nhìn chung, các vùng cháy trong các hình ảnh video thường có màu sắc tương tự nhau. Điều này giúp gợi ra ý tưởng về việc phát hiện các điểm ảnh vùng cháy dựa trên các giá trị màu sắc. Để đạt được điều này, chúng ta tạo ra một hàm tra cứu màu sắc cháy (FireColorLookup). Trong hàm này, một bộ ba màu RGB trả về giá trị: đó là màu lửa hoặc không phải.

Hàm FireColorLookup sử dụng một thuộc tính màu sắc cháy được tạo thành bởi hàng trăm màu lửa thu được từ các hình mẫu có chứa các vùng cháy. Các giá trị màu sắc này tạo thành 1 đám mây điểm ba chiều trong không gian màu RGB như được trình bày trong hình 2.23. Vấn đề này giờ đây giảm xuống để tượng trưng cho đám mây màu lửa này trong không gian màu RGB một cách hiệu quả và quyết định chủng loại màu điểm ảnh cho trước bằng cách kiểm tra xem nó có nằm bên trong đám mây màu lửa này hay không.

Để quyết định đại diện cho đám mây màu lửa bằng cách dùng một hỗn hợp Gaussian trong không gian màu RGB. Trong luận văn sử dụng ý tưởng được trình bày trong [44]. Trong phương pháp này, một tập màu sắc cháy mẫu FC = {c1, c2, …, cn} được xem là một tiến trình điểm ảnh và một mô hình hỗn hợp Gaussian với N (=10) sự phân bố Gaussian được khởi tạo bằng cách sử

Trần Xuân Linh - K11T2 Trang 79 dụng các mẫu này. Nói cách khác tượng trưng cho đám mây các điểm ảnh màu lửa này trong không gian màu RGB bằng cách sử dụng N khối cầu. Phần hợp của các khối cầu này hầu như che phủ đám mây điểm này. Hình 2.23 cho ta thấy đám mây màu lửa mẫu và sự phân bố Gaussian như các khối cầu che kín đám mây này. Đối với 1 màu truy vấn c thì hàm FireColorLookup kiểm tra xem có

Phát hiện đối tượng chuyển động

Sự phân loại theo hệ mét