Mô hình từ điển thích nghi thời gian thực

Một phần của tài liệu Thuật toán phát hiện chuyển động (Trang 31)

Nhƣ đã trình bày ở phần 1.2, mô hình MOG [2] đã đƣợc sử dụng để mô hình các nền phức tạp, không tĩnh. Tuy nhiên, MOG cũng có một vài nhƣợc điểm: Các nền có mức độ thay đổi lớn sẽ khó để có thể mô hình hóa với một vài phân bố Gauss dẫn tới rất nhạy với thay đổi – đƣợc đề cập tới trong [1]. Thêm vào đó, việc phụ thuộc vào tốc độ học để thích nghi với sự thay đổi của môi trƣờng thì MOG đối mặt với một số điều mâu thuẫn: Với một tốc độ học thấp thì

sẽ tạo ra một mô hình lớn nên khó có thể phát hiện một thay đổi đột ngột của mô trƣờng. Nếu mô hình thích nghi quá nhanh thì một đối tƣợng vật thể sẽ đƣợc hiểu nhƣ là nền và kết quả là tỉ lệ phát hiện sai tăng lên.

Để khắc phục các vấn đề này, một kĩ thuật không tham số trong việc ƣớc lƣợng hàm mật độ xác suất tại một điểm từ rất nhiều mẫu sử dụng ƣớc lƣợng phân bố nhân đƣợc phát triển [1]. Điều này cho phép thích nghi nhanh với các thay đổi của nền để xử lý và phát hiện các vật thể với độ nhạy cao. Tuy vậy, các kĩ thuật không tham số này khó có thể đƣợc sử dụng trong thực tế vì cần các khoảng thời gian dài cho việc lấy mẫu nền. Điều này cũng dẫn đến một hệ quả là đòi hỏi một dung lƣợng lƣu trữ lớn cho thuật toán hoạt động. Để khắc phục điều này, chúng ta sẽ phát triển các mô hình nền có độ nén cao để khắc phục điều này.

Các kĩ thuật xử lý dựa trên cơ sở điểm ảnh giả thiết rằng chuỗi theo thời gian của các điểm ảnh là độc lập với các điểm ảnh khác. Điều này trái ngƣợc với một số nhà nghiên cứu dựa trên khái niệm liên quan tới vùng điểm trong ảnh hoặc khung hình để tách một ảnh bằng lọc phân lớp cấp thấp thu đƣợc tại mỗi mức. Thuật toán tách nền sử dụng từ điển (codebook) [4] đƣợc tạo nên từ các giá trị mẫu theo thời gian mà không cần tới các tham số. Các nền hỗn tạp có thể đƣợc mô hình hóa bằng nhiều từ mã (codeword). Ƣu điểm nổi bật của thuật toán này là:

 Một mô hình đơn giản có khả năng thích nghi có thể bắt đƣợc các cấu trúc nền thay đổi trong một khoảng thời gian dài với dung lƣợng bộ nhớ sử dụng hạn chế.

 Khả năng kiểm soát đƣợc các thay đổi độ sáng một cách cục bộ hay toàn cục.

 Cho phép có cả vật thể chuyển động ngay trong thời gian học cấu trúc nền.

 Có thể xây dựng mô hình phân lớp về cấu trúc nền cho phép biểu diễn nhiều lớp nền khác nhau – nền tồn tại vĩnh viễn(tƣờng gạch, đƣờng xá,…), nền tồn tại tạm thời(xe ô tô đang đỗ, vật thể đứng yên,…), vật thể chuyển động.

Một phần của tài liệu Thuật toán phát hiện chuyển động (Trang 31)