Lưu đồ thuật toán

frame video

Chuyển ảnh sang không gian màu YCrCb

frinput ≤frtoLearn

Học nền theo giải thuật codebook với ngưỡng học

learnHigh, learnLow

Mô hình background Đúng

Sai

Trừ nền theo giải thuật codebook với ngưỡng kiểm

tra minMode, maxMode

Lọc bỏ nhiễu Liên kết thành phần liên thông Ảnh foreground Hình 3-2. Lưu đồ thuật toán học và trừ nền

Pha học nền thực hiện một quá trình học trên các ảnh đầu vào. Mục đích là xây dựng mô hình nền sử dụng cho pha trừ nền tiếp theo .

9 Đầu vào: Tâp frame ảnh đầu tiên của video. 9 Đầu ra: Ảnh nền kết quả YCrCb.

9 Thuật toán: Khi có frame ảnh đầu vào, chương trình chuyển frame này từ

không gian màu RGB sang không gian màu YCrCb. Sau đó, chương trình kiểm tra xem số lượng frame đầu vào (frInput) có vượt quá số lượng frame học nền (frtoLearn) hay không. Nếu frInput ≤ frtoLearn, frame ảnh đầu vào

được chuyển vào chu trình học nền theo giải thuật codebook với các thông số

cài đặt: các ngưỡng biên codewords min, max và các ngưỡng học cho mỗi từ

mã learnHigh, learnLow.

Kết thúc pha học nền, những frame ảnh tiếp theo của video được đưa sang pha trừ nền. Mục đích pha này là tìm hiệu giữa frame ảnh video với ảnh nền đã xây dựng trong pha học nền trước đó..

9 Đầu vào: Frame ảnh video và ảnh nền đã xây dựng. 9 Đầu ra: Ảnh foreground hai mức 0 và 255.

9 Thuật toán: Khi frInput > frtoLearn, chương trình áp sẽ thực hiện trừ nền theo giải thuật codebook giữa frame ảnh này và ảnh nền với thông số cài đặt là ngưỡng kiểm tra cho mỗi từ mã minMode, maxMode. Ảnh kết quả thu

được từ phép trừ nền tiếp tục qua hai công đoạn “làm sạch”: lọc bỏ nhiễu và liên kết thành phần liên thông để có ảnh kết quả cuối cùng foreground. Công

đoạn lọc bỏ nhiễu sử dụng phép toán hình thái morphological, cho phép loại

đi những thành phần có kích thước nhỏ, đơn lẻ, không thuộc đối tượng quan tâm. Công đoạn liên kết các thành phần liên thông thực hiện nhóm các pixel lân cận thành một nhóm liên thông tương ứng với một đối tượng nào đó. Chi tiết cụ thể những bước này thêm tại mục 2.3.5.

Ảnh kết quả foreground là ảnh hai mức xám, 0 tương ứng với nền và 255 tương ứng với đối tượng được phát hiện.

Các phương trình tính toán của bộ lọc

Thuật toán Kalman rời rạc