frame video
Chuyển ảnh sang không gian màu YCrCb
frinput ≤frtoLearn
Học nền theo giải thuật codebook với ngưỡng học
learnHigh, learnLow
Mô hình background Đúng
Sai
Trừ nền theo giải thuật codebook với ngưỡng kiểm
tra minMode, maxMode
Lọc bỏ nhiễu Liên kết thành phần liên thông Ảnh foreground Hình 3-2. Lưu đồ thuật toán học và trừ nền
48
Pha học nền thực hiện một quá trình học trên các ảnh đầu vào. Mục đích là xây dựng mô hình nền sử dụng cho pha trừ nền tiếp theo .
9 Đầu vào: Tâp frame ảnh đầu tiên của video. 9 Đầu ra: Ảnh nền kết quả YCrCb.
9 Thuật toán: Khi có frame ảnh đầu vào, chương trình chuyển frame này từ
không gian màu RGB sang không gian màu YCrCb. Sau đó, chương trình kiểm tra xem số lượng frame đầu vào (frInput) có vượt quá số lượng frame học nền (frtoLearn) hay không. Nếu frInput ≤ frtoLearn, frame ảnh đầu vào
được chuyển vào chu trình học nền theo giải thuật codebook với các thông số
cài đặt: các ngưỡng biên codewords min, max và các ngưỡng học cho mỗi từ
mã learnHigh, learnLow.
Kết thúc pha học nền, những frame ảnh tiếp theo của video được đưa sang pha trừ nền. Mục đích pha này là tìm hiệu giữa frame ảnh video với ảnh nền đã xây dựng trong pha học nền trước đó..
9 Đầu vào: Frame ảnh video và ảnh nền đã xây dựng. 9 Đầu ra: Ảnh foreground hai mức 0 và 255.
9 Thuật toán: Khi frInput > frtoLearn, chương trình áp sẽ thực hiện trừ nền theo giải thuật codebook giữa frame ảnh này và ảnh nền với thông số cài đặt là ngưỡng kiểm tra cho mỗi từ mã minMode, maxMode. Ảnh kết quả thu
được từ phép trừ nền tiếp tục qua hai công đoạn “làm sạch”: lọc bỏ nhiễu và liên kết thành phần liên thông để có ảnh kết quả cuối cùng foreground. Công
đoạn lọc bỏ nhiễu sử dụng phép toán hình thái morphological, cho phép loại
đi những thành phần có kích thước nhỏ, đơn lẻ, không thuộc đối tượng quan tâm. Công đoạn liên kết các thành phần liên thông thực hiện nhóm các pixel lân cận thành một nhóm liên thông tương ứng với một đối tượng nào đó. Chi tiết cụ thể những bước này thêm tại mục 2.3.5.
Ảnh kết quả foreground là ảnh hai mức xám, 0 tương ứng với nền và 255 tương ứng với đối tượng được phát hiện.
49