Một bộ lọc vân-bố cục là một cặp gồm một vùng ảnh r và một texton t. Vùng ảnh r có dạng hình chữ nhật với 4 góc đƣợc chọn một cách ngẫu nhiên bên trong một hình vuông có diện tích khoảng phân nửa ảnh (xem hình 4-5). Kết quả trả về của bộ lọc (r,t) này khi áp vào vị trí i, là số lƣợng pixel có texton là t trong hình chữ nhật r. Bộ lọc này có thể đƣợc tính một cách nhanh chóng trên toàn bộ ảnh bằng việc tính trƣớc ảnh integral (integral images). Quá trình này đƣợc minh hoạ trong hình nhƣ
sau: bản đồ texton đƣợc phân chia ra thành K kênh, mỗi kênh sẽ đƣợc tính toán ảnh integral riêng biệt. Gọi là ảnh integral của bản đồ texton T cho texton thứ t, kết
quả của bộ lọc đƣợc tính nhƣ sau:
(3.10) Trong đó, thể hiện các góc phải-dƣới, trái-dƣới, phải-trên và trái-trên của hình chữ nhật r.
31
Hình 3-5. Phân tách bản đồ texton ra thành nhiều kênh. Bản đồ texton gồm K texton đƣợc phân chia ra thành K kênh. Ảnh integral đƣợc xây dựng cho từng kênh cho
phép tính toán bộ lọc vân-bố cục với thời gian hằng số.
Hình 3-6. Tính toán kết quả trả về và nắm bắt thông tin ngữ cảnh [15]
Tronghình trên: (a,b) là ảnh đầu vào và bản đồ texton của nó (các texton đƣợc biểu diễn bằng các màu khác nhau). (c) Bộ lọc vân-vị trí đƣợc định nghĩa gồm một cặp (r,t) và trị trí tƣơng đối với điểm i (hình chữ thập vàng). (d) Một bộ lọc thứ 2, gồm
32
trí khác nhau trên ảnh. Gọi A là diện tích của r1, các kết quả tƣơng ứng là:
, ,
Đối với bộ lọc thứ 2 (hình d) khi texton t tƣơng ứng với “cỏ”, thuật toán khám phá ra rằng tại điểm i (ví dụ nhƣ i4) thuộc về vùng “cừu” sẽ tạo ra giá trị lớn, và do đó có thể nắm bắt thông tin ngữ cảnh: pixel “cừu” đƣợc bao quanh bởi pixel “cỏ”.
Thông tin bố cục cũng có thể đƣợc nắm bắt bằng cách sử dụng loại đặc trƣng này thông qua ví dụ trong hình 4-6.
Hình 3-7. Nắm bắt thông tin bố cục.
Trong hình trên. (a) là bản đồ texton (b) là ảnh gán nhãn đúng. (c) là hai bộ lọc vân- vị trí: (r1,t1) và (r2,t2). (d) thể hiện kết quả trả về của bộ lọc (r1,t1) khi áp vào các vị trí khác nhau trên ảnh. Màu càng sáng thể hiện kết quả càng lớn. (e) Kết quả trả về khi đặt hai bộ lọc tại vị trí đúng nhƣ vị trí của t1, t2 trong ảnh huấn luyện, dẫn đến việc tăng cƣờng lẫn nhau nhƣ thấy trong hình (f). (e’) Thử nghiệm thứ hai với t1 và
33
t2 hoán đổi vị trí cho nhau dẫn đến (f’) hai bộ lọc không tăng cƣờng cho nhau, cho
ra tín hiệu phân loại yếu.