Mục đích của mục này là nhằm giới thiệu một kỹ thuật biểu diễn hình ảnh mới mang tên ảnh tích phân. Kỹ thuật này cho phép tính toán nhanh chóng giá trị của những mọi chi tiết Haar bất kỳ trong ảnh.
Giá trị của ảnh tích phân tại vị trí (x, y) là tổng giá trị của tất cả những điểm ảnh ở trên và về phía trái điểm đó, bao gồm cả điểm đó.
Xây dựng ảnh tích phân từ ảnh đầu vào
Giả sử có ảnh đầu vào với là giá trị của điểm ảnh trong ảnh ban đầu.
Gọi là ảnh tích phân của ảnh i ban đầu và là giá trị của ảnh tích phân tại điểm .
Khi đó, ảnh tích phân có thể được định nghĩa theo công thức sau:
Một kỹ thuật khác để xây dựng ảnh tích phân từ ảnh ban đầu là sử dụng cặp hồi quy:
Trong đó là tổng tích lũy hàng, và .
Với cách này, ảnh tích phân có thể được tính toán chỉ với một lần quét duy nhất trên ảnh ban đầu.
Ưu điểm của kỹ thuật biểu diễn bằng ảnh tích phân
Ảnh tích phân cho phép tính toán tổng giá trị của bất kỳ vùng ảnh hình chữ nhật nào trong ảnh ban đầu chỉ với giá trị của 4 điểm trong ảnh tích phân.
Trong hình trên, giá trị của ảnh tích phân tại điểm 1 chính là tổng giá trị của tất cả những điểm ảnh trong hình chữ nhật A. Giá trị tại điểm 2 là A+B, giá trị tại điểm 3 là A+C, và ở điểm 4 là A+B+C+D. Từ đó suy ra tổng giá trị của tất cả các điểm ảnh trong hình chữ nhật D chính bằng .
Việc tính giá trị chênh lệch giữa hai vùng ảnh chữ nhật bất kỳ chỉ phải thông qua giá trị của 8 điểm ảnh trong ảnh tích phân. Nhờ đó, việc tính toán giá trị của các chi tiết Haar đều được thực hiện rất nhanh chỉ với một số ít các phép tính cộng trừ trên một vài giá trị mảng trong ảnh tích phân.
Giá trị của một chi tiết Haar với 2 hình chữ nhật chỉ phải tính toán với 6 giá trị mảng do hai hình chữ nhật kề nhau. Chi tiết với 3 hình chữ nhật cần 8 giá trị, và chi tiết với 4 hình chữ nhật cần 9.
Kỹ thuật biểu diễn ảnh tích phân còn ảnh hưởng tới cách thức mà phương pháp thực hiện việc quét ảnh. Trong hầu hết những phương pháp thông thường khác, bài toán phát hiện khuôn mặt đa kích thước được giải quyết bằng cách tạo ra một tập ảnh theo mô hình kim tự tháp từ ảnh ban đầu và tiến hành quét trên từng ảnh đó bằng một cửa sổ có kích thước cố định. Với việc sử dụng ảnh tích phân, ta chỉ phải thay đổi kích thước cửa sổ quét. Việc bỏ qua thao tác thay đổi kích thước ảnh ban đầu cho phép tiết kiệm được rất nhiều thời gian, đồng thời cũng có thể được cài đặt dễ dàng hơn.
Việc sử dụng ảnh tích phân cho phép tính toán các chi tiết Haar ở mọi vị trí và kích thước chỉ với một vài phép tính cộng/trừ. Những chi tiết Haar đơn lẻ không có khả năng phân lớp tốt những ảnh mặt hay không-phải-là-mặt, do đó mục tiếp theo sẽ xem xét cách thức để lựa chọn những chi tiết tốt nhất và kết hợp những chi tiết này như thế nào để thu được bộ phân lớp mạnh cuối cùng.