2.3 Lý thuyết tích chập và mạng tích chập (CNN)
2.3.1 Tích chập
Tích chập là phép tốn tuyến tính giữa ảnh I kích thước bất kì và kernel K ∈ Rm×n
được tính theo cơng thức sau :
I(x, y)∗K(x, y) = m/2 X u=−m/2 n/2 X v=−n/2 K(u, v)I(x−u, y−v) (2.13) Trong phép tính tích chập gồm có 2 tham số chính:
1. Bộ lọc (kernel) là các ma trận số dùng để lọc ảnh (hay trích xuất thơng tin trong ảnh). Bộ lọc có nhiều hình dạng nhưng phổ biến nhất là hình vng các cỡ3×3
hay 5×5.
2. Điểm neo (anchor point) của kernel thường được chọn là tâm của kernel. Giá trị mỗi phần tử trên kernel được xem như là hệ số tổ hợp với lần lượt từng giá trị độ xám của điểm ảnh trong vùng tương ứng với kernel.
Theo hướng thực nghiệm phép tính tích chập giữa một ảnh I và một kernel K là quét K trên từng điểm ảnh của I, tại mỗi điểm ảnh trên I thực hiện phép tích chập chập giữa K với ma trận tương ứng do K chiếu xuống điểm ảnh đó sao cho tâm của K trùng với điểm ảnh đang xét. Với các điểm ảnh ở biên để thực hiện tính tốn, ảnh gốc thường được mở rộng biên với số lượng cột và hàng của đường biên được mở rộng là tùy chọn nhưng thường phụ thuộc vào kiểu kernel sao cho khi trượt trên ảnh đã mở rộng khơng bị thiếu vùng để tính tốn. Các giá trị của đường biên thường được chọn bằng 0 hoặc những giá trị điểm ảnh gần đó. Trong luận văn giá trị đường biên được chọn bằng 0.
Ví dụ: phép tính tính chập giữa 1 ảnh xám I với kernel K.