[31].
Trong lớp mạng tích chập, có ba tham số (tham số không được cập nhật khi huấn luyện) kiểm soát kích thước của khối nơ-ron đầu ra lần lượt là: độ sâu (depth), bước nhảy (stride) và giá trị đệm (zero-padding):
- Độ sâu (depth): Giá trị này chỉ định chiều sâu của khối nơ-ron đầu ra và nó cũng chính bằng số bộ lọc được sử dụng trong lớp mạng hiện tại. Mỗi bộ lọc này sẽ tìm kiếm những đặc trưng khác nhau của ảnh đầu vào. Ví dụ các bộ lọc ở lớp mạng tích chập đầu tiên (lớp nhận đầu vào là ảnh ban đầu), các bộ lọc sẽ sẽ được học để làm nổi lên các vùng cạnh, các đốm màu,...trên ảnh.
- Bước nhảy (stride): Bước nhảy là khoảng cách dịch các bộ lọc khi di chuyển bộ lọc theo chiều rộng và chiều dài của khối đầu vào. Ví dụ khi bước nhảy bằng 1, ở mỗi lần dịch chuyển, bộ lọc sẽ được di chuyển sang 1 pixel theo chiều rộng, khi bộ lọc dịch đến hết chiều rộng nó sẽ được đưa quay lại vị trí ban đầu với chiều dài được dịch xuống 1 pixel, cứ tiếp tục như thế cho đến khi đi hết mặt chiều rộng và chiều dài của ảnh.
- Giá trị đệm (zero-padding): Có những lớp mạng tích chập sẽ thêm các giá trị 0 vào viền của khối nơ-ron đầu vào (hình 2.6). Giá trị đệm này sẽ quy định số đường viền các pixel 0 được thêm vào. Như chúng ta sẽ thấy ở dưới đây thì giá trị đệm sẽ giúp kiểm soát kích thước dài, rộng của khối đầu ra (ví dụ như đảm bảo kích thước khối đầu vào bằng kích thước khối đầu ra).