卷积和池化 – 源码巴士

卷积

1.卷积的解释

对于卷积的定义式
$\int_{-\infty}^{\infty} f(s)g(x-s)ds$

我们可以赋予f(x)、g(x)以下含义：

f: 影响幅度与x无关, 对任意位置, 影响幅度仅取决影响位置和被影响位置的间隔

g: 事件影响每个位置发生的事件都会产生自己的影响，大小仅与位置（事件）相关

因而对于定义式，其含义为：对于已知的影响方式（f）和事件影响（g），一次作用后得到的新的数值分布

2.图像的卷积：

图像的卷积不同于上文提到的卷积：

图像的卷积是二维的，因而原数值和影响方式均为二维
图像卷积一般不考虑所有位置产生的影响，仅考虑周围一部分

称卷积核为图像卷积中上文提到的f函数，显然最终图像的大小与卷积核和原图像大小有关
因而我们可以通过在外圈增加0改变卷积后图像的大小，并可以依此分类：

比原图小 -> valid卷积
和原图同 -> same卷积
比原图大 -> full卷积（反卷积）

注：

由于是卷积，故（x - n，y - n）对应卷积核中的（1，1）…
反卷积用途是扩大分辨率，并不意味着对卷积还原（存在多个原数值对应同一卷积结果，因而不可能存在还原方式）
一般情况下，通过一个卷积核可以提取出某个图像的特征，而需要提取多少图像特征，就需要设计多少不同的卷积核
卷积核的大小是自定义的。卷积核越小，计算复杂性越低（但1 * 1的卷积核无法提升感受野）；卷积核为奇数，进行same卷积操作后能保证与原图相同，而偶数不行；于是通常选用3* 3的卷积核，但具体大小如何选择视实验结果优劣决定

池化

池化一般与卷积搭配使用，主要目的是对卷积后得到的特征图进行压缩，进而：

使特征图变小，简化网络计算复杂度
进行特征压缩，提取主要特征

其方式与卷积几乎完全相同（按照一定的池化方式依次同时扫描一定范围的图像，得到该范围对应的结果再组合起来），于是池化可以按照池化方式分为最大池化和平均池化两类
区别就是字面意思，最大池化指取该范围图像值的最大值作为输出，平均池化即取该范围图像的平均值作为输出
但卷积不同位置对应的区域是可重叠的，而池化则二者均可，于是又可按照是否重叠将池化分为一般池化（不可重叠）和重叠池化、空间金字塔池化（？待学）

原文链接：https://blog.csdn.net/Ciel__bleu/article/details/126013696