卷积
1.卷积的解释
对于卷积的定义式
( f ∗ g ) ( x ) = ∫ − ∞ ∞ f ( s ) g ( x − s ) d s (f * g )(x) = \int_{-\infty}^{\infty} f(s)g(x-s)ds(f∗g)(x)=∫−∞∞f(s)g(x−s)ds
我们可以赋予f(x)、g(x)以下含义:
f: 影响幅度 与x无关, 对任意位置, 影响幅度仅取决影响位置和被影响位置的间隔
g: 事件影响 每个位置发生的事件都会产生自己的影响,大小仅与位置(事件)相关
因而对于定义式,其含义为:对于已知的影响方式(f)和事件影响(g),一次作用后得到的新的数值分布
2.图像的卷积:
图像的卷积不同于上文提到的卷积:
- 图像的卷积是二维的,因而原数值和影响方式均为二维
- 图像卷积一般不考虑所有位置产生的影响,仅考虑周围一部分
称卷积核为图像卷积中上文提到的f函数,显然最终图像的大小与卷积核和原图像大小有关
因而我们可以通过在外圈增加0改变卷积后图像的大小,并可以依此分类:
- 比原图小 -> valid卷积
- 和原图同 -> same卷积
- 比原图大 -> full卷积(反卷积)
注:
- 由于是卷积,故(x - n,y - n)对应卷积核中的(1,1)…
- 反卷积用途是扩大分辨率,并不意味着对卷积还原(存在多个原数值对应同一卷积结果,因而不可能存在还原方式)
- 一般情况下,通过一个卷积核可以提取出某个图像的特征,而需要提取多少图像特征,就需要设计多少不同的卷积核
- 卷积核的大小是自定义的。卷积核越小,计算复杂性越低(但1 * 1的卷积核无法提升感受野);卷积核为奇数,进行same卷积操作后能保证与原图相同,而偶数不行;于是通常选用3* 3的卷积核,但具体大小如何选择视实验结果优劣决定
池化
池化一般与卷积搭配使用,主要目的是对卷积后得到的特征图进行压缩,进而:
- 使特征图变小,简化网络计算复杂度
- 进行特征压缩,提取主要特征
其方式与卷积几乎完全相同(按照一定的池化方式依次同时扫描一定范围的图像,得到该范围对应的结果再组合起来),于是池化可以按照池化方式分为最大池化和平均池化两类
区别就是字面意思,最大池化指取该范围图像值的最大值作为输出,平均池化即取该范围图像的平均值作为输出
但卷积不同位置对应的区域是可重叠的,而池化则二者均可,于是又可按照是否重叠将池化分为一般池化(不可重叠)和重叠池化、空间金字塔池化(?待学)
版权声明:本文为Ciel__bleu原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。