Grad-CAM论文解读

Grad-CAM: Visual Explanations from Deep Networks
via Gradient-based Localization
论文地址：https://ieeexplore.ieee.org/document/8237336
代码：keras vgg16_Grad_cam.
pytorch vgg16 vgg16_Grad_cam
resnet resnet_Grad_cam

主要内容

Grad-CAM论文解读
前言
一、与CAM的区别
二、Grad-CAM
总结

前言

我们提出了一个新技术用来生成卷积神经网络可解释性的图片，使得CNN变得更加透明，Grad-CAM利用其中某一类的得分进行反向传播，传到最后一个卷积层，可以得粗糙的定位图片。

一、与CAM的区别

CAM需要对分类网络进行二次训练，其主要思想是在训练好的分类网络的基础上，将后面的全连接层替换成GAP（global average pool）,保持GAP前面层不变的情况下再训练的GAP的权重，然后利用反向传播计算出CAM图。
Grad-CAM的方法不需要对网络结构修改后再继续训练，只要训练一次，就可以利用Grad-CAM算法得到对应输入图像的类激活图。

二、Grad-CAM

1.Grad-CAM计算公式

计算类c的得分yc关于最后一个卷积块的第k个特征图所有像素的梯度的平均值，作为第k个特征图是c类的权重在这里插入图片描述
CAM中是将得到第k个特侦图是c类的权重与对应的第k个特征图相乘求和，Grad-CAM有个小小的区别在于将权重和特征图进行加权求和之后，只取了结果大于0的那些像素值，因为作者认为只有结果大于0的那些像素才是对神经网络判别为c类有促进作用的特征图。反之，小于0的则是有消极作用。所以，作者在加权求和之后又加了一个ReLU函数这样就可以得到对分类结果有正影响的CAM结果图了。
在这里插入图片描述

2.Grad-CAM与CAM的相互推导

作者认为：Grad-CAM是可以推导出CAM的，反过来说CAM是Grad-CAM的一个特例。

对于CAM,最终的分类结果yc有：
在这里插入图片描述
其中wck是第二次训练后得到的权重，Akij表示最后一个卷积块的第k个特征图在（i，j）位置处的像素值。令Fk表示第k个特征图的全局平均值：

那么yc可以简化为：
等式两边同时对Fk求导数，则wck等于yc关于Fk的偏导数，等于分子分母同时对Aijk求偏导：