深度学习中Map的概念

mAP定义及相关概念

precision，即准确率。

解释：10张图片，每张都有狗、猫，识别到里面有狗也有猫，两者皆有，准确率就高

recall，即召回率。

解释：10张图片，每张都有狗、猫，识别到有狗，召回率就高

mAP: mean Average Precision, 即各类别AP的平均值
AP: PR曲线下面积，后文会详细讲解
PR曲线: Precision-Recall曲线
Precision: TP / (TP + FP)
Recall: TP / (TP + FN)
TP: IoU>0.5的检测框数量（同一Ground Truth只计算一次）
FP: IoU<=0.5的检测框，或者是检测到同一个GT的多余检测框的数量
FN: 没有检测到的GT的数量

图中的曲线C就是一条P-R曲线，P表示纵轴的查准率precision，R表示横轴的召回率或称为查全率recall。P-R曲线下的面积可以用于评估该曲线对应的模型的能力，也就是说比较2个目标检测模型哪个更好，可以用P-R曲线面积来比较，面积越大模型越好。然而可能是因为这个面积并不好计算，所以定义了公式(1)来计算出一个叫AP的东西，反正这个东西也能体现出precision和recall对模型能力的综合影响。

从公式(2)可以知晓，Pinterpo(r)表示所有大于指定召回率r的召回率rhat所对应的的p的最大值。大于某个r的rhat有很多，我们要找到这些rhat中所对应的p是最大的那个，然后返回这个p。公式(1)中规定了r会从0-1.0以0.1为步长取11个值，然后将这11个r对应的11个p累加求算术平均值就得到了AP。所以我们要先得到一组rhat和p，这需要我们先了解recall和precision是如何计算的。

我们先来看看P(precision)和R(recall)的计算公式：
precision = TP / (TP+FP)
recall = TP / (TP+FN)

TP是检测对了的正样本，FP是检测错了的正样本，FN是漏检的正样本。

对于目标检测模型一般最后都会输出一个置信度（如果样本图片中有不止一个目标，本例中只选择猫类别的置信度即可），所以可以设置一个置信度阈值，比如0.6，那么高于0.6的就认为该样本被检测为了正样本(即检测为猫)，这样我们会得到0.6阈值下的一组正样本。

然后在这组正样本的基础上，设定一个IoU的阈值，其值为0.5（意思是检测为猫的目标的预测边界框和真实边界框的交并比要大于0.5），大于该阈值的认为是TP，其它的认为是FP。然后用测试样本中真实的正样本数量减去TP，就得到了FN。

这样，在置信度阈值为0.6的情况下，我们就得到了一对P(precision)和R(recall)，接着我们取不同的置信度阈值，得到更多的P-R对,然后根据公式(2)找到所有大于指定召回率r的召回率rhat所对应的的p的最大值(采用这种方法是为了保证P-R曲线是单调递减的，避免摇摆)，作为当前指定召回率r条件下的最大查准率p，然后根据公式(1)计算出AP。这个AP就是猫这个类别的AP，接着我们可以计算其它类别的AP，然后对这些AP求算术平均值，就得到了mAP。

了解了mAP之后，我们就容易理解为什么目标检测模型的度量指标不能像图像分类模型那样直接计算一遍precision和recall，因为目标检测任务中会包含多个类别的目标，并且除了给目标分类，还要预测目标的边界框，所以要加入IoU的概念，并考虑多个类别，而mAP就是在考虑了IoU和多类别之后计算出的度量指标。

原文链接：https://blog.csdn.net/qq_43061705/article/details/103188443