识别指标TP、FP、FN、TN、TPR、FPR举例理解
举个例子:
假定有10个人,5个男人分别是a1,a2,a3,a4,a5。5个女人:b1,b2,b3,b4,b5。然后对其进行和男人相似度的分类
| 人名 | 是男人的概率 | 真实 |
|---|---|---|
| a1 | 90% | 男人 |
| a2 | 80% | 男人 |
| a3 | 70% | 男人 |
| a4 | 60% | 男人 |
| a5 | 50% | 男人 |
| b1 | 40% | 女人 |
| b2 | 30% | 女人 |
| b3 | 20% | 女人 |
| b4 | 10% | 女人 |
| b5 | 0% | 女人 |
现在按照一个标准(70%)来分类(预测),大于等于70%的为正例(是男人),小于70%的为负例(不是男人)。
| 是男人的概率 | 真实 | 预测 | 分类 | 正负例 |
|---|---|---|---|---|
| a1 | 90% | 男人 | 男人 | >=70% |
| a2 | 80% | 男人 | 男人 | >=70% |
| a3 | 70% | 男人 | 男人 | >=70% |
| a4 | 60% | 男人 | 女人 | <70% |
| a5 | 50% | 男人 | 女人 | <70% |
| b1 | 40% | 女人 | 女人 | <70% |
| b2 | 30% | 女人 | 女人 | <70% |
| b3 | 20% | 女人 | 女人 | <70% |
| b4 | 10% | 女人 | 女人 | <70% |
| b5 | 0% | 女人 | 女人 | <70% |
根据下表:
| 样本 | 预测值 | 真实值 |
|---|---|---|
| 真正例(True Positive,TP) | 1 | 1 |
| 假正例(False Positive,FP) | 1 | 0 |
| 真负例(True Negative,TN) | 0 | 0 |
| 假负例(False Negative,FN) | 0 | 1 |
| 指标名称 | 指标别名 | 公式 | 注释 |
|---|---|---|---|
| TPR (True Positive Rate) | 真正例率,召回率,灵敏性 | T P R = T P T P + F N TPR = \frac{TP}{TP+FN}TPR=TP+FNTP | 在所有实际为阳性的样本中,被正确地判断为阳性之比率 |
| FPR (True Positive Rate) | 假正例率 | F P R = F P F P + T N FPR = \frac{FP}{FP+TN}FPR=FP+TNFP | 在所有实际为阴性的样本中,被错误地判断为阳性之比率。 |
| Precision | 准确率 | P r e c i s i o n = T P T P + F P Precision = \frac{TP}{TP+FP}Precision=TP+FPTP | 预测为正样本中,预测正确的比例 |
| F1 | f1值 | F 1 = 2 × P r e c i s i o n × T P R P r e c i s i o n + T P R F1 = \frac{2\times Precision\times TPR }{Precision+TPR }F1=Precision+TPR2×Precision×TPR | 用来衡量precision和recall的值,它是这个两个值的调和均值,f1值越大,证明阈值越好。 |
根据上表计算得到:
TPR=60%
FPR=0%
Precision=100%
f1 = 0.75
版权声明:本文为weixin_44493841原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。