分类性能评估指标 — 理论篇 — TP、TN、FP、FN,precision、recall、F1、PR曲线,sensitivity、specificity,FPR、TPR、ROC曲线

1. 混淆矩阵:TP,TN,FP,FN

        TP:true positive,实际为正例,预测为正例

        TN:true negative,实际为负例,预测为负例

        FP:false positive,实际为负例,预测为正例

        FN:false negative,实际为正例,预测为负例

2. precision, recall,F1,PR曲线

        precision:精确率、查准率,预测为正例的样本中,实际为正例的样本所占的比例

precision = \frac{TP}{TP + FP}

        recall:召回率、查全率,预测正确的正例样本,占实际正例样本的比例

recall=\frac{TP}{TP + FN}

        F1 是 precision 和 recall 的调和平均数

\frac{1}{F1}=\frac{1}{precision}+\frac{1}{recall}

F1=\frac{2*precision*recall}{precision+recall}

        PR曲线:以Precision为Y轴,Recall为X轴绘制而成

3. sensitivity,specificity

        sensiticity:敏感性(对正例样本的敏感性)

        sensitivity = recall = \frac{TP}{TP+FN}

        specificity:特异度(可以理解为负例样本的敏感性)

specificity=\frac{TN}{TN+FP}

4. FPR,TPR,ROC曲线

        FPR:false positive rate,假正例率;预测误判为正例的负样本数量占实际所有负样本的比例

FPR=\frac{FP}{FP+TN}=1-specificity

        TPR:true positive rate,真正例率;预测正确的正样本数量占实际所有正样本的比例

TPR=\frac{TP}{TP+FN}=sensiticity=recall

        ROC曲线:以TPR为Y轴,FPR为X轴绘制而成;ROC曲线下面积为AUC。

 

 

 

 

 

 


版权声明:本文为Sweety_Lin原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。