[AI Algorithm] 评判预测性能的四个指标

基本指标

评价模型的常用方法——精确率、召回率、F1 值、ROC、AUC 各自的优缺点是什么?
假如数据可以被分为好数据(1)和坏数据(0),那么根据实际情况和评价结果的不同,总共能将结果分为四种情况:
True Positive(TP):实际为好数据,判定结果为好数据
False Positive(FP):实际为坏数据,判定结果为好数据
True Negative(TN):实际为坏数据,判定结果为坏数据
False Negative(FN):实际为好数据,判定结果为坏数据

注意,TP,FP,TN,FN的选定取决于0和1的情况,而不是数据本身的好坏。0和1的选定要看你自己想得到好数据还是坏数据。这里就认为好数据为1。

精确率(Precision)

在所有预测为好数据的结果中间,实际确实为好数据的占比(预测正确)。
P r e c i s i o n = T P T P + F P Precision=\frac{TP}{TP+FP}Precision=TP+FPTP

召回率(Recall)

在所有实际为好数据的数据中间,被预测为好数据的占比。
R e c a l l = T P T P + F N Recall=\frac{TP}{TP+FN}Recall=TP+FNTP

准确率(Accuracy)

在所有数据中间,被预测正确的占比。
A c c u r a c y = T P + T N T P + T N + F P + F N Accuracy=\frac{TP+TN}{TP+TN+FP+FN}Accuracy=TP+TN+FP+FNTP+TN

ROC曲线

首先需要介绍曲线的x轴和y轴:
X轴——True Positive Rate (TPR)
T P R = T P T P + F N TPR=\frac{TP}{TP+FN}TPR=TP+FNTP
Y轴——False Positive Rate(FPR)
F P R = F P F P + T N FPR=\frac{FP}{FP+TN}FPR=FP+TNFP
绘制曲线就是在坐标系中描上一系列(TPR,FPR)的点,然后连成一条曲线即可。


版权声明:本文为qq_37398834原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。