评价指标-回归/分类/推荐

回归常用的指标

1)均方误差MSE:是反映估计值与被估计量之间差异程度的一种度量。
在这里插入图片描述

2)RMSE均方根误差:观测值与真值偏差的平方和与观测次数m比值的平方根,用来衡量观测值同真值之间的偏差。
在这里插入图片描述

3)SSE和方误差
在这里插入图片描述

4)MAE:直接计算模型输出与真实值之间的平均绝对误差
在这里插入图片描述

5)MAPE:不仅考虑预测值与真实值误差,还考虑了误差与真实值之间的比例。
在这里插入图片描述
6)平均平方百分比误差
在这里插入图片描述

7)决定系数在这里插入图片描述

分类常用的性能度量指标

精确率、召回率、F1、TPR、FPR、AUC、ROC曲线、混淆矩阵

在这里插入图片描述
预测为真真实为真TP(true positive)
预测为假真实为真FN(false negative)
预测为真真实为假FP(false positive)
预测为假真实为假TN(true negative)

精确率」查准率 Precision=TP/(TP+FP)
召回率」查全率Recall=TP/(TP+FN)
真正例率」即为正例被判断为正例的概率TPR=TP/(TP+FN)
假正例率」即为反例被判断为正例的概率FPR=FP/(TN+FP)
F1 :
在这里插入图片描述
错误率
在这里插入图片描述
准确率:ACC = 1-e

AUC与ROC曲线
对于0、1分类问题,一些分类器得到的结果并不是0或1,如神经网络得到的是0.5、0.6等,此时就需要一个阈值cutoff,那么小于阈值的归为0,大于的归为1,可以得到一个分类结果。

ROC曲线(Receiver Operational Characteristic Curve)是以False Positive
Rate为横坐标,True Postive Rate为纵坐标绘制的曲线。

曲线的点表示了在敏感度和特殊性之间的平衡,例如越往左,也就是假阳性越小,则真阳性也越小。曲线下面的面积越大,则表示该方法越有利于区分两种类别。

AUC即为ROC曲线所覆盖的区域面积。
ROC曲线的主要意义是方便观察阈值对学习器的泛化性能影响,所以有助于选择最佳的阈值。ROC曲线越靠近左上角,模型的查全率就越高。最靠近左上角的ROC曲线上的点是分类错误最少的最好阈值,其假正例和假反例总数最少。
在这里插入图片描述
混淆矩阵在这里插入图片描述

多分类指标
kappa系数


版权声明:本文为weixin_36378508原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。