准确率accuracy、精确率precision、召回率recall、f1_score

一、准确率

准确率(accuracy):对于给定的测试数据集,分类器正确分类的样本数与总样本数之比。
由准确率,我们的确可以在一些场合,从某种意义上得到一个分类器是否有效,但它并不总是能有效的评价一个分类器的工作。举个例子,google抓取 了argcv 100个页面,而它索引中共有10,000,000个页面,随机抽一个页面,分类下,这是不是argcv的页面呢?如果以accuracy来判断我的工 作,那我会把所有的页面都判断为"不是argcv的页面",因为我这样效率非常(return false,一句话),而accuracy已经到了99.999(9,999,900/10,000,000),完爆其它很多分类器辛辛苦苦算的值,而我这个算法显然不是需求期待的,那怎么解决呢?这就是precision,recall和f1-measure出场的时间了.

二、精确率、召回率、f1

  • TP ——将正类预测为正类数(True Positive)

  • FN ——将正类预测为负类数(False Negative)

  • FP ——-将负类预测为正类

  • TN ——-将负类预测为负类数

真实为正真实为负
预测为正TPFP
预测为负TNFN

准确率=T P ÷ ( T P + F P + T N + F N ) TP\div(TP+FP+TN+FN)TP÷(TP+FP+TN+FN)

精确率p=T P ÷ ( T P + F P ) TP\div(TP+FP)TP÷(TP+FP)
误报率

召回率 r= T P ÷ ( T P + F N ) TP\div(TP+FN)TP÷(TP+FN)

多点误报召回率高

召回率是精确率和召回率的调和均值

精确率和召回率都高时,F1值也会高。
2/f1 = 1/p+1/r


版权声明:本文为happy_wealthy原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。