1、样本标注时多数正样本被错误的标注为负样本,这样模型学到正例的能力变弱,这样正样本预测为负样本的同时,负样本的精度也会减少。
方法一:对错误的标注样本进行修正,观察结果,看是否有改变。
2、一般情况下,正负样本比列小于1:100(看到有的人说1:1000一下,数值还不太确定)都不算不平衡。
3、方法二:增加数据量,认为可能是数据量不够,学不上来,效果不够;特征找的不够,则会那个负样本区分力度不大,网络太浅,学不到特征。
总结
正负样本的数量不均衡!
版权声明:本文为wzk4869原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。