机器学习基础(五十)—— Gini Impurity(基尼不纯度)与香浓熵(Shannon Entropy))

                      
 

基尼不纯度/香浓熵:衡量集合的无序程度;

基尼不纯度

基尼不纯度:将来自集合的某种结果随机应用于某一数据项的预期误差率。

I G (f)= i=1 m f i (1f i )= i=1 m f i  i=1 m f 2 i =1 i=1 m f 2 i  IG(f)=∑i=1mfi(1−fi)=∑i=1mfi−∑i=1mfi2=1−∑i=1mfi2

from collections import Counterimport operatorimport mathdef calcEnt(dataSet):    classCount = Counter(sample[-1] for sample in dataSet)    prob = [float(v)/sum(classCount.values()) for v in classCount.values()]    return reduce(operator.add, map(lambda x: -x*math.log(x, 2), prob))
  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
           

再分享一下我老师大神的人工智能教程吧。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!https://blog.csdn.net/jiangjunshow


版权声明:本文为hftytf原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。