极简代码(一) —— class label 的统计计数

考虑对 np.array 类型的 label 进行统计计数,以计算当前样本集的信息熵(Shannon Entropy)或者作为其他的计算环节。

cnt = [sum(y == c) for c in set(y)]
                        # y == c:得到布尔类型构成的数组

如果想要把列别信息也加进去,则返回的数据可以是一个二元 tuple:

cnt = [(c, sum(y == c)) for c in set(y)]

当然最为简单的还是直接调用标准库中的 collections 中的 Counter:

cnt = Counter(y)

版权声明:本文为lanchunhui原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。