考虑对 np.array 类型的 label 进行统计计数,以计算当前样本集的信息熵(Shannon Entropy)或者作为其他的计算环节。
cnt = [sum(y == c) for c in set(y)]
# y == c:得到布尔类型构成的数组如果想要把列别信息也加进去,则返回的数据可以是一个二元 tuple:
cnt = [(c, sum(y == c)) for c in set(y)]当然最为简单的还是直接调用标准库中的 collections 中的 Counter:
cnt = Counter(y)版权声明:本文为lanchunhui原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。