分桶特征:
将连续型数值划分到不同的桶中(换句话说,将连续型特征离散化
- 举个例子:
将某地人口特征分为以下3个分桶:
经过分桶,人口矢量 [[10001],[5001],[1]] 将变成 [[1],[2],[0]],
(惊奇的发现这些特征值被变换成了桶的索引,而索引是离散特征)
一般来说,这些特征将会被进一步转化为独热编码(以透明方式实现)
版权声明:本文为m0_51370744原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。
将连续型数值划分到不同的桶中(换句话说,将连续型特征离散化