sklearn决策树相同数据集及模型参数为什么生成的模型不一样?

每次决策树分叉时,所有的特征都是随机排序的,随机种子就是random_state如果你的max_features小于你总特征数n_features,那么每个分叉必须采样,随机性很大。即使你的max_features = n_features,表现相同的分叉还是会选第一个,所以依然有随机性,sklearn的算法大多有random_state,如果需要复盘或是需要模型稳定不变必须设置。


版权声明:本文为happy_wealthy原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。