人工智能入门-R语言数据分析与数72

rpart参数设置

ßrpart.control对树进行一些设置  

Þxval是10折交叉验证  

Þminsplit是最小分支节点数,这里指大于等于20,那么该节点会继续分划下去,否则停止  

Þminbucket:叶子节点最小样本数  

Þmaxdepth:树的深度  

Þcp全称为complexity parameter,指某个点的复杂度,对每一步拆分,模型的拟合优度必须提高的程度  

 

ßna.action:缺失数据的处理办法,默认为删除因变量缺失的观测而保留自变量缺失的观测。           

ßmethod:树的末端数据类型选择相应的变量分割方法:  

ß连续性method=“anova”,离散型method=“class”,计数型method=“poisson”,生存分析型method=“exp”  

 

ßparms用来设置三个参数:先验概率、损失矩阵、分类纯度的度量方法(gini和information)  

ßcost是损失矩阵,在剪枝的时候,叶子节点的加权误差与父节点的误差进行比较,考虑损失矩阵的时候,从将“减少-误差”调整为“减少-损失” 

 

绘图结果

人工智能入门-R语言数据分析与数72
 

人工智能入门-R语言数据分析与数72


版权声明:本文为weixin_44292902原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。