写在开头:
我是一个学R的小白,因为读研老师要求开始接触R。
记一记笔记留给自己以后回顾,顺便分享出来嘻嘻。
我把需要深入的的函数进行介绍~方便了解这些函数的用法,一些简单的函数我就不放出来啦
决策树这部分的笔记主要是利用分类回归法哈
rpart()函数
用于建立分类回归树,使用前library(rpart)。
格式
rpart(输出变量~输出变量,data=,method=,parms=list(split=异质性测度指标),control)
参数含义
method——用于指定方法。可取值:”class”表示建立分类树;”poisson”和”anova”分别表示输出变量为计数变量和其他数值型变量
parms——用于指定分类树异质性测度指标。可取值:”gini”表示采用Gini系数;”information”表示采用信息熵
control——用于设定预修剪参数、后修剪中的复杂度参数CP值
rpart.control()函数
用于自行设置预修剪等参数,使用前library(rpart)。
格式
rpart.control(minsplit=20,maxcompete=4,xval=10,maxdepth=30,cp=0.0.1)
参数含义
minsplit——用于指定节点的最小样本量,默认为20.当节点样本量小于指定值时将不再继续分组。
maxcompete——制定按变量重要性