我试图了解 rpart 在我试图完成的项目中如何工作。我对 R 比较陌生,但我有很多使用 SAS 构建各种分析模型的经验。
首先我运行了这段代码
mtree1 <- rpart(X17~., data = mydata, method="class", control = rpart.control(minsplit = 20, minbucket = 7, maxdepth = 10, usesurrogate = 2, xval =10 ))
我得到一棵树,X12 作为顶部分割,X10 是左侧的下一个分割,X69 是右侧的分割,然后是该分支上的 X68 和 X70。
接下来我运行了以下片段
mtree1 <- rpart(X17~ X12+X10+X69+X68+X70, data = mydata, method="class", control = rpart.control(minsplit = 20, minbucket = 7, maxdepth = 10, usesurrogate = 2, xval =10 ))
我得到一模一样的树
最后我跑了这个
mtree1 <- rpart(X17~ X12+X69+X68+X70, data = mydata, method="class", control = rpart.control(minsplit = 20, minbucket = 7, maxdepth = 10, usesurrogate = 2, xval =10 ))
现在我根本没有分裂。 (顺便说一句,我的数据集有 234144 个观察值和 90 个自变量,其中 210205 个商品和 23839 个坏商品。)
这是代码和输出的图像
这是什么原因呢?我将不胜感激任何帮助。谢谢。
KK