Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
如何在 Caret 中绘制随机森林(护林员)树
我生成了如下所示的随机森林树 并尝试绘制它 但出现错误 我在哪里犯了错误 我怎样才能以正确的方式绘制它 Actmodel lt train Activity Section Author data CB1 method ranger trC
r
RandomForest
rcaret
randomForest 包在删除一个预测类时的奇怪行为
我正在运行一个随机森林模型 它产生的结果从统计角度来看对我来说完全没有意义 因此我确信有些东西mustrandomForest 包的代码出现错误 至少在模型的本次迭代中 预测 左侧变量是具有 3 种可能结果的政党 ID 民主党 独立党 共和
r
machinelearning
Classification
RandomForest
从 SHAP 值中获取特征重要性
我想要获得重要功能的数据框 通过下面的代码 我得到了 shap values 但我不确定这些值的含义是什么 在我的 df 中有 142 个特征和 67 个实验 但得到了一个带有 ca 的数组 2500 个值 explainer shap T
python
RandomForest
featureselection
scikit-learn RandomForestClassifier 中的子样本大小
如何控制用于训练森林中每棵树的子样本的大小 根据 scikit learn 的文档 随机森林是一种适合许多决策的元估计器 数据集的各个子样本上的树分类器并使用 平均以提高预测准确性并控制过度拟合 子样本大小始终与原始输入样本相同 大小 但如
machinelearning
scikitlearn
RandomForest
datascience
R 中使用 randomForest 进行内存高效预测
TL DR我想知道使用基于大型数据集 数百个特征 数十万行 构建的随机森林模型执行批量预测的内存有效方法 Details 我正在处理一个大型数据集 内存中超过 3GB 并且想要使用以下方法进行简单的二进制分类randomForest 由于我
r
parallelprocessing
RandomForest
随机森林修剪
我有 sklearn 随机森林回归器 它非常重 有 1 6 GB 并且在预测值时工作很长时间 我想把它修剪一下 让它变得更轻 据我所知 决策树和森林没有实施修剪 我无法自己实现它 因为树代码是用 C 编写的 而我不知道 有谁知道解决方案吗
python
machinelearning
scikitlearn
RandomForest
Pruning
我的 R 平方分数为负,但使用 k 倍交叉验证的准确度分数约为 92%
对于下面的代码 我的 r 平方分数为负 但使用 k 折交叉验证的准确度分数为 92 这怎么可能 我使用随机森林回归算法来预测一些数据 数据集的链接在下面的链接中给出 https www kaggle com ludobenistant hr
python
machinelearning
scikitlearn
RandomForest
如何在 R 中执行随机森林/交叉验证
我无法找到对我尝试生成的回归随机森林模型执行交叉验证的方法 因此 我有一个数据集 其中包含 1664 个解释变量 不同的化学性质 和一个响应变量 保留时间 我正在尝试生成一个回归随机森林模型 以便能够预测给定保留时间的物质的化学性质 ID
r
RandomForest
crossvalidation
R randomForest - 如何使用“getTree”树进行预测
背景 我可以在 R 中创建一个随机森林 set seed 1 library randomForest data iris model rf lt randomForest Species data iris importance TRUE
r
RandomForest
party
cartanalysis
使用插入符包通过controls = cforest_unbiased()运行cforest
我想使用插入符包运行一个公正的 cforest 这可能吗 tc lt trainControl method cv number f index indexList savePredictions T classProbs TRUE sum
r
RandomForest
rcaret
如何替换 randomForest r 包中的引导步骤
首先是一些背景信息 这在 stats stackexchange 上可能更有趣 在我的数据分析中 我尝试比较不同机器学习方法在时间序列数据上的性能 回归 而不是分类 例如 我训练了一个 Boosting 训练模型 并将其与随机森林训练模型
r
function
Edit
RandomForest
statisticsbootstrap
如何在 Spark Pipeline 中使用随机森林
我想通过网格搜索和 Spark 交叉验证来调整我的模型 在 Spark 中 它必须将基础模型放入管道中 即管道办公室演示 http spark apache org docs latest ml guide html example mod
apachespark
apachesparkmllib
pipeline
RandomForest
apachesparkml
Sklearn 随机森林回归器的错误
当尝试使用 y 数据拟合随机森林回归器模型时 如下所示 0 00000000e 00 1 36094276e 02 4 46608221e 03 8 72660888e 03 1 31375786e 04 1 73580193e 04 2
python
NumPy
machinelearning
scikitlearn
RandomForest
使用python sklearn增量训练随机森林模型
我使用下面的代码来保存随机森林模型 我正在使用 cPickle 保存训练后的模型 当我看到新数据时 我可以增量训练模型吗 目前 训练集大约有2年的数据 有没有办法再训练两年并将其 某种程度上 附加到现有保存的模型中 rf RandomFor
python
pickle
RandomForest
trainingdata
R:tuneRF 函数的行为不明确(randomForest 包)
我对这句话的含义感到不舒服stepFactor的参数tuneRF http www inside r org packages cran randomForest docs tuneRF函数用于调整mtry进一步使用的参数randomFor
r
Optimization
machinelearning
datamining
RandomForest
用于分类的 Python 向量化[重复]
这个问题在这里已经有答案了 我目前正在尝试构建一个包含大约 80 个类别的文本分类模型 文档分类 当我使用随机森林构建和训练模型时 将文本矢量化为 TF IDF 矩阵后 该模型运行良好 然而 当我引入新数据时 我用来构建 RF 的相同单词不
python
scikitlearn
vectorization
RandomForest
为每个因子组添加单独的 vlines 到 ggplot(变量重要性随机森林的点图)
我正在使用 ggplot2 制作随机森林中六个相关变量重要性结果的点图 我的数据 我已经使用 reshape2 将其转换为长格式 如下所示 我的真实数据集有点大 Factor Group Value Gender A 0 000127 Ag
r
ggplot2
RandomForest
有没有办法获取 R 中随机森林树中用于分类的实例?
The getTreeR 中的 randomForest 包中的函数显示随机森林中使用的特定树的结构 这是 iris 数据集的示例 library randomForest data iris rf lt randomForest Spec
r
machinelearning
RandomForest
featureextraction
featureselection
加快随机森林速度的建议
我正在做一些工作randomForest包 虽然效果很好 但可能很耗时 有人对加快速度有什么建议吗 我使用的是带有双核 AMD 芯片的 Windows 7 盒子 我知道 R 不是多线程 处理器 但很好奇是否有任何并行包 rmpi snow
r
RandomForest
R ranger 包中的预测概率
我正在尝试在 R 中建立一个具有随机森林分类的 模型 通过 Ned Horning 编辑代码 我首先使用randomForest包但后来发现ranger 这保证了更快的计算 首先 我使用下面的代码在拟合模型后获得每个类别的预测概率rando
r
RandomForest
rranger
1
2
3
4
»