使用公式接口时出现问题的随机森林训练运行时

2024-03-08

运行随机森林示例http://www.kaggle.com/c/icdar2013-gender-prediction-from-handwriting/data http://www.kaggle.com/c/icdar2013-gender-prediction-from-handwriting/data,以下行:

forest_model <- randomForest(as.factor(male) ~ ., data=train, ntree=10000)

需要几个小时(不确定它是否会结束,但该过程似乎确实有效)。

该数据集有 1128 行和约 7000 个变量。

是否可以估计随机森林训练何时完成?我可以通过某种方式分析 R 来获取更多信息吗?


发现问题,在randomForest中使用公式造成了巨大的性能下降。

有关此内容以及如何估计随机森林运行时间的更多信息,请参阅:https://stats.stackexchange.com/questions/37370/random-forest-computing-time-in-r https://stats.stackexchange.com/questions/37370/random-forest-computing-time-in-r and in http://www.gregorypark.org/?p=286 http://www.gregorypark.org/?p=286

这是最终代码:

forest_model <- randomForest(y=train$male, x=train[,-2], ntree=10000,do.trace=T)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用公式接口时出现问题的随机森林训练运行时 的相关文章

随机推荐