运行随机森林示例http://www.kaggle.com/c/icdar2013-gender-prediction-from-handwriting/data http://www.kaggle.com/c/icdar2013-gender-prediction-from-handwriting/data,以下行:
forest_model <- randomForest(as.factor(male) ~ ., data=train, ntree=10000)
需要几个小时(不确定它是否会结束,但该过程似乎确实有效)。
该数据集有 1128 行和约 7000 个变量。
是否可以估计随机森林训练何时完成?我可以通过某种方式分析 R 来获取更多信息吗?
发现问题,在randomForest中使用公式造成了巨大的性能下降。
有关此内容以及如何估计随机森林运行时间的更多信息,请参阅:https://stats.stackexchange.com/questions/37370/random-forest-computing-time-in-r https://stats.stackexchange.com/questions/37370/random-forest-computing-time-in-r and in http://www.gregorypark.org/?p=286 http://www.gregorypark.org/?p=286
这是最终代码:
forest_model <- randomForest(y=train$male, x=train[,-2], ntree=10000,do.trace=T)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)