如何在 R 中执行随机森林/交叉验证

2024-05-08

我无法找到对我尝试生成的回归随机森林模型执行交叉验证的方法。

因此，我有一个数据集，其中包含 1664 个解释变量（不同的化学性质）和一个响应变量（保留时间）。我正在尝试生成一个回归随机森林模型，以便能够预测给定保留时间的物质的化学性质。

ID  RT (seconds)    1_MW    2_AMW   3_Sv    4_Se
4281    38  145.29  5.01    14.76   28.37
4952    40  132.19  6.29    11  21.28
4823    41  176.21  7.34    12.9    24.92
3840    41  174.24  6.7 13.99   26.48
3665    42  240.34  9.24    15.2    27.08
3591    42  161.23  6.2 13.71   26.27
3659    42  146.22  6.09    12.6    24.16

这是我拥有的表格的示例。我基本上想根据 1_MW 等（最多 1664 个变量）绘制 RT，这样我就可以找到这些变量中哪些重要，哪些不重要。

I do:-

r = randomForest(RT..seconds.~., data = cadets, importance =TRUE, do.trace = 100)
varImpPlot(r)

它告诉我哪些变量重要，哪些变量不重要，这很棒。但是，我希望能够对数据集进行分区，以便可以对其执行交叉验证。我找到了一个在线教程，解释了如何做到这一点，但针对的是分类模型而不是回归模型。

我知道你这样做：-

k = 10
n = floor(nrow(cadets)/k)
i = 1
s1 = ((i-1) * n+1)
s2 = (i * n)
subset = s1:s2

定义要进行的交叉折叠次数以及每次折叠的大小，并设置子集的起始值和结束值。但是，我不知道之后要做什么。有人告诉我要循环，但老实说我不知道该怎么做。我也不知道如何将验证集和测试集绘制到同一个图表上以描述准确性/错误水平。

如果您能帮我解决这个问题，我将不胜感激，谢谢！

来自source http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm#ooberr:

袋外 (oob) 误差估计

在随机森林中，不需要交叉验证或单独的测试集以获得测试集误差的无偏估计。这是在运行期间内部估计...

尤其，predict.randomForest返回袋外预测，如果newdata没有给出。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

RandomForest

crossvalidation

如何在 R 中执行随机森林/交叉验证的相关文章

融化R中的下半矩阵

如何融化下半三角形加对角矩阵 11 NA NA NA NA 12 22 NA NA NA 13 23 33 NA NA 14 24 34 44 NA 15 25 35 45 55 A lt t matrix c 11 NA NA NA NA
如何在ubuntu的conda环境中更改Rstudio中的R版本

我在基本系统中安装了 R 4 3 和 Rstudio 在 conda 环境中安装了旧版本的 R 4 2 3 命令which R返回环境中安装的 R 的目录 home 用户 miniconda3 envs anndata2ri pip bin
从日期变量创建月末日期

我有一个包含日期变量的大型数据框它反映了该月的第一天有没有一种简单的方法来创建代表该月最后一天的新数据框日期变量以下是一些示例数据 date start month seq as Date 2012 01 01 length 4 by
如何添加链接以从我的 R闪亮应用程序在新窗口中打开 pdf 文件？

我可以使用 a 从我的 Shiny 应用程序添加到外部站点的超链接 a google href http www google com 但如何创建一个链接来打开 pdf 或类似文件看起来应该很简单但我找不到任何例子我的问题与此类似
如何在 Caret 中绘制随机森林（护林员）树

我生成了如下所示的随机森林树并尝试绘制它但出现错误我在哪里犯了错误我怎样才能以正确的方式绘制它 Actmodel lt train Activity Section Author data CB1 method ranger trC
如何在 R 中合并同名列表中的数据框？

我有一个包含很多数据框的列表如果它们具有相同的名称我想合并它们即合并所有具有相同名称 a 和 b 的数据框像这样 a lt aaaaa b lt bbbbb c lt ccccc g lt list df1 lt data fram
R中的字典数据结构

在 R 中我有例如 gt foo lt list a 1 b 2 c 3 如果我输入foo I get a 1 1 b 1 2 c 1 3 我怎样才能看透foo仅获取键列表在这种情况下 a b c R 列表可以具有命名元素因此可
尝试使用 JRI 将 R 与我的 Java 应用程序集成，但出现错误。谁能解释一下原因和解决办法吗？

我需要将 Java 与 R 集成来运行一些数学命令并使用 R 的功能进行绘图以下部分代码给出了错误 public static void main String args HelloRWorld r new HelloRWorld r h
R - 计算 bin 中特定值的数量

我有一个如下所示的数据框 df Value lt c 1 1 0 2 1 3 4 0 0 1 2 0 3 0 4 5 2 3 0 6 Sl lt c 1 20 df lt data frame Sl Value gt df Sl Value
警告消息 - 来自 dummies 包的 dummy

我正在使用 dummies 包为分类变量生成虚拟变量其中一些变量具有两个以上类别 testdf lt data frame A as factor c 1 2 2 3 3 1 B c A B A B C C C c D D E D D E
如何在 data.table 中分组后使用条件计算行数

我有以下数据框 dat lt read csv s1 s2 v1 v2 a b 10 20 a b 22 NA a b 13 33 c d 3 NA c d 4 5 NA c d 10 20 dat gt A tibble 6 x 4 gt
如何按时间间隔匹配数据帧？

这是我从数据记录器导入原始数据时经常出现的问题温度记录仪设置为每十分钟记录一次温度单独的气体记录仪设置为记录最后十分钟间隔内使用的气体我想将这两个记录器的数据合并到一个数据框中进行绘图和分析但时间并不完全一致我希望每十分钟的时间段
R - 重塑 - 熔化错误

我正在尝试融化数据框但出现了这个奇怪的错误有什么想法吗 str zx7 data frame 519 obs of 5 variables calday new Date format 2011 01 03 2011 01 04 201
从 data.frame 在 ggplot 图例中添加信息

我想在图例中添加信息哪个传感器具有该值这是我的代码 z lt data frame a c sensor 1 sensor 2 sensor 3 sensor 4 sensor 5 sensor 6 sensor 7 sensor 8
如何声明包含 M 个元素的列表对象

我想声明一个包含 M 3 x 3 矩阵的列表如果我事先知道数字 M 那么我可以通过以下方式声明这样的列表 elm lt matrix NA 3 3 Say M 7 myList lt list elm elm elm elm elm el
在 Shiny 中显示反应式 htmlTable 表格

我正在制作我的第一个 Shiny 应用程序但找不到任何有关如何显示使用 htmlTable 包创建的表格的示例我基本上想在按下按钮时创建一个表格并显示它 Shiny 显示 html 代码而不是表格我不知道用什么替换服务器部分中的 re
在ggplot中设置y轴中断

我在代码中设置中断时遇到困难我尝试添加breaks seq 0 100 by 20 但似乎无法让它正常工作本质上我希望 Y 轴从 0 到 100 每 20 个刻度一次 YearlyCI lt read table header T te
R中IF函数的使用

我正在短跑ifR 中的函数但收到以下警告消息 In if runif 50 0 1 lt 0 69 the condition has length gt 1 and only the first element will be used
如何根据 ggplot2 中的汇总数据创建堆积条形图

我正在尝试使用 ggplot 2 创建堆积条形图我的宽格式数据如下所示每个单元格中的数字是响应的频率 activity yes no dontknow Social events 27 3 3 Academic skills works
当将遗传算法与 lme4 一起使用时，glmulti 无限期运行

我在 R 中使用 glmulti 进行模型平均我的模型中有大约 10 个变量使得详尽的筛选不切实际因此我需要使用遗传算法 GA 调用 method g 我需要包含随机效应因此我使用 glmulti 作为 lme4 的包装器此处提供

随机推荐

为什么仍然需要在 using 语句的 RHS 中使用 typename 来消除依赖类型的歧义？

我很清楚为什么需要使用typename对于依赖类型因为编译器在看到类似的内容时可能无法消除类型和变量声明之间的歧义T type 参见例如这个答案 https stackoverflow com a 613132 3093378一个很好的解
如何在目标c中从网络提供商获取用户的当前位置？

在离线模式下如何获取用户在ios中的当前位置是否可以通过网络提供商获取位置我给你完整的解决方案如果你想实现这一点你应该使用核心定位框架第一步在 h文件中导入CoreLocation框架 import
在 macOS 上更新 GNU make

我从下载了 GNU make 4 2 1here http ftp gnu org gnu make make 4 2 1 tar gz 并按照展开文件夹中的 INSTALL 文件中的说明安装它现在我跑make v在 shell 中我仍
AppCache 卡在 Android 原生浏览器上

我在尝试实现应用程序缓存功能的移动网站上遇到了一个奇怪的问题它在桌面 Chrome 和 Firefox Android 版 Chrome 和 iOS 上运行良好但 Android 原生浏览器在 Samsung Galaxy S3 上运
为线条指定颜色

我试图在 matplotlib 中绘制可变数量的行其中 X Y 数据和颜色存储在 numpy 数组中如下所示有没有办法将颜色数组传递到绘图函数中这样我就不必采取额外的步骤来单独为每条线分配颜色我是否应该将 RGB 颜色数组转换为另
MVC4优化如何允许部分视图脚本？

部分视图和 MVC 的一个问题是如果您的可重用部分视图需要某些 JavaScript 则无法包含它并将其加载到页面底部的脚本部分除了性能问题之外这意味着像 jquery 这样必要的东西还不存在你必须使用任何依赖 jquery 的代码
如何从头开始重复C程序并清理屏幕和第一个输入值？

我是编程新手我写了一个简单的程序我想一次又一次地重复该程序并且只有当用户想要退出时它才能退出这是我的程序 include
CakePHP 后退和前进按钮没有布局

我们正在 CakePHP 中构建一个大型 CMS 并集成了 Croogo 安装我们最近遇到了一个问题当用户单击back在浏览器中或forward按钮您最终得到的是使用以下命令的视图 ctp 文件blank布局所以没有样式 js 等
for 和 while 循环中没有循环条件

while cond fine for cond fine 但是当我删除条件部分时 while syntax compilation error for Infinite loop 这些循环内部是如何实现的或者编译器解析器如何知道中
验证 Laravel 中的选择表单

我的联系表上有这个 html div class form group div
正确的需要授权的资源的http状态代码

如果用户尝试访问需要用户登录的页面则返回的正确 http 状态代码似乎存在很多混乱那么当我显示登录页面时基本上会发送什么状态代码我很确定我们需要在4xx range 我在这里讨论的不是 HTTP 身份验证因此我们至少不会使用 1 个
R：使用 RGDAL 和 RASTER 包时抛出错误

给所有可能相关的人这是源代码 GRA D1 lt raster files 1 Sets up an empty output raster GRA D1 lt writeStart GRA D1 filename GRA D1 tif
R 语言 - 等待用户使用 scan 或 readline 输入

我试图让用户输入一些关键字进行查询在我的脚本中我使用了 scan 或 readline 我使用 R 嵌入脚本编辑器 Windows 进行了尝试但是当我执行代码时它使用我的下一行脚本作为标准输入这是我的部分脚本 keywords
请解释JQuery中$({deg: 0})的含义

有人可以向我解释一下这是什么意思吗 deg 0 in 使用 jquery animate 跨浏览器进行 CSS 旋转 https stackoverflow com questions 15191058 css rotation cross
定时器启动/停止参数

自从加入这个社区以来我在技能和进步方面取得了突飞猛进的进步你们都是一个巨大的帮助我无法提供一个计时器该计时器已在启动和停止时实现了某些参数我要么收到错误消息局部变量计时器可能尚未初始化要么没有收到错误消息但什么也没有发生也
如何删除空 html 标签（其中包含空格和/或其 html 代码）

需要 preg replace 的正则表达式这个问题没有在另一个问题中得到回答因为并非我要删除的所有标签都不为空我不仅要从 HTML 结构中删除空标签还要删除包含换行符以及空格和或其 html 代码的标签可能的代码是删除匹
CSS - 将文本保留在图像下方

我正在尝试创建一个简单的图片库有人告诉我使用 float left 但是当我这样做时页脚中的所有文本都会射到第一张图像我已经搜索了大约一个小时试图找到解决方案但我找不到任何东西我尝试过使用边距边框不同的对齐方式和各种不同的小东
为什么 1.__add__(2) 不起作用？ [复制]

这个问题已经存在了可能的重复访问 python int 文字方法 https stackoverflow com questions 10955703 accessing a python int literals methods 在P
VB.NET 中共享变量有什么用？

有什么用SharedVB NET 中的变量它是一样的static在 C 和大多数其他语言中这意味着类中的每个对象都使用变量属性或方法的相同副本当与静态方法一起使用时您不需要对象实例 MyClass DoSomething 而不是
如何在 R 中执行随机森林/交叉验证

我无法找到对我尝试生成的回归随机森林模型执行交叉验证的方法因此我有一个数据集其中包含 1664 个解释变量不同的化学性质和一个响应变量保留时间我正在尝试生成一个回归随机森林模型以便能够预测给定保留时间的物质的化学性质 ID

如何在 R 中执行随机森林/交叉验证

如何在 R 中执行随机森林/交叉验证 的相关文章

随机推荐

热门标签

如何在 R 中执行随机森林/交叉验证的相关文章