插入符使用插入符训练对象返回的预测与使用提取的最终模型返回的预测不同

2024-04-12

在拟合模型时我更喜欢使用插入符号，因为它的相对速度和预处理功能。然而，我对它如何做出预测有点困惑。当比较直接从训练对象做出的预测和从提取的最终模型做出的预测时，我看到了非常不同的数字。来自火车对象的预测似乎更准确。

library(caret)
library(ranger)

x1 <- rnorm(100)
x2 <- rbeta(100, 1, 1)

y <- 2*x1 + x2 + 5*x1*x2

data <- data.frame(x1, x2, y)
fitRanger <- train(y ~ x1 + x2, data = data,
                   method = 'ranger', 
                   tuneLength = 1,
                   preProcess = c('knnImpute', 'center', 'scale'))

predict.data <- data.frame(x1 = rnorm(10), x2 = rbeta(10, 1, 1))
prediction1 <- predict(fitRanger, newdata = predict.data)
prediction2 <- predict(fitRanger$finalModel, data = predict.data)$prediction

results <- data.frame(prediction1, prediction2)
results

我确信这与我如何预处理火车对象中的数据有关，但即使我预处理测试数据并使用 Ranger 模型进行预测，值也是不同的

predict.data.processed <- predict.data %>% 
                             preProcess(method = c('knnImpute', 
                                                   'center', 
                                                   'scale')) %>% .$data

results3 <- predict(fitRanger$finalModel, data = predict.data.processed)$prediction

results <- cbind(results, results3)
results

我想从游侠模型中的每棵树中提取预测，但在插入符中无法做到这一点。有什么想法吗？

为了从最终模型中获得与插入符号相同的预测train您应该以相同的方式预处理数据。使用你的例子set.seed(1):

插入符预测：

prediction1 <- predict(fitRanger,
                       newdata = predict.data)

Ranger 对最终模型进行预测。在 Predict.data 上使用插入符预处理

prediction2 <- predict(fitRanger$finalModel,
                       data = predict(fitRanger$preProcess,
                                      predict.data))$prediction

all.equal(prediction1,
          prediction2)
#output
TRUE

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

Prediction

rcaret

插入符使用插入符训练对象返回的预测与使用提取的最终模型返回的预测不同的相关文章

geom_密度匹配geom_histogram binwitdh

我想在 ggplot2 中的分布条形图上添加一条线以显示平均分布但遇到了麻烦像这样的 ggplot 调用 ggplot x aes date received geom histogram aes y count binwidth 30
R：邻接表到邻接矩阵

Bonjour 我想将邻接列表 3 列转换为邻接矩阵在这个论坛中我找到了多个有关如何将边列表转换为邻接矩阵的示例我成功地为两列列表做到了这一点我已经尝试了在网上可以找到的所有解决方案但似乎我错过了一小步我尝试过的我的变量是用
使 matplotlib 图形默认看起来像 R？

Is there a way to make matplotlib behave identically to R or almost like R in terms of plotting defaults For example R t
r - 从我的应用程序下载shinyapps代码

我正在尝试从shinyapps io 在另一台电脑上下载我的shiny 应用程序代码我按照这个例子 https support rstudio com hc en us articles 204536588 从 shinyapps io下
如何转置 R markdown 文档中的表格？

假设我打印一个名为summary table的数据框如下所示 summary table data frame a c 1 2 3 b c 11 12 13 c c 21 22 23 d c 31 32 33 e c 41 42 43 f
为格子中的每个面板添加不同的独特标签

很清楚如何在格子中标记面板 https stackoverflow com questions 8508269 how to label panels in lattice using panel text or ltext论据但是如果
如何将环境变量传递给shinyapps

我想将安全参数传递给shinyapps io部署以便我的应用程序可以通过以下方式获取它们 Sys getenv PASSWORD X 我找不到任何相关内容deployApp函数在rsconnect包裹您可以使用Renviron网站 or
如何使用 grid.arrange 移动图例位置

我试图在一页中排列 4 个图将图例放在底部中心我用它来获取其中一个图的图例因为它们对于四个图来说是相同的 get legend lt function myggplot tmp lt ggplot gtable ggplot buil
如何在r中进行左连接[重复]

这个问题在这里已经有答案了我有两个数据集一和二数据集一 a b c 111 a 1 112 b 2 113 c 3 114 d 4 115 e 5 数据集二 e d g 222 ss 11 111 ff 22 113 ww 33 114
如何正确调整 R 中 ggplot 的各个方面的大小，包括图例？

我在 ggplot2 中制作散点图然后使用 ggsave 导出特定宽度和高度的 PDF 但是图形图例永远不会使用 ggsave 正确调整大小其边框不会留在绘图内是否有另一种方法可以同时调整 ggplot 所有部分的大小以便于导出我
提取所有列组中共有的元素

我有一个 R 数据集 x 如下 ID Month 1 1 Jan 2 3 Jan 3 4 Jan 4 6 Jan 5 6 Jan 6 9 Jan 7 2 Feb 8 4 Feb 9 6 Feb 10 8 Feb 11 9 Feb 12 10
R 中的输出，避免写“[1]”

I use print从 R 中的函数输出例如 print blah blah blah 这输出 1 blah blah blah 到控制台我怎样才能避免 1 和引号 Use cat Your string type cat查看帮助页面
读取多个 CSV 文件，并在文件开头跳过不同行数

我必须阅读大约 300 个单独的 CSV 我已经成功使用循环和结构化 CSV 名称来自动化该过程然而每个 CSV 在开头都有 14 17 行垃圾并且随机变化因此在 read table 命令中硬编码 skip 参数将不起作用每个
RPostgreSQL 无法关闭连接

我有一个闪亮的应用程序使用它连接到数据库RPostgreSQL 在应用程序结束时连接关闭驱动程序应该被卸载但我收到错误警告我连接未关闭代码看起来像这样 in the app R file but not in the serve
通过 rpy 将 SPSS 文件（.sav）导入 pandas 时如何保留标签？

我正在寻找使用 SPSS 文件 sav pandas 在没有 SPSS 程序的情况下典型文件转换为 csv 后的样子如下在调查前两行的含义时我不知道 SPSS 似乎第一行包含Labels 而第二行包含VarNames 当我将文件带入
R（或替代方案？）中的高（或非常高）阶多项式回归

我想对 R 中的一组数据进行非常高阶回归拟合但是poly 函数的阶数极限为 25 对于此应用程序我需要的订单范围为 100 到 120 model lt lm noisy y poly q 50 Error in poly q 50
矩阵中两个字符串的最大 nchar

我想找到更好的方法来找到我正在相互比较的两个字符串的更大的 nchar 假设我有字符串句子匹配data frame 和我需要创建一个 max nchar string1 nchar string2 矩阵但没有 for 循环这是非常慢的方
递归累积函数

我需要在 R 中编写一个累积求和函数但我一直碰壁该函数具有以下结构 a x1 a x2 a 2 x1 a x3 a 2 x2 a 3 x1 a x4 a 2 x3 a 3 x2 a 4 x1 等等 cumsum 似乎不适用于此类功能有
使用 sapply 的列表和矩阵

我有一个也许是基本的问题我在网上搜索过我在读取文件时遇到问题尽管如此我还是按照 Konrad的建议设法读取了我的文件我很欣赏这一点 How to get R to read in files from multiple subdi
使用cowplot包的多重图的中心X轴标签

我有一个多图图形由 2x2 配置中的 4 个图组成我使用 cowplot 包和plot grid函数使用下面的代码排列了绘图 plot grid p1 p2 p3 p4 align vh vjust 1 scale 1 其中 p1 p4

随机推荐

窗口函数或公共表表达式：计算范围内的前几行

我想使用窗口函数来确定每一行满足特定条件的先前记录的总数一个具体的例子 clone d test Table pg temp 2 test Column Type Modifiers id bigint date timestamp wi
基于编译时类型的调度

遵循现代 C 设计的技术我正在实现一个具有各种编译时优化的持久性库如果模板化成员变量派生自给定类我希望能够将函数分派给该变量 template
Workbox：构建项目时无法缓存所有文件

I use Vuejs我用workbox webpack plugin为了使我的网站离线我想缓存一个包含我所有文件 3个文件的文件夹如下图所示但是当我构建我的项目时使用Laravel mix The main js 包含 Vue
android中contentprovider和contentResolver有什么区别

有什么区别内容提供商 and 内容解析器我不想为SQLite数据库我正在开发一个媒体应用程序我找到了一些解释here http www androiddesignpatterns com 2012 06 content resolve
如何在多个分支上同时工作

这是后续这个问题 https stackoverflow com questions 8453039 cleaning my git branch of features in development关于创建分支让我感到奇怪的是我仍然会
显示多个表中的列

我正在尝试从两个表中获取列名我尝试了如下查询 SHOW COLUMNS FROM users UNION SHOW COLUMNS FROM posts 但这不起作用并返回语法错误我尝试使用相同的查询DESCRIBE但这也不起作用如何
自定义强类型 BindingSource 项目添加

我想自定义添加一个新项目到BindingSource 均为强类型如以下 MSDN 文章所述如何使用 Windows 窗体 BindingSource 自定义项目添加 http msdn microsoft com en us libr
CSS：固定大小的div，固定垂直位置并水平居中？

在CSS中是否可以有一个 div 它既水平居中又固定在浏览器底部我正在为内部 div 使用设置的宽度和高度我试过放一个divposition relative在固定的外部 div 内垂直对齐内容但外部 div 不居中我又回到了原
为什么Kotlin for Android Developers（书）需要再次添加扩展parseList？

我知道 Anko 提供了 parseSingle parseOpt 和 parseList 函数我不明白为什么 Android 开发者书的代码需要再次设计扩展 parseList 你可以告诉我吗谢谢 https github com
角度 4 |如何在点击时动态注入指令？

美好的一天如何实现在单击按钮时注入自定义指令请参阅下面我的代码
nvm安装了node和npm，安装本地browserify时出现符号链接问题

今天我已经安装了最新版本node通过nvm在 Linux Mint Ubuntu 13 10 上感谢 nvm 我现在不必将 sudo 命令与 npm 一起使用这已经解决了一些软件包的问题 node v v0 10 29 npm v 1
achartengine - 无法弄清楚如何使用日期作为 x 轴 - 我保存的文件是空的

我有一个活动我从编辑文本中获取输入并将其存储在列表中我还将当前日期存储在列表中然后我按保存按钮保存上述内容第二天用户再输入一些数据并保存依此类推我想制作一个 x 轴日期格式和 y 轴用户输入的值的图在一项活动中我有 Str
NSXMLParser 可以用来解析 HTML [重复]

这个问题在这里已经有答案了可能的重复使用 NSXMLParser 解析 HTML https stackoverflow com questions 8866376 using an nsxmlparser to parse html
Xcode：复制标头：公共、私有、项目？

我正在构建一个 Cocoa Touch 静态库我应该如何决定是否将头文件复制为公共私有或项目 Public 该界面已最终确定可供产品的客户使用公共标头作为可读源代码包含在产品中不受限制 Private 该界面不适用于您的客户或者
std::mutex 会创建栅栏吗？

如果我锁定一个std mutex我总会得到一个记忆栅栏吗我不确定这是否暗示或强迫你获得栅栏 Update 根据 RMF 的评论找到了这个参考资料多线程编程和内存可见性 http en wikipedia org wiki Memory
如何深度复制混有特征的类

这是一些示例 scala 代码 abstract class A val x Any abstract def copy A class b i Int extends A i override def copy new B x class
python中，什么时候可以省略self？

下面定义的代码Duck类由以下组合而成Bill类和Tail班级我的问题是至于方法about inside Duck类定义为什么可以写bill description and tail length Is self这里省略了如果是我什
neo4j cypher节点之间的多重关系

例如 a r gt b 两个节点之间存在多个r 每个r userId都是唯一的例如 a r R userId user1 gt b a r R userId user2 gt b 对于 a r gt c 也是如此而情况是a r gt b
Mojolicious REST 调用中错误的 HTTP 响应

我使用的mojolicious应用程序是基于JSON的即客户端和服务器之间的交互更多的是JSON结构化数据的交换我正在尝试实现一种标准方法当在 REST 调用期间发生错误时使用正确的 HTTP 响应代码来处理错误实施此类标准的最佳
插入符使用插入符训练对象返回的预测与使用提取的最终模型返回的预测不同

在拟合模型时我更喜欢使用插入符号因为它的相对速度和预处理功能然而我对它如何做出预测有点困惑当比较直接从训练对象做出的预测和从提取的最终模型做出的预测时我看到了非常不同的数字来自火车对象的预测似乎更准确 library caret

插入符使用插入符训练对象返回的预测与使用提取的最终模型返回的预测不同

插入符使用插入符训练对象返回的预测与使用提取的最终模型返回的预测不同 的相关文章

随机推荐

热门标签

插入符使用插入符训练对象返回的预测与使用提取的最终模型返回的预测不同的相关文章