在 lm lapply 调用列表中使用权重参数[重复]

2024-01-14

这是我的问题(为了可重现而虚构的数据):

set.seed(42)
df<-data.frame("x"=rnorm(1000),"y"=rnorm(1000),"z"=rnorm(1000))
df2<-data.frame("x"=rnorm(100),"y"=rnorm(100),"z"=rnorm(100))
breaks<-c(-1000,-0.68,-0.01315,0.664,1000)
divider<-cut(df$x,breaks)
divider2<-cut(df2$x,breaks)
subDF<-by(df,INDICES=divider,data.frame)
subDF2<-by(df2,INDICES=divider2,data.frame)
reg<-lapply(subDF,lm,formula=x~.)
pre<-lapply(1:4,function(x){predict(reg[[x]],subDF2[[x]])})
lapply(1:4,function(x){summary(reg[[x]])$r.squared})

上面的代码工作正常。我正在做的事情如下:根据的价值观x,我分裂了df在 4 个数据帧中并对每个数据帧运行回归,以便能够预测其他数据集的值。数据帧的分割是为了更好地预测范围x对实际数据影响很大。

我想做的是为回归添加一个权重参数,以更加重视最新的数据。我的权重参数是:weights<-0.999^seq(250,1,by=-1)如果有250条数据。种子为 42,加上之前的休息,所有 4 个维度均为 250。

当我尝试做的时候reg<-lapply(subDF,lm,formula=x~.,weights=0.999^seq(250,1,by=-1)),我收到此错误:

Error in eval(expr, envir, enclos) : 
  ..2 used in an incorrect context, no ... to look in

这很奇怪,因为lapplyhas a ...参数,此处用于formula但它不接受weights.

所以我真的不知道该怎么做才能增加这些重量。我应该在我的代码中纠正什么,或者我应该(几乎)完全更改它以便能够使用权重?

对于这个例子,为了使其(也许)更容易,我削减了中断,以便 4 个子集具有相同的维度,但理想情况下,即使 4 个子集不具有相同的维度,答案也会起作用(因此中断breaks<-c(-1000,-0.75,0,0.75,1000)例如)

This https://stats.stackexchange.com/questions/105605/forecasting-a-time-series-with-weightsCrossValidated 上的帖子也有完全相同的问题,但没有有效的解决方案,所以这对我没有帮助。


不幸的是,您已经亲身经历了 R 中可以说是最严重的错误。即所谓的非标准评估 (NSE) 错误。

经过一番挖掘代码后,我想我找到了罪魁祸首。让我们一件一件地看:

首先我们来看看traceback():

weights <- 0.999^seq(250,1,by=-1)

lapply(subDF, lm, formula=x~., weights=weights)
Error in eval(expr, envir, enclos) : 
  ..2 used in an incorrect context, no ... to look in
> traceback()
8: eval(expr, envir, enclos)
7: eval(extras, data, env)
6: model.frame.default(formula = ..1, data = X[[1L]], weights = ..2, 
       drop.unused.levels = TRUE)
5: stats::model.frame(formula = ..1, data = X[[1L]], weights = ..2, 
       drop.unused.levels = TRUE)
4: eval(expr, envir, enclos)
3: eval(mf, parent.frame())
2: FUN(X[[1L]], ...)
1: lapply(subDF, lm, formula = x ~ ., weights = weights)

看起来问题出现在内部model.frame.default。那么,让我们看一下源代码。我不会发布整个源代码,但如果你输入model.frame.default在控制台中,您将看到中间的某个位置:

extras <- substitute(list(...))
extranames <- names(extras[-1L])
extras <- eval(extras, data, env)

最后一行是失败的地方。第一行称为 NSE,由以下命令创建substitute. substitute将创建所谓的expression也就是说,让我们说一个稍后在内部评估(即创建)的对象eval。正如你所看到的eval, extras将被评估在data然后如果没有找到env。对于公式来说这是可以的,因为它是在数据中评估的并且x~.会告诉eval使用中的所有列data. weights虽然不在data。所以,eval将在以下位置查找它env。但什么是env?

显然,env是一个环境并且是在其中创建的model.frame.default在行中:

env <- environment(formula$terms)

那么这是什么意思?让我们看另一个例子:

xtest <- function(x) {
  new_func <- function(x) {
    env <- environment(x)
    print(env)
  }
  new_func(x)
} 

> xtest(x~z)
<environment: R_GlobalEnv>

在上面的函数中,我尝试用更少的行复制什么env将在model.frame.default。如你看到的,environment(formula)指向全球环境。

所以,它就在那里env试图找到..2即传入的第二个参数... (i.e. weights),但由于没有...在全局环境中,您遇到了错误。希望现在已经清楚了!

最好的解决方案,我会做的是使用 @Heroka 的答案来解决它(或者你可以重写整个model.frame.default and lm从头开始不使用 NSE,但我认为第一个更合理:))。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 lm lapply 调用列表中使用权重参数[重复] 的相关文章

  • R:从 Github 安装包时出现编码问题

    我正在尝试安装dcStockR https github com yutannihilation dcStockR来自 Github 的包 这是一个htmlwidgets http www htmlwidgets org 周围的包装纸dc
  • 将 stat_smooth 添加到 ggplot2 中的仅 1 个方面

    我有一些数据 在某个因素的某个水平上 存在显着的相关性 在另一个层面上 则没有 并排绘制这些图很简单 使用 stat smooth 向它们添加一行 也很简单 但是 我不希望线条或其填充显示在两个面之一中 有没有一种简单的方法可以做到这一点
  • 在 Shiny 应用程序中更改 bsModal 的背景

    我正在开发一个 Shiny 应用程序 我需要确保最终用户不会意外关闭 bsModal 因为它上面有一些操作按钮 我做了一些研究并了解到我需要覆盖背景和键盘参数 但即使我看到了一些建议 我也不知道这到底需要放在我的代码中的哪里 我不精通 Ja
  • OpenStreetMap 不显示在 RStudio 中(使用 R 3.2.1)

    我正在使用来自的代码here https rstudio github io leaflet library leaflet m lt leaflet gt addTiles gt addMarkers lng 174 768 lat 36
  • 将多个函数应用于一个向量

    我正在寻找一种将多个函数应用于一个向量的选项 我认为这对于逆应用函数来说是一种仁慈 其中一个函数应用于许多向量 或列 有没有办法指定两个或多个函数 例如 min 和 max 并将其应用于向量 与 CathG的评论类似 但没有get v lt
  • 正则表达式在 R 中同时多次包含字母/特殊字符时删除单词

    我想删除那些单词中字母 特殊字符的数量同时出现两次以上的单词 例如 输入就像 Google in theee lland of whhhat c c and e 输出应该是 Google in lland of c c and x lt G
  • ‘!’ 对于 R 中的因子没有意义

    我需要从数据框中排除变量 PABI 所以 我按如下方式进行子集化 MyData4 lt subset MyData PROV PABI newdata lt MyData MyData4 但我得到了这个错误 Error in FUN lef
  • 将一长行带空格的数据导入R中

    这个问题是我上一个问题的后续问题 将一长行数据导入到 R 中 https stackoverflow com questions 8389913 我有一个由单行文本组成的大型数据文件 格式类似于 Cat 14 15 Horse 16 我最终
  • 省略 RColorBrewer 调色板上较亮的颜色以在 ggplot2 中使用

    我想在 RColorBrewer 的 Oranges 调色板中使用较深的颜色 以便在我的 ggplot 条形图 中使用 然而我却做不到 帮助 下面是示例代码 my palette brewer pal n 9 Oranges 4 9 Bar
  • do.call 的 envir 选项如何工作?

    的文档do call states If quote is FALSE 默认值 然后对参数进行求值 在调用环境中 而不是在envir 这句话向我暗示 当quote FALSE 指定envir没有什么区别 然而 事实并非如此 事实上我遇到过需
  • 为什么我在 R 向量的类别中看到“整数”而不是“向量”

    为什么从数据框中切片的列的数据类型显示为 整数 而不是 向量 df lt data frame x 1 3 y c a b c x y 1 1 a 2 2 b 3 3 c c1 lt df 1 1 1 2 3 class c1 1 inte
  • 导出绘图变量显示空白图像

    我正在使用 JRI 进行 java 和 R 集成 请找到下面的脚本 String path C Users hrpatel Desktop CSVs DataNVOCT csv rengine eval library tseries re
  • 根据 R 中的另一个变量过滤簇中的 id

    我有 100 名患者的数据 每个患者都有 7 天 1 到 7 的值 如何仅在第一天根据另一个变量选择患者 df lt data frame id c 1 1 1 2 2 2 day c 1 2 3 1 2 3 RRT c 0 1 0 1 0
  • 在 R 中将 ascii 数字转换为字符串

    要将 R 中的字符串转换为 ascii 代码 我通常使用 gt strtoi charToRaw abcd 16L 1 97 98 99 100 是否有一个函数可以做相反的事情 即 gt myDesiredFunc c 97 98 99 1
  • 使用条件求 R 中的累积和

    我需要创建一个新变量 其中包含每个 ID 过去三年金额的总和 如果没有三年的数据 则应显示 NA 举个例子 ID YEAR AMOUNT 1 2010 5 1 2011 2 1 2012 4 1 2013 1 1 2014 3 2 2013
  • 将时间值转换为数字,同时保留时间特征

    我有一个数据集 其中包含不同事件发生的间隔时间 我想要做的是将数据转换为数字向量 以便更容易操作和运行摘要 制作图表等 同时保持其时间特征 这是我的数据片段 data lt c 03 31 12 17 16 29 09 52 04 01 0
  • 从R中的序列中随机提取多个连续项

    Frag lt seq 1 30000 K lt 9 P lt sample 1 K 1 sys sample lt Frag seq P length Frag K 现在 sys sample 包含 3333 个数字 如何在R中随机提取1
  • R 语言 NaN + NA 行为

    我有一个关于 R 中算术行为的问题 看下面这段代码 gt NaN NA 1 NaN gt gt gt NaN as integer NA gt NA 所以 我很困惑这两个添加给出了不同的结果 有谁知道这是否是真正想要的行为还是只是某种错误
  • R 彩色树状图建议?

    我想制作彩色树状图 但尚未找到足够的库 http addictedtor free fr graphiques RGraphGallery php graph 79 http addictedtor free fr graphiques R
  • R 计算股票的 beta(使用 PerformanceAnalytics CAPM.beta() 函数或 lm() 函数产生意外结果)

    我正在尝试使用 PerformanceAnalytics CAPM beta 函数量化 R 中股票的 beta 基准测试与 SPY 结果甚至与我在 Yahoo Google Finance 在线看到的值不接近 代码 require Perf

随机推荐

  • 带引导程序的滑出面板

    我使用 twitter bootstrap 并尝试做类似的事情here http codepen io Tyriar pen nJGfj 滑出面板 我见过nav collapse效果非常相似 只是它从上方下降并且仅出现在特定屏幕尺寸下方 希
  • React Native - 如何仅输入数字键盘(不带标点符号)

    有没有一种方法可以在没有标点符号的情况下键入数字键盘
  • 如何在 Svelte 中使用 Web 组件?

    我想使用一些网络组件https github com microsoft vscode webview ui toolkit https github com microsoft vscode webview ui toolkit 但我不知
  • jquery代理传递参数

    绑定事件处理程序时如何通过代理传递字符串 我想将附加到目标处理程序的数据属性传递给对象的方法 这可能吗 function ReservationSchedulePicker reservationType Reservation Type
  • 如何查找 Coq 证明策略的定义或实现?

    我正在看this https github com coq coq blob cdfe69d6da6b32338ba74c9f599c74389089c9dd theories Numbers Natural Abstract NAdd v
  • WIX:我的 CustomAction 应在何处以及如何创建和读取临时文件?

    我有一个脚本 CustomAction 是的 我知道所有关于不要使用脚本 CustomActions 我有不同意见 我想运行命令并捕获输出 我可以使用 WScript Shell COM 对象执行此操作 然后调用shell Exec 但是
  • 如何动态改变这个随机数生成器的曲线?

    该函数生成一个随机数 但概率曲线倾向于较低范围 function getRandomLowNumber min 1 max 100 factor 1 let num getRandomDecimal min max let rollDiff
  • 将我的 PDO 连接保存为全局变量 [重复]

    这个问题在这里已经有答案了 在询问有关 PDO 查询的另一个问题时 我被告知将 PDO 连接对象保存为全局对象以在调用数据库查询的各种函数中使用它通常是不好的做法 以下是我通常如何使用 PDO 对象 function somefunctio
  • std::forward 无法转换大括号括起来的初始值设定项列表

    为什么 struct screen 无法正确初始化框架结构 我想要的是初始化屏幕结构并直接初始化 2 个框架结构 include
  • SIFT 算法中奇怪的 Octave 值?

    我在 opencv 代码中使用 sift 算法从图像中获取描述符和关键点 我的代码是 Ptr
  • 获取过滤数组项的索引

    在 JavaScript 中 我有以下数组 var arr 5 10 2 7 从该数组中 我想获取一个仅包含小于 10 的项目索引的数组 因此 在上面的示例中 索引数组将是 var indexes 0 2 3 现在 我想要类似的东西filt
  • 快速数字格式化

    我刚刚开始了解 Swift 但我在极其基础的数字格式化方面遇到了严重的问题 例如 我需要显示至少 2 位数字的整数 例如 00 01 02 03 04 05 我期望的正常语法是这样的 println 02i 02i 02i var1 var
  • 非 LL(1) 的 LL(2) 语言

    为了进一步了解解析器和语法 我正在寻找一个 希望简单的 示例language即 LL 2 但不是 LL 1 也就是说 可以由 LL 2 语法生成但不能由任何 LL 1 语法生成的语言 该课程中有有用的语言吗 也就是说 我们可以想象一种 LL
  • WOW.js 无法与 Wordpress 正常工作

    所以我试图让 wow js 和 Animate css 在我的 WordPress 模板上工作 我已经将它们全部链接得很好 它不会引发任何错误 并且动画确实有效 但由于某种原因 动画是在页面加载时触发的 而不是在页面滚动时触发的 效果是所有
  • 如何使用mysql join更新记录?

    在我的 mysql 中 我有 t1 t2 表 我想根据 t1 的字段值与 t2 的字段值匹配 从 t2 的字段值更新 t1 的字段 我尝试了以下但它没有更新 我在这里做错了什么 UPDATE t1 INNER JOIN t2 ON t1 n
  • Sinon-chai CalledWith(new Error()) 并带有确切的消息

    我需要测试这个功能 user js function getUser req res next helper get user param1 param2 err file gt if err return next err 这是我的测试功
  • 如何找到我自己的 Facebook ID? (不是应用程序范围的 ID)

    我以前可以访问我的 Facebook 个人资料页面https www facebook com https www facebook com 用户名 并将 www 替换为 graph https graph facebook com htt
  • Swift 中的 CocoaLumberjack,如何打印行号和文件名称

    我是 CocoaLumberjack 的新手 我让它在 Swift 上工作如下this https github com CocoaLumberjack CocoaLumberjack issues 405 如果我尝试打印日志 DDLogD
  • POM 中的多个依赖范围

    我的 POM 中有一个依赖项 需要将其设置为 提供 因此它不会包含在编译中 但仍然可以在我的项目中引用 当我去运行测试时 我希望相同的依赖项具有 测试 范围 这样我就不必手动将 jar 添加到我的类路径中 有没有办法做到这一点或达到类似的结
  • 在 lm lapply 调用列表中使用权重参数[重复]

    这个问题在这里已经有答案了 这是我的问题 为了可重现而虚构的数据 set seed 42 df lt data frame x rnorm 1000 y rnorm 1000 z rnorm 1000 df2 lt data frame x