使用 tidyr 中的收集改变了我的回归结果

2024-03-24

当我运行下面的代码时，一切都按预期进行

# install.packages("dynlm")
# install.packages("tidyr")
require(dynlm)
require(tidyr)


Time <- 1950:1993

Y <- c(5820, 5843, 5917, 6054, 6099, 6365, 6440, 6465, 6449, 6658,  6698, 6740, 6931, 
       7089, 7384, 7703, 8005, 8163, 8506, 8737, 8842, 9022, 9425,  9752, 9602, 9711, 
       10121, 10425, 10744, 10876, 10746, 10770, 10782, 11179, 11617, 12015, 12336, 
       12568, 12903, 13029, 13093, 12899, 13110, 13391)

X <- c(6284, 6390, 6476, 6640, 6628, 6879, 7080, 7114, 7113, 7256, 7264, 7382, 7583, 7718,  
       8140, 8508, 8822, 9114, 9399, 9606, 9875, 10111, 10414, 11013, 10832, 10906, 11192, 
       11406, 11851, 12039, 12005, 12156, 12146, 12349, 13029, 13258, 13552, 13545, 13890, 
       14005, 14101, 14003, 14279, 14341)

data <- data.frame(Time, Y, X)

data_ts <- ts(data, start = 1950, end = 1993, frequency = 1)

Modell <- dynlm(log(Y) ~ log(X) + log(L(X)) + log(L(X, 2)) + log(L(X, 3)) 
                     + log(L(X, 4)) + log(L(X, 5)), data = data_ts)
summary(Modell)

在这种情况下我的摘要输出是这样的

...        
              Estimate  Std. Error t value Pr(>|t|)    
(Intercept)  -0.059109   0.091926  -0.643    0.525    
log(X)        0.883020   0.145754   6.058 9.17e-07 ***
log(L(X))     0.004167   0.211420   0.020    0.984    
log(L(X, 2)) -0.092880   0.207026  -0.449    0.657    
log(L(X, 3)) -0.012016   0.210395  -0.057    0.955    
log(L(X, 4))  0.200596   0.212370   0.945    0.352    
log(L(X, 5))  0.014497   0.144103   0.101    0.920 
...

现在，当我使用gather()为某些图定义新的数据框

data_tidyr <- gather(data, "Key", "Value", -Time)

并重新运行上面的代码而不改变任何其他内容我得到这个摘要：

              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  -0.05669    0.07546  -0.751    0.457    
log(X)        0.82128    0.13486   6.090 3.53e-07 ***
log(L(X))     0.17484    0.13365   1.308    0.198    
log(L(X, 2))       NA         NA      NA       NA    
log(L(X, 3))       NA         NA      NA       NA    
log(L(X, 4))       NA         NA      NA       NA    
log(L(X, 5))       NA         NA      NA       NA

我对这种行为感到困惑，因为收集操作（定义一个新的数据框，将列收集到行中）与我用来运行回归的数据集无关（至少这是我的印象）。以某种方式使用gather()改变计算的方式，但我不知道如何改变。非常感谢您的帮助！

一些数字：

“动态”版本0.3-3
R版本：3.2.0（64位）

Update

好的，谢谢您到目前为止的所有回答和评论，但问题仍然存在：环境中发生了什么？我想知道为什么以及如何发生这种情况。对我来说，这是一件很严重的事情，因为据我了解，避免一个函数调用对其他函数产生非预期的副作用正是 R 等函数式语言试图实现的目标。现在，除非我在这里遗漏了一些东西，否则这种行为似乎与这个意图相矛盾。

造成这一意外变化的根本原因是dplyr (dplyr, not tidyr) 更改了默认方法lag功能。这gather函数调用dplyr::select_vars，加载dplyr通过命名空间并覆盖lag.default.

The dynlm函数内部调用lag当你使用L在公式。然后dispatch方法发现lag.default. When dplyr通过命名空间加载（甚至不需要附加），lag.default from dplyr被发现。

这两个滞后函数根本不同。在新的 R 会话中，您会发现以下差异：

lag(1:3, 1)
## [1] 1 2 3
## attr(,"tsp")
## [1] 0 2 1
invisible(dplyr::mutate) # side effect: loads dplyr via namespace...
lag(1:3, 1)
## [1] NA  1  2

所以解决方案相当简单。只需覆盖lag.default自己发挥作用。

lag.default <- stats:::lag.default
dynlm(log(Y) ~ log(X) + log(L(X)) + log(L(X, 2)), data = data_ts)

## Time series regression with "ts" data:
##   Start = 1952, End = 1993
## 
## Call:
##   dynlm(formula = log(Y) ~ log(X) + log(L(X)) + log(L(X, 2)), data = data_ts)
## 
## Coefficients:
##   (Intercept)        log(X)     log(L(X))  log(L(X, 2))  
## -0.05476       0.83870       0.01818       0.13928      

lag.default <- dplyr:::lag.default
dynlm(log(Y) ~ log(X) + log(L(X)) + log(L(X, 2)), data = data_ts)

## Time series regression with "ts" data:
## Start = 1951, End = 1993
## 
## Call:
## dynlm(formula = log(Y) ~ log(X) + log(L(X)) + log(L(X, 2)), data = data_ts)
## 
## Coefficients:
##  (Intercept)        log(X)     log(L(X))  log(L(X, 2))  
##     -0.05669       0.82128       0.17484            NA  

lag.default <- stats:::lag.default
dynlm(log(Y) ~ log(X) + log(L(X)) + log(L(X, 2)), data = data_ts)

## Time series regression with "ts" data:
##   Start = 1952, End = 1993
## 
## Call:
##   dynlm(formula = log(Y) ~ log(X) + log(L(X)) + log(L(X, 2)), data = data_ts)
## 
## Coefficients:
##   (Intercept)        log(X)     log(L(X))  log(L(X, 2))  
## -0.05476       0.83870       0.01818       0.13928

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

tidyr

使用 tidyr 中的收集改变了我的回归结果的相关文章

更改列名称的字母大小写

我有大量数据集每个数据集都包含一长串列名在某些文件中列名称全部大写而在某些文件中仅列名称的第一个字母大写我需要附加数据集并认为匹配数据集中的列名称的最简单方法是将全大写名称转换为仅第一个字母大写的名称我希望找到一个通用的解决
如何使用 R vctrs 包构建一个可以与 c() 结合的对象

我试图了解如何用向量构建对象我认为这很简单但是当我在我的对象上使用 c 时遇到了麻烦我们的对象有两个属性 x 和描述符在本例中都是字符串我的对象将具有不同类型的属性我们构建了一个构造函数 new toy vector 我还没有在
循环更改多个数据帧

例如我有这三个数据集就我而言它们更多并且有很多变量 data frame1 lt data frame a c 1 5 3 3 2 b c 3 6 1 5 5 c c 4 4 1 9 2 data frame2 lt data fra
闪亮的如何阻止用户访问选项卡？

我需要阻止用户访问其他选项卡直到完成某些操作在这个可重现的示例中我想阻止用户访问Tab 2直到他按下按钮该应用程序如下所示这是该应用程序的代码 library shiny ui lt shinyUI navbarPage tabP
无法使用include_graphics在Rmarkdown中插入png（错误：文件不是PNG格式）

这个错误很奇怪当我编织文档时出现以下错误 Quitting from lines 42 43 sigminer doc Rmd Error in png readPNG path native TRUE info TRUE file i
R - 如何为一个图例元素组合 expression()、paste() 和 formatC() 命令？

我正在努力创造一个美好的传奇它应该包含希腊字母 mu 我可以使用表达式一些文字即和 mm 以及使用 formatC 格式化的模型系数来完成此操作我运行没有问题的是要么没有希腊字母然后我可以使用简单的粘贴命令 leg txt lt
如何使用 R / igraph 设置边缘颜色和顶点间距

我是 R 新手试图弄清楚如何为我有数据的系统制作社交网络地图我已经设法从常见问题解答和教程中弄清楚我想做的大部分事情但我被困在两件事上如何使画布更大图表间隔更大现在已经太挤了目前边缘厚度是根据重量设置的权重代表不同的状态
错误：“tidyverse”的包或命名空间加载失败：“namespace:dplyr”未导出对象“relocate”

我使用以下命令安装了 tidyverse install packages tidyverse 但是安装后当我使用以下命令调用库时 library tidyverse 我收到此错误 Error package or namespace l
R：使用 RGDAL 和 RASTER 包时抛出错误

给所有可能相关的人这是源代码 GRA D1 lt raster files 1 Sets up an empty output raster GRA D1 lt writeStart GRA D1 filename GRA D1 tif
加拿大人口普查地图分区 R

我对 R 和映射非常陌生我想创建某些数据的映射我有一组名为 D Montreal 的数据显示 2010 年前往蒙特利尔的加拿大人口普查部门游客来自哪个国家我想使用此数据创建一个地图以显示有多少人来自不同地区也许可以通过对根据人数
R：如何添加具有从矩阵的每一行中随机选择的值的列？

我会先说我是一个 R 菜鸟我认为这可能有一个简单的解决方案但我正在努力寻找它我有一个 2 列 1 000 行的矩阵保持行固定我想创建一个新变量从两列中随机选择一个元素例如制作一个简单的矩阵 matrix c 1 1 4 6 1
dplyr ：过滤一系列行（在一列中）

虚拟数据框 id family lt c 1 1 2 2 3 3 people lt c male female male female male children dataset lt data frame id family peopl
在 Bookdown 中呈现附录图号

Bookdown 是一个很棒的软件包我期待看到它如何发展但现在我在渲染数字方面遇到了麻烦pdf document2附录中的数字时的格式具体来说当带有标题的图形位于附录中时图形编号应采用 A 1 A 2 B 1 B 2 等形式但图
从 data.frame 创建新列

我有一个长格式的数据集其中测量时间嵌套在 Networkpartners NP 中而 Networkpartners NP 又嵌套在人员 ID 中下面是它的示例真实数据集有数千行 ID NP Time Outcome 1 11
xml2 包 (R) 中的 xml_find_all 函数未找到相关节点

我使用 R 中的 xml2 包来访问 xml 数据发现它在不同的 xml documents 上表现不同在这个宠物的例子中 library xml2 doc lt read xml
如何处理重叠的因子水平？（例如，生成表格和图表时）

我面临一个数据集的问题重叠因素水平我想按因素级别生成时间线条形图和统计数据但是我希望因子水平是模棱两可的这意味着属于多个级别的观察结果应该在图中出现多次这是我的数据结构的示例 head lt c ID YEAR BRAZIL G
网页抓取（R 语言？）

我想获取中间栏中的公司名称this http www consumercomplaints in bysubcategory mobile service providers page 1 html页面以蓝色粗体书写以及登记投诉者的位置
R 的 dplyr 切片中的奇怪行为

打电话时slice df i 在 R 的 dplyr 包中如果我要求的行索引不存在 nrows lt i 它似乎返回除组中的第一行之外的所有行就像我调用的那样slice df 1 例如 library dplyr c1 lt c a b
R Shiny - 修复了 Shiny 仪表板中的侧边栏和主标题

我有一个简化的闪亮仪表板请参阅下面的代码我想修复侧边栏和主标题因此在其他帖子的帮助下我编写了一个 CSS 文件来解决该问题 sidebar color FFF position fixed width 220px white sp
为 ggplot 定义新的尺度轴变换

我正在尝试创建一个squared使用 y 轴变换scales trans new但遇到错误 MWE data data frame x 1 10 y runif 10 z rnorm 10 10 library ggplot2 ggplot

随机推荐

如何使用 HTML5 音频标签创建自动播放列表？

如何使用 HTML5 的音频标签创建自动播放列表我想要实现的是一个只有播放暂停按钮大 30x25 px 的播放器播放器在页面加载时自动播放当歌曲结束时它会自动播放下一首歌曲尝试在播放列表中包含 3 4 首歌曲查看这篇文章使用
ng-select 中的对象及其属性

我一直在试图弄清楚如何使用数组 if 对象作为 ng select 指令的键值这是我想使用的数据 scope selectValues name Options 1 value 11 name Options 2 value 22 nam
如何从 key.pk8 和certificate.pem 生成 Android 密钥库？

所以今天我终于将我的 SDK 更新到 22 0 0 但这会在 AndroidManifest xml 中创建一个错误android debuggable false 这意味着我无法再从外部签名和压缩我自己的 APK 我一直使用自己的 key
scanf 格式说明符从一组字符中读取零个或多个字符

我需要对读取字符串中可以包含的字符非常严格我有一系列空格后面跟着一个字符后面跟着一系列空格例子 c c 我需要找到一个格式说明符它允许我忽略该字符但前提是它是这个特定字符而不是任何其他字符这个序列 e 应该被中止 I trie
Azure ARM 模板（取决于）

寻求一些指导和解释dependsOn 我在模板中看到有两种在模板中提供依赖项的方法一种方法是提供resourceId另一种方法是使用提供字符串值concat 我试图理解两者之间的区别 Example concat Microsoft Ne
错误：指针和整数之间的比较

我正在尝试编写一个可以处理重定向的简单 shell 但是我得到错误指针和整数之间的比较我明白为什么会出现错误但我不确定如何修复它 args 声明为 static char args 512 这是我收到错误的代码 if args l
Visual Studio上的Nuget包推送403错误

我创建了一个视觉工作室类库我想将其作为一个包发送给 Nuget 我用了视觉工作室包管理器安慰命令如下 nuget spac 你好nuget nuget 包 hellonuget nuspec nuget 推送 hellonuget 1
如何在“表格列表”中仅显示一次表格标题，以便将表格拆分为多个页面

我正在使用 R 包 xtable and knitr 和乳胶包 longtable and hyperref 准备一份文件我的一张桌子很长并且分成多页事实证明表列表显示了该表出现的每个页码但所有超链接都将我带到了该表的开头我的问
CSS Sprites 在 IE 中不起作用[8/7/6]

我正在尝试 CSS 使用精灵来动画我的风险矩阵它在 Firefox 和 Chrome 中工作得很好但图像不会显示在 IE 中代码如下不想将整个内容粘贴到此处但摘录显示了模式 dl dd a a dd dd a a dd dl
隐藏文件夹 C# [重复]

这个问题在这里已经有答案了可能的重复 C 获取不包括隐藏文件的文件列表 https stackoverflow com questions 2418270 c get a list of files excluding those tha
android 背景重复-y

我有一个图像我想将其放置在右侧并在 y 轴上重复它 HTML 中类似于背景 url img png 右重复 y 在android中可以做到这一点吗当我将此位图设置为背景时它不在右侧
检查 FTP 服务器上的可用空间

我正在运行一个构建脚本其中三个可执行文件每个 100mb 被上传到 FTP 服务器由于 FTP 服务器空间问题第一次上传可能会失败因此我们的构建过程会失败这意味着我必须从服务器释放一些空间并再次运行构建脚本这是浪费时间我想在
Python 子模块在 python 3.7 中正确导入，但在 3.6 中则不然

我的目录结构如下 test init py m1 init py f1 py f2 py test init py是空的 test m1 init py包含一行import test m1 f1 test m1 f1 py包含一行impor
如何将复杂对象传递到 ASP.NET MVC 中的另一个视图？

我正在尝试将一个复杂的对象可以序列化如果有帮助的话传递给另一个视图目前这是我在某些控制器方法中拥有的代码 User user New User Name Fred Email xxxx return RedirectToActio
为什么每个逻辑 CPU 在多线程情况下都有自己的 CR3 寄存器？

当我们有一个支持某种形式的多线程的 CPU 时每个逻辑 CPU 都有它自己的一组寄存器至少包括 CR3 寄存器由于我们在执行不同线程时正在处理同一进程的虚拟地址空间并且永远不会发生上下文切换切换同一进程的线程时TLB缓存也不会失
conda环境安装后无法导入包

我尝试安装gdal我的 conda 环境中的包我激活了 gcpy 环境并使用安装了 gdal 包conda install c conda forge gdal 该软件包安装成功但是当我尝试导入包时出现错误 In 1 import
.Bool、.so、? 之间的区别所以

我试图找出上述例程和 if 语句之间的区别 say y Bool say y so say y say so y 会产生不同的结果到目前为止对我来说唯一明显的区别是优先级高于so Bool and so似乎完全是同义词这是正确的并且
Android谷歌地图异步任务添加标记

我有一张地图我有一个点数据库我想在 AsyncTask 中显示数据库中的点以便在加载点时用户可以在地图上移动没有太多点例如 353 等但当用户更接近缩放具有更大标记的地图时我会重新绘制所有点当发生重绘时应用程序冻结了不
Icalendar 事件 RSVP 是否有标准和实现

总结是我现在正在实现一个事件确认系统但找不到 ICalendar 回复的正确格式因此我想知道是否有一个完整的 REPLY 消息的示例也许还有一个 PHP 库可以包装所有这些消息现在了解详细信息我们收到外部电子邮件包括要求回复的
使用 tidyr 中的收集改变了我的回归结果

当我运行下面的代码时一切都按预期进行 install packages dynlm install packages tidyr require dynlm require tidyr Time lt 1950 1993 Y lt c 5

使用 tidyr 中的收集改变了我的回归结果

Update

使用 tidyr 中的收集改变了我的回归结果 的相关文章

随机推荐

热门标签

使用 tidyr 中的收集改变了我的回归结果的相关文章