dplyr 和 tidyr - 使用因子一次性计算大量线性模型

2024-01-04

在阅读了 tidyverse 的更多内容后,我开始立即拟合许多线性模型,如中所述this https://blog.rstudio.org/2016/02/02/tidyr-0-4-0/。也就是说,我会按照以下方式做一些事情:

library(dplyr)
library(tidyr)
library(purrr)
df <- data.frame(y = rnorm(10), 
                 x1 = runif(10),
                 x2 = runif(10))

df %>%
  gather(covariate, value, x1:x2) %>% 
  group_by(covariate) %>% 
  nest() %>% 
  mutate(model = map(.x = data , .f = ~lm(y ~ value, data = .))) %>% 
  mutate(rsquared = map_dbl(.x = model, .f = ~summary(.)$r.squared))

问题是,当变量类型不同时,例如当一个是数字而一个是因子时,这种方法会失败,因为gather()函数将强制整体value向量化为因子。例如,

df <- data.frame(y = rnorm(10), 
                 x1 = runif(10),
                 x3 = sample(c("a", "b", "c"), 10, replace = TRUE))

df %>%
  gather(covariate, value, x1:x3) %>% 
  sapply(class)

随后是警告

Warning message:
attributes are not identical across measure variables; they will be dropped 

          y   covariate       value 
  "numeric" "character" "character" 

and the value列是一个字符,所以技巧nest()将不再起作用,因为所有协变量都将作为因子放入。

我想知道是否有tidy这样做的方法。


您可以在拟合模型时转换类型,但您应该按照注释中指出的那样小心行事,因为这可能会产生意想不到的后果。

如果您仍然想转换,您可以使用type_convert from readr在整个框架上或type.convert就在“值”向量上。

Using type_convert:

mutate(model = map(.x = data , .f = ~lm(y ~ value, data = readr::type_convert(.))))

Using type.convert:

mutate(model = map(.x = data , .f = ~lm(y ~ type.convert(value), data = .)))

作为链的一部分,其中任何一个都会导致本例所需的结果:

df %>%
    gather(covariate, value, x1:x3) %>% 
    group_by(covariate) %>% 
    nest() %>% 
    mutate(model = map(.x = data , .f = ~lm(y ~ type.convert(value), data = .))) %>% 
    mutate(rsquared = map_dbl(.x = model, .f = ~summary(.)$r.squared))

# A tibble: 2 x 4
  covariate              data    model   rsquared
      <chr>            <list>   <list>      <dbl>
1        x1 <tibble [10 x 2]> <S3: lm> 0.33176960
2        x3 <tibble [10 x 2]> <S3: lm> 0.06150498
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

dplyr 和 tidyr - 使用因子一次性计算大量线性模型 的相关文章

  • 在 R 中运行 glmnet 包,出现错误“缺少 TRUE/FALSE 需要的值”,可能是由于缺少值?

    我正在尝试使用glmnet来自glmnet运行 LASSO 回归的包 我正在使用以下命令 library glmnet glmnet a b family binomial alpha 1 我收到错误 gt Error in if all
  • 可以使用部分名称访问列表成员吗?这是一个功能吗?

    考虑这个 R 代码 gt l list key 1 gt l k 1 1 gt l ke 1 1 gt l k NULL gt names l 1 key 这是否意味着您可以使用以下方式访问列表成员 及其部分名称 当我在一次令人沮丧的错误搜
  • 在r中水平旋转直方图

    谁能帮我如何在 r 中将直方图旋转 90 度 我知道箱线图中有一个选项 horiz T 但我不知道直方图是否有类似的选项 我认为你必须使用 hist 和 barplot 来完成它 如下所示 直接来自文档 你可以在这里检查它 layout x
  • 使用条件求 R 中的累积和

    我需要创建一个新变量 其中包含每个 ID 过去三年金额的总和 如果没有三年的数据 则应显示 NA 举个例子 ID YEAR AMOUNT 1 2010 5 1 2011 2 1 2012 4 1 2013 1 1 2014 3 2 2013
  • 将值排列在特定组内

    我试图在嵌套数据帧的精确组内按降序排列值 我的输入数据如下所示 我有两个分组变量 group1 and group2 和三个值 即id value2 value3 library tidyverse set seed 1234 df lt
  • 如何从 Matlab 运行 R 脚本 [重复]

    这个问题在这里已经有答案了 我有 m 文件 我想用它来运行 R 脚本 我怎样才能做到这一点 Matlab文件 caller m some matlab code need to call a R script some matlab cod
  • 在模块中使用shiny的renderUI

    这是我在 stackoverflow 上的第一个问题 我在闪亮 1 0 5 中遇到模块和 renderUI 的问题 当我在中使用 renderUI 时 Main Part ui lt bootstrapPage uiOutput Dynam
  • 将数据帧单列中的值向上移动

    使用这样的示例数据 example data frame x c 1 2 3 4 5 6 7 8 y c 1 2 3 4 5 6 7 8 z c 1 2 3 4 5 6 7 8 看起来像这样 x y z 1 1 1 1 2 2 2 2 3
  • 如何从线性模型 (lm) 预测 x 值

    我有这个数据集 x lt c 0 40 80 120 160 200 y lt c 6 52 5 10 4 43 3 99 3 75 3 60 我使用计算了一个线性模型lm model lt lm y x 我想知道的预测值x如果我有新的y值
  • 在 jupyter 笔记本中内联显示 R ggplots

    我正在尝试运行这里找到的一个简单示例 https www datacamp com community blog jupyter notebook r gs OczVCjA https www datacamp com community
  • 获取R中另一列值为1的列的中位数

    好的 我有一个类似于此结构的 csv 文件 hashID value flag 98fafd 35 1 fh56w2 25 0 ggjeas 55 1 adfh5d 45 0 基本上我想要做的是获取值列的中位数 但只包含其中的行flag 1
  • 如何根据一个值过滤远程表?

    我正在做一个filter using in 但 dplyr 翻译查询的方式似乎不正确 事实上 in 运算符对于多个值可以正常工作 但当仅存在单个元素时则不行 在我最初的场景中 过滤值是动态的 因此我希望有一个在这两种情况下都有效的函数 my
  • 如何将第一行更改为R中的标题?

    我有下表 X 5 X 6 X 7 X 8 X 9 X 10 X 11 X 12 X 13 17 Zip CuCurrent PaCurrent PoCurrent Contact Ext Fax email Status 18 74136
  • 将 jupyter R 内核与 Visual Studio 代码结合使用

    对于 python jupyter 笔记本 我目前正在使用 VSCode python 扩展 但是我找不到任何使用替代内核的方法 我对 jupyter R 内核特别感兴趣 有没有办法在 VSCode 中使用 R 内核来处理 jupyter
  • 使用 dplyr 对 R 中所有因变量进行分组汇总统计

    我正在尝试为 10 个因变量中的每一个生成分组 听力 我的自变量 因此 HL 和 NH 是两个组 汇总统计数据 平均值 标准差 最小值 最大值 标准误差等 我可以使用以下 2 个代码对一个变量 R PTA 执行此操作 1 RightPTA
  • 替换 gtable 中 ggplot 的元素:标签和网格线

    我正在学习操纵ggplot对象与gtable 这是我问的一个相关问题 用 grid 和 gtable 拆解 ggplot https stackoverflow com questions 27750737 dismantling a gg
  • merge.zoo 删除时区

    的结果merge zoo与其输入的时区不同 考虑下面的例子 library zoo zoo a zoo data frame a 1 5 seq as POSIXct 2014 01 01 00 00 01 tz UTC as POSIXc
  • 使用条件函数在 data.table() 中分配多列

    在上一个问题中在 dplyr mutate 中返回一个列表 https stackoverflow com questions 21630406 return a list in dplyr mutate noredirect 1 comm
  • 如何使用 2 个不同的 y 轴进行绘图?

    我想在 R 中叠加两个散点图 以便每组点都有自己的 不同的 y 轴 即在图上的位置 2 和 4 中 但这些点看起来叠加在同一个图上 是否可以这样做plot Edit显示问题的示例代码 example code for SO question
  • OpenBUGS:伯努利分布中缺失值

    我正在尝试通过 R R2OpenBUGS 使用 OpenBUGS 将观察 时间 建模为随机变量 如果所有观察时间都可用 没有 NA 则一切正常 但如果我将其中一个时间设置为 NA 则什么也不会发生 我使用 WinBUGS 测试了相同的代码

随机推荐

  • 用Java向多个收件人发送邮件

    我想使用以下方法向多个收件人发送消息 message addRecipient Message RecipientType TO String arg1 Or message setRecipients Message RecipientT
  • 对于 Windows 窗体来说,PostMessage to self 相当于什么?

    我正在编写一个源自的自定义控件System Windows Forms Control 该控件正在使用Control KeyDown事件 观察击键 我应该处理一些击键 例如
  • 识别相同 OleDbException 类型的异常

    我有以下代码来验证另一个应用程序是否以独占模式打开 MSAccess 2003 数据库 数据库已有密码 OleDbConnectionStringBuilder conString new OleDbConnectionStringBuil
  • 将矩阵图像定位在图像视图的中心

    我创建了一个图像库 一切正常 需要放大和移动图像 ImgView setScaleType ImageView ScaleType MATRIX 当我这样做时 我得到的图像很小 所以我调用了该方法 scaleFactor view getW
  • C# 将函数源代码转换为字符串

    在 C 中 有没有办法将函数的源代码转换为字符串 有点像 JavaScript 中的实现方式 我需要这个 因为我正在为 Asp Net 控件编写一些文档 并且希望在结果旁边显示原始源代码 而不是复制 粘贴它 简短的回答 不 长答案 您可以使
  • android 上的 chromium 中的 kiosk 模式或全屏模式

    我已经为我的 Android 设备构建了一个 chromium ContentShell 如下所述 https code google com p chromium wiki AndroidBuildInstructions https c
  • plpgsql CREATE FUNCTION 在“CREATE”处或附近出现语法错误

    即使我清空所有 DECLARE 块和 BEGIN END 块并尝试返回一个字符串 似乎也无法将此函数创建为 Create 谁能帮我解决我在这里做错的事情吗 尝试在 pgAdminIII Ubuntu 中执行此命令 CREATE OR REP
  • 如何获取给定字符串中数字字符的总数? [关闭]

    这个问题不太可能对任何未来的访客有帮助 它只与一个较小的地理区域 一个特定的时间点或一个非常狭窄的情况相关 通常不适用于全世界的互联网受众 为了帮助使这个问题更广泛地适用 访问帮助中心 help reopen questions 如何计算字
  • 每个标记的可变宏扩展

    假设我有一个宏 一个只调用函数的简单宏foo对于不同类型 define FOO type foo type 一次 假设我想将这个东西称为多种不同类型 具体来说 foo int foo float foo point2d 我想用一个名为的宏生
  • Docker-compose 默认排除服务

    如果我在 docker compose 项目中定义了很多服务 如何从默认服务中排除某个服务docker compose up命令 例如 我有一个 nginx 服务和一个 ssl 服务 它们发生冲突 因为它们都消耗端口 80 所以我怎样才能使
  • Java 模式在“ABC”中查找两组两个字母

    我有一个这样定义的模式 private static final Pattern PATTERN Pattern compile a zA Z 2 在我的代码中我正在这样做 Matcher matcher PATTERN matcher m
  • 我想在android中读取图像中的exif信息。我可以从图库中的图像读取 exif,但无法读取从相机拍摄的 exif 照片

    如上图所示 我选择的是拍照 exif信息为空 我从手机选项中选择了图像 并且 exif 信息不为空 现在可以通过 ExifInterface 支持库从流中读取 EXIF 数据 compile com android support exif
  • textarea 的 window.getSelection() 在 Firefox 中不起作用?

    我正在尝试获取 HTML 页面上的选择文本 我使用下面的代码 并且window getSelection 文本区域接缝在 Firefox 中不起作用 但在 Google Chrome 中运行良好 我使用的是 Firefox 24 和 chr
  • 在android中安装应用程序时创建文件夹

    我们可以在应用程序安装期间在设备的内部存储上创建一个目录吗 创建该目录后 我需要将一些图像和音乐从我们的 res 文件夹复制到该目录 有人对在安装时创建目录有什么想法吗 提前致谢 public void onCreate Bundle sa
  • 如何查看用C/C++编写的函数的源代码? [复制]

    这个问题在这里已经有答案了 一般来说 用 R 编写的函数的源代码只需在 R 控制台上输入函数名称即可查找 对于用 C 或 C 编写的函数如何做到这一点 例如当我尝试查找代码时lapply 函数 它向我展示了这个 function X FUN
  • 减少寻找 N 线交点所需的时间

    有N水平或垂直的线段 现在我需要找出交点总数和每条线段的交点总数 N可以达到100000 我尝试检查每一对线 答案是正确的 但我需要减少它所花费的时间 这是我的代码 using namespace std typedef struct Po
  • 在 Android 中检查并启用磁传感器校准

    我在 Android 应用程序中使用磁传感器校准来实现增强现实 当应用程序长时间使用时 传感器校准会逐渐减少 有没有办法检查校准并自动启用或提示用户再次进行手动校准 不幸的是 对于 AR 类型的应用程序 我不知道如何知道磁传感器是否已正确校
  • Find_by_sql 作为 Rails 范围

    Sitepoint 的 r937 非常友善地帮助我找出从数据库返回正确结果所需的查询 我需要的是能够使用这个查询作为范围 并且能够将其他范围链接到这个范围上 查询是 SELECT coasters FROM SELECT order rid
  • JavaScript:“函数体后缺少 } 语法错误”

    好吧 你知道这个错误了 但是我到底为什么会收到这个错误呢 当它在本地运行时 我根本没有收到任何错误 但是当我上传我的项目时 我遇到了这个恼人的语法错误 我已经检查过Firebug https en wikipedia org wiki Fi
  • dplyr 和 tidyr - 使用因子一次性计算大量线性模型

    在阅读了 tidyverse 的更多内容后 我开始立即拟合许多线性模型 如中所述this https blog rstudio org 2016 02 02 tidyr 0 4 0 也就是说 我会按照以下方式做一些事情 library dp