在 group_by() %>% mutate() 函数调用中使用带引号的变量

2024-02-15

可重现的例子

cats <-
  data.frame(
    name = c(letters[1:10]),
    weight = c(rnorm(5, 10, 1), rnorm(5, 20, 3)),
    type = c(rep("not_fat", 5), rep("fat", 5))
  )

get_means <- function(df, metric, group) {
  df %>%
    group_by(.[[group]]) %>%
    mutate(mean_stat = mean(.[[metric]])) %>%
    pull(mean_stat) %>%
    unique()
}

get_means(cats, metric = "weight", group = "type")

我尝试过的

我希望得到两个值，但我得到一个值。看来 groupby 失败了。

我尝试了所有方法，包括使用 quo()、eval() 和 Replace()、UQ()、!! 以及一大堆其他方法来尝试使 group_by() 中的内容正常工作。

这看起来非常简单，但我无法弄清楚。

代码推理

决定将变量放在引号中是因为我在 ggplot aes_string() 调用中使用它们。我在函数中排除了 ggplot 代码以简化代码，否则会很容易，因为我们可以使用标准评估。

我认为在 tidyeval 框架中执行此操作的“预期”方法是将参数作为名称（而不是字符串）输入，然后使用引用参数enquo(). ggplot2了解整洁的评估运算符，因此这适用于ggplot2以及。

首先，让我们调整一下dplyr您的示例中的摘要函数：

library(tidyverse)
library(rlang)

get_means <- function(df, metric, group) {

  metric = enquo(metric)
  group = enquo(group)

  df %>%
    group_by(!!group) %>%
    summarise(!!paste0("mean_", as_label(metric)) := mean(!!metric))
}

get_means(cats, weight, type)

  type    mean_weight
1 fat            20.0
2 not_fat        10.2

get_means(iris, Petal.Width, Species)

  Species    mean_Petal.Width
1 setosa                0.246
2 versicolor            1.33 
3 virginica             2.03

现在添加到ggplot中：

get_means <- function(df, metric, group) {

  metric = enquo(metric)
  group = enquo(group)

  df %>%
    group_by(!!group) %>%
    summarise(mean_stat = mean(!!metric)) %>% 
    ggplot(aes(!!group, mean_stat)) + 
      geom_point()
}

get_means(cats, weight, type)

我不确定您想要什么类型的图，但您可以使用整洁的评估来绘制数据和汇总值。例如：

plot_func = function(data, metric, group) {

  metric = enquo(metric)
  group = enquo(group)

  data %>% 
    ggplot(aes(!!group, !!metric)) + 
      geom_point() +
      geom_point(data=. %>% 
                   group_by(!!group) %>%
                   summarise(!!metric := mean(!!metric)),
                 shape="_", colour="red", size=8) + 
      expand_limits(y=0) +
      scale_y_continuous(expand=expand_scale(mult=c(0,0.02)))
}

plot_func(cats, weight, type)

仅供参考，您可以使用以下命令允许函数采用任意数量的分组变量（包括无）...论证和enquos代替enquo（这还需要使用!!!（取消引号拼接）而不是!!（取消引用））。

get_means <- function(df, metric, ...) {

  metric = enquo(metric)
  groups = enquos(...)

  df %>%
    group_by(!!!groups) %>%
    summarise(!!paste0("mean_", quo_text(metric)) := mean(!!metric))
}

get_means(mtcars, mpg, cyl, vs)

    cyl    vs mean_mpg
1     4     0     26  
2     4     1     26.7
3     6     0     20.6
4     6     1     19.1
5     8     0     15.1

get_means(mtcars, mpg)

  mean_mpg
1     20.1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

tidyeval

在 group_by() %>% mutate() 函数调用中使用带引号的变量的相关文章

更快的 %in% 运算符

The 快速匹配 https cran r project org web packages fastmatch index html包实现了更快的版本match对于重复匹配例如在循环中 set seed 1 library fastma
排序因素与水平

有人能解释一下 R 中 ordered 参数的用途吗 R says ordered逻辑标志来确定级别是否应被视为有序按给定的顺序所以如果我有一个名为名称的因素并设置ordered TRUE names lt factor c fred
当有很多列时，使用 readr::read_csv() 导入数据时覆盖列类型

我正在尝试使用 R 中的 readr read csv 读取 csv 文件我导入的 csv 文件大约有 150 列我只包含示例的前几列我希望将第二列从默认类型我执行 read csv 时为日期覆盖为字符或其他日期格式 GIS Jo
通过使用 navbarPanel() 并隐藏导航栏构建多页闪亮应用程序用户端（在 ui.R 中）？

我想构建一个多页闪亮应用程序我可以在其中控制用户可以看到哪个页面迪安阿塔利确实这个演示应用程序中有类似的东西 https github com daattali advanced shiny tree master multiple
用表达式分割轴标签

我有一个带有包含表达式的长标签的图我想将其分成两行在表达式中添加 n 结果不符合预期 ylabel lt expression A very long label with text and n expression alpha bet
R 中按时间划分的平均值

我每秒测量一次化合物浓度我想求 30 秒和 60 秒的平均值我一直在阅读这里的帖子我尝试过lubridate and dplyr 但没有运气我正在努力完成这项工作但我一直没能做到我正在从 SAS 过渡到 R 所以请耐心等待这是
R 将多个值与向量进行比较并返回向量[重复]

这个问题在这里已经有答案了我有一个向量 A 对于 A 的每个元素我想检查它是否等于第二个向量 Targets 中的任何元素我想要一个逻辑值向量其长度为 A 作为返回也提到了同样的问题here http r 789695 n4 na
如何在knitr和RStudio中为word和html设置不同的全局选项？

我正在使用 RStudio 0 98 932 和 knitr 1 6 想要为word和html设置不同的全局knitr选项例如想要将word的fig width和fig height设置为6 html的fig width和fig hei
跟踪循环迭代

抛硬币成功你赢100 否则你输50 你会一直玩直到你口袋里有钱a 的价值如何a在任何迭代中都被存储 a lt 100 while a gt 0 if rbinom 1 1 0 5 1 a lt a 100 else a lt a 50
使用字符串中的变量名称访问变量值，R

Intro 一个数据集有大量的age year变量 age 1990 age 1991 etc 我有一个字符串值数组length age years 表示这些变量使得age years 1 回报 age 1990 etc Need 我想搜
randomForest 包在删除一个预测类时的奇怪行为

我正在运行一个随机森林模型它产生的结果从统计角度来看对我来说完全没有意义因此我确信有些东西mustrandomForest 包的代码出现错误至少在模型的本次迭代中预测左侧变量是具有 3 种可能结果的政党 ID 民主党独立党共和
rpart“as.character(x) 中的错误：无法强制类型 'builtin' 为类型 'character' 的向量”消息是什么意思？

我一直在用头撞rpart几天了尝试为我拥有的这个数据集制作分类树我认为现在是时候询问生命线了我确信这是我没有看到的愚蠢的事情但这里是我一直在做什么 EuropeWater lt read csv file paste Users a
将字符串列拆分为多个虚拟变量

作为 R 中 data table 包的相对缺乏经验的用户我一直在尝试将一个文本列处理为大量指示符列虚拟变量每列中的 1 表示特定的子字符串是在字符串列中找到例如我想处理这个 ID String 1 a b 2 b c 3 c 进入
R - 计算 bin 中特定值的数量

我有一个如下所示的数据框 df Value lt c 1 1 0 2 1 3 4 0 0 1 2 0 3 0 4 5 2 3 0 6 Sl lt c 1 20 df lt data frame Sl Value gt df Sl Value
purrr::可能函数可能无法与map2_chr函数一起使用

我怀疑这是 purrr 包中的错误但想先在 StackOverflow 中检查我的逻辑在我看来 possibly功能在内部不起作用map2 chr功能我正在使用 purrr 版本 0 2 5 考虑这个例子 library dplyr
正态分布平均值的贝叶斯推理玩具 R 代码 [降雪量数据]

我有一些降雪观测 x lt c 98 044 107 696 146 050 102 870 131 318 170 434 84 836 154 686 162 814 101 854 103 378 16 256 我被告知它遵循正态分布
R 闪亮仪表板中的动态重复条件面板

我正在尝试创建一个动态条件面板所以我的条件如下在用户界面中输入 selectInput inpt Input Number seq 1 50 1 selectize FALSE 我的条件面板 UI 输入是 conditionalPane
警告消息 - 来自 dummies 包的 dummy

我正在使用 dummies 包为分类变量生成虚拟变量其中一些变量具有两个以上类别 testdf lt data frame A as factor c 1 2 2 3 3 1 B c A B A B C C C c D D E D D E
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
绘制 Cox 回归的 Kaplan-Meier 图

我使用 R 中的以下代码设置了一个 Cox 比例风险模型来预测死亡率添加协变量 A B 和 C 只是为了避免混淆即年龄性别种族但我们真正对预测变量 X 感兴趣 X 是一个连续变量 cox model lt coxph Surv t

随机推荐

如何与其他进程共享现有的 char * ？

我正在尝试使用其他分叉执行的进程共享一些内存shmget and shmat char test test int shID char shptr key t shkey 2404 shID shmget shkey sizeof cha
PAnsiChar 和 PChar 的区别

PAnsiChar 和 PChar 之间有区别吗是什么类型德尔福2007年之前先感谢您 D2009 及之后是的有 PChar是一个指向 a 的指针Char这是一个 unicode 字符 aWideChar And PAnsiCha
如何启用 PostgreSQL 函数分析器？

这花了我一段时间才弄清楚几周前我在一个外语维基上找到了答案它非常有帮助所以我想我会分享在 Win32 上的 PostgreSQL 8 3 上默认情况下会安装分析插件但不会加载只需执行以下 SQL LOAD libdir plu
如何设计轮播点样式？

我如何将我的旋转木马点设计成这样这是我现在所拥有的这是我的风格 slick dots position absolute bottom 45px list style none display block text align cent
在生产 Java 服务器中打开 GC 日志记录是常见做法吗？

我在一些地方 1 看到人们在生产服务器关键任务中启动 GC 日志记录例如 java server Xms1024m Xmx1024m XX NewSize 256m XX MaxNewSize 256m XX UseConcMarkS
当我点击它们时如何更改圆半径（使用 Three.js）？

我有以下 JavaScript 代码取自一个示例它绘制了一些圆圈当您单击其中一个圆圈时它会改变颜色但我还想在单击该圆圈时更改该圆圈的半径大小并保持其他圆圈不变这文档 https threejs org docs index
如何解码 HTML 实体？

这是一个 Perl 快速问题如何转换 HTML 特殊字符例如 uuml or 039 转换为普通 ASCII 文本我从这样的事情开始 s d chr 1 eg 并且可以为所有 HTML 字符编写它但是像这样的函数可能已经存在请注意
在按下和释放鼠标时绘制矩形，opengl

我试图根据用户输入绘制一个矩形该矩形从左键单击收集 x1 y1 坐标然后从左键单击的释放指定 x2 y2 我成功保存了基于此鼠标操作的坐标基于确认保存坐标的 cout 这是我尝试过的请记住没有任何崩溃因此存在逻辑错误 void
如何使用 Factorplot 用分类值注释条形或绘制 4 个变量？

我有一个要绘制的数据框我想到了两个选择检查图像对于选项 1 我需要注释一个分类值 Elec 对于选项 2 我仍然需要使用 factorplot 但我不知道如何修复收到的错误 CODE FOR THE DATAFRAME raw dat
Bootstrap 4 有内置水平分隔线吗？

Bootstrap 4 有内置水平分隔线吗我可以做这个但我想使用内置的 bootstrap css 我在文档中找不到它也许我错过了它 HTML 已经有一个内置的水平分隔符称为 hr 水平规则的缩写 Bootstrap 风格像这样
哪些方法可以访问源代码？

有多种方法可以从需要加载该库的 Ruby 代码中访问该库的源代码其中有的直接读取库文件并解析其他人通过一些内置方法访问源代码这些方法提供有关源代码的信息例如抽象语法树在我无法直接读取文件内容的情况下如前面的方式访问源的唯一
如何使用公共类上的静态变量在活动之间传递数据？

我试图在公共类上使用静态变量来在活动之间传递它们我在这样做时遇到了一个罕见的问题我正在为活动的静态变量赋予值此活动调用 GLSurfaceView 并监听屏幕方向的变化如果我为 GLSurfaceView 上的静态变量赋予值那么一
iOS 如何保存录制的音频？

我正在开发一个应用程序其中音频被录制并转录为文本我正在使用 Nuance Developers 提供的 Speechkit 我要添加的功能是将录制的音频文件保存到永久内存在表格视图中显示音频文件稍后加载保存的音频文件播放音频文件
从 MPEG TS 中提取 PCR 时间值

我正在尝试从 MPEG TS 数据包中提取 PCR 时间值根据wiki http en wikipedia org wiki MPEG transport stream PCR 包含 33 6 9 位并且还指出前 33 位基于 90 k
将文件插入 Google Drive 时出现 IOException

我在将图像发布到 Google 云端硬盘时遇到以下问题 java io IOException insufficient data written at sun net www protocol http HttpURLConnection
locationManager didUpdateLocations 在设备上触发两次，在模拟器上仅触发一次

相同的代码我假设设备实际上由于某种原因更新了位置两次即使我只调用 startUpdatingLocation 一次并且在 didUpdateLocations 内部运行一些 stopUpdatingLocations func loca
如何在 Android Jetpack Compose 中使用字符串资源？

让我有以下内容strings xml资源文件
python中uuid4和秘密token_bytes有什么区别？

检查了两者的cpython源代码secrets https github com python cpython blob master Lib secrets py and uuid4 https github com python cpy
使用 function-java 向 Java 生产项目添加闭包有多安全？

我很想在 Java 中使用闭包我读到过它们可能会也可能不会进入 Java 7 但是有一个名为函数式java http code google com p functionaljava 已经实现了包括闭包在内的功能特性在企业生产应用程序
在 group_by() %>% mutate() 函数调用中使用带引号的变量

可重现的例子 cats lt data frame name c letters 1 10 weight c rnorm 5 10 1 rnorm 5 20 3 type c rep not fat 5 rep fat 5 get mean

在 group_by() %>% mutate() 函数调用中使用带引号的变量

在 group_by() %>% mutate() 函数调用中使用带引号的变量 的相关文章

随机推荐

热门标签

在 group_by() %>% mutate() 函数调用中使用带引号的变量的相关文章