使用 purrr 和 dplyr： rlang::sym 是最好的方法

2023-12-09

我想编写使用 dplyr 动词的函数，这意味着我必须涉入rlang.

提供一个具体的例子，假设我想使用purrr::map_df()迭代 a 中的变量dplyr::group_by(). The 使用 dplyr 编程小插图走过写一个my_summarise()功能;使用的方法rlang::enquo()在分组变量上，然后取消引用!!。这种方法可以创建一个类似 dplyr 的新函数，该函数采用不带引号的变量名（my_summarise(df, g1)在小插图中）。

相反，我想 purrr 以字符串形式提供变量名称。是rlang::sym()正确的方法是这样做吗？好像不是，因为sym()dplyr 编程小插图中没有提到，rlang 中也几乎没有提到整洁的评价文章。有没有更好的办法？

library(tidyverse)
my_summarise <- function(df, group_var) {
  group_var <- rlang::sym(group_var)

  df %>%
    group_by(!!group_var) %>%
    summarise(mpg = mean(mpg))
}

# This works. Is that a good thing?
purrr::map_df(c("cyl", "am"), my_summarise, df = mtcars)

# A tibble: 5 x 3
    cyl   mpg    am
  <dbl> <dbl> <dbl>
1  4.00  26.7 NA   
2  6.00  19.7 NA   
3  8.00  15.1 NA   
4 NA     17.1  0   
5 NA     24.4  1.00

作为后续，为什么简单地取消引用（不首先应用enquo or sym）有时工作？在下面的例子中，为什么select()按预期工作但是group_by()不是吗？

x <- "cyl"
select(mtcars, !!x)
group_by(mtcars, !!x)

更新：答案与取消引用无关。就是那个select更灵活，可以处理字符串，而group_by can't.

其他参考：这个博客文章作者：埃德温·托恩。

简短的回答：是的。

如果你想map在列上，sym是一个很好的方法。莱昂内尔·亨利展示sym in the 草稿插图.

如果您想要传递列名称，但不尝试迭代，Kirill Müllerprefers quo。在下面的示例中，它们具有相同的效果。

library(dplyr)

x <- rlang::quo(cyl)
y <- rlang::sym("cyl")
identical(group_by(mtcars, !!x), group_by(mtcars, !!y))  # TRUE

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 purrr 和 dplyr： rlang::sym 是最好的方法的相关文章

如何测试字符串中的前三个字符是r中的字母还是数字？

下面给出了我拥有的数据集的示例请注意总数据集中我有超过两列 ID X 1 MJF34 2 GA249D 3 DEW235R 4 4SDFR3 5 DAS3 我想测试 X 中的前三个字符是否是字母如果是那么我想替换该值以仅显示前三个字
直接来自数据的马尔可夫模型图（makovchain 或 deemod 包？）

我想读取一堆因子数据并从中创建一个可以很好地可视化的转换矩阵我发现了一个非常好的软件包称为 heemod 它与 diagram 一起工作得不错对于我的第一个快速而肮脏的方法我运行了一段 Python 代码来获取矩阵然后使用这个 R
R + ggplot2 - 无法分配大小为 128.0 Mb 的向量

我有一个 4 5MB 9 223 136 行的文件其中包含以下信息 0 0 0 0147938 3 67598e 07 0 0226194 7 35196e 07 0 0283794 1 10279e 06 0 033576 1 470
如果我有一个包含计数的表格，如何获得直方图/摘要统计数据？ [复制]

这个问题在这里已经有答案了我习惯了像这样的观察向量c 1 1 1 3 4 我可以在上面看到汇总统计数据和绘制直方图等但现在我发现自己拥有相同的数据但采用如下压缩格式 value numObs 1 3 3 1 4 1 当数据以data
如何为 nls 函数找到良好的起始值？

我不明白为什么我不能对这些数据使用 nls 函数我尝试过很多不同的起始值但总是出现相同的错误这是我一直在做的事情 expFct2 function x a b c a 1 exp x b c vec x lt c 77 87 87 7
如何解决在Windows中运行R时出现“剪贴板缓冲区已满且输出丢失”错误？

我正在尝试将一些数据直接从 R 复制到我的 Windows 计算机中的剪贴板我发现在一些网站上使用 file clipboard 可以工作确实如此但对于非常小的数据集例如如果我复制一个小数据集 100 个 obs 它会顺利工作 d
重叠并固定小平面中的 x 尺度（尺度=“自由”）以制作电影

在另一篇文章中 Justin 的帮助下我用以下方法绘制了模拟结果facet gridggplot2 中的选项包含数据和答案的帖子在这里使用facet grid选项通过ggplot2绘制数据框的列 https stackoverflow
基于多列重新编码数据框列[重复]

这个问题在这里已经有答案了如何根据其他列的值重新编码列假设我有以下数据框我想重新编码df Col3使得该值为 0 如果df Col1 x and df Col2 a gt df lt data frame a c rep x 3 re
删除ggplot2 geom_bar中没有数据的日期列[重复]

这个问题在这里已经有答案了我想隐藏 ggplot2 中没有数据的列这是使用 nycflights13 库的可重现示例 library nycflights13 library dplyr library ggplot2 small da
Sweave + RweaveHTML：cat 输出未出现在输出中

我对 Sweave RweaveHTML 有疑问我希望 cat 的输出最终出现在正在生成的 html 文件中我有一个案例它没有我不明白为什么 test function bla bla cat Result is 然后在 Rnw 文
R：几个单独图的重新排序因子水平

我正在尝试从同一个 data frame 创建多个单独的图每个图的 y 轴上的因子水平顺序不同每个图都应该对 y 上的因子水平进行递减排序我知道这可以为每个图手动完成但我正在寻找一种更有效和更优雅的方法因为我需要创建相当多的图这
在函数中调用其他列的控制流程

我正在尝试在给定条件的情况下连接到函数中的其他列本质上我想让数据框在给定条件的情况下从长到宽其中一列中的这些值是NA相对于同一行中具有值的另一列转动NAs转化为特定的数字尽管分配的值必须是特定于列的因此如果2010 has N
R - 对矩阵的每行/列应用具有不同参数值的函数

我试图将函数应用于矩阵的每一行或每一列但我需要为每一行传递不同的参数值我以为我熟悉 lapply mapply 等但可能还不够举个简单的例子 gt a lt matrix 1 100 ncol 10 gt a 1 2 3 4 5 6
使用 R 中“rpart”包中的生存树来预测新的观察结果

我正在尝试使用 R 中的 rpart 包来构建生存树并且我希望使用这棵树来对其他观察结果进行预测我知道有很多涉及 rpart 和预测的问题但是我还没有找到任何解决我认为特定于将 rpart 与 Surv 对象一起使用的问题的方法
使用示例代码继续在 ggplot2 中遇到错误“loop_apply”未从当前命名空间（plyr）解析”

我今天一直遇到这个错误我已经从 github 下载了 plyr 但它仍然不起作用安装 plyr 后我重新启动了 R studio 甚至我的电脑看来问题可能是由于 R 解析对外部 DLL 的引用的方式发生了变化正如线程中途提到的he
在 R 中按邮政编码绘制美国地图上的点，并插入阿拉斯加和夏威夷

我正在尝试以密度点格式在美国地图上绘制点其中每个邮政编码的点的大小根据该邮政编码中从事某种职业的人数而定我已经非常接近我需要的东西但正在努力获取阿拉斯加和夏威夷的坐标它们需要在插图上这里的第一组代码是我所拥有的 loc full2
Quanteda 包，朴素贝叶斯：如何预测不同特征的测试数据？

I used quanteda textmodel NB创建一个模型将文本分类为两个类别之一我将模型拟合到去年夏天的训练数据集上现在我今年夏天尝试使用它对我们在工作中收到的新文本进行分类我尝试这样做并收到以下错误 Error in
寻找一种有效的方法来计算两个表中间隔集之间的重叠数量？

注意为了方便起见我使用上一篇文章中的示例数据集假设有两个数据集 ref and map 他们是 ref lt data table space rep nI 3 t1 c 100 300 500 t2 c 150 400 600 id
错误：列索引必须最多为 1，如果... heatmap.2

我在 heatmap 2 中收到错误我在这里发现了类似的错误R knnImputation 给出错误 https stackoverflow com questions 45117125 r knnimputation giving er
如何更改 R Markdown HTML 文档中目录的颜色和属性？

我花了很多时间谷歌搜索这个但似乎无法弄清楚我正在使用 R Markdown 制作 HTML 文档文档在这里 http rmarkdown rstudio com html document format html http rmark

随机推荐

使用 Python 3.6 通过个人访问令牌向 VisualStudioOnline REST API 进行身份验证

我正在尝试使用 python 3 6 来使用 VisualStudioOnline REST API 大量使用 python 2 x 的示例 python 脚本响应是通用的 html 登录页面我已经使用 REST Console Chro
getline 无法正常工作？可能是什么原因？ [复制]

这个问题在这里已经有答案了可能的重复 getline 不要求输入我的程序中发生了一些独特的事情以下是一些命令集 cout lt lt Enter the full name of student cin name getline ci
如何更新嵌套字典中键的值？

items id 1 language English name Sarah description Blah blah id 2 language English name Jessica description More blah d
Mercurial 通过变更集获取分支名称

我已经尝试过 hg log rev branch changeset 但我得到的是这个分支中所有变更集的集合我想要得到的是目标分支的名称例如默认而不是整个集合有办法实现这个目标吗这不是转速设置的目的你想做一些完全不同的事情 h
如何修复 java.lang.InknownClassChangeError：使用 cxf 实现类

我们在运行 openjdk 版本 1 8 0 201 的 RedHat linux 环境中的 tomcat 8 上进行 SOAP 客户端调用时遇到问题而在 Windows 计算机 tomcat 8 Oracle java 8 上使用类似的
在 django 表中设置 AUTOINCRMENT 值

我在mysql中有如下表 CREATE TABLE portal asset id int 11 unsigned NOT NULL AUTO INCREMENT asset id int 11 NOT NULL ENGINE InnoDB
编译器优化问题

大部分功能都在
Python Git 模块经验？ [关闭]

Closed 这个问题是基于意见的目前不接受答案人们对 Python 的 Git 模块有什么体验我知道 GitPython PyGit 和 Dulwich 如果您知道其他的请随意提及我正在编写一个程序该程序必须与 Git 存储库
持久矩形选择器

我正在尝试开发一个处理天文数据的管道在某些时候我需要在图像上绘制一个矩形来选择一个区域我正在使用 matplotlib widgets RectangleSelector 来做到这一点对我来说使用起来非常方便因为它非常容易使用我
无需 Android Studio 即可运行 AVD 模拟器

有没有一种方法可以在不先启动 Android Studio 的情况下运行模拟器也许来自命令行我知道这个功能在旧版本中可用但从那时起就消失了但也许有人知道如何做到这一点从控制台运行模拟器的方法我假设您之前使用 Android St
使用“gsub”替换点

我正在尝试替换所有在我的数据框的特定列中带有每个单元格中还有其他字符我想确保只更改当我使用 gsub 时我得到的输出似乎进行了更改但是当我转到 View 时实际上并未进行更改我认为 gsub 应该实际更改数据框中的值是我使
Android Google Mapview Activity 未在 Android Studio 中打开

我是 Android 新手正在尝试在 Android 手机上显示 Google 地图我创建了适用于任何 Android 应用程序的 API 密钥我没有为我的应用程序提供任何特定的 SHA 我想这应该不重要使用 Google Andr
find 与 find_by 与 where

我是 Rails 新手据我所知查找记录的方法有很多种 find by
如何使用 python pandas 的 read_html 读取具有多个 tbodies 的 html 表？

这是我的html import pandas as pd html table table thead tr th Col1 th th Col2 th tr thead tbody tr td 1a td td 2a td tr tbod
如何将特定文件从一个 git 存储库复制到另一个 git 存储库，并保留历史记录

我有一个旧的私人存储库其中包含我想要放入 GitHub 的文件但是我只想包含某些文件或者可能只包含具有特定文件扩展名的文件及其提交历史记录但是我不想在提交历史记录中包含任何排除的文件我想提供一个我想要复制的此类文件的列表是理想的
需要几个月之间完整的高图表条形图

我已经创建了高图表来完全满足我的要求如附图所示并且我在小提琴中尝试了下面的代码 fiddle中的示例代码如下 https jsfiddle net vsLr07ak 下面是我的代码 Highcharts chart container
在没有证书的java SSL over https中[关闭]

Closed 这个问题需要多问focused 目前不接受答案是否可以使用 sslHttpURLConnection在Java中不使用证书我想使用随机数或对称密钥虽然SSL TLS 并不严格要求证书 HTTPS 需要证书因为RFC 2
是否可以用 CSS 创建这个不规则四边形？

我已经尝试过perspective解决方案在这里如何分别变换形状的每一面但可能由于形状不规则而无法使其工作只有顶部和右侧的柱子是倾斜的垂直的和底部的柱子是直的我怎样才能用 CSS 做到这一点使用 CSS 边框您可以创建三角形和梯
找不到iPhone模拟器路径[关闭]

Closed 这个问题需要细节或清晰度目前不接受答案目前我正在开发视频上传应用程序我的问题是当我尝试在聚光灯下搜索模拟器路径时我也手动尝试过我只得到了iPhoneSimulator platform文件但在此文件中没有任何文件
使用 purrr 和 dplyr： rlang::sym 是最好的方法

我想编写使用 dplyr 动词的函数这意味着我必须涉入rlang 提供一个具体的例子假设我想使用purrr map df 迭代 a 中的变量dplyr group by The 使用 dplyr 编程小插图走过写一个my summari

使用 purrr 和 dplyr： rlang::sym 是最好的方法

使用 purrr 和 dplyr： rlang::sym 是最好的方法 的相关文章

随机推荐

热门标签

使用 purrr 和 dplyr： rlang::sym 是最好的方法的相关文章