如何使用 purrr 中的映射和 dplyr::mutate 基于列对创建多个新列

2024-01-09

我必须使用 R 来解决以下问题。简而言之，我想根据数据框中不同列对的计算在数据框中创建多个新列。

数据如下：

df <- data.frame(a1 = c(1:5), 
                 b1 = c(4:8), 
                 c1 = c(10:14), 
                 a2 = c(9:13), 
                 b2 = c(3:7), 
                 c2 = c(15:19))
df
a1 b1 c1 a2 b2 c2
1  4 10  9  3 15
2  5 11 10  4 16
3  6 12 11  5 17
4  7 13 12  6 18
5  8 14 13  7 19

输出应该如下所示：

a1 b1 c1 a2 b2 c2 sum_a sum_b sum_c
1  4 10  9  3 15    10     7    25
2  5 11 10  4 16    12     9    27
4  7 13 12  6 18    16    13    31
5  8 14 13  7 19    18    15    33

我可以使用 dplyr 通过以下方式进行一些手动工作来实现此目的：

df %>% rowwise %>% mutate(sum_a = sum(a1, a2),
                          sum_b = sum(b1, b2),
                          sum_c = sum(c1, c2)) %>% 
  as.data.frame()

因此，要做的是：获取其中包含字母“a”的列，逐行计算总和，并创建一个名为 sum_[letter] 的新列。对具有不同字母的列重复此操作。

这是可行的，但是，如果我有一个包含 300 个不同列对的大型数据集，则手动输入将很重要，因为我必须编写 300 个 mutate 调用。

我最近偶然发现了 R 包“purrr”，我的猜测是这将解决我以更自动化的方式做我想做的事情的问题。

特别是，我认为能够使用 purrr:map2 来传递两个列名列表。

list1 = 其中包含数字 1 的所有列
list2 = 其中包含数字 2 的所有列

然后我可以计算每个匹配列表条目的总和，其形式为：

map2(list1, list2, ~mutate(sum))

但是，我无法弄清楚如何使用 purrr 最好地解决这个问题。我对使用 purrr 相当陌生，所以我非常感谢有关此问题的任何帮助。

这是一个选项purrr。我们得到unique的前缀names数据集（'nm1'），使用map (from purrr) 循环访问唯一名称，select该专栏matches'nm1' 的前缀值，使用添加行reduce并绑定列（bind_cols）与原始数据集

library(tidyverse)
nm1 <- names(df) %>% 
          substr(1, 1) %>%
          unique 
nm1 %>% 
     map(~ df %>% 
            select(matches(.x)) %>%
            reduce(`+`)) %>%
            set_names(paste0("sum_", nm1)) %>%
     bind_cols(df, .)
#    a1 b1 c1 a2 b2 c2 sum_a sum_b sum_c
#1  1  4 10  9  3 15    10     7    25
#2  2  5 11 10  4 16    12     9    27
#3  3  6 12 11  5 17    14    11    29
#4  4  7 13 12  6 18    16    13    31
#5  5  8 14 13  7 19    18    15    33

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

purrr

dplyr

如何使用 purrr 中的映射和 dplyr::mutate 基于列对创建多个新列的相关文章

orderBy 随递减排序和递增排序的变化

是否有一种标准方法可以按几列对 data frame 进行排序但会发生减少或增加的变化例如您可能希望按一个变量递减和下一个变量递增对 data frame 进行排序有没有类似的东西 mydf order mydf myvar
R 中具有 NA 值的聚合栅格

我在 R 中有一个分辨率为 1 公里的栅格其 NA 值分布广泛但位置不规则即包含数据的单元格不连续并且 NA 值分散我正在尝试使用用户定义的平均圆角函数包括在下面以 5 公里分辨率因子 5 聚合此栅格使用 raster
中断、保存并稍后继续循环的最佳方法

事情是这样的我有一个需要几天时间才能运行的循环我想中断循环检查进度然后稍后继续目前我正在使用以下内容 for i in 1 100000 Sys sleep i 2 5 print i write csv i i csv 我检查
R：使用 dcast 时包含没有条目的因子

我在数据帧上使用 reshape2 函数 dcast 其中一个变量是某些级别未出现在数据框中的因素但我会将所有值包含在创建的新列中例如假设我运行以下命令 library reshape2 dataDF lt data frame id
不同的分位数：箱线图与小提琴图

require ggplot2 require cowplot d iris ggplot2 ggplot d aes factor 0 Sepal Length geom violin fill black alpha 0 2 draw
corr.test 与 cor.test p 值

我正在尝试使用 psych 包 psych 1 6 9 中的 corr test 但在使用 method spearman 时它似乎给出了与 cor test 不同的 p 值相关系数相同但 p 值不同我整理了一些示例代码和输出如下
R 中的 For 循环分配给数据框

运行 for 循环后我在分配给数据帧时遇到问题当我使用 print 时它给出了我的价值有什么解释吗 salesdate lt rep seq from as Date 2013 12 19 to as Date 2013 12 23
根据绘图单击事件对数据框进行子集化

我有下面的数据框 Name lt c John Bob Jack Number lt c 3 3 5 NN lt data frame Name Number 还有一个简单闪亮的应用程序可以从中创建一个绘图直方图我的目标是单击直方图的一
将 R 传单地图保存为 html：不包括图块

我正在尝试使用 saveWidget 或将 rmd 文件输出到 html 来保存 R 传单地图如下所述将传单输出保存为 html https stackoverflow com questions 30110377 saving lea
使用 dplyr 按组计算加权平均值（并复制其他方法）

我对语法感到困惑dplyr当尝试计算加权平均值时我听从大卫的建议here https stackoverflow com a 27609266 1457380 语法非常透明因此很有吸引力但它似乎没有按我的预期工作低于加权平均值是针对
对 R/Sweave 进行编程以获得正确的 \Sexpr 输出

我在为 Sweave 进行 R 编程时遇到了一些问题 rstats twitter 小组经常指出这里所以我想我应该把这个问题向大家提出我是一名分析师而不是程序员所以在我的第一篇文章中请放轻松问题是我正在使用 R 在 Sweave
是否可以在 R 中创建自定义 pch 形状？

R 中的许多绘图函数都使用图形参数pch指定数据点的形状根据R 文档 https www rdocumentation org packages graphics versions 3 6 2 topics points 有 26 个矢量
将一个大的 xlsx 文件导入到 R 中？

我想知道是否有人知道从大 xlsx 文件 20Mb 导入数据的方法我尝试使用 xlsx 和 XLConnect 库不幸的是两者都使用 rJava 我总是收到相同的错误 gt library XLConnect gt wb lt lo
整理包中的字段说明

我很抱歉因为我知道这个答案可能出现在编写 R 包的手册中但在我阅读和查看其他包的整理字段时我无法 100 弄清楚该字段的用途用简单的语言我的是英语来看包的描述文件中的整理字段有什么作用人们想在那里放什么我认为这来自于某个时
ggplot2：图例中的斜体

我正在尝试编辑图例中的标签以便第一个标签 WT 为纯文本而后续 7 个标签为斜体我一直在使用element text face c plain rep italic 7 但这导致没有任何标签被转换为斜体我有点困惑为什么它不起作用因
在 R 中高效加载稀疏矩阵

我在将数据有效加载到 R 中的稀疏矩阵格式时遇到问题这是我当前策略的不完整示例 library Matrix a1 Matrix 0 5000 100000 sparse T for i in 1 5000 a1 i idxOfCol
R 中的频率加权，与 Stata 的结果比较

我正在尝试分析明尼苏达大学 IPUMS 数据集中的数据1990 年美国人口普查 http usa ipums org usa sampdesc shtml us1990a in R 我正在使用survey http faculty wash
R 中的微秒时间戳

在 CSV 文件中我有几列其中一列有时间戳其中每个时间戳是今天午夜经过的微秒每个 csv 文件仅包含一天内的数据因此这并不含糊我的问题是如何将这些微秒时间戳解析为 R 多谢我的 CSV 文件的一部分 34201881666
使用 ggplot2 在一张画布上绘制多个图形[重复]

这个问题在这里已经有答案了我正在尝试根据此表将两个 ggplot2 图合并为一个图 Type RatingA RatingB 1 One 3 36 2 Two 5 53 3 One 5 57 4 One 7 74 5 Three 4 38
修改x轴刻度标签

我正在尝试更改由生成的箱线图的 x 轴刻度标签ggplot2 x 轴是一个分类变量 HabFac 我想要的是将其刻度更改为 6 个化学品 A E 下面是我的代码 raw data read table Read data p TT ggpl

随机推荐

HTML 元素过多会影响页面性能吗？

我想知道两者之间是否有区别 1 10 000 个可见的表行 2 使用 display none 隐藏 10 000 个表格行我想知道的是如果页面上所有 10 000 行都可见是否会导致页面滚动滞后但如果我隐藏其中的 9000 个这
在 Julia 中将 4 个字节转换为 Float32 的最快方法？

我有一个mmaped 数组Vector UInt8 我想将 4 个字节从特定位置转换为Float32 目前我可以通过以下方式做到这一点 f1 a i reinterpret Float32 x i i 3 f2 a i read IOBuf
基础设施服务合同应该放在哪里？

I have UI 应用 Domain and 基础设施 Layers In my 基础设施图层参考Domain and 应用层注册两者的服务接口Ninject 但我需要在我的应用将服务分层基础设施层然后我需要引用基础设施层在我的应用 L
如何计算 pandas 列（字符串列表）中的值？

我有一个数据框列它是字符串列表 df colors 0 blue green brown 1 2 green red blue 3 purple 4 brown 我想要得到的是 blue 2 green 2 brown 2 red 1 p
仅在另一个管道在谷歌数据流上完成后才执行管道

我想在谷歌数据流上运行一个管道该管道取决于另一个管道的输出现在我只是在本地使用 DirectRunner 运行两个管道 with beam Pipeline options pipeline options as p p beam io
Java，解压缩文件名中包含德语字符的文件夹

我正在尝试解压缩其中包含德语字符的文件夹例如 Aufh nge 我知道在Java 7中它默认使用utf 8 并且我认为是utf 8字符之一这是我的代码片段 public static void main String args th
使用 C# (ASP.NET MVC) 上传 csv 文件

我有一个 CSV 文件其中包含以下内容 ProductName EmployeeID EmployeeName ContactNo Adddress iPad 1233 Tom 89897898 34 Pitt st iPad 1573
从元组中过滤 pandas 数据框

AB col 0 230 10 215 15 200 20 185 40 177 0 237 10 222 15 207 20 192 40 184 sales account Jones LLC A 0 B 230 C 140 accou
如果异步任务没有等待，它会在哪里抛出异常？

我有以下示例另请阅读代码中的注释因为它会更有意义 public async Task
grails 中的多态属于多对多映射？

所以我知道使用超类是可能的但是这在灵活性上非常有限所以我的问题是我可以使用接口吗唉 interface Taggable Adds tag s and returns a list of currently set tags Li
chrome 移动 android 中的 localStorage 为空

I use Sentry https sentry io跟踪我的网站中的错误问题是有时 Android 版 chrome mobile 的 localStorage 为空导致所有相关方法例如 getItem 或 setItem 都会产
Python 中的双进度条

有没有办法在Python中创建双进度条我想在彼此内部运行两个循环对于每个循环我想要一个进度条我的程序看起来像 import time for i1 in range 5 for i2 in range 300 do somethin
Plotly 中大型数据集的 Scatter 3D

我有一个 3D 散点图想在 python 中使用 Plotly 进行绘图问题是数据帧的大小太大我想使用 webgl 来绘制图表据我所知情节有go Scatter3d绘制散点图的函数另外还有一个go Scattergl绘制大型数
使用 gperftools 进行排序时分析计时器过期

我花了一整天的时间试图制作性能工具 https github com gperftools gperftools在职的我尝试了不同的 libunwind 版本但是当我成功安装它时每当我使用 std system 时都会出现以下错误
编辑时无法在 Chrome 开发者工具中添加额外的空格“ ”

我试图添加额外的空格 nbsp 在 Chrome 开发者工具的 Elements 部分的 div 标签内 div hello nbsp nbsp world div 上面的内容按字面意思呈现预期的 hello world Actual h
有没有Android设备或方法可以同时打开前后摄像头？ [复制]

这个问题在这里已经有答案了由于某种原因我需要同时打开前置和后置摄像头当我尝试在 Nexus 4 上打开第二个摄像头时我尝试了新的 Camera2 API 并收到 ERROR MAX CAMERAS IN USE 错误文档显示它可能
MSVC - 在通用 lambda 的调用者中使用命名空间指令会泄漏到 lambda 的主体中

考虑以下玩具代码 include
如何实现邀请码与其他用户共享资源？

我们希望能够与新用户或其他用户共享 Web 应用程序内的资源我们希望通过实施邀请码来做到这一点我之前在其他应用程序例如谷歌文档中已经多次看到过这种实现您可以在其中向另一个用户发送邀请代码并且其他用户将拥有第一个用户同意的任何访问
Rails 控制台无法工作“您可能遇到了错误”

我搜索这个问题是否已经被问过但我没有找到任何东西我已经使用 ruby 版本 2 3 0 和 Rails 版本 5 0 0 1 创建了一个应用程序当我运行这个命令时 rails console 我尝试像这样访问数据库 Post all
如何使用 purrr 中的映射和 dplyr::mutate 基于列对创建多个新列

我必须使用 R 来解决以下问题简而言之我想根据数据框中不同列对的计算在数据框中创建多个新列数据如下 df lt data frame a1 c 1 5 b1 c 4 8 c1 c 10 14 a2 c 9 13 b2 c 3 7 c2

如何使用 purrr 中的映射和 dplyr::mutate 基于列对创建多个新列

如何使用 purrr 中的映射和 dplyr::mutate 基于列对创建多个新列 的相关文章

随机推荐

热门标签

如何使用 purrr 中的映射和 dplyr::mutate 基于列对创建多个新列的相关文章