dplyr mutate - 如何将一行作为函数参数传递？

2024-01-02

我正在尝试在我的 tibble 中创建一个新列，该列收集并格式化所有其他列中找到的所有单词。如果可能的话，我想使用 dplyr 来做到这一点。原始数据框：

df <- read.table(text =      "  columnA     columnB      
                 1            A           Z                    
                 2            B           Y                    
                 3            C           X                    
                 4            D           W                    
                 5            E           V                   
                 6            F           U            "  )

作为一个简化的例子，我希望做类似的事情：

df %>%
    rowwise() %>%
    mutate(newColumn = myFunc(.))

输出如下所示：

       columnA     columnB      newColumn
1            A           Z             AZ        
2            B           Y             BY        
3            C           X             CX        
4            D           W             DW        
5            E           V             EV        
6            F           U             FU

当我在代码中尝试此操作时，输出如下所示：

       columnA     columnB      newColumn
1            A           Z             ABCDEF        
2            B           Y             ABCDEF        
3            C           X             ABCDEF    
4            D           W             ABCDEF    
5            E           V             ABCDEF    
6            F           U             ABCDEF

myFunc 应该将一行作为参数，但是当我尝试使用 rowwise() 时，我似乎将整个 tibble 传递到函数中（我可以通过向 myFunc 添加打印函数来看到这一点）。

如何只传递一行并迭代执行此操作，以便将该函数应用于每一行？这可以用 dplyr 完成吗？

Edit:

为了解决我的问题，示例中的 myFunc 被简化了。实际的函数如下所示：

get_chr_vector <- function(row) {

    row <- row[,2:ncol(row)] # I need to skip the first row
    words <- str_c(row, collapse = ' ')
    words <- str_to_upper(words)
    words <- unlist(str_split(words, ' '))
    words <- words[words != '']
    words <- words[!nchar(words) <= 2]
    words <- removeWords(words, stopwords_list) # from the tm library
    words <- paste(words, sep = ' ', collapse = ' ')
}

看一眼?dplyr::do and ?purrr::map，它允许您将任意函数应用于任意列，并通过多个一元运算符链接结果。例如，

df1 <- df %>% rowwise %>% do( X = as_data_frame(.) ) %>% ungroup
# # A tibble: 6 x 1
#                  X
# *           <list>
# 1 <tibble [1 x 2]>
# 2 <tibble [1 x 2]>
# ...

注意该栏X现在包含 1x2data.frames (or tibbles）由原始行中的行组成data.frame。您现在可以将每一项传递给您的自定义myFunc using map.

myFunc <- function(Y) {paste0( Y$columnA, Y$columnB )}
df1 %>% mutate( Result = map(X, myFunc) )
# # A tibble: 6 x 2
#                  X    Result
#             <list>    <list>
# 1 <tibble [1 x 2]> <chr [1]>
# 2 <tibble [1 x 2]> <chr [1]>
# ...

Result列现在包含的输出myFunc应用于原始文件中的每一行data.frame，如预期的。您可以通过连接来检索值tidyr::unnest手术。

df1 %>% mutate( Result = map(X, myFunc) ) %>% unnest
# # A tibble: 6 x 3
#   Result columnA columnB
#    <chr>  <fctr>  <fctr>
# 1     AZ       A       Z
# 2     BY       B       Y
# 3     CX       C       X
# ...

如果需要的话，unnest可以限制为特定列，例如unnest(Result).

EDIT: 因为你原来的data.frame仅包含两列，您实际上可以跳过do步骤及使用purrr::map2反而。语法非常类似于map:

myFunc <- function( a, b ) {paste0(a,b)}
df %>% mutate( Result = map2( columnA, columnB, myFunc ) )

注意myFunc现在定义为二元函数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

rowwise

dplyr mutate - 如何将一行作为函数参数传递？的相关文章

更改 pander 中的默认对齐方式 (pandoc.table)

我目前正在切换到pander对于我的大部分时间knitr markdown格式化因为它提供了如此出色的pandoc支持我不太满意的一件事是默认的居中对齐营销人员可能会喜欢它但对于技术报告来说这是一个可怕的事情使用的最佳选择Hmis
如何返回包含最大值标签的向量

我有一个 4 列数组我想获得一个向量其中每行包含包含该行最大值的列的标签我可以在循环中执行此操作但我想使用矩阵函数来提高速度我怎样才能在不编写自己的库函数的情况下做到这一点有一个函数可以做到这一点如果x是你的矩阵尝试max
使用 RDCOMClient 搜索 Outlook 收件箱

我尝试使用 RDCOMClient 在 Outlook 收件箱中搜索电子邮件中的特定主题然后获取附件我在一封电子邮件上进行了这项工作但由于主题包含日期元素我需要搜索成为一个类似的子句但不太清楚这适合我的下面的查询 outlook
R中整数类和数字类有什么区别

我想先说我是一个绝对的编程初学者所以请原谅这个问题是多么基本我试图更好地理解 R 中的原子类也许这适用于一般编程中的类我理解字符逻辑和复杂数据类之间的区别但我正在努力寻找数字类和整数类之间的根本区别假设我有一个简单的向量x
手动设置scale_fill_distiller()的比例

我正在尝试制作一系列图表进行比较举例来说我想使用iris数据集来制作这样的图其中我已过滤以仅查看 setosa 物种 library ggplot2 library dplyr iris gt filter Species setos
如何自动启动我的 ec2 实例、运行命令然后将其关闭？

我想每周对 redshift postgres 数据库中的数据运行一次机器学习模型我使用以下命令将 R 脚本设置为休息 apiplumbr然后我将其设置为一项任务来管理pm2 我有它所以任务会在ec2实例启动然后继续运行要让 R 脚本
合并数据框而不重复行

我想合并两个数据框但如果有多个匹配项则不想重复行相反我想总结一下那天的观察结果来自合并提取两个数据框中与指定列匹配的行并将其连接在一起如果有多个匹配项则所有可能的匹配项各贡献一行这是一些示例代码 days lt as d
如何绘制堆积比例图？

我有一个数据框 x lt data frame id letters 1 3 val0 1 3 val1 4 6 val2 7 9 id val0 val1 val2 1 a 1 4 7 2 b 2 5 8 3 c 3 6 9 我想绘制一个
从 df 中提取具有两列的重叠行对

我想找出这两个表之间哪些对重叠 gt dput data1 structure list Name x c MDH1 MDH1 IDH2 IDH2 IDH2 IDH2 IDH2 IDH2 IDH2 SCOALB SCOALB CSY4 CS
ubuntu中R的igraph包的安装

我使用以下命令在 ubuntu 中安装 R 的 igraph 包 install packages igraph 但我收到一条错误消息警告无法访问存储库的索引 http ftp iitm ac in cran src contrib h
融化R中的下半矩阵

如何融化下半三角形加对角矩阵 11 NA NA NA NA 12 22 NA NA NA 13 23 33 NA NA 14 24 34 44 NA 15 25 35 45 55 A lt t matrix c 11 NA NA NA NA
R 将多个值与向量进行比较并返回向量[重复]

这个问题在这里已经有答案了我有一个向量 A 对于 A 的每个元素我想检查它是否等于第二个向量 Targets 中的任何元素我想要一个逻辑值向量其长度为 A 作为返回也提到了同样的问题here http r 789695 n4 na
获取函数的命名空间

我正在开发一个包我希望在其中向对象添加编辑历史记录该包允许其他包注册用于编辑对象的函数我正在寻找一种方法来记录注册用于编辑的函数的包的版本问题是给定一个函数如何从导出的位置获取包我的想法是调查它的搜索路径但是search 仅
跟踪循环迭代

抛硬币成功你赢100 否则你输50 你会一直玩直到你口袋里有钱a 的价值如何a在任何迭代中都被存储 a lt 100 while a gt 0 if rbinom 1 1 0 5 1 a lt a 100 else a lt a 50
从 n,k 维矩阵数组中减去 n,k 维矩阵

如果我有一个数组A A lt array 0 c 4 3 5 for i in 1 5 set seed i A i lt matrix rnorm 12 4 3 如果我有矩阵 B set seed 6 B lt matrix rnorm
为什么数据帧上的 is.vector 不返回 TRUE？

tl dr R 中的向量到底是什么长版 R 中很多东西都是向量例如数字是长度为 1 的数值向量 is vector 1 1 TRUE 列表也是一个向量 is vector list 1 1 TRUE 好的所以列表是一个向量显然数
将 ftransform 与折叠 R 包中的 fgroup_by 一起使用

我正在尝试重现以下输出dplyr代码与R包裹collapse dplyr Code library tidyverse starwars gt select name mass species gt group by species gt
R - 计算 bin 中特定值的数量

我有一个如下所示的数据框 df Value lt c 1 1 0 2 1 3 4 0 0 1 2 0 3 0 4 5 2 3 0 6 Sl lt c 1 20 df lt data frame Sl Value gt df Sl Value
在R中循环子文件夹

我正在 R 环境中包含多个子文件夹的文件夹中工作我想要循环遍历多个子文件夹然后在每个子文件夹中调用 R 脚本来执行我想出了下面的代码但我的代码似乎添加了到子文件夹列表我收到错误文件中的错误文件名 r 编码编码无效的描述
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我

随机推荐

NSButton RadioGroup（NSMatrix 替代方案）

我已经尝试了几次设置几个类似的按钮所有按钮都连接到相同的 IBActions 但似乎仍然无法复制 RadioButton 行为目前我有 5 个 Button 它们都是一个 NSView 的子级 NSView ButtonOne NSB
Windows Phone 8.1 的 SQLite.Net PCL 支持/解决方法

我有一个 WIndows Phone 8 1 应用程序我想在此处使用 SQLite Net PCL 库分叉 oysteinkrog https github com oysteinkrog SQLite Net PCL https git
二元运算“==”不能应用于类型X

我有一个自定义类型 pub struct PValue pub name String pub value Option
Delphi错误E2010不兼容的类型：'字符串'和'过程，无类型指针或无类型参数'

我使用了 TStringList 和类似的东西 geo TStringList response TStringStream begin http tidhttp Create nil try TODO oUser cConsole Mai
对于 ListBox1 中的每个项目执行一些操作，然后将项目添加到 listbox2 vb

我制作了一个应用程序来将某些数字转换为其他格式 i e 1 A 2 B 3 C 4 D 5 E ETC 我已经毫无问题地实现了该功能并且已经使用它相当长一段时间了但现在我想更快地批量完成操作所以对我来说从文本文件复制到 Textbo
Spring-WS无需操作即可生成WSDL

Spring WS生成WSDL时不需要绑定标签中的操作你知道为什么吗有我的 spring ws service xml
使用 http 的 Range 标头下载视频的后半部分

我想下载本地主机上视频的后半部分我编写了一些 python 代码来下载从一半到结尾的文件通过 http 的 Range 标头但是当我用 vlc 打开文件时没有任何反应所以它不起作用如何下载 mp4 文件的一部分并且仍然能够观看它
如何选择statsmodels STL函数的正确参数？

我一直在阅读有关时间序列分解的内容并且非常了解它如何在简单的示例中工作但在扩展这些概念时遇到了困难例如我正在使用一些简单的合成数据因此没有与该数据相关的实际时间可以每秒或每年采样一次无论采样频率如何周期大约为 160 个时
返回 ICollection 相对于 List 的优点是什么[重复]

这个问题在这里已经有答案了可能的重复 List of T 和 Collection of T 有什么区别 https stackoverflow com questions 398903 what is the difference be
在 Matlab 中创建多个具有相同比例的箱线图

我想在 Matlab 中绘制几个不同的箱线图但给它们相同的比例这样读者就不会因为并排比较它们而被误导我尝试过使用 datalim 选项但它只对箱线图施加上限但如果数据未达到上限则不会拉伸它有任何想法吗尝试 linkaxes
在 iOS 7 中的 Alamofire 中设置自定义 HTTP 标头不起作用

我尝试过设置Alamofire Manager sharedInstance session configuration HTTPAdditionalHeaders我在 iOS 7 中使用了自定义 HTTP 标头但我没有运气这在 iOS
未在 T-SQL 中创建动态列

我有以下表格 tbl工程查找专栏管理员 elccolumnid elclookupcode elccolumnname elcisrequired 1 64 FirstName 1 2 64 LastName 1 3 65 abc 1 4
在 Kubernetes 上使用 Nginx SSL 代理运行 Meteor 应用程序

我在 Google Cloud 上使用 Kubernetes 部署了一个 Meteor 应用程序并配置了 Nginx 作为 SSL 终止一切正常但是如果两个不同的客户端连接到两个不同的 SSL 容器则更新在长达 10 秒的时间内不
在安装了 VS2010 的机器上和在安装了 7.1 SDK 的机器上构建之间的差异

我们正在尝试升级代码库以使用 Visual Studio 2010 但在构建服务器上对所有内容进行排序时遇到问题我们不想在构建服务器上安装 Visual Studio 2010 因此只安装了 Net 4 框架和 SDK v7 1 我们仍然
如何通过pyelftools保存修改后的ELF

最近我对ELF文件结构很感兴趣在网上搜索我发现了一个很棒的脚本名为派尔夫工具但实际上我不知道如何保存修改后的ELF ELFFile 类没有任何方法可以执行首先我喜欢下面的内容 header self elf header sel
Phonegap 不传播会话 cookie

Using Phonegap 3 0 0 ios6 1 在真正的 iPhone 上在处理服务器端的真正 https 域上来自不同来源的许多响应导致我在处理会话 cookie 时进行了多次尝试和失败我仍然无法在Iphone5 Phone
Twitter 图标未显示在设备上 iOS 7 的 UIActivityViewController 中

我正在使用 UIActivityViewController 将我的应用程序中的信息共享到 Twitter 和 FB 这些信息在设置中进行了正确配置代码是最简单的 IBAction share NSString postText so
Ionic 3如何使用textarea ngModel和默认值？

我是 ionic 新手对文本区域有疑问这是我的代码
使用自定义 LoaderInfo 类的自定义 AS3 Loader 类？

这是一个专门关于创建自定义 Loader 类作为后续的问题如何修改现有的 AS3 事件以便可以传递数据 https stackoverflow com questions 758322 how do i modify existing as
dplyr mutate - 如何将一行作为函数参数传递？

我正在尝试在我的 tibble 中创建一个新列该列收集并格式化所有其他列中找到的所有单词如果可能的话我想使用 dplyr 来做到这一点原始数据框 df lt read table text columnA columnB 1 A Z

dplyr mutate - 如何将一行作为函数参数传递？

dplyr mutate - 如何将一行作为函数参数传递？ 的相关文章

随机推荐

热门标签

dplyr mutate - 如何将一行作为函数参数传递？的相关文章