如何strsplit数据框列并相应地复制行？ [复制]

2024-01-12

我有一个像这样的数据框：

> df <- data.frame(Column1=c("id1", "id2", "id3"), Column2=c("text1,text2,text3", "text4", "text5,text6"), Column3=c("text7", "text8,text9,text10,text11", "text12,text13"))

> df
  Column1           Column2                   Column3
1     id1 text1,text2,text3                     text7
2     id2             text4 text8,text9,text10,text11
3     id3       text5,text6             text12,text13

如何将其转换为这种格式？

  Column1 variable                     value
1     id1  Column2                     text1
2     id1  Column2                     text2
3     id1  Column2                     text3
4     id2  Column2                     text4
5     id3  Column2                     text5
6     id3  Column2                     text6
7     id1  Column3                     text7
8     id2  Column3                     text8
9     id2  Column3                     text9
10    id2  Column3                    text10
11    id2  Column3                    text11
12    id3  Column3                    text12
13    id3  Column3                    text13

我想第一步是melt()数据框（顺便说一句，我应该担心这个警告吗？）：

> library(reshape2)    
> mdf <- melt(df, id.vars="Column1", measure.vars=c("Column2", "Column3"))
> mdf
  Column1 variable                     value
1     id1  Column2         text1,text2,text3
2     id2  Column2                     text4
3     id3  Column2               text5,text6
4     id1  Column3                     text7
5     id2  Column3 text8,text9,text10,text11
6     id3  Column3             text12,text13
Warning message:
attributes are not identical across measure variables; they will be dropped

然后我基本上需要“strsplit()”“值”列并相应地复制行，但我想不出一种方法来做到这一点。

> strsplit(mdf$value, ",")
[[1]]
[1] "text1" "text2" "text3"

[[2]]
[1] "text4"

[[3]]
[1] "text5" "text6"

[[4]]
[1] "text7"

[[5]]
[1] "text8"  "text9"  "text10" "text11"

[[6]]
[1] "text12" "text13"

任何帮助表示赞赏！谢谢。

A data.table解决方案：

library(data.table)
mdt <- melt(setDT(df), id.vars="Column1")[,strsplit(as.character(value),",",fixed=TRUE),
                                          by=list(Column1,variable)]

结果：

> mdt
    Column1 variable     V1
 1:     id1  Column2  text1
 2:     id1  Column2  text2
 3:     id1  Column2  text3
....

您还可以使用tstrsplit函数从最新版本的data.table https://github.com/Rdatatable/data.table/wiki/Installation(v1.9.5+) 保留名称value列而不是将其重命名为V1:

mdt <- melt(setDT(df), id.vars="Column1")[,lapply(.SD, function(x) tstrsplit(x, ",", fixed=TRUE)),
                                          by=list(Column1,variable)]

结果：

> mdt
    Column1 variable  value
 1:     id1  Column2  text1
 2:     id1  Column2  text2
 3:     id1  Column2  text3
....

替代解决方案dplyr & tidyr:

library(dplyr)
library(tidyr)
mdf <- df %>% gather(variable, value, -Column1) %>% 
  transform(value = strsplit(as.character(value),",")) %>%
  unnest(value)

结果：

> mdf
   Column1 variable  value
1      id1  Column2  text1
2      id1  Column2  text2
3      id1  Column2  text3
....

与最新版本tidyr，您还可以使用separate_rows-功能：

mdf <- df %>% 
  gather(variable, value, -Column1) %>% 
  separate_rows(value)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

split

DataFrame

reshape2

melt

如何strsplit数据框列并相应地复制行？ [复制] 的相关文章

使用 lpSolve 优化 R 团队名单

我是 R 新手有一个想要解决的特定幻想运动队优化问题我见过其他帖子使用 lpSolve 来解决类似的问题但我似乎无法理解代码下面的示例数据表每个球员都在一个球队中扮演着特定的角色有薪水并且每场比赛都有平均得分我需要的限制是
通过 :: 调用包中的函数是一个好习惯吗

我正在编写一些 R 函数这些函数在其他包中使用一些有用的函数例如stringr and base64enc 不打电话好不好library or require 首先加载这些包但要使用直接引用我需要的功能比如stringr str m
JavaScript 用空格分割字符串

我想分割一个字符串但我想保留空白例如 var str my car is red var stringArray stringArray 0 my stringArray 1 stringArray 2 car stringArray
在R闪亮中，如何在UI端使用在SERVER端计算的值？

在我的 R闪亮应用程序中我想调整我的高度d3heatmap 见包装d3热图 https cran r project org web packages d3heatmap index html 作为我的数据框行数的函数有一个论点heig
R tm 包创建 N 个最常见术语的矩阵

我有一个termDocumentMatrix使用创建的tmR 中的包我正在尝试创建一个包含 50 个最常出现的术语的矩阵数据框当我尝试转换为矩阵时出现此错误 gt ap m lt as matrix mydata dtm Error
R Shiny UI 子选项复选框？

我有一个基本的 RShiny 应用程序它有一个反应式复选框它根据复选框中选择的数据 df 列绘制时间序列数据我当前的代码生成一个带有复选框输入的 UI 如下所示 Load R packages library shiny libra
如何在R中的2行之间交换多个值

我有一个大小为 10x100 的矩阵如何交换前 30 列中第 1 行和第 2 行之间的值我们可以反转前两行的行索引以及通过采取序列创建的列索引rounded 30 总列数用于交换行中的值 colS lt seq round ncol m
获取所有参数作为列表

R 是否提供对象函数方法关键字来获取所有函数参数使用一个例子 function a b default 会提供a and b也在函数环境内有没有类似的说法list 这还包括a and b在结果中或者换一种方式简写list a
使用 sapply 的列表和矩阵

我有一个也许是基本的问题我在网上搜索过我在读取文件时遇到问题尽管如此我还是按照 Konrad的建议设法读取了我的文件我很欣赏这一点 How to get R to read in files from multiple subdi
根据条件计算平均值

下面是我的数据框 Row ID A B 1 0 0 2 0 0 3 0 0 4 0 1 5 0 1 6 0 1 7 62 75 0 8 100 0 9 100 0 10 100 1 11 100 1 12 100 1 13 100 1 14
使用 ape 包在 R 中进行标签和色叶树状图（系统发育）

继上一篇文章之后 r 中的标签和彩色叶树状图 https stackoverflow com questions 18802519 label and color leaf dendrogram in r 我有一个后续问题我的问题与提到的
在 R 中索引数据帧

再会我不明白这里的主题就像它有效但我不明白为什么我有这个数据库 planets df is pre loaded in your workspace Use order to create positions positions lt
如何导入 .tsv 文件

我需要读取一个表 tsvR 中的文件 test lt read table file drug info tsv Error in scan file what nmax sep dec quote skip nlines na strin
使用 ggplot 未完全填充等值线图

我正在尝试使用以下方法绘制我的第一个填充等高线图ggplot 根据我的数据我期待类似的结果但我的结果是 a lt c 1 1 1 1 1 3 1 2 2 2 2 2 2 5 2 1 3 3 3 3 1 3 2 b lt c rep c
检索除指定一列之外的所有 DataFrame [重复]

这个问题在这里已经有答案了有没有办法选择 pandas DataFrame 对象中除一列之外的所有列我已经看到了删除列的方法但我不想这样做 use drop method df drop column name axis 1
从频率表生成 data.frame

我在 2 4 数组中有包含 500 个观察值的合成数据 datax array c 120 181 50 43 41 33 24 8 dim c 2 4 dimnames datax list gender c male female pu
如何在 rmarkdown 中显示带有 results='asis' 的格式化 R 输出

当使用 results asis 时有没有办法在 rmarkdown knitr 中显示格式化程序 R 输出一个例子是以下函数 myfun lt function cat hello n cat c one 1 two 2 然后该块将
替换向量中非 %in% 向量的值

简短的问题我可以像这样替换某些变量值 values lt c a b a b c a b df lt data frame values 将 df values 的所有值替换为 x 其中值是neither a 或 b 输出应该是 c a
R data.table fread 使用不带标题的命名 colClasses（例如没有 col.names？）

更新 2016 年 6 月 col names 已添加到 data table 1 9 6 所以问题已经结束每个人都非常高兴我想我现在可以将所有 read csv 调用转换为 fread 调用而不必担心破坏原问题使用数据表1 9
Pandas：数据帧累积和，如果其他列为假则重置[重复]

这个问题在这里已经有答案了我有一个包含 2 列的数据框这里的目标很简单如果行列设置为 False 则重置 df cumsum df value condition 0 1 1 1 2 1 2 3 1 3 4 0 4 5 1 想要的结果

随机推荐

如何在 Ubuntu 21.10 中构建不带 zstd 压缩的 .deb？

我正在使用构建 debdpkg buildpackage在 Ubuntu 21 10 上然后在 Debian 系统中提取该系统不使用 zstd 压缩在构建 deb 时如何切换到旧的压缩运行命令 compression xz或同等的
当想要使用 git bash 推送到 GitHub 时如何修复 SSL 证书错误？

我正在尝试在 Windows 8 上使用 git bash 向 GitHub 推送一个简单的 Web 应用程序但是当我执行 git Push origin master 时它显示致命无法访问 https com git SSL 证书
使用 Bulk Collect 将批量记录插入到远程数据库 (dblink)

我想使用 DBLINK FMATLINK 将来自不同表的大量记录插入到目标远程表 Audition Detail 中我已经使用了批量收集但它抛出错误我也浏览了一些链接克服通过数据库链接批量插入的限制 https stackoverf
在 ASP.NET Core 中生成报告的最佳方法是什么？

谁能告诉我如何在 ASP NET Core 程序中创建报告我想将报告导出为 Excel PDF 和 Word 在 ASP NET Core 中生成报告的最佳方法是什么我正在寻求专业人士的建议我正在Asp Net Core 2 1 中做
如何使用 boost::asio 的 async_read_some() 读取所有可用数据，而无需等待新数据到达？

我使用 boost asio 进行串行通信我想监听某个端口上的传入数据所以我使用注册一个 ReadHandlerserialport async read some 然后创建一个单独的线程来处理异步处理程序调用io service
使用 git 提交日期作为证据

我们的存储库多年来约有 7000 次提交我们想使用 git 存储库作为法庭优先性的证据有没有办法表明旧的 git 提交没有改变至少作者日期和提交日期并且在某种程度上是它们看起来的样子在 Git 中可以更改旧的提交日期但它确实会使
Linux：仅设置目录权限[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我必须更改的权限htdocsapache 中的目录属于某个组并具有一定的读写执行能力目录需要有 775 权限文件需要有 664 权
“Ruby on Rails-教程”期间的路由错误

似乎这里有些人遇到了这个问题但我在另一个主题中找不到任何解决方案我正在学习 Ruby on Rails 教程的第 3 章处理静态页面当我想在本地主机上打开它们时它会在浏览器中显示路由错误我的 Ruby 目前版本为 1 9 3
为什么 VS 2008 IDE 不记得我的偏好设置？

这是一个很小的问题我只是在问编译 http imgs xkcd com comics compiling png 由于某种原因当我关闭并重新打开时我的 VS 2008 IDE 不记得我的窗口首选项它会重置窗口宽度位置外观等让我
RecyclerView 与 in recyclerView 一起启动 ActivityOnresult

我有一个回收器视图 A 其中包含另一个回收器视图 B 当我单击 recyclerview A 项目中的加号图标时它会打开一个带有 recyclerview C 的新活动长按并选择几个项目然后单击完成这需要更新我单击加号图标的 re
在 Liferay-Portlet 中哪里放置资源-操作-映射？

我正在尝试根据以下内容向 Liferay Portlet 添加权限Liferay 文档 http www liferay com web guest community wiki wiki Main Using 20Liferay s 20
CSS 网格，网格项“高度：100%”在 Chrome 中不起作用

这是我在这里发表的第一篇文章所以希望我能在这个问题中获得所有必要的信息我一整天都在努力尝试在我正在创建的一些卡片上获得正确的网格功能请参阅下面的屏幕截图链接经过一段时间的工作我能够在 Firefox 中获得我想要的结果但是当我在
编写正则表达式以提取“/”之前的数字

我不想使用字符串分割因为我有数字 1 99 以及文本中某处包含的字符串列如何编写正则表达式来提取以下示例中的数字 10 He got 10 19 questions right 使用前瞻来匹配像这样 d 如果您的实现使用作为分隔符
Spock @Unroll 注释

在最近的一次代码审查中出现了关于 Unroll 注释属于类级别还是方法级别的问题该类的大多数方法但不是全部都需要 Unroll 如果在类级别声明并且并非类的所有方法都需要它声明 Unroll 是否会导致任何性能损失 Unroll
我可以在另一个 col 里面有一个 Bootstrap col 吗？

我对 Bootstrap 还是个新手我正在尝试找出什么是正确的什么是错误的是否可以接受col里面的一个col 在下面的示例中我有一个表单想要适合屏幕的一半我还希望某些表单控制元素为半角而其他元素为全角这是解决这个问题的正确方法
如何将单选按钮对齐到关联文本的右侧？

我在类似按钮的单选组中有以下单选按钮默认情况下按钮位于关联文本的左侧如何让按钮本身位于关联文本的右侧
如何在 csproj 中从 AspNetCompiler 的预编译中排除路径

我用来排除的命令行示例Admin路径与 x C Users Test gt C Windows Microsoft NET Framework v4 0 30319 aspnet compiler exe v Application Web
MYSQL 如果在特定表的任何列中找到值，则选择行

如果在特定表的任何列中找到值我试图从特定表中获取所有行你可以使用IN eg SELECT FROM tbName WHERE yourValue IN column1 column2 column3
将 diffmerge 设置为可视 Git difftool 不起作用

我正在尝试将 DiffMerge 配置为 Git 中的 difftool 但没有成功这是我的相关部分 gitconfig文件未显示的其他设置仅供用户使用 diff tool diffmerge difftool diffmerge cm
如何strsplit数据框列并相应地复制行？ [复制]

这个问题在这里已经有答案了我有一个像这样的数据框 gt df lt data frame Column1 c id1 id2 id3 Column2 c text1 text2 text3 text4 text5 text6 Column

如何strsplit数据框列并相应地复制行？ [复制]

如何strsplit数据框列并相应地复制行？ [复制] 的相关文章

随机推荐

热门标签