合并一个 data.frame 中的行

2023-12-12

这是一个非常相似的问题将两行合并到一个数据框中但我有字符串变量,只想折叠一些具有相同国家/地区名称的行。我改编了MWER

data<-data.frame(code= c(345, 346), name= "Yemen", v1= c("", "text1"), v2= c("text2", ""),v3= c("text3", ""),v4= c("", "text4"))
code  name    v1    v2    v3    v4
345   Yemen         text2 text3      
346   Yemen   text1             text4

aggregate(x=data[c("v1","v2","v3","v4")], by=list(name=data$name), paste)
name v1.1  v1.2  v2.1 v2.2  v3.1 v3.2 v4.1  v4.2
1 Yemen      text1 text2      text3           text4

我希望粘贴能够作为一个函数将空单元格与另一行的文本组合起来,但我不知何故得到了一行包含更多变量 v1.1 等。


我们可以使用data.table。我们将“data.frame”转换为“data.table”(setDT(data)),按“名称”分组,我们unlist中指定的列.SDcols, and paste它在一起。

library(data.table)
setDT(data)[, unlist(.SD), name, .SDcols=v1:v4][V1!='', paste(V1, collapse=', '), name]

由于未显示预期输出,因此也可以

setDT(data)[, lapply(.SD, function(x) paste(x[x!=''], collapse='')) , name, .SDcols= v1:v4]

Update

根据预期的输出,我们将“factor”列(“v1:v4”)转换为“character”类,然后使用公式方法aggregate and paste按“名称”分组的列。

data[3:6] <- lapply(data[3:6], as.character)
aggregate(.~name, data[-1], FUN=function(x) paste(x[x!=''], collapse=', '))
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

合并一个 data.frame 中的行 的相关文章

  • 如何返回包含最大值标签的向量

    我有一个 4 列数组 我想获得一个向量 其中每行包含包含该行最大值的列的标签 我可以在循环中执行此操作 但我想使用矩阵函数来提高速度 我怎样才能在不编写自己的库函数的情况下做到这一点 有一个函数可以做到这一点 如果x是你的矩阵 尝试max
  • 如何自动启动我的 ec2 实例、运行命令然后将其关闭?

    我想每周对 redshift postgres 数据库中的数据运行一次机器学习模型 我使用以下命令将 R 脚本设置为休息 apiplumbr然后我将其设置为一项任务来管理pm2 我有它 所以任务会在ec2实例启动然后继续运行 要让 R 脚本
  • R - 与 SpatialPolygonsDataFrame 对象相交的 SpatialLinesDataFrame 列表的嵌套循环

    我有一系列需要完成的步骤SpatialLinesDataFrame 此处的 线 基于对象与多特征中各个特征的关系SpatialPolygonsDataFrame 多边形 对象 简而言之 每个线列表元素源自单个面要素内部 并且可能会也可能不会
  • 如何绘制堆积比例图?

    我有一个数据框 x lt data frame id letters 1 3 val0 1 3 val1 4 6 val2 7 9 id val0 val1 val2 1 a 1 4 7 2 b 2 5 8 3 c 3 6 9 我想绘制一个
  • 从 R 中的方差分析 (glm) 中提取残余偏差

    我在 R 中安装了一个 glm 模型并采用了方差分析表 我需要提取 残余偏差 列 但它会产生错误 以下是代码 创建数据 counts lt c 18 17 15 20 10 20 25 13 12 outcome lt gl 3 1 9 t
  • 不同 R/lme4 版本的单一拟合结果不匹配

    我试图将 R 版本 3 5 3 lme4 1 1 18 1 的随机效应估计与 R 版本 4 1 1 lme4 1 1 27 1 相匹配 然而 当存在奇异拟合时 这两个版本之间的随机效应存在微小差异 我对奇点警告很满意 但令人费解的是不同版本
  • 从 df 中提取具有两列的重叠行对

    我想找出这两个表之间哪些对重叠 gt dput data1 structure list Name x c MDH1 MDH1 IDH2 IDH2 IDH2 IDH2 IDH2 IDH2 IDH2 SCOALB SCOALB CSY4 CS
  • R- 将某些列从 0 标准化为 1,其值等于 0

    我最近开始使用 are 我想扩展我的数据矩阵 我在这里找到了一种方法在两点之间缩放系列 https stackoverflow com questions 5468280 scale a series between two points
  • 融化R中的下半矩阵

    如何融化下半三角形加对角矩阵 11 NA NA NA NA 12 22 NA NA NA 13 23 33 NA NA 14 24 34 44 NA 15 25 35 45 55 A lt t matrix c 11 NA NA NA NA
  • R 中按时间划分的平均值

    我每秒测量一次化合物浓度 我想求 30 秒和 60 秒的平均值 我一直在阅读这里的帖子 我尝试过lubridate and dplyr 但没有运气 我正在努力完成这项工作 但我一直没能做到 我正在从 SAS 过渡到 R 所以请耐心等待 这是
  • dplyr 返回每个组的全局平均值,而不是每个组的平均值

    有人可以解释一下我在这里做错了什么 library dplyr temp lt data frame a c 1 2 3 1 2 3 1 2 3 b c 1 2 3 1 2 3 1 2 3 temp gt group by temp 1 g
  • 将第 N 行上的 NA 行插入 data.frames 列表,其中 N 来自列表

    经过几个小时后 我发现自己无法解决以下问题 我有一个数据框列表 我想分别向每个 DF 插入 而不是替换 一行或多行 NA 始终至少一行 要插入的 NA 数量存储在单独的列表中 为了说明这一点 我有以下两个列表 list of datafra
  • randomForest 包在删除一个预测类时的奇怪行为

    我正在运行一个随机森林模型 它产生的结果从统计角度来看对我来说完全没有意义 因此我确信有些东西mustrandomForest 包的代码出现错误 至少在模型的本次迭代中 预测 左侧变量是具有 3 种可能结果的政党 ID 民主党 独立党 共和
  • 将 ftransform 与折叠 R 包中的 fgroup_by 一起使用

    我正在尝试重现以下输出dplyr代码与R包裹collapse dplyr Code library tidyverse starwars gt select name mass species gt group by species gt
  • R中的重叠矩阵

    我有以下数据框 id channel 1 a 1 b 1 c 2 a 2 c 3 a 我想创建并重叠矩阵 它基本上是一个方阵 行和列标签为 a b c 表中的每个条目显示每个通道共有多少个 id 例如 在上面的例子中 矩阵看起来像 a b
  • R - 计算 bin 中特定值的数量

    我有一个如下所示的数据框 df Value lt c 1 1 0 2 1 3 4 0 0 1 2 0 3 0 4 5 2 3 0 6 Sl lt c 1 20 df lt data frame Sl Value gt df Sl Value
  • Git 将一个分支合并到所有其他分支中

    我知道这个问题已经在这里被问过 https stackoverflow com questions 2329716 merging changes from master into all branches using git https
  • 使用officer R导出时如何提高ggplots的分辨率

    我想将图表导出到 PPT 并使用Officer 包来实现相同的目的 但是 图表的默认分辨率较低 我想更改它 我目前正在使用以下电话 ph with gg p1 type chart res 1200 其中 p1 是 ggplot 对象 运行
  • R 中两个时间戳之间的左连接

    我的目标是执行左连接intervals哪里的bike id比赛和created at时间戳在records在 之间start and end in the intervals table gt class records 1 data ta
  • 绘制 Cox 回归的 Kaplan-Meier 图

    我使用 R 中的以下代码设置了一个 Cox 比例风险模型来预测死亡率 添加协变量 A B 和 C 只是为了避免混淆 即年龄 性别 种族 但我们真正对预测变量 X 感兴趣 X 是一个连续变量 cox model lt coxph Surv t

随机推荐

  • Centos 上带有 sqlite3 模块的 python 2.7.3 的问题

    我想在我的centos服务器上玩sqlite3 但它总是报告相同的错误 已安装模块 Python 2 7 3 default Jun 29 2012 19 03 18 GCC 4 4 6 20110731 Red Hat 4 4 6 3 o
  • MySQL InnoDB 是否总是需要每个外键约束都有一个索引?

    我正在使用 phpMyAdmin 为了使用 InnoDB 设置外键约束 在 结构 选项卡上的 关系视图 链接下 我似乎需要为要添加约束的字段添加索引 这显然会影响表上插入 更新的性能 特别是如果我想添加几个约束的话 是否可以在 InnoDB
  • 使用索引矩阵检索具有否定精确索引的矩阵元素?

    例如我有A 11 24 33 47 52 67 我的索引矩阵为I 2 3 所以我想从 I 给出的索引以外的索引中获取 A 的元素 所以我想要B 11 47 52 67 我该如何做到这一点并将 I 用作负索引矩阵 go for idx log
  • OpenGL 纹理未显示

    我试图在 OpenGL 中显示一个简单的纹理 来自数组 但我只得到一个空白的白色屏幕 我生成纹理的代码 GLbyte textureData 0 0 0 255 0 0 0 255 0 0 0 255 GLsizei width 2 GLs
  • 如何在 MVC 控制器中实现数据访问层

    我知道数据访问层或简单的 DAL 用于访问和检索数据库中的信息 但我不确定如何在控制器内调用 DAL 数据 例如 我在 DAL 中创建了这个静态类 但我不确定如何将其调用到我的控制器 任何帮助或指南将不胜感激 DohvatiMetodu 是
  • 无法在另一个类的 swing 组件中设置值

    我的 UI 有这个类 public class MyFrame extends JFrame JTextArea textArea public MyFrame setSize 100 100 textArea new JTextArea
  • 使用 Jackson 反序列化重复键以列出

    我正在尝试将 json 反序列化为对象 但是 json 有重复的键 我无法更改 json 我想使用 Jackson 将重复键更改为列表 这是我检索的 json 的示例 myObject foo bar1 foo bar2 这是反序列化后我想
  • PassportJS 重定向循环

    下面是我的代码 restify require restify passport require passport GoogleStrategy require passport google Strategy jsonContentTyp
  • 计算两个日期之间的差异返回负数

    我正在尝试计算不同日期之间有多少天 正如主题所说 我得到了负值 我想我可以只取绝对值 但它返回负值的事实让我怀疑计算是否正确 下面是我的代码 DateTime previousDay new DateTime 1998 6 31 new G
  • 将 Pandas 数据框中的特定列添加到另一个 Pandas 数据框中

    我正在尝试向 pandas 数据框 df1 添加一列 该数据框具有来自另一个具有相同唯一标识符 sameid 的数据框 df2 的唯一标识符 id 列 我尝试过合并 但我只需要添加一个特定列 addthiscolumn 而不是所有列 做这个
  • 使用默认程序打开文件

    在我的应用程序中 我想使用正确的默认程序打开一些文件 例如 doc 文件应该使用 WORD 打开 psd 文件应该使用 Photoshop 打开 如果安装了 这应该在 html 或 java 脚本下完成 请告诉我该怎么做 JavaScrip
  • 如何在视图寻呼机中制作地图重叠布局

    我有包含地图视图的嵌套片段 除了地图视图之外 所有视图都按照我的预期重叠 我也有一个回收视图 它显示在剪切布局下 但没有映射 截屏 我得到的结果是 结果是我所期望的 我尝试设置负边距 但它不适用于地图视图 代码 fragment aroun
  • cakephp 3.x 保存嵌套(深层)关联

    我有来自第 3 方服务调用的产品数据 然后我从中创建一个对象并将其保存到我的 MySQL 数据库 我的模型如下 产品 hasMany gt gt product sku hasMany gt gt product sku attribute
  • 将数据库从 SQL Server 2012 降级到 2008 [已关闭]

    Closed 这个问题不符合堆栈溢出指南 目前不接受答案 我想将数据库降级到SQL Server 2008企业版 我知道没有直接的选择 我尝试在 2012 年进行备份 然后在 2008 年进行恢复 不起作用 关于如何完全传输数据库有什么想法
  • USB 调试时 Android-Studio 因 ArrayOutOfBounds 异常而无法使用

    我在 Opensuse 13 2 上安装可用的 Android Studio 时遇到了很大的困难 我尝试过Java OpenSDK 1 7 0 75 b13和1 8 0 40 b10以及Oracle 1 8 0 31 b13 设置STUDI
  • 如何解决有关字符文字的 C4428 Visual C++ 警告的此实例?

    当前 Visual C 问题C4428 warning 源中遇到的通用字符名称 在下面的代码上 const wchar t someMagicValue L ufffd 我想解决这个警告 我想知道是否存在以下问题 const wchar t
  • 本地文件系统上的独立 HBase 出现 Zookeeper 错误?

    大家好 我正在尝试遵循HBase快速入门并在本地文件系统上启动 HBase 不使用 HDFS 但是 当我使用 hbase shell 启动 shell 并输入 status 时 我收到 Zookeeper 错误 hbase main 001
  • 如何避免缩进的嵌套承诺?

    我听说承诺在代码中应该是线性的 而不是回调 回调地狱 尽管我仍然有一个类似于回调地狱的场景 并希望 Promise 能够兑现其承诺 并具有与此问题代码等效的线性语法 给出的承诺p q w 考虑这段代码 p then gt q then gt
  • 在 Windows 上安装 Theano - DLL 加载失败

    我正在尝试在 Windows 8 上安装 Theano 已关注these steps 我尝试使用以下方法进行测试 import numpy as np import time import theano print blas ldflags
  • 合并一个 data.frame 中的行

    这是一个非常相似的问题将两行合并到一个数据框中但我有字符串变量 只想折叠一些具有相同国家 地区名称的行 我改编了MWER data lt data frame code c 345 346 name Yemen v1 c text1 v2