复制data.frame的每一行并指定每行的复制次数？

2024-01-23

我在 R 中编程，遇到以下问题：

我有一个数据字符串 jb，它很长。这是它的一个简单版本：

jb:    a     b     frequency               jb.expanded: a    b   
       5     3        2                                 5    3
       5     7        1                                 5    3
       9     1        40                                5    7
       12    4        5                                 9    1
       12    5        13                                9    1
                                                        ...  ...

我想复制行，复制的频率就是列频率。这意味着，第一行被复制两次，第二行被复制一次，依此类推。我已经用代码解决了这个问题

jb.expanded <- jb[rep(row.names(jb), jb$freqency), 1:2]

现在问题来了：

每当频率角中的任何数字大于 10 时，复制列的数量就是错误的。例如：

Frequency: 43 --> 14 columns
           40 --> 13 columns
           13 --> 11 columns
           14 --> 12 columns

你能帮助我吗？我不知道如何解决这个问题，我也在互联网上找不到任何内容。

感谢您的帮助！

Update

重新审视这个问题后，我有一种感觉@Codoremifa 的假设是正确的，即您的“频率”列可能是factor.

如果是这种情况，这里有一个例子。它与您的实际数据不匹配，因为我不知道您的数据集中还有哪些其他级别。

mydf$F2 <- factor(as.character(mydf$frequency))
## expandRows(mydf, "F2")
mydf[rep(rownames(mydf), mydf$F2), ]
#      a b frequency F2
# 1    5 3         2  2
# 1.1  5 3         2  2
# 1.2  5 3         2  2
# 2    5 7         1  1
# 3    9 1        40 40
# 3.1  9 1        40 40
# 3.2  9 1        40 40
# 3.3  9 1        40 40
# 4   12 4         5  5
# 4.1 12 4         5  5
# 4.2 12 4         5  5
# 4.3 12 4         5  5
# 4.4 12 4         5  5
# 5   12 5        13 13
# 5.1 12 5        13 13

嗯。对我来说，这看起来不像 61 行。为什么不？因为rep使用底层的数值factor，在这种情况下与显示的值有很大不同：

as.numeric(mydf$F2)
# [1] 3 1 4 5 2

要正确转换它，您需要：

as.numeric(as.character(mydf$F2))
# [1]  2  1 40  5 13

原答案

不久前，我写了一个函数，它是 @Simono101 答案的概括。该函数如下所示：

expandRows <- function(dataset, count, count.is.col = TRUE) {
  if (!isTRUE(count.is.col)) {
    if (length(count) == 1) {
      dataset[rep(rownames(dataset), each = count), ]
    } else {
      if (length(count) != nrow(dataset)) {
        stop("Expand vector does not match number of rows in data.frame")
      }
      dataset[rep(rownames(dataset), count), ]
    }
  } else {
    dataset[rep(rownames(dataset), dataset[[count]]), 
            setdiff(names(dataset), names(dataset[count]))]
  }
}

出于您的目的，您可以使用expandRows(mydf, "frequency")

head(expandRows(mydf, "frequency"))
#     a b
# 1   5 3
# 1.1 5 3
# 2   5 7
# 3   9 1
# 3.1 9 1
# 3.2 9 1

其他选项是将每行重复相同的次数：

expandRows(mydf, 2, count.is.col=FALSE)
#      a b frequency
# 1    5 3         2
# 1.1  5 3         2
# 2    5 7         1
# 2.1  5 7         1
# 3    9 1        40
# 3.1  9 1        40
# 4   12 4         5
# 4.1 12 4         5
# 5   12 5        13
# 5.1 12 5        13

或者指定每行重复次数的向量。

expandRows(mydf, c(1, 2, 1, 0, 2), count.is.col=FALSE)
#      a b frequency
# 1    5 3         2
# 2    5 7         1
# 2.1  5 7         1
# 3    9 1        40
# 5   12 5        13
# 5.1 12 5        13

注意需要的count.is.col = FALSE最后两个选项的争论。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

replication

复制data.frame的每一行并指定每行的复制次数？的相关文章

如何在 R 中将 dd/mm/yy 转换为 yyyy-mm-dd

我有一个向量其日期值采用这种格式 dd mm yy 例如 27 06 16 我想将其转换为 yyyy mm dd 格式例如 2016 06 27 以进行逻辑比较我正在使用这个表达 as Date as character 27 06
对 git Push 运行单元测试，对 Pull 请求运行集成测试

在构建 R 包时我们使用 testthat 来编写测试我们有 2 个文件特定包的测试文件特异性R 我们用它来确保所有包继续一起工作并且总体结果良好整体R 当前当我们推送到 github 或通过 Travis 创建 PR 时都会
在 grid.text 中使用 pch 字符

我使用 ggplot2 创建了一个图表现在我想让图例不在图表上而是在图表外的网格中我现在的问题是是否有人知道是否有可能在 grid text 中使用 pch 符号 Here is an image to show what I wa
将行从 0 折叠到 0

对于这样的数据集 Incident ID date product INCFI0000029582 2014 09 25 08 39 45 foo INCFI0000029582 2014 09 25 08 39 48 bar INCFI0
如何在 R 或 MATLAB 中为散点图创建阴影误差条“框”

我想在 R 或 MATLAB 中创建一个简单的散点图涉及两个变量 x 和 y 它们有与之相关的错误 epsilon x 和 epsilon y 然而我不是添加误差线而是希望在每个 x y 对周围创建一个阴影框其中框的高度范围从 y
配置失败，因为找不到 libcurl

我正在尝试使用从远程服务器提取一些 json 数据fromJSON gt server lt http 111 111 000 00 3000 gt streams lt fromJSON paste server output strea
匹配较大向量中的序列

我想要一个函数它返回向量的匹配子序列的初始索引例如 y lt c a a a b c multi match c a a y 1 1 2 multi match c a b y 1 3 我有一个粗略的实现但我觉得我必须重新发明轮子而
R：函数中使用的 ggplot2 未反映字体大小变量的变化

我经常需要将多个不同大小的相同 ggplot2 图表输出到 png 文件通过使用输出高度和宽度以像素为单位的变量可以轻松生成每个 png 文件的大小对于 ggplot2 部分我使用字体大小和某些其他元素的变量并设置一个简单的循
如何使用电子表格中的第一行作为 Dataframe 列名称而不是 0 1 2...等？

我希望我的数据框将第一行名称显示为数据框列名称而不是从 0 等编号我该如何执行此操作我尝试使用 pandas 和 openpyxl 模块将我的 Excel 电子表格转换为数据框 import pandas as pd from ope
将箱线图与 Wilcoxon 检验进行比较

我正在使用 R 中的 ggplot2 包比较两组长度不同的个体和箱线图我想比较这两个分布但到目前为止我发现使用 wilcoxon 测试的唯一方法是 ggpubr 包中的 stat compare means 这是比较分布的正确方法吗
如何使用 grid.arrange 排列绘图的变量列表？

library ggplot2 df lt data frame x 1 10 y rnorm 10 p1 lt ggplot df aes x y geom point plist lt list p1 p1 p1 p1 p1 In my
在汇总表中添加一列，其中包含每个变量的分布图

有没有一种好方法来添加包含每个变量的分布图的列例如这里 library vtable st iris 没有必要使用这个包接受建议尽管我知道这可能更容易做到ggplot 我总是渴望看看我是否可以达到类似的结果base R绘图工具我将利
如何重置 pandas 数据框中的索引？ [复制]

这个问题在这里已经有答案了我有一个数据框从中删除了一些行结果我得到一个数据帧其中索引是这样的 1 5 6 10 11 我想将其重置为 0 1 2 3 4 我该怎么做以下似乎有效 df df reset index del df
删除单元格中的重复条目 - R

我在这里到处搜索并尝试了重复和独特的功能来解决我要问的问题但没有任何效果假设我有一个名为 company 的数据框其状态可变当我折叠行时我在状态变量观察之一中留下以下输出 PA PA PA TX TX 我怎样才能删除单元格内的重
如何创建一个包含滚动桶集中数据计数的集合

我有一个月的流量的服务器日志下面是部分示例 UploadDateGMT UserFileSize TotalBusinessUnits 2012 01 01 00 00 38 1223 1 2012 01 01 00 01 16 1302
每个 id 创建 n 行 |熊猫

我有一个数据框df如下 id lob addr addr2 a1 001 1234 0 a1 001 1233 0 a3 003 1221 0 a4 009 1234 0 我想生成n 让我们每个 id 取 4 行其他列是null na n
添加一个新列，其中标签附加到新月形数字

我想添加一个新列给出一个常量标签并逐行附加新月数字逻辑我的输入 position work chr1 jil2001 chr4 jil2001 chr3 kou2009 chr9 nai2012 chr7 fandis2005 我的预
在 Shiny 的压缩文件夹中下载多个 csv 文件

有人可以指出我如何使这个下载 zip 功能在 server R 中工作吗当我运行这个时我收到以下错误 1 var folders 00 1dk1r000h01000cxqpysvccm005p87 T Rtmps3T6Ua write
时间序列数据 - 如何[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在考虑进行一项为期一个月的研究受试者记录他的饮酒量和排尿频率我想让受试者每天记录这些活动这样我就有一个月的数据每天的排尿次
从另一个项目调用项目脚本

我正在构建一个 RStudio 项目项目 2 我想在其中访问另一个已构建的 RStudio 项目项目 1 中包含的某些脚本项目 1 包含各种脚本其中一些脚本通过source 来电有什么办法可以实现这一点吗我最初认为在项目 1 中

随机推荐

neo4j 导入速度减慢

我正在尝试使用 cypher 将大约 500 000 个节点的中等数据集导入到 neo4j 中我在配备 SSD 的 3 4 GHz i7 iMac 上本地运行 neo4j community 2 0 0 M05 我将密码传输到 neo4j
用完整的背景图像填充 svg 路径

我有下一个 svg
如何检测malloc失败？

有什么便携式方法可以检查是否malloc分配非零内存块失败根据单一 Unix 规范 http pubs opengroup org onlinepubs 007908799 xsh malloc html malloc将返回NULL并设置
AppDomain.CurrentDomain.Evidence 抛出 SerializationException

在 VS 2013 中使用 ReSharper 8 2 2 运行测试用例时我遇到了一个奇怪的错误演示问题的简化测试用例仅包含两行代码 CallContext LogicalSetData mydata new ActivityStack
无法从 Angular 中的资产文件夹加载 CSS 文件

我尝试在 Angular 5 项目中从资产文件夹加载 CSS 文件在这个文件夹中我有一个完整的模板当我打开文件夹中的默认 index html 时它可以正常工作但我想在 setcard component html 中使用它我打
nHibernate在多个线程上枚举相同的集合

我有一个生产应用程序 IIS8 MVC5 nHibernate DAL 并且我注意到最近 CPU 使用率很高循环应用程序池修复了它但在从服务器进行一些诊断和内存转储来分析问题之后我注意到多个线程尝试枚举同一集合的一致模式最常见的一点
Terraform v0.12 多行字符串 EOF shell 风格的“here doc”语法没有像 v0.11 之前那样被解释

在 Octopus Deploy 中我使用其应用 Terraform 模板设置了 Terraform 应用步骤在我的 Terraform main tf 文件中我想使用连接在 AWS 中的 Amazon Linux EC2 实例上运行
为什么 IoC/DI 在 Python 中不常见？

In Java IoC http en wikipedia org wiki Inversion of Control DI http en wikipedia org wiki Dependency Injection是一种非常常见的做法
错误 1449 (HY000): 指定为定义者的用户 ('mysql.infoschema'@'localhost') 不存在

我正在尝试列出 ubuntu 操作系统上 mysql 数据库中的所有表但我一直收到这个错误 mysql gt use mysql Database changed mysql gt show tables ERROR 1449 HY000
与 NHibernate ICriteria/QueryOver 查询的外连接中的条件相等

我该如何做equalsNhibernate QueryOver ICriteria 中外连接的条件我发现比较的唯一方法surveyRequest Survey Id with surveyID下面是与IsIn SystemUser sys
HTMLBars 模板中不允许使用“SCRIPT”标签

您好感谢您点击我的问题我刚刚将我的应用程序升级到最新的 ember cli 版本 2 3 0 beta 1 现在我的一个或多个模板搞乱了构建接下来的事情似乎是一个微不足道的问题但我从来没有完全解决它所以我终于问了正如标题所示
如何通过HttpClient以小写形式设置“Connection: keep-alive”标头？

我有一个任务需要能够以与 Firefox 浏览器相同的方式发送 Connection keep alive 标头请注意 keep alive 必须全部小写 Connection keep alive 但是我没有运气使用 HttpCli
州/省的地理边界 -> Google 地图多边形

我正在构建一个 Web 应用程序它将根据按钮和点击事件在 Google 地图上动态突出显示某些美国州和加拿大省份计划 A 多边形我的主要想法是绘制多边形为此我需要所有州和省轮廓顺时针或逆时针的坐标纬度经度列表在政府网站
如何修复“‘ServerVersion’引发‘System.InvalidOperationException’类型的异常”？ [复制]

这个问题在这里已经有答案了我有一个本地 SQL Server 数据库已启动并正在运行并且我正在尝试以一种看似万无一失的方式连接到它 new SqlConnection Server localdb v12 0 Integrated S
传达 Infinispan 远程异常会产生过多的网络流量

当我们的Infinispan集群版本9 4 8 Final 发生异常时出现异常的节点会将此信息发送到集群中的其他节点这似乎是设计使然此活动可能会导致大量流量从而导致超时异常进而使节点想要将其超时异常传达给其他节点在生产中我们
如何使用 Gatsby JS 处理国际化/本地化？

我想在世界各地的不同当地人中发布我的静态网站并提供本地化内容如何实现这一目标我最近添加了一个默认的 Gatsby starter 具有多语言 url 路由和浏览器语言检测功能 demo https gatsby starter defa
Keras Conv2D 和输入通道

Keras 层文档指定了卷积层的输入和输出大小 https keras io layers 卷积 https keras io layers convolutional 输入形状 samples channels rows cols 输出形
如何将多个报告附加在一起？

我有许多报告需要单独运行也需要作为一组运行我已经创建了这些报告并希望我可以创建一个表单在其中可以将 report1 report2 report3 等附加在一起而无需创建不同的报告并制作所有这些报告的子报告这可能吗编辑我在
Akka 在 Actor 之外进行日志记录

我有一个 Akka Actor 打电话给MyObject foo MyObject不是演员如何设置登录使用 Actor 就很简单因为我可以混合 Actor Logging 在 MyObject 中我无权访问 context syst
复制data.frame的每一行并指定每行的复制次数？

我在 R 中编程遇到以下问题我有一个数据字符串 jb 它很长这是它的一个简单版本 jb a b frequency jb expanded a b 5 3 2 5 3 5 7 1 5 3 9 1 40 5 7 12 4 5 9

复制data.frame的每一行并指定每行的复制次数？

Update

原答案

复制data.frame的每一行并指定每行的复制次数？ 的相关文章

随机推荐

热门标签

复制data.frame的每一行并指定每行的复制次数？的相关文章