如何根据值扩展数据框？ [复制]

2024-06-05

我有以下输入数据框：

df <- data.frame(x=c('a','b','c'),y=c(4,5,6),from=c(1,2,3),to=c(2,4,6))  
df
  x y  from to
1 a 4  1    2
2 b 5  2    4
3 c 6  3    6

现在我想将每行乘以 from 和 to 之间的值，即 ('a',4) 跨越两行，即1,2。预期结果如下所示：

exp <- data.frame(x=c('a','a','b','b','b','c','c','c','c'),
                  y=c(4,4,5,5,5,6,6,6,6),
                  z=c(1,2,2,3,4,3,4,5,6))
exp
  x y z
1 a 4 1
2 a 4 2
3 b 5 2
4 b 5 3
5 b 5 4
6 c 6 3
7 c 6 4
8 c 6 5
9 c 6 6

在没有循环的情况下完成此任务的最惯用的方法是什么？

一种“非 tidyverse”方式：

data.frame(
  x = c('a', 'b', 'c'),
  y = c(4, 5, 6),
  from = c(1, 2, 3),
  to = c(2, 4, 6),
  stringsAsFactors = FALSE
) -> xdf

do.call(rbind.data.frame, lapply(1:nrow(xdf), function(i) {
  data.frame(x = xdf$x[i], y=xdf$y[i], z=xdf$from[i]:xdf$to[i], stringsAsFactors=FALSE)
}))

一种“tidyverse”方式：

library(tidyverse)

data_frame(
  x = c('a', 'b', 'c'),
  y = c(4, 5, 6),
  from = c(1, 2, 3),
  to = c(2, 4, 6)
) -> xdf

rowwise(xdf) %>% 
  do(data_frame(x = .$x, y=.$y, z=.$from:.$to))

另一种“tidyverse”方式not已进行以下基准测试：

xdf %>% 
  rowwise() %>% 
  do( merge( as_tibble(.), tibble(z=.$from:.$to), by=NULL) ) %>%
  select( -from, -to )     # Omit this line if you want to keep all original columns.

既然你问了 abt 性能：

library(microbenchmark)

data.table::data.table(
  x = c('a','b','c'),
  y = c(4,5,6),
  from = c(1,2,3),
  to = c(2,4,6)
) -> xdt1

data.frame(
  x = c('a', 'b', 'c'),
  y = c(4, 5, 6),
  from = c(1, 2, 3),
  to = c(2, 4, 6),
  stringsAsFactors = FALSE
) -> xdf1

data.table操作经常就地修改，因此保持公平竞争环境并在执行操作之前复制每个数据帧/表。

那个时间惩罚是~100纳秒在大多数现代系统上。

microbenchmark(

  data.table = {
    xdt2 <- xdt1
    xdt2[, diff:= (to - from) + 1]
    xdt2 <- xdt2[rep(1:.N, diff)]
    xdt2[,z := seq(from,to), by=.(x,y,from,to)]
    xdt2[,c("x", "y", "z")]
  }, 

  base = {
    xdf2 <- xdf1
    do.call(rbind.data.frame, lapply(1:nrow(xdf2), function(i) {
      data.frame(x = xdf2$x[i], y=xdf2$y[i], z=xdf2$from[i]:xdf2$to[i], stringsAsFactors=FALSE)
    }))
  }, 

  tidyverse = {
    xdf2 <- xdf1
    dplyr::rowwise(xdf2) %>% 
      dplyr::do(dplyr::data_frame(x = .$x, y=.$y, z=.$from:.$to))
  }, 

  plyr = {
    xdf2 <- xdf1
    plyr::mdply(xdf2, function(x,y,from,to) data.frame(x,y,z=seq(from,to)))[c("x","y","z")]
  },

  times = 1000

)
## Unit: microseconds
##        expr       min         lq       mean    median         uq        max neval
##  data.table   920.361  1072.9265  1257.2321  1178.832  1280.2660  10628.552  1000
##        base   677.069   761.3145   884.4136   825.472   915.8985   5366.515  1000
##   tidyverse 15926.127 17231.5015 19201.4798 17994.919 20014.4140 166901.570  1000
##        plyr  1938.838  2196.4205  2448.5314  2322.949  2501.5075   5735.255  1000

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

如何根据值扩展数据框？ [复制] 的相关文章

R 绘制一些 unicode 字符，但不绘制其他字符

我们的系统管理员刚刚将我们的操作系统升级到 SLES12SP1 我重新安装了 Rv3 2 3 并尝试绘图我用cairo pdf并尝试绘制 x 标签为的图 u0298即太阳能符号但它不起作用标签只是空白例如 cairo pdf Rpl
R ggplot结合颜色图例和不同因子长度的填充

我正在使用不完整因子设计的数据绘制图表由于设计的原因我的颜色手动比例和填充手动比例的长度不同因此我得到了两个传说我怎样才能删除其中之一或者更好地将它们组合起来我看过这些问题合并单独的大小并填充 ggplot 中的图例 http
R 数据框中的重复行

我正在尝试使用下面的代码复制数据框中的行但是我发现它很慢 duprow df 1 for i in 1 2000 print i df rbind df duprow 有更快的方法吗您可以使用rep 例如对于数据框第 1 行的 5 个
我想将两个变量合并为一个具有日期格式的变量

我有一个包含几个月的字符列的数据集 MONTH 和指示年份的数字列 YEAR 为了将其用作面板数据我需要将这些结合起来YEAR and MONTH转换为日期格式的变量我尝试过改变变量MONTH转换为数字格式然后合并MONTH与柱YEA
在 R 中调用“boot”时没有数据

我有一个包含很多列的数据框第一列包含系统 1 系统 2 等类别第二列包含代表 0 和 1 的数字请看下面例如 SYSTEM Q1 Q2 S1 0 1 S1 1 0 S2 1 1 S2 0 0 S2 1 1 我在 R 中有这段代码来
按组渐进串联列[重复]

这个问题在这里已经有答案了假设我有这个输入 ID date 1 date 2 str 1 1 2010 07 04 2008 01 20 A 2 2 2015 07 01 2011 08 31 C 3 3 2015 03 06 2013
R 矩阵到犰狳的转换非常慢

观察对于中等大小的矩阵将矩阵从 R 传递到 C 的开销要慢得多arma mat类型比NumericMatrix类型大约需要 250 倍的时间这是一个最小的例子 include
使用同一变量的多个子集创建新数据框

我想创建一个新的数据框其中的列是由不同变量分割的同一变量的子集例如我想创建一个新的变量子集 b 其中列由不同变量 year 的子集分割 set seed 88 df lt data frame year rep 1996 1998 3
R 中带有自定义字段类的参考类？

我想在另一个引用类中使用自定义引用类但此代码失败 nameClass lt setRefClass nameClass fields list first character last character methods list ini
Python pandas：向我的数据框中添加一列来计算变量

我有一个像这样的数据框 gt org group org1 1 org2 1 org3 2 org4 3 org5 3 org6 3 我想将列 count 添加到 gt 数据帧以计算组的成员数量预期结果如下 org group count
R data.table如何创建重复项[重复]

这个问题在这里已经有答案了 I have dataDT lt data table A 1 3 B 1 3 dataDT A B 1 1 1 2 2 2 3 3 3 I want dataDT lt data table A c 1 3 1
如何从 R 中的列表列表中提取元素？

我有一堆列表其中包含列表广义线性模型输出我想编写一个函数该函数将从每个列表中提取多个元素然后将结果组合到数据框中我想提取modelset 1 likelihood modelset 1 fixef modelset 2 like
如何在 R 中计算带有变量的表达式？

我希望这段代码能够设置plt等于 10 gt var plt gt eval paste0 var lt 10 1 plt lt 10 但相反它返回一个字符串 I tried eval as expression paste0 var l
在 pandas 的单独列中分配 2 次幂的存储桶范围

我有一列值如下所示 col 12 76 34 我需要为此生成一个带有存储桶标签的新列col1如下所述 col1 bucket labels 12 8 16 76 64 128 34 32 64 这里列中的值可能会有所不同结果的数量也会
我收到类似 Error in if (file.access(phantompath, 1) < 0) { 的错误：当我使用 Phantomjs(port = 4567l) 时，参数的长度为零

我的代码是 library RSelenium library wdman pDrv lt phantomjs port 4567L 以下是运行上述代码后出现的错误 checking phantomjs versions BEGIN PRE
升级到 Mac OSX 10.10 后，从 R 控制台运行系统命令无法找到已安装的程序

我一直有一些奇怪的问题 https stackoverflow com questions 26477679 texi2dvi error when compiling tex files using rstudio and knitr s
R 代码编程：在堆叠排序表上先向下填充缺失列值，然后向上填充

我有一个包含 3 列的数据框但第三列有一些缺失值需要用以下逻辑填充期望的结果是第三列部分上没有缺失值要填充它我们必须找到第一个周其中为该特定项目第一列填充了部分值并且然后通过向下复制 part 来填充它直到找
GGplot为点添加数据标签

如何使用 ggplot 将数据标签添加到点我有一个名为 stacked 的堆叠数据框 gt head stacked time value variable 1 100 152 2211 gg 2 110 146 3304 gg 3 11
带有预先计算值的 geom_boxplot

过去我已经能够使用 ggplot2 创建箱线图方法是提供下须线下分位数中位数上分位数和上须线以及 x 轴标签例如 DF lt data frame x c A B min c 1 2 low c 2 3 mid c 3 4 to
将多个ggplot2图保存为列表中的R对象并在网格中重新显示

我想在大型 for 循环期间将多个绘图使用 ggplot2 保存到列表中然后随后在网格中显示图像使用 grid arrange 我已经尝试了两种解决方案 1 将其存储在列表中如下所示 pltlist qplot lt qplot 然

随机推荐

matplotlib vlines 图中未应用 y 轴的最小值

我正在 matplotlib 中绘制 vlines 图数据集中的所有 y 值如下 gt 0 我希望 y 轴最底部的刻度能够读取0 但相反我得到 500 这是代码 usr bin env python import numpy as np
如何通过 swift 包管理器在 swift 项目中添加 Alamofire [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我正在探索 SPM 现在我需要知道如何在我的项目中通过 SPM 导入 Alamofire 创建一个名为的 swift 文件Package在你
C/C++ 中随机数生成器的实现[重复]

这个问题在这里已经有答案了我对 C 中随机数生成器的实现有点困惑它也与 C 中的明显不同如果我理解正确对 srand seed 的调用会以某种方式初始化可通过 rand 访问的隐藏变量种子该变量又将函数指向预先生成的序列例如例
在 Mono 上使用 Mono for android

将 MonoDevelop 的编译器切换为 Mono 工具而不是 NET 看起来非常容易您只需在 IDE 的设置下选择不同的框架即可然而在切换到 Mono 并使用 Mono 工具编译项目后 Mono for android 似乎不再是
如果用户可以解密 web.config，那么加密它有什么意义呢？

哎呀一些供应商告诉我的老板不加密 web config 是一个很大的安全漏洞这对我来说听起来像是废话我的意思是如果有人破坏了服务器我们不是就完蛋了吗就像 Joelt 所建议的那样 ASP NET 最近出现了一个安全问题允许人
在 Express 中设置客户端可访问 Cookie

我正在开发一个使用 Express 和 SocketIO 的 Node 应用程序我想在我的 Express 控制器中设置一个 cookie 然后可以从我的客户端 Javascript 代码访问该 cookie 我尝试的一切似乎都不起作用
我应该使用 AWK 或 SED 删除 CSV 文件中引号之间的逗号吗？（重击）

我有一堆日常打印机登录CSV格式我正在编写一个脚本来跟踪使用了多少纸张并将信息保存到数据库中但我遇到了一个小问题本质上日志中的一些文档名称中包含逗号全部用双引号引起来并且由于它采用逗号分隔格式所以我的代码搞乱了并将所有内容推到
ImproperlyConfigured at / 不允许空静态前缀 - Django

我正在使用 Django 上传显示图像该网站部署在 Heroku 上下列的this https coderwall com p bz0sng教程我能够成功上传图像但是图像并未显示在模板中然后我了解到我的 urls py 末尾应该
Flash AS3 -domain.com/crossdomain.xml 和安全错误

在代码中我在 URLLoader 之前使用它 swf 将与许多不同的域一起使用并且这将及时更改 Security allowDomain In http domain com crossdomain xml http domain co
如何将 C++ 类包装在基于 C 的 dll 或基于 CLI 的 dll 中？

我被告知将我用 C 编写的类导入到 dll 中然后在 c 应用程序中使用该 dll 下列的本指南 https stackoverflow com questions 4555961 how to use a class in dll我创建
celerybeat 和 sqlalchemy + 金字塔应用程序出现“ResourceClosedError：事务已关闭”错误

我有一个名为的金字塔应用程序mainsite 该站点以相当异步的方式工作主要是通过从视图启动线程来执行后端操作它使用 sqlalchemy 连接到 mysql 并使用 ZopeTransactionExtension 进行会话管理到目
如何将 STOMP 客户端连接到 Wildfly？

我想向 STOMP 客户端公开我的 WildFly 服务器但我还没有找到任何最近的样本据我了解最近 WildFly 版本中的所有通信都通过单个套接字默认情况下监听 8080 我需要更改任何配置还是开箱即用任何指示表示赞赏我使用的
用于选择 querySelector 中当前元素的 CSS 伪选择器可用于同级 (+) 或一般同级 (~) 选择器？ [复制]

这个问题在这里已经有答案了如果我有这个 HTML div class elem div class child div div div class sibling div 和JS let elem document querySelect
Django 模板变量从 {% for %} 循环到 Javascript

这是一个迭代记录的 Django 模板每条记录都包含一个由 JS 函数填充的 div 为了让 JS 知道要做什么它需要从每次 for 循环迭代中获取一个变量并使用它我不知道具体如何实现这一目标或是否可能我不知道也许记录在单独的 J
在R中使用plotly在轴标题中换行和下标

我刚开始使用plotly对于 R 中的一些交互式散点图并且在轴标签上遇到困难通常我设计我的情节ggplot2然后使用ggplotly函数来转换它们但这有时由于某种原因非常慢所以我想直接在中创建我的图plotly 我现在尝试更改轴标题
为什么我在 Java 中收到有关“可能丢失精度”的警告？

class Test public static void main String args short s 2 s1 200 s2 s2 s s1 error possible loss of precision System out p
Rails 3.1 中的嵌套表单

我在嵌套表单方面遇到问题 rails 3 1 在应该渲染 fields for 块时不渲染 fields for 块例如在编辑现有记录时由于我对自己的英语不够自信我制作了一个小示例应用程序新行动 def new manga Man
在 MVC 类上创建主键字段

我是 MVC 和 C 新手我只是偶然发现它并发现它很有趣我遇到了一个不允许我继续的问题这是我的代码 using System using System Collections Generic using System Linq usi
如何搭建qtwayland？

我花了一整天的时间尝试使用QtWayland Compositor 1 0在 Qt 创建者中我已经遵循了从那里开始的所有步骤https wiki qt io QtWayland https wiki qt io QtWayland但我收到
如何根据值扩展数据框？ [复制]

这个问题在这里已经有答案了我有以下输入数据框 df lt data frame x c a b c y c 4 5 6 from c 1 2 3 to c 2 4 6 df x y from to 1 a 4 1 2 2 b 5 2 4

如何根据值扩展数据框？ [复制]

如何根据值扩展数据框？ [复制] 的相关文章

随机推荐

热门标签