data.table 相当于 tidyr 中的complete/fill

2024-03-26

我有以下数据

library(tidyr)
library(dplyr)
#> 
#> Attaching package: 'dplyr'
#> The following objects are masked from 'package:stats':
#> 
#>     filter, lag
#> The following objects are masked from 'package:base':
#> 
#>     intersect, setdiff, setequal, union
library(data.table)
#> 
#> Attaching package: 'data.table'
#> The following objects are masked from 'package:dplyr':
#> 
#>     between, first, last

df <- structure(list(filename = c("PS92_019-6_rovT_irrad.tab", "PS92_019-6_rovT_irrad.tab", 
  "PS92_019-6_rovT_irrad.tab", "PS92_019-6_rovT_irrad.tab"), depth = c(5, 
  10, 20, 75), ps = c(3.26223404971255, 3.38947945477306, 3.97380593851983, 
  0.428074807655144)), row.names = c(NA, -4L), class = c("tbl_df", "tbl", 
  "data.frame"), .Names = c("filename", "depth", "ps"))

df
#> # A tibble: 4 x 3
#>                    filename depth        ps
#>                       <chr> <dbl>     <dbl>
#> 1 PS92_019-6_rovT_irrad.tab     5 3.2622340
#> 2 PS92_019-6_rovT_irrad.tab    10 3.3894795
#> 3 PS92_019-6_rovT_irrad.tab    20 3.9738059
#> 4 PS92_019-6_rovT_irrad.tab    75 0.4280748

在此数据中，在深度 = 0 处缺少观测值。使用 tidyr，我可以通过以下方式完成它：

df %>% tidyr::complete(depth = c(0, unique(depth))) %>% fill(everything(), .direction = "up")  ## use the last observations to fill the new line
#> # A tibble: 5 x 3
#>   depth                  filename        ps
#>   <dbl>                     <chr>     <dbl>
#> 1     0 PS92_019-6_rovT_irrad.tab 3.2622340
#> 2     5 PS92_019-6_rovT_irrad.tab 3.2622340
#> 3    10 PS92_019-6_rovT_irrad.tab 3.3894795
#> 4    20 PS92_019-6_rovT_irrad.tab 3.9738059
#> 5    75 PS92_019-6_rovT_irrad.tab 0.4280748

问题是我必须在大型数据集上运行它，我发现完成/填充功能有点慢。因此，我想给与 data.table 一起看看它是否可以加快速度。但是，我我无法理解它。任何帮助表示赞赏。

它没有特定的功能，但您可以通过以下方式实现相同的功能：

# load package
library(data.table)

# convert to a 'data.table'
setDT(df)

# expand and fill the dataset with a rolling join
df[.(c(0, depth)), on = .(depth), roll = -Inf]

这使：

                    filename depth        ps
1: PS92_019-6_rovT_irrad.tab     0 3.2622340
2: PS92_019-6_rovT_irrad.tab     5 3.2622340
3: PS92_019-6_rovT_irrad.tab    10 3.3894795
4: PS92_019-6_rovT_irrad.tab    20 3.9738059
5: PS92_019-6_rovT_irrad.tab    75 0.4280748

请向@Frank 寻求改进建议。

旧的解决方案：

df[CJ(depth = c(0,unique(depth))), on = 'depth'
   ][, c(1,3) := lapply(.SD, zoo::na.locf, fromLast = TRUE), .SDcols = c(1,3)][]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dataTable

data.table 相当于 tidyr 中的complete/fill 的相关文章

访问动态创建的 Shiny 模块的返回值

我正在寻找构建一个闪亮的应用程序它动态创建返回简单表单的模块通过 callmodule 我有两个未解决的问题希望得到一些指导首先当向用户提供多个表单通过单击按钮时先前呈现的表单上的值将恢复为默认值如何停止这种行为以便值保
如何在RcppParallel中调用用户定义的函数？

受到文章的启发http gallery rcpp org articles parallel distance matrix http gallery rcpp org articles parallel distance matrix 我
使用 fread 导入数据后所有列均作为字符

我导入了一个 CSV 文件包含文本列和数字列 x lt fread myfile csv header TRUE verbose T na strings c null null 但导入后当我运行summary x 时所有列都被视为字
R（或替代方案？）中的高（或非常高）阶多项式回归

我想对 R 中的一组数据进行非常高阶回归拟合但是poly 函数的阶数极限为 25 对于此应用程序我需要的订单范围为 100 到 120 model lt lm noisy y poly q 50 Error in poly q 50
准备编程竞赛的缩写和函数[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
使用 sapply 的列表和矩阵

我有一个也许是基本的问题我在网上搜索过我在读取文件时遇到问题尽管如此我还是按照 Konrad的建议设法读取了我的文件我很欣赏这一点 How to get R to read in files from multiple subdi
根据条件计算平均值

下面是我的数据框 Row ID A B 1 0 0 2 0 0 3 0 0 4 0 1 5 0 1 6 0 1 7 62 75 0 8 100 0 9 100 0 10 100 1 11 100 1 12 100 1 13 100 1 14
R 中的聚类分析：确定最佳聚类数

如何选择最佳的聚类数量来进行 k 均值分析绘制以下数据的子集后多少个簇比较合适如何进行聚类树突分析 n 1000 kk 10 x1 runif kk y1 runif kk z1 runif kk x4 sample x1 lengt
如何导入 .tsv 文件

我需要读取一个表 tsvR 中的文件 test lt read table file drug info tsv Error in scan file what nmax sep dec quote skip nlines na strin
如何在 R 中绘制预测的子集？

我有一个简单的 R 脚本来根据文件创建预测自 2014 年以来就有数据记录但我在尝试实现以下两个目标时遇到了困难仅绘制预测信息的子集从 11 2017 开始以特定格式包含月份和年份即 6 月 17 日这是链接到dataset
R 和 Python 中 LU 分解结果不一致

我有以下矩阵A in R 1 2 3 4 1 1 1527778 0 4444444 0 375 0 3333333 2 0 5555556 1 4888889 0 600 0 3333333 3 0 6250000 0 4000000 1
为 Linux 安装 R 包时出错

我试图在 R 3 3 上安装一个名为 rgeos 的包但是当我输入 install packages rgeos 但它返回给我以下错误其他包也会发生同样的情况但不是所有包 gt installing source package rg
用于不规则时间序列的滚动窗口函数，可以处理重复项

我有以下数据框 grp nr yr 1 A 1 0 2009 2 A 2 0 2009 3 A 1 5 2009 4 A 1 0 2010 5 B 3 0 2009 6 B 2 0 2010 7 B NA 2011 8 C 3 0 2014
如何在 rmarkdown 中显示带有 results='asis' 的格式化 R 输出

当使用 results asis 时有没有办法在 rmarkdown knitr 中显示格式化程序 R 输出一个例子是以下函数 myfun lt function cat hello n cat c one 1 two 2 然后该块将
如何拆分 data.frame -> 将合并应用于子集 -> 合并到 data.frame 中

我真的不知道如何在不使用 for 循环的情况下实现这一目标 x lt c a b c d gt x 1 a b c d data lt data frame x c a b a b c a a b c d name c one one tw
ggplot() 使用scale::percent_format() 缩放产生奇怪的结果

library tidyverse mtcars gt count cyl gt mutate prop n sum n gt ggplot aes x cyl y prop geom point scale y continuous la
如何在主图区域之外的 ggplot2 中添加多个标题

我想为页脚添加两个标题但 ggplot 似乎只需要 1 是否有解决方法可以将注释或 geom text 添加到左下角和右下角 library ggplot2 p lt ggplot mtcars aes x wt y mpg geom p
为“facet_wrap”中的每列创建边框和标题

我想在每个方面周围放置带有标签和标题的黑色边框facet wrap 与此类似的东西样本数据 library tidyverse mtcars gt mutate gear factor gear levels c 4 3 5 gt ggp
如何更改数据表中的少数列名称

我有一个包含 10 列的数据表 town tc one two three four five six seven total 需要生成我正在使用的列一到总计的平均值 DTmean lt DT lapply SD mean by t
如何在R中绘制仪表图表？

如何在 R 中绘制以下图 Red 30 Yellow 40 Green 30 Needle at 52 所以这里有一个完整的ggplot解决方案注意从原始帖子中编辑在仪表中断处添加数字指示器和标签这似乎是OP在评论中所要求的如果不

随机推荐

将 margin-bottom 添加到页脚之前的图像

我想看看是否有办法添加margin bottom to an img仅当元素后跟一个footer元素目前我正在使用一个特殊的类 image before footer 在我最后一次img元素来实现这一点但想知道是否有办法在 CSS 中动
有没有人能够成功使用 albahari.com 的 PredicateBuilder 来对抗 MongoDB？

我使用 albahari com 中流行的 PredicateBuilder 编写了以下代码 var predicate PredicateBuilder False
增加tomcat 7中的并发连接数

想知道如何增加tomcat 7中的并发连接数我做了一些研究从apache文档中发现设置acceptCount maxConnections的值并增加maxThreads可以做到这一点但是当尝试时我只能提交500个请求1000 下面
多字段匹配查询

我对弹性搜索相当陌生想编写一个涉及两个字段的查询我的意思是字段的内容包含指定的子字符串我有一个包含字段的文档如下所示 name n tag t 我试过这个 search d query match name n tag t 但查询结
androidx.legacy:legacy-support-v4: 依赖有什么用

我正在实现 Android Room 数据库在其中一篇教程中我发现了使用androidx legacy legacy support v4 1 0 0依赖性谁能告诉我这种依赖关系的用途 androidx legacy legacy su
Linux 上的 PHP 和 RAW Sockets

做一个就足够了 sudo setcap cap net raw eip usr bin php5 能够在 Linux 中的 PHP 而不是 CLI 中使用 RAW SOCKETS 吗如果是那么它不起作用但开始在 CLI 中工作但不使用
如何在 C# 中解析 HTTP url？

我的要求是解析 Http URL 并相应地调用函数在我当前的实现中我使用嵌套的 if else 语句我认为这不是一种优化的方式您能建议其他一些有效的方法吗网址是这样的 server func1 server func1 SubFu
使用服务主体对 GetReportInGroupAsync PowerBI Embedded API 调用进行未经授权的响应

我正在尝试将 Power BI 报告嵌入到我的 Net Core 应用程序中但是我无法从请求中获得有效的响应我正在使用 Microsoft PowerBI API 包和通过服务主体注册的 azure 应用程序据我所知我已按照此处的说
在没有包装器的情况下在 QT 上使用 OpenGL [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个与 OpenGL 结合使用的 GUI 工具包 QT 看起来很有前途但不幸的是它将大多数
在 Angular 中旋转伪 3D 轮播

我正在尝试创建一个伪 3d 轮播其中包含 5 个项目如下所示并让它们循环我发现这很棒堆栈闪电战 https stackblitz com edit angular ivy sqt1uq file src 2Fapp 2Fapp co
一般替换 Angular 2 路由参数并导航

我正在构建一个 Angular 应用程序其中大多数路由都属于给定项目并包含一个projectId 顶部导航区域将有一个项目的下拉列表当用户从下拉列表中选择一个项目时它需要导航到当前路线但将 projectId 替换为新值这非常类似
NameError：未定义全局名称“numpy”

我正在尝试通过收集 essentia 一个 MIR 库函数来编写一个特征提取器流程图如下单独的特征提取池化 PoolAggregator 使用poolAggregator连接形成整个特征列表np concatenate 即使不导入
如果屏幕上显示多个二维码，请扫描二维码

我正在开发一个Android示例应用程序作为一个学术项目我需要扫描二维码我使用了二维码扫描库如果屏幕上只有一个二维码我能够成功检测到二维码是的我想扫描二维码尽管相同的二维码一次显示在屏幕上的多个位置例如在我的笔记本电脑屏幕
Nginx：何时使用 proxy_set_header 主机 $host 与 $proxy_host

我一直在阅读反向代理想知道什么时候proxy set header Host host是适当的proxy set header Host proxy host 我做了一些研究本文 https www digitalocean com co
在强制布局上拖动会阻止其他 mouseup 侦听器

我想在 d3 js 强制布局中启用拖动当拖动一个圆圈并释放鼠标按钮时我想通过回调调用特定的函数如下所示 this force d3 layout force nodes this nodes size this width this
Netty websocket客户端闲置5分钟后不从服务器读取新帧

我在服务器端和客户端都使用 Netty 来建立和控制 websocket 连接我在服务器端有一个空闲状态处理程序 http netty io 4 1 api io netty handler timeout IdleStateHandle
在jsp页面中显示jfreechart

我想显示一个jfreechartjsp 页面中的图表我写的代码如下 img src chart jpg 哪里的createCategoryChart 方法创建所需的 jpg 它存储在 eclipse 文件夹中我没有在文件名中添加任何路径
强制 UIView/UIVIewController 方向

我们正在编写一个专门处于横向模式的应用程序我们对根视图使用变换将其旋转到 LandscapeRight 然后该视图加载的每个视图都共享坐标系这一切都很好除了我们的视图之一有一个由视图控制器加载的 UIWebView 对象我们尝试查看
如何将shadershop公式转换成glsl

我最近一直在学习着色器的一些基础知识并且想出了一个很棒的视觉工具着色器商店 http www cdglabs org Shadershop 但我无法将我在此站点中创建的公式转换为 glsl 一个简单的例子我在此网站中创建了一个公式我
data.table 相当于 tidyr 中的complete/fill

我有以下数据 library tidyr library dplyr gt gt Attaching package dplyr gt The following objects are masked from package stats

data.table 相当于 tidyr 中的complete/fill

data.table 相当于 tidyr 中的complete/fill 的相关文章

随机推荐

热门标签