R 将时间序列中的重复行与数据表中的不同列类型组合起来

2023-11-27

这个问题是建立在另一个问题的基础上的R 按 ID 将重复行与数据框中不同的列类型组合起来。我有一个带有列的数据表time以及其他一些不同类型的列（因子和数字）。这是一个例子：

dt <- data.table(time  = c(1, 1, 1, 1, 1, 2, 2, 3, 3, 4, 4, 4, 4),
             abst  = c(0, NA, 2, NA, NA, NA, 0, 0, NA, 2, NA, 3, 4),
             farbe = as.factor(c("keine", NA, "keine", NA, NA, NA, "keine", "keine", NA, NA, NA, "rot", "blau")),
             gier  = c(0, NA, 5, NA, NA, NA, 0, 0, NA, 1, NA, 6, 2),
             goff  = as.factor(c("haus", "maus", "toll", NA, "haus", NA, "maus", NA, NA, NA, NA, NA, "maus")),
             huft  = as.factor(c(NA, NA, NA, NA, NA, "wolle", NA, NA, "wolle", NA, NA, "holz", NA)),
             mode  = c(4, 2, NA, NA, 6, 5, 0, NA, NA, NA, NA, NA, 3))

现在我想合并列中的重复时间time。数字列定义为所有相同 ID 的平均值（不含 NA！）。因子列合并为一列。 NA 可以省略。

dtRes <- data.table(time  = c(1, 1, 1, 2, 3, 4, 4),
                abst  = c(1, 1, 1, 0, 0, 3, 3),
                farbe = as.factor(c("keine", "keine", "keine", "keine", "keine", "rot", "blau")),
                gier  = c(2.5, 2.5, 2.5, 0, 0, 3, 3),
                goff  = as.factor(c("haus", "maus", "toll", "maus", NA, "maus", "maus")),
                huft  = as.factor(c(NA, NA, NA, "wolle", "wolle", "holz", "holz")),
                mode  = c(4, 4, 4, 2.5, NA, 3, 3))

我需要对此进行一些快速计算，因为我有大约一百万个观察值。

对这个问题的一些额外想法：farbe可能不是唯一的。在这种情况下，我认为对我的数据来说最好的想法是有一个重复的行，但只有一个不同的行farbe，因此有 2 个相同的时间，其余时间保持相同，但值不同farbe。这应该只是非常罕见的情况，但将是一个很好的补充。

另外：我的真实数据中有更多的数字和因子列，所以我不想单独定义每一列。在某些数据表中没有因子列。因此，即使没有数字（time总是存在并且数字）或因子列。

提前谢谢！

我们可以通过以下方式进行分组mean

library(data.table)
library(tidyr)
library(dplyr)
dt[, lapply(.SD, function(x) if(is.numeric(x)) mean(x, na.rm = TRUE)
     else toString(unique(x[!is.na(x)]))), .(time)] %>%
     separate_rows(farbe, goff)
# A tibble: 7 x 7
#   time  abst farbe  gier goff   huft     mode
#  <dbl> <dbl> <chr> <dbl> <chr>  <chr>   <dbl>
#1     1     1 keine   2.5 "haus" ""        4  
#2     1     1 keine   2.5 "maus" ""        4  
#3     1     1 keine   2.5 "toll" ""        4  
#4     2     0 keine   0   "maus" "wolle"   2.5
#5     3     0 keine   0   ""     "wolle" NaN  
#6     4     3 rot     3   "maus" "holz"    3  
#7     4     3 blau    3   "maus" "holz"    3

Or with cSplit

library(splitstackshape)
cSplit(dt[, lapply(.SD, function(x) if(is.numeric(x)) 
    mean(x, na.rm = TRUE) else toString(unique(x[!is.na(x)]))), .(time)], 
    c('farbe', 'goff'), sep= ',\\s*', 'long', fixed = FALSE)
#   time abst farbe gier goff  huft mode
#1:    1    1 keine  2.5 haus        4.0
#2:    1    1  <NA>  2.5 maus        4.0
#3:    1    1  <NA>  2.5 toll        4.0
#4:    2    0 keine  0.0 maus wolle  2.5
#5:    3    0 keine  0.0 <NA> wolle  NaN
#6:    4    3   rot  3.0 maus  holz  3.0
#7:    4    3  blau  3.0 <NA>  holz  3.0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dataTable

TimeSeries

Aggregate

R 将时间序列中的重复行与数据表中的不同列类型组合起来的相关文章

如何将 pandas DataFrame 转换为 TimeSeries？

我正在寻找一种将 DataFrame 转换为 TimeSeries 而不拆分索引和值列的方法有任何想法吗谢谢 In 20 import pandas as pd In 21 import numpy as np In 22 dates
在另一列的字符串中搜索一列中的文本

这里是 R 新手一直在搜索此论坛尝试找到一种在同一行数据的字符串中搜索文本的方法我以前使用过 grepl 但无法让它向下查找列并对每一行应用检查我觉得这是一个简单的解决方案但我花了几个小时但似乎无法得到它基本上我有类似下面第
在 R 中查找 Windows 用户名

有没有办法在 R 会话中获取当前的 Windows 用户名或 Windows 主目录 Thanks 抱歉如果我错过了什么但我找不到任何东西你可以做 Sys getenv USERNAME Sys getenv HOME 如果你只是输入
挖泥机子集 (MuMIn) - 如果存在主效应，则必须包括交互作用

我正在使用 dredge MuMIn 进行一些探索性工作在此过程中我想将两个变量设置为仅当它们之间存在相互作用时才允许一起出现即它们不能仅作为主要效果一起出现使用样本数据我想挖掘模型 fm1 尽管它可能没有意义如果变量 GNP
RQuantLib 包不适用于 R 3.5.0

有没有其他人尝试加载 R 3 5 0 的 RQuantLib 包我尝试过以前有效 install packages drat dependencies TRUE drat addRepo ghrr install packages RQ
如何为 nls 函数找到良好的起始值？

我不明白为什么我不能对这些数据使用 nls 函数我尝试过很多不同的起始值但总是出现相同的错误这是我一直在做的事情 expFct2 function x a b c a 1 exp x b c vec x lt c 77 87 87 7
R 中数据帧的条件求和

我正在努力将在 Excel 中进行的分析迁移到 R 因为我的数据集已达到 Excel 的限制在 Excel 中我有一个工作表状态它执行 sumifs 函数对另一个工作表成员中状态中具有相同状态周组合的值求和我想在 R
根据R中的特定行值将数据帧拆分为多个数据帧

我需要根据数据帧中重复出现的标题行将数据帧拆分为 17 872 个数据帧我需要将新创建的数据框存储在列表中我的数据框看起来像 0 1 2 32 Alert Type Response 33 w1 x1 y1
将 dplyr 中的starts_with与部分列名称的向量一起使用

我想使用 dplyr 选择与字符串向量匹配的某些列 one lt seq 1 10 two lt rnorm 10 three lt runif 10 1 2 four lt 10 1 df lt data frame one two th
R 中自定义函数的等高线图

我正在使用一些自定义函数我需要根据参数的多个值为它们绘制轮廓这是一个示例函数我需要画这样的等高线图任何想法 Thanks 首先你构造一个函数 fourvar它将这四个参数作为参数在这种情况下您可以使用 3 个变量来完成此操作其
在 r 中使用 SSasymp

我想我不知道如何在 r 中使用 SSasymp 函数我想为我的项目创建一个渐近函数我试过这个 c lt seq 0 200 0 5 d lt SSasymp c 500 0 log 50 plot c d type l log 50 应
R 中带有变音符号的字符列表

我试图将字符串中的电话字符出现次数制成表格但变音符号单独作为字符制成表格理想情况下我有一个国际音标的单词列表其中包含大量变音符号以及它们与基本字符的几种组合我在这里给出了仅包含一个单词的 MWE 但对于单词列表和更多类型的组合
将从数据透视表包生成的数据透视表转换为数据帧

我正在尝试制作一个数据透视表pivottabler包裹我想将数据透视表对象转换为数据框以便我可以将其转换为数据表带有 DT 并在 Shiny 应用程序中渲染它以便可以下载 library pivottabler pt qpvt mt
使管道工 API 可通过互联网使用

我对 R 中的管道工包相当陌生我有一个可以在我的计算机上本地运行的工作 API 我可以使用以下代码从网络上的实时 JS 应用程序访问它 r lt plumb my api code r r run host 0 0 0 0 port 80
在 R 中，如何让 PRNG 在平台之间给出相同的浮点数？

在 R 4 1 1 中运行以下代码会在平台之间产生不同的结果 set seed 1 x lt rnorm 3 3 print x 22 0 83562861241004716 intel windows 0 8356286124100471
使用示例代码继续在 ggplot2 中遇到错误“loop_apply”未从当前命名空间（plyr）解析”

我今天一直遇到这个错误我已经从 github 下载了 plyr 但它仍然不起作用安装 plyr 后我重新启动了 R studio 甚至我的电脑看来问题可能是由于 R 解析对外部 DLL 的引用的方式发生了变化正如线程中途提到的he
将日期刻度添加到 R 中的 ggplot

我试图在此图中的 x 轴上添加刻度以显示一年中的所有月份我的代码如下 library ggplot2 library scales p lt ggplot df test aes time reading p geom point alp
R tidyr regex：从字符列中提取有序数字

假设我有一个像这样的数据框 df lt data frame x c This script outputs 10 visualizations This script outputs 1 visualization This script
三角形内的热图

考虑以下示例 triangle lines lt data frame X c 0 0 1 1 0 5 0 5 Y c 0 0 0 0 1 1 grp c 1 2 1 3 2 3 df lt matrix c c 0 2 0 5 0 8 c
将一个 Rmarkdown 文档中的代码块插入到另一个 Rmarkdown 文档中

我一直在举办一些小型 R 教程研讨会我将挑战脚本保存在 Rmarkdown 文档中它们包含自由文本和 R 代码块一些代码块是预先填充的例如为了设置数据集以供以后使用而一些代码块则供与会者在研讨会期间填写代码对于每个挑战脚

随机推荐

JPanel 动作监听器

我有一个 JPanel 其中有一堆不同的复选框和文本字段我有一个已禁用的按钮需要在设置特定配置时启用我需要的是在整个 JPanel 上寻找事件的监听器每当发生任何变化时我相信我需要一个动作侦听器但我找不到任何东西来桥接动作侦听器
“导入错误：没有名为 pwd 的模块”，但它存在

我正在尝试在本地测试 gae boilerplate 但是当我尝试创建新帐户时会出现以下错误奇怪的是如果我打开 python 解释器并输入 import pwd 它就会起作用 Internal Server Error The ser
Objective C 中的悬空指针 - nil 也会释放内存吗？

我的理解是当内存未被释放或释放时就会发生内存泄漏当指针未设置为 nil 并且对象被释放时就会出现悬空指针我的问题是可以将对象设置为 nil 释放内存并清除指针引用吗 i e Car myCar Car alloc initW
需要重构箭头反模式的想法

我继承了一个怪物它伪装成 NET 1 1 应用程序处理符合医疗保健索赔支付 ANSI 835 标准的文本文件但它是一个怪物正在处理的信息涉及医疗保健索赔 EOB 和报销这些文件由在前几个位置具有标识符的记录和根据该类型记录的规范格式
Go结构体和字节数组之间的转换

我正在用 Go 编写一个客户端服务器应用程序我想在 Go 中执行类似 C 的类型转换例如在围棋中 type packet struct opcode uint16 data 1024 byte var pkt1 packet n r
如何在视图内切换视图？

我正在使用 MVVM 轻型框架制作一个 WPF 应用程序我想做的是在视图中有一个登录表单当用户按下该视图中的按钮时它会为附加的 ViewModel 启动 LoginCommand 从那里我要么想要启动一个包含应用程序其余部分的新窗口
没有可用的 mysql-server 软件包

我正在尝试在 Amazon Linux 实例上设置 MySQL 我已经尝试了所有方法也使用 y 选项 sudo yum install mysql server sudo yum install mysql56 server sudo y
从类中删除必需的属性，但 MVC3 仍然不会在文本框中没有值的情况下发布表单

我有课在某一时刻我使用 System ComponentModel 将类的属性设置为 Required 好吧然后我意识到这是没有必要的我已经删除了所需的属性但是当我尝试将表单提交到 ActionResult 时表单不会发布并且
C# - 通过进程名称的一部分来终止进程

我正在寻找如何在 C 中执行此操作如下所示 foreach Process proc in Process GetProcessesByName cheatengine x86 64 proc Kill 我正在使用这个语句但是该程序有不
销毁并重新创建一个对象是否会使指向该对象的所有指针无效？

这是后续这个问题假设我有这样的代码 class Class public virtual method this gt Class new this Class Class object new Class object gt metho
检测 Android JNI 代码中的本机内存泄漏

如何检测Android JNI代码中的内存泄漏我正在使用弗罗约 2017年更新 valgrind 可用对于安卓内置的 malloc 调试功能在以下版本中得到了显着扩展安卓N 对于查找内存泄漏非常有用您可能需要 exit 应用程序触发
iPhone 的动态图标更改

我的问题也和其他人之前问过的一样我发现一旦你设置了应用程序的图标我们就无法更改应用程序图标动态地是的我同意了如果是这样我们使用动态图标苹果不接受但我承认苹果有一些规则和规定所以这是我的问题如何动态更改应用程序图标我不会将
AppleScript：获取对象或类的所有属性的列表

为了存储对象的值以供外部外部 AS 访问我需要能够获取该对象的每个属性然后我尝试将其强制为文本并将其存储在某个地方如何获取对象拥有的属性列表作为一个例子我可以这样写 tell me get properties end tell
定义每个子类定义一次的静态属性的最佳方法是什么？

我编写了以下控制台应用程序来测试静态属性 using System namespace StaticPropertyTest public abstract class BaseClass public static int MyPrope
Android 上的 Eclipse 调试出了什么问题？ [复制]

这个问题在这里已经有答案了可能的重复 Android 看似无用的调试环境我显然已经被 Visual Studio 宠坏了因为虽然我刚刚学习 Android 和 Eclipse 环境但在 Eclipse 中调试应用程序正在严重损害进一
是什么导致我的函数最后返回 None ？ [复制]

这个问题在这里已经有答案了我非常简单的 python 函数正在返回None最后我不太清楚为什么我看了一些其他的帖子还是没明白这是我的代码 def printmult n i 1 while i lt 10 print n i en
CSS图灵完备了吗？

据我所知 CSS 不是图灵完备但我对 CSS 的了解非常有限 CSS图灵完备了吗你可以编码Rule 110在 CSS3 中所以只要您考虑适当的随附 HTML 文件它就是图灵完备的和用户交互成为CSS 执行的一部分 A相当好的实施可
Java Excel POI 在quartz 多次执行后停止

我想对此有一些见解我有一个从数据库读取和写入 Excel 文件的程序它的执行基于使用 Quartz api 的计时器并在每周的每个星期二触发问题是当我通过安排它每小时执行一次作业来测试它时程序在写入 Excel 文件的过程中执行
WPF 动画窗口可见性更改

我正在尝试弄清楚如何为 WPF 窗口从 Visibile 到 Hidden 的更改设置动画我目前让应用程序工作的方式是窗口通常是隐藏的当我将鼠标移动到屏幕一侧时它会弹出我正在使用布尔值到可见性转换器来执行此操作但我想要做什么是让
R 将时间序列中的重复行与数据表中的不同列类型组合起来

这个问题是建立在另一个问题的基础上的R 按 ID 将重复行与数据框中不同的列类型组合起来我有一个带有列的数据表time以及其他一些不同类型的列因子和数字这是一个例子 dt lt data table time c 1 1 1 1 1

R 将时间序列中的重复行与数据表中的不同列类型组合起来

R 将时间序列中的重复行与数据表中的不同列类型组合起来 的相关文章

随机推荐

热门标签

R 将时间序列中的重复行与数据表中的不同列类型组合起来的相关文章