R data.table - 将函数 A 应用于某些列，将函数 B 应用于其他一些列

2023-12-07

我想聚合数据表的行，但聚合函数取决于列的名称。

例如，如果列名称是：

variable1 or variable2，然后应用mean()功能。
variable3，然后应用max()功能。
variable4，然后应用sd()功能。

我的数据表总是有一个datetime列：我想按时间聚合行。但是，“数据”列的数量可能会有所不同。

我知道如何使用相同的聚合函数来做到这一点（例如mean()) 对于所有列：

dt <- dt[, lapply(.SD, mean),
           by = .(datetime = floor_date(datetime, timeStep))]

或者仅适用于列的子集：

cols <- c("variable1", "variable2")    
dt <- dt[ ,(cols) := lapply(.SD, mean), 
            by = .(datetime = floor_date(datetime, timeStep)),
            .SDcols = cols]

我想做的是这样的：

colsToMean <- c("variable1", "variable2") 
colsToMax <- c("variable3")   
colsToSd <- c("variable4")   
dt <- dt[ ,{(colsToMean) := lapply(.SD???, mean),
             (colsToMax) := lapply(.SD???, max),
             (colsToSd) :=  lapply(.SD???, sd)}, 
            by = .(datetime = floor_date(datetime, timeStep)),
            .SDcols = (colsToMean, colsToMax, colsToSd)]

我在看R 中的 data.table - 将多个函数应用于多个列这给了我使用自定义函数的想法：

myAggregate <- function(x, columnName) {
   FUN = getAggregateFunction(columnName) # Return mean() or max() or sd()
   return FUN(x)
}
dt <- dt[, lapply(.SD, myAggregate, ???columName???),
           by = .(datetime = floor_date(datetime, timeStep))]

但我不知道如何将当前列名称传递给myAggregate()...

这是一种方法Map or mapply:

让我们先制作一些玩具数据：

dt <- data.table(
    variable1 = rnorm(100),
    variable2 = rnorm(100),
    variable3 = rnorm(100),
    variable4 = rnorm(100),
    grp = sample(letters[1:5], 100, replace = T)
)

colsToMean <- c("variable1", "variable2") 
colsToMax <- c("variable3")   
colsToSd <- c("variable4")

Then,

scols <- list(colsToMean, colsToMax, colsToSd)
funs <- rep(c(mean, max, sd), lengths(scols))

# summary
dt[, Map(function(f, x) f(x), funs, .SD), by = grp, .SDcols = unlist(scols)]

# or replace the original values with summary statistics as in OP
dt[, unlist(scols) := Map(function(f, x) f(x), funs, .SD), by = grp, .SDcols = unlist(scols)]

GForce 打开的另一个选项：

scols <- list(colsToMean, colsToMax, colsToSd)
funs <- rep(c('mean', 'max', 'sd'), lengths(scols))

jexp <- paste0('list(', paste0(funs, '(', unlist(scols), ')', collapse = ', '), ')')
dt[, eval(parse(text = jexp)), by = grp, verbose = TRUE]

# Detected that j uses these columns: variable1,variable2,variable3,variable4 
# Finding groups using forderv ... 0.000sec 
# Finding group sizes from the positions (can be avoided to save RAM) ... 0.000sec 
# Getting back original order ... 0.000sec 
# lapply optimization is on, j unchanged as 'list(mean(variable1), mean(variable2), max(variable3), sd(variable4))'
# GForce optimized j to 'list(gmean(variable1), gmean(variable2), gmax(variable3), gsd(variable4))'
# Making each group and running j (GForce TRUE) ... 0.000sec

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dataTable

R data.table - 将函数 A 应用于某些列，将函数 B 应用于其他一些列的相关文章

无法更新/编辑从 R 中的包（`gratia`）导出的 ggplot2 对象

我希望我在这里遗漏了一些令人痛苦的明显的东西我希望更新例如修复标题实验室等由生成的 ggplot 对象gratia draw 不太确定为什么我无法更新该对象有一个简单的解决方案吗 devtools install github
rpart“as.character(x) 中的错误：无法强制类型 'builtin' 为类型 'character' 的向量”消息是什么意思？

我一直在用头撞rpart几天了尝试为我拥有的这个数据集制作分类树我认为现在是时候询问生命线了我确信这是我没有看到的愚蠢的事情但这里是我一直在做什么 EuropeWater lt read csv file paste Users a
从 n,k 维矩阵数组中减去 n,k 维矩阵

如果我有一个数组A A lt array 0 c 4 3 5 for i in 1 5 set seed i A i lt matrix rnorm 12 4 3 如果我有矩阵 B set seed 6 B lt matrix rnorm
R 可以创建带有可单击条形图的条形图图像以插入网页吗？

我知道如何创建条形图以及如何将其粘贴在网页上例如使用hwriteImage in the 作家包 http www embl de gpau hwriter 我想要的是每个栏都是一个在鼠标悬停时突出显示的区域并且每个栏在单击时都有不
Quantmod 的简单功能不再起作用

我明天要交论文我收到了一条关于 quantmod 的非常奇怪的错误消息这是我在过去几周使用这个包时从未遇到过的我无法导入特定于道琼斯指数 DJI 的数据我收到以下错误消息 getSymbols DJI src yahoo from
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
需要在R中按行绑定列表数据

我在 R 中按行绑定列表时遇到问题我的列表数据集是 id 1 data k 1 id k b c 1 1 1 3 data k 2 id k b c 1 2 1 4 id 2 data k 1 id k b c 2 1 1 6 data
如何按时间间隔匹配数据帧？

这是我从数据记录器导入原始数据时经常出现的问题温度记录仪设置为每十分钟记录一次温度单独的气体记录仪设置为记录最后十分钟间隔内使用的气体我想将这两个记录器的数据合并到一个数据框中进行绘图和分析但时间并不完全一致我希望每十分钟的时间段
绘制 Cox 回归的 Kaplan-Meier 图

我使用 R 中的以下代码设置了一个 Cox 比例风险模型来预测死亡率添加协变量 A B 和 C 只是为了避免混淆即年龄性别种族但我们真正对预测变量 X 感兴趣 X 是一个连续变量 cox model lt coxph Surv t
为什么 sapply 的缩放速度比样本大小的 for 循环慢？

假设我想采用向量 X 2 1 N 并将 e 计算为每个元素的指数是的我认识到最好的方法就是通过向量化 exp X 但这样做的目的是将 for 循环与 sapply 进行比较我通过逐步尝试三种方法一种使用 for 循环两种以不同方
我可以使用哪个 R 函数来查找两条线的交点？

我刚刚研究了 stackoverflow 上所有的在 R 中寻找交集问题它们要么是关于曲线要么是关于分布像这个 https stackoverflow com questions 20519431 finding point of
R - 重塑 - 熔化错误

我正在尝试融化数据框但出现了这个奇怪的错误有什么想法吗 str zx7 data frame 519 obs of 5 variables calday new Date format 2011 01 03 2011 01 04 201
在r中的某个阈值处破坏 cumsum() 函数

例如我有以下代码 cumsum 1 100 我想打破它如果一个元素 i 1 大于3000 我怎样才能做到这一点因此而不是这个结果 1 1 3 6 10 15 21 28 36 45 55 66 78 91 105 120 136 15
如何按定义的顺序将图像合并到一个文件中

我有大约 100 张图像 png 我不想手动执行此操作而是希望将它们按照定义的顺序基于文件名并排放置在一个 pdf 中每行 12 个图像有人有什么建议吗我按照下面托马斯告诉我的方法尝试了它把它们贴在旁边有一个黑边我怎样才能去
R Shinydashboard 自定义 CSS 到 valueBox

我一直在尝试将 valueBox 的颜色更改为自定义颜色超出 validColors 中可用的颜色但一直无法这样做我知道有一种方法可以使用标签来包含自定义 CSS 但是我无法将它们放在正确的位置 ui lt dashboardPage
在 RMarkdown 输出到 PDF 时缩进而不添加项目符号点或编号

之前有人问过如何在没有项目符号的情况下缩进文本 RMarkdown 中的点但这是针对 HTML 输出的在 RMarkdown 中缩进而不添加项目符号点或数字 https stackoverflow com questions 47087
增加雷达图中长轴标签的空间

我想创建一个雷达图ggirahExtra ggRadar 问题是我的标签很长并且被剪掉了我想我可以通过添加在标签和绘图之间创建更多空间margin margin 0 0 2 0 cm to element text in axis tex
C# 数据表更新多行

我如何使用数据表进行多次更新我找到了这个更新 1 行 http support microsoft com kb 307587 my code public void ExportCSV string SQLSyntax string L
当设置 coord_fixed 时，ggplot/shiny 中的鼠标悬停坐标是错误的

我正在使用问题中的答案当您将鼠标悬停在闪亮的 ggplot 上时出现工具提示 https stackoverflow com questions 27965931 tooltip when you mouseover a ggplot o
ggplot：如何限制条形图中的输出，以便仅显示最频繁出现的情况？

我几个小时以来一直在寻找这个简单的东西但没有结果我有一个数据框其中一列为变量国家地区我想要两件事以下绘制最常见的国家地区最常见的位于顶部找到部分解决方案EDIT找到完整的解决方案 gt gt 重点问题是根据频率限制条形图

随机推荐

你能在 kivy 文件中换行吗？

我的 kv 中有几行文件非常长 80多个字符我想知道是否有办法在下一行包装继续它们例如我该如何从这个 Line points self pos 0 5 self pos 1 2 self pos 0 self width 5 se
Win32 - 从 C 代码回溯

我目前正在寻找一种在 Windows 下从 C 代码非 C 获取回溯信息的方法我正在构建一个跨平台 C 库具有引用计数内存管理功能它还具有集成的内存调试器可提供有关内存错误的信息 XEOS C 基础库当发生故障时启动调试器提
Oracle JSON_OBJECT NULL ON NULL 子句不起作用

我正在尝试让 Oracle 生成 JSONnullSQL 上的值NULL数据如下 select json object key a value 1 key b value null null on null c1 json object
在 mocha 中测试 NodeJS 时，域无法正确捕获错误

当运行利用域进行错误处理的测试时即使库内的域处理程序应该捕获错误 Mocha 仍然会抛出错误如果我在 Mocha 之外执行代码它会正常运行让我相信问题出在 Mocha 上 Example foo js module exports
Java 中删除字符串中的空格

我有一个像这样的字符串 mysz name john age 13 year 2001 我想删除字符串中的空格我试过trim 但这只会删除整个字符串前后的空格我也尝试过replaceAll W 但随后也会被删除我怎样才能获得一个字符
如何在ajax响应中从字节流渲染pdf

我正在开发一个移动应用程序我们正在使用 jquery mobile 我们可以选择查看或下载 pdf 格式的记录我无法控制后端我将在 json 对象中获取 pdf 数据作为 ajax 响应我想读取该数据并以 pdf 形式显示我的下一
共享 SD 卡中的图像

我花了两周时间寻找如何共享存储在 SD 卡上的图像但没有成功 This answer对我不起作用也不是我正在寻找的我正在与凸轮预览应用程序将图像存储到 SD 然后在应用程序内图库中显示它们 public class GalleryVi
特定存储库的 Git 全局配置？

意思是有类似每个回购部分的东西 repo url 覆盖全局不适用于特定存储库选项 core filemode false editor notepad repo example com repo1 git core filemode
R 中的“错误恢复文件幻数”错误

As in 加载 R 工作区时什么可能导致错误的幻数错误以及如何避免它 and R 有幻数 PNG 错误我得到一个错误恢复文件幻数 error gt load fossilien dat Error bad restore file
沙盒阻止我格式化字符串

我有一个简单的常规脚本 node master echo I am about to try to use String format def jjj String format bob echo jjj 如果我将此脚本直接放入我的作业配置
GridLayout 未填充 JPanel

我遇到 GridLayout 问题并且整个 JPanel 未填充我有一个 N M 网格我用 N M 瓷砖填充它它们扩展了 JPanel 添加所有这些图块后 JPanel 的底部和右侧仍然有空间我认为 GridLayout 应该填满
Stateflow 在 reyclerview android kotlin 中引用整个数据

嘿嘿我正在学习状态流在 Android 科特林中我正在创建一个反向对话日历视图回收者视图 In my mainactivity有一个fragment 里面有我reyclerview 我的目标是做分页的东西 in my 回收者视图所以我先加
使用 procf//status 了解进程状态

我正在 Solaris 上工作我知道如果有一个进程正在运行就会有一个名为 proc
D lang - 在同一程序中使用 read 和 readln()

我的 D 程序遇到了一个非常奇怪的问题 read s variable 本身工作得很好而 readln variable 本身工作得很好但是当我将两者放在一起时 readln 似乎被忽略了使用 gdc 和 dmd 均发生错误 impo
从头开始制作Android聊天应用程序

我需要为Android 制作聊天应用程序我想到使用PHP脚本来实现聊天应用程序基本思想是将消息从android客户端发送到PHP脚本并利用PHP脚本将消息发送到MySQL数据库这些消息将广播给其他人但问题是自动向其他人广播消息有
从列表列表中删除重复项

我有一个Python列表列表 k 1 2 4 5 6 2 1 2 3 4 我想从中删除重复的元素如果它是一个普通列表而不是我可以使用的列表set 但不幸的是该列表不可散列并且无法创建列表集仅元组所以我可以将所有列表转换为元组然后
如何创建文件下载按钮？和 Axios 不工作

我试图在我的个人网站上创建一个下载按钮供人们下载我的 docx 简历但遇到了一些问题首先我用简单的 href 链接来做到这一点 a href xxx docx a
Jquery对话框按钮返回值

我正在使用jquery对话框我想要实现的是当用户按确定时编程继续进行当按取消时它停止 function displaymessage confirm dialog buttons OK function this dialo
C# 中同步线程访问和写入

我有一个用 C 编写的多线程端口扫描仪应用程序我想在应用程序运行时将一些内容打印到控制台和日志文件因此我有以下帮助程序类它可以很好地写入日志文件和控制台 public class Output private const strin
R data.table - 将函数 A 应用于某些列，将函数 B 应用于其他一些列

我想聚合数据表的行但聚合函数取决于列的名称例如如果列名称是 variable1 or variable2 然后应用mean 功能 variable3 然后应用max 功能 variable4 然后应用sd 功能我的数据表总是有一个d

R data.table - 将函数 A 应用于某些列，将函数 B 应用于其他一些列

R data.table - 将函数 A 应用于某些列，将函数 B 应用于其他一些列 的相关文章

随机推荐

热门标签

R data.table - 将函数 A 应用于某些列，将函数 B 应用于其他一些列的相关文章