我正在尝试计算数据框中的经过时间,其中经过时间的“开始”值取决于数据框中因子列的值。 (简单来说,我将把时间值视为数字而不是时间对象 - 我的问题是关于分割-应用-组合,而不是时间对象)。我的数据框如下所示:
df <- data.frame(id=gl(2, 3, 5, labels=c("a", "b")), time=1:5)
我想通过每次减去每个因素级别的最短时间来计算经过的时间(尽管为了这个示例,我将只处理数值,而不是时间值)。所以我想将数据框分割为id
,减去最小值y
中每个元素的值y
列,并返回带有转换值的向量(或数据框)。我想得到这样的结果:
> dfTrans
id time elapsed
a 1 0
a 2 1
a 3 2
b 4 0
b 5 1
对于 plyr 来说似乎是一个完美的任务,但我找不到一个简单的解决方案。
我能想到的最好的办法是
elapsed <- dlply(df, .(id), function(x) x$time - min(x$time))
elapsed_comb <- NA
for(i in 1:length(names(elapsed))) {
elapsed_comb <- c(elapsed_comb, elapsed[[i]])
}
elapsed_comb <- elapsed_comb[-1]
df$elapsed <- elapsed_comb
这是不优雅的,而且看起来很脆弱。当然有更好的方法吗?