R 合并具有相似值的行

2024-04-23

我有一个数据框,行值首先从小到大排序。我计算相邻行之间的行值差异,组合具有相似差异(例如,小于 1)的行,并返回组合行的平均值。我可以使用 for 循环检查每一行的差异,但这似乎是一种非常低效的方法。还有更好的想法吗?谢谢。

library(dplyr)
DF <- data.frame(ID=letters[1:12],
                 Values=c(1, 2.2, 3, 5, 6.2, 6.8, 7, 8.5, 10, 12.2, 13, 14))
DF <- DF %>%
   mutate(Diff=c(0, diff(Values)))

DF 的预期输出为

ID        Values
a         1.0
b/c       2.6  # (2.2+3.0)/2
d         5.0
e/f/g     6.67 # (6.2+6.8+7.0)/3
h         8.5
i         10.0
j/k       12.6 # (12.2+13.0)/2
i         14.0

这是一个选项data.table

library(data.table)
setDT(DF)[, .(ID = toString(ID), Values = round(mean(Values), 2)),
          by = .(Diff = cumsum(c(TRUE, diff(Values)>=1)))][, -1, with = FALSE]
#        ID Values
#1:       a   1.00
#2:    b, c   2.60
#3:       d   5.00
#4: e, f, g   6.67
#5:       h   8.50
#6:       i  10.00
#7:    j, k  12.60
#8:       l  14.00
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R 合并具有相似值的行 的相关文章

随机推荐