我想绘制簇(由变量定义id
)从数据集中进行替换,与之前回答的问题相比,我希望选择 K 次的聚类以使每个观察重复 K 次。也就是说,我正在进行集群引导。
例如,以下示例id=1
两次,但重复观察id=1
仅在新数据集中出现一次s
。我想要所有的观察结果id=1
出现两次。
f <- data.frame(id=c(1, 1, 2, 2, 2, 3, 3), X=rnorm(7))
set.seed(451)
new.ids <- sample(unique(f$id), replace=TRUE)
s <- f[f$id %in% new.ids, ]
一种选择是lapply
在每个new.id
并将其保存在列表中。然后你可以将它们堆叠在一起:
library(data.table)
rbindlist(lapply(new.ids, function(x) f[f$id %in% x,]))
# id X
#1: 1 1.20118333
#2: 1 -0.01280538
#3: 1 1.20118333
#4: 1 -0.01280538
#5: 3 -0.07302158
#6: 3 -1.26409125
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)