我试图在一系列值之间进行采样,作为 R 中较大循环的一部分。随着循环进行到每一行j
,我想对给定值之间的一个数字进行采样start
列和中给出的值end
列,将该值放入sampled
该行的列。
结果应该是这样的:
ID start end sampled
a 25 67 44
b 36 97 67
c 23 85 77
d 15 67 52
e 21 52 41
f 43 72 66
g 39 55 49
h 27 62 35
i 11 99 17
j 21 89 66
k 28 65 48
l 44 58 48
m 16 77 22
n 25 88 65
我开始使用mapply
,它对整个 df 进行采样,但随后我尝试将所有 15 个采样值放入一行中。
df[j,4] <- mapply(function(x, y) sample(seq(x, y), 1), df$start, df$end)
我想也许可以使用一些东西seq
可能有效,但这会导致错误:from
长度必须为 1。
df[j,4] <- sample(seq(df$start, df$end),1,replace=TRUE)
外层循环结构非常复杂,所以我没有在这里包含它,但是df[j,4]
部分代码是必要的,因为它是更大循环的一部分。在某些情况下,必须根据实际数据集中的其他依赖关系对行进行重新采样。例如,采样值a
可能需要大于b
。其余代码更新采样列,检查依赖关系,如果不满足依赖关系,将重新运行示例。如果我能让这个采样部分工作,我应该能够轻松地将其插入(我希望)。
这是一个示例数据集。
structure(list(ID = c("a", "b", "c", "d", "e", "f", "g", "h",
"i", "j", "k", "l", "m", "n"), start = c(25, 36, 23, 15, 21,
43, 39, 27, 11, 21, 28, 44, 16, 25), end = c(67, 97, 85, 67,
52, 72, 55, 62, 99, 89, 65, 58, 77, 88), sampled = c(NA, NA,
NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA)), class = c("spec_tbl_df",
"tbl_df", "tbl", "data.frame"), row.names = c(NA, -14L), spec = structure(list(
cols = list(ID = structure(list(), class = c("collector_character",
"collector")), start = structure(list(), class = c("collector_double",
"collector")), end = structure(list(), class = c("collector_double",
"collector")), sampled = structure(list(), class = c("collector_logical",
"collector"))), default = structure(list(), class = c("collector_guess",
"collector")), skip = 1), class = "col_spec"))```