我正在尝试做集合运算在存储在列表列中的向量之间,例如this https://stackoverflow.com/questions/38712196/text-file-to-dataframe-with-a-list-column.
DT <- data.table(exp = c("exp1", "exp2", "exp2"),
sample = c(1L, 1L, 2L),
listdata = list(c(2L,5L), c(2L,3L,5L,7L), c(1L,2L,6L)))
> DT
exp sample listdata
1: exp1 1 2,5
2: exp2 1 2,3,5,7
3: exp2 2 1,2,6
虽然很麻烦,但我可以做
DT$inc = list(setdiff(unlist(DT$listdata[2]), unlist(DT$listdata[1])))
并获取一个新的列表列,其值为c(3,7)
。但是如果我尝试使用计算当前行和第一行之间的差异
DT$inc = list(list(setdiff(unlist(DT$listdata, recursive = FALSE), unlist(DT$listdata[1]))))
期待新专栏“inc”
0
c(3,7)
c(1,6)
I get c(3,7,1,6)
。显然unlist
将整个列表列压平在一起。知道发生了什么事吗?
我也在学习 dplyr 和 data.table。因此,如果您可以使用其中之一提供解决方案,那将会非常有帮助。