我的列表中有一堆 data.tables 。我要申请unique()
到我的列表中的每个 data.table,但这样做会破坏我的所有 data.table 键。
这是一个例子:
A <- data.table(a = rep(c("a","b"), each = 3), b = runif(6), key = "a")
B <- data.table(x = runif(6), b = runif(6), key = "x")
blah <- unique(A)
Here, blah
仍然有一把钥匙,世界上一切都很好:
key(blah)
# [1] "a"
但是如果我将 data.tables 添加到列表中并使用lapply()
,密钥被破坏:
dt.list <- list(A, B)
unique.list <- lapply(dt.list, unique) # Keys destroyed here
lapply(unique.list, key)
# [[1]]
# NULL
# [[2]]
# NULL
这可能与我没有真正理解“通过引用”分配键的含义有关,因为我还遇到了键消失的其他问题。
So:
- 为什么 lapply 不保留我的密钥?
- “通过引用”分配键是什么意思?
- 我是否应该将 data.tables 存储在列表中?
- 如何安全地存储/操作 data.tables 而不必担心丢失密钥?
EDIT:
就其价值而言,令人恐惧的for
循环也工作得很好:
unique.list <- list()
for (i in 1:length(dt.list)) {
unique.list[[i]] <- unique(dt.list[[i]])
}
lapply(unique.list, key)
# [[1]]
# [1] "a"
# [[2]]
# [1] "x"
但这是R,并且for
循环是evil.