我有一个也许是基本的问题,我在网上搜索过。我在读取文件时遇到问题。尽管如此,我还是按照@Konrad的建议设法读取了我的文件,我很欣赏这一点:How to get R to read in files from multiple subdirectories under a Large Directory?
这是一个类似的问题,但是我还没有解决。
我的问题:
我在不同的文件夹中有大量具有相同名称(“tempo.out”)的文件。此 tempo.out 有 5 列/标题。它们都是相同的格式,1048行5列:
id X Y 时间 温度
setwd("~/Documents/ewat")
dat.files <- list.files(path="./ress",
recursive=T,
pattern="tempo.out"
,full.names=T)
readDatFile <- function(f) {
dat.fl <- read.table(f)
}
data.filesf <- sapply(dat.files, readDatFile)
# I might not have the right sintax in sub5:
subs5 <- sapply(data.filesf,`[`,5)
matr5 <- do.call(rbind, subs5)
probs <- c(0.05,0.1,0.16,0.25,0.5,0.75,0.84,0.90,0.95,0.99)
q <- rowQuantiles(matr5, probs=probs)
print(q)
我想提取这数千个文件中每个文件的第五列(temp)并进行分位数等计算。
我首先尝试读取“ress”中的所有子文件
后者没有给出错误,但我的主要问题是“data.filesf”不是矩阵而是列表,实际上第五列不是我所期望的。然后是以下内容:
matr5 <- do.call(rbind, subs5)
也没有给出所需的值/结果。
将列放入巨大矩阵的最佳方法是什么?