我正在尝试在 R 中读取 CSV 文件。如何在读取时读取日期和时间并对其进行格式化,并避免丢失标记为 ? 的值。我读取后加载的数据应该是干净的。
我尝试过类似的东西data <- read.csv("Data.txt")
它有效,但日期和时间保持原样。
另外,如何从特定数据范围中提取数据子集?
为此我尝试了类似的东西
subdata <- subset(data,
Date== 01/02/2007 & Date==02/02/2007,
select = Date:Sub_metering_3)
我收到错误Error in eval(expr, envir, enclos) : object 'Date' not found
日期是第一列。
功能read.csv()
and read.table()
没有设置对诸如可以有多种格式的日期之类的内容进行详细的花式转换。当这些函数不能自动执行所需操作时,我发现最好以文本形式读取数据,然后在事后转换变量。
data <- read.csv("Data.txt",colClasses="character",na.strings="?")
data$FixedDate <- as.Date(data$Date,format="%Y/%m/%d")
或者无论您的日期格式是什么。变量FixedDate
那么将是类型Date
您可以使用相等和其他条件来子集。
另外,在您的示例代码中,您放置01/02/2007
作为裸代码,这会导致将 1 除以 2,然后除以 2007,得到 0.0002491281,而不是插入有意义的日期。考虑as.Date("2007-01-02")
反而。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)