dat 文件在实际数据之前有一些额外信息行。跳过它们skip
争论:
read.table("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
header=TRUE, skip=3)
如果您不熟悉数据集,检查这一点的一个简单方法是首先使用readLines
检查几行,如下所示:
readLines("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
n=10)
# [1] "Ozone data from CZ03 2009" "Local time: GMT + 0"
# [3] "" "Date Hour Value"
# [5] "01.01.2009 00:00 34.3" "01.01.2009 01:00 31.9"
# [7] "01.01.2009 02:00 29.9" "01.01.2009 03:00 28.5"
# [9] "01.01.2009 04:00 32.9" "01.01.2009 05:00 20.5"
在这里,我们可以看到实际数据从[4]
,所以我们知道跳过前三行。
Update
If you really只想Value
专栏,你could通过以下方式做到这一点:
as.vector(
read.table("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
header=TRUE, skip=3)$Value)
Again, readLines
对于帮助我们找出要导入的列的实际名称很有用。
但我没有看到much这样做比读取整个数据集并稍后提取更有优势。