我想导入一个然而,当我尝试这样做时......
sneak_cal <- read.delim("iCal-TribeEvents.ics", sep = ":", header=FALSE, stringsAsFactors = FALSE, strip.white = TRUE, na.strings = "")
...我最终分割了网站的字符串(属于X-ORIGINAL-URL
or the UID
场)也是如此,这是不可取的
ie https
and //www.kicksonfire.com
最终目标是将数据转换为整齐的格式,其中每一行代表一个单独的数据VEVENT
,我认为这将由一个独特的UID
,不会丢失任何信息(例如 URL)
是否建议使用另一种方法,例如预先定义预期作为键的字段并将值或空白空间与该键匹配?自从.ics
文件每次都有相同的预期字段,似乎使用这些字段作为模板来读取数据可能有意义,但我不知道该怎么做。
这是一个例子
x <- readLines("https://www.kicksonfire.com/releases/?ical=1&tribe_display=list", warn = FALSE)
stopifnot(!any(grepl("^\\s+", x))) # disregarding value fields that have linefeeds for the sake of simplicity
keyval <- do.call(rbind, regmatches(x, regexpr(":", x, fixed = TRUE), invert = TRUE))
keyval <- keyval[which.max(keyval[,1]=="BEGIN" & keyval[,2]=="VEVENT"):tail(which(keyval[,1]=="END" & keyval[,2]=="VEVENT"), 1),]
keyval <- cbind.data.frame(keyval, id=cumsum(keyval[,1]=="BEGIN" & keyval[,2]=="VEVENT"))
df <- reshape(keyval, timevar="1", idvar="id", direction = "wide")
head(df[,c(3,4,9)])
# 2.DTSTART;VALUE=DATE 2.DTEND;VALUE=DATE 2.SUMMARY
# 1 20170422 20170423 Air Jordan 11 Low GS Blue Moon
# 14 20170422 20170423 Air Jordan 5 Premium Pure Platinum
# 27 20170427 20170428 Nike Air VaporMax Asphalt
# 40 20170427 20170428 Nike Air VaporMax Oreo
# 53 20170427 20170428 Nike WMNS Air VaporMax White Ice Blue
# 66 20170427 20170428 wings+horns x adidas NMD R2 Light Grey
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)