我有一个数据框,其中包含ID
,这对于组中的每个元素、两个日期时间以及这两个时间间隔都是相同的。日期时间对象之一是我的相关时间标记。现在我想获取数据帧的子集,其中包含每个组的最早条目。条目(尤其是时间间隔)需要保持不变。
我的第一个方法是根据 1. ID 和 2. 相关日期时间对框架进行排序。但是,我无法返回每个新组的第一个条目。
然后我一直在看aggregate()
也ddply()
函数,但我在两者中都找不到仅返回第一个条目而不将聚合函数应用于时间间隔值的选项。
有没有一种(简单的)方法来实现这一点?
添加:
也许我通过添加aggregate()和ddply()注释不清楚。我不一定需要聚合。考虑到数据帧的排序方式是每个新组的第一行是我要查找的行,因此只需返回一个子集,其中每行的 ID 与之前的 ID 不同(即每个新组的起始行)。
示例数据:
structure(list(ID = c(1454L, 1322L, 1454L, 1454L, 1855L, 1669L,
1727L, 1727L, 1488L), Line = structure(c(2L, 1L, 3L, 1L, 1L,
1L, 1L, 1L, 1L), .Label = c("A", "B", "C"), class = "factor"),
Start = structure(c(1357038060, 1357221074, 1357369644, 1357834170,
1357913412, 1358151763, 1358691675, 1358789411, 1359538400
), class = c("POSIXct", "POSIXt"), tzone = ""), End = structure(c(1357110430,
1357365312, 1357564413, 1358230679, 1357978810, 1358674600,
1358853933, 1359531923, 1359568151), class = c("POSIXct",
"POSIXt"), tzone = ""), Interval = c(1206.16666666667, 2403.96666666667,
3246.15, 6608.48333333333, 1089.96666666667, 8713.95, 2704.3,
12375.2, 495.85)), .Names = c("ID", "Line", "Start", "End",
"Interval"), row.names = c(NA, -9L), class = "data.frame")