我有一个包含公司季度数据的数据框,并且有这个问题:
如何只保留那些拥有 4 个季度数据的公司的记录(因为公司有时会出现 1、2 或 3 个季度的数据,但我需要在整个数据框架中为每个公司保留 4 个完整的季度)
我在下面包含了示例 R 代码:
company<-c("xray", "xray", "xray", "xray", "foxrot", "foxrot", "delta", "kilo", "kilo", "kilo", "kilo", "kilo", "kilo" )
year <-c("1984","1984","1984","1984", "1985", "1985","1986", "1987","1988","1989","1989","1989","1989" )
qtr <-c("1","2","3","4", "1", "2","3", "4","1", "1","2","3","4")
IQ <- rnorm(13,0,10)
REVQ <- rnorm(13,0,10)
AssetQ <- rnorm(13,0,10)
CashQ <- rnorm(13,0,10)
#Show dataframe
data<-data.frame( year, qtr, company, IQ, REVQ, AssetQ, CashQ )
在此示例中,1984 年的“xray”和 1989 年的“kilo”应该是新数据框中仅保留的公司。此示例的独特之处在于,您会注意到季度序列 1-2-3-4 出现了三次,但其中只有两个序列是好的,因为另一个序列(位于第 5-8 行)是随机出现的。为了使清理工作有意义,每个序列 1-2-3-4 需要分配给同一年份和同一公司。
这种情况使任务相当棘手(至少对我自己来说),我已经尝试了近一天,搜索网络并尝试不同的方法,但似乎没有任何方法可以正常工作。
因此,我真诚地寻求帮助。
谢谢你~M