我在使用以下方法准备汇总表时遇到问题dplyr
基于以下数据集:
set.seed(1)
df <- data.frame(rep(sample(c(2012,2016),10, replace = T)),
sample(c('Treat','Control'),10,replace = T),
runif(10,0,1),
runif(10,0,1),
runif(10,0,1))
colnames(df) <- c('Year','Group','V1','V2','V3')
我想计算平均值、中位数、标准差并计算每种组合的观察值数量Year
and Group
.
我已成功使用此代码来获取mean
, median
and sd
:
summary.table = df %>%
group_by(Year, Group) %>%
summarise_all(funs(n(), sd, median, mean))
然而我不知道如何介绍n()
里面的函数funs()
命令。它给了我计数V1
, V2
and V3
。这是相当多余的,因为我只想要样本的大小。我尝试过介绍
mutate(N = n()) %>%
之前和之后group_by()
线,但它没有给我我想要的。
有什么帮助吗?
EDIT:我的疑问还不够清楚。问题是代码给了我不需要的列,因为观察的数量V1
对我来说就足够了。