样本数据
date coins
2013-10-01 NA
2013-10-01 NA
2013-10-01 NA
2013-11-01 10
2013-11-01 NA
2013-11-01 20
2013-11-01 30
2013-11-01 40
2013-12-30 NA
2013-12-30 22
2013-12-30 24
2013-12-30 25
我想做的事?
我想计算硬币列的平均值和中位数,忽略缺失值。
到目前为止我做了什么?
- 根据日期变量对数据进行分组
by_date <- group_by(df, date)
- 汇总数据使用:
by_date %>% summarise_each_(funs(mean(., na.rm = TRUE), median(., na.rm=TRUE)), names(by_date)[2])
Questionsummarise_each_ 返回的结果显示NaN日期2013-10-01。这是否意味着该函数不会忽略缺失值?
这里的问题是 2013-10-01 的所有值都是NA
,所以不可能有均值。这NaN
R 是想告诉你这个吗?
如果您不想让 2013-10-01 显示在摘要中,一种选择是删除NA
预先值如下:
by_date<-group_by(df[!is.na(df$coins),],date)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)