如何在 R 中绘制非常大的数据集?
我想使用箱线图、小提琴图或类似的图。内存中无法容纳所有数据。我可以逐步读入并计算制作这些图所需的摘要吗?如果是这样怎么办?
作为对我的评论的补充德米特里回答 https://stackoverflow.com/questions/4341052/plotting-of-very-large-data-sets-in-r/4342051#4342051,一个计算分位数的函数ff
大数据处理包:
ffquantile<-function(ffv,qs=c(0,0.25,0.5,0.75,1),...){
stopifnot(all(qs<=1 & qs>=0))
ffsort(ffv,...)->ffvs
j<-(qs*(length(ffv)-1))+1
jf<-floor(j);ceiling(j)->jc
rowSums(matrix(ffvs[c(jf,jc)],length(qs),2))/2
}
这是一个精确的算法,因此它使用排序——因此可能需要很多时间。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)