我只是好奇,无论解释如何,以长格式或宽格式存储数据是否更有效?我用过object.size()
确定内存中的大小,但它们没有显着差异(长的在大小方面稍微更有效)并且该值只是估计。
除了原始大小之外,我还想知道哪种格式在建模中使用时的操作效率更高。
两者的内存占用情况不同matrix
es 应该相同:
> object.size(long <- matrix(seq(10000), nrow = 1000))
40200 bytes
> object.size(square <- matrix(seq(10000), nrow = 100))
40200 bytes
效率上的任何差异都会与使用 R 的低效率相比相形见绌,因此即使可以测量,也几乎不需要考虑。
对于一个人来说,情况就大不相同了data.frame
,因为它是作为list
of vector
s:
> object.size(as.data.frame(long))
41704 bytes
> object.size(as.data.frame(square))
50968 bytes
其时间效率取决于您到底想做什么。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)