h5py是否将整个文件读取到内存中?
如果是这样,如果我有一个非常非常大的文件怎么办?
如果不是的话,我每次要单个数据就从硬盘取数据会不会很慢?我怎样才能让它更快?
h5py是否将整个文件读取到内存中?
不,不是的。特别是,切片(dataset[50:100]
)允许您将数据集的一部分加载到内存中。有关详细信息,请参阅h5py 文档 http://docs.h5py.org/en/latest/high/dataset.html.
如果不是的话,我每次要单个数据就从硬盘取数据会不会很慢?
总的来说,hdf5 速度非常快。但从内存读取显然比从磁盘读取要快。您可以决定将数据集的多少读入内存(dataset[:]
加载整个数据集)。
我怎样才能让它更快?
如果您想优化性能,您应该阅读sections http://docs.h5py.org/en/latest/high/dataset.html#chunked-storage about chunking and 压缩。还有一个book http://shop.oreilly.com/product/0636920030249.do详细解释了这些事情(免责声明:我不是作者)。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)