HDF5 中的稀疏数组支持

2024-06-24

我需要以某种方式在磁盘上存储 512^3 阵列，并且我目前正在使用 HDF5。由于阵列稀疏，大量磁盘空间被浪费。

HDF5 是否提供对稀疏数组的支持？

一种解决方法是使用以下内容创建数据集compression option http://docs.h5py.org/en/latest/high/dataset.html#dataset-compression。例如，在 Python 中使用h5py http://www.h5py.org/:

import h5py
f = h5py.File('my.h5', 'w')
d = f.create_dataset('a', dtype='f', shape=(512, 512, 512), fillvalue=-999.,
                     compression='gzip', compression_opts=9)
d[3, 4, 5] = 6
f.close()

生成的文件大小为 4.5 KB。如果不进行压缩，同一文件的大小约为 512 MB。这是 99.999% 的压缩，因为大部分数据都是-999.（管他呢fillvalue你要）。

通过设置使用 C++ HDF5 API 可以实现等效的效果H5::DSetCreatPropList::setDeflate https://support.hdfgroup.org/HDF5/doc/cpplus_RM/class_h5_1_1_d_set_creat_prop_list.html#afce63c8d8c410e4a52b25b469fea1859到 9，有一个示例显示在h5group.cpp https://support.hdfgroup.org/HDF5/doc/cpplus_RM/h5group_8cpp-example.html.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

HDF5 中的稀疏数组支持的相关文章

HDF5 存储开销

我正在将大量小数据集写入 HDF5 文件生成的文件大小约为我所输入数据的简单制表所期望的文件大小的 10 倍我的数据按层次结构组织如下 group 0 gt subgroup 0 gt dataset dimensions 100 x
R构造稀疏矩阵

我正在阅读 R 中 Matrix 包的说明但我无法理解p函数中的参数 sparseMatrix i ep j ep p x dims dimnames symmetric FALSE index1 TRUE giveCsparse TRU
javascript排序稀疏数组保留索引

对稀疏数组进行排序并使元素保持相同索引的最佳方法是什么例如 a 0 3 a 1 2 a 2 6 a 7 4 a 8 5 我想排序后有 a 0 2 a 1 3 a 2 4 a 7 5 a 8 6 这是一种方法它将定义的数组元素复制到新数组
用Python计算稀疏矩阵的N个最小特征值

我想在Python中找到稀疏矩阵的N个最小特征值我尝试过使用scipy sparse linalg eigen arpack包但计算最小特征值的速度非常慢我在某处读到有一个移位反转模式但是当我尝试使用它时我收到一条错误消息告诉我
pyspark中的稀疏向量RDD

我一直在使用 mllib 的功能通过 Python Pyspark 实现此处描述的 TF IDF 方法 https spark apache org docs 1 3 0 mllib feature extraction html http
Pandas 无法读取使用 h5py 创建的 hdf5 文件

当我尝试读取使用 h5py 创建的 HDF5 格式文件时出现 pandas 错误我想知道我是否只是做错了什么 import h5py import numpy as np import pandas as pd h5 file h5py
scipy.sparse.hstack(([1], [2])) ->“ValueError：块必须是二维的”。为什么？

scipy sparse hstack 1 2 and scipy sparse hstack 1 2 工作得很好但不是scipy sparse hstack 1 2 为什么会这样呢这是我的系统上发生的情况的痕迹 C Anaconda
远程linux服务器到远程linux服务器大型稀疏文件复制 - 如何？

我有两台 CentOS 5 4 服务器每台服务器上都安装了 VMware Server 假设我始终对 vmware 虚拟机使用稀疏文件将虚拟机文件从一台服务器复制到另一台服务器的最可靠最快速的方法是什么虚拟机的文件复制起来很痛苦因
使用 python 生成器高效创建 scipy.lil_matrix

我有一个生成单一维度的生成器numpy arrays 的长度相同我想要一个包含该数据的稀疏矩阵行的生成顺序与我希望它们出现在最终矩阵中的顺序相同 csr矩阵优于lil矩阵但我认为后者在我描述的场景中更容易构建假设row gen是一个
NumPy 和 SciPy - .todense() 和 .toarray() 之间的区别

我想知道使用是否有什么区别优点缺点 toarray vs todense 在稀疏 NumPy 数组上例如 import scipy as sp import numpy as np sparse m sp sparse bsr mat
保存为 HDF5 的图像未着色

我目前正在开发一个将文本文件和 jpg 图像转换为 HDF5 格式的程序用HDFView 3 0打开似乎图像仅以灰度保存 hdf h5py File Sample h5 img Image open Image jpg data np
R 中大型稀疏矩阵的聚类分析

我有一个包含 250000 笔交易行和 2183 项列的交易数据集我想将其转换为稀疏矩阵然后对其进行分层聚类我尝试了包 sparcl 但它似乎不适用于稀疏矩阵关于如何解决这个问题有什么建议吗或者我可以使用任何其他包对稀疏矩
Maven项目中的HDF5

我正在尝试将 hdf hdf5lib H5 导入到 NetBeans 中的 Maven 项目中它有这个作为导入行 import hdf hdf5lib H5 正如这里所建议的 https support hdfgroup org prod
h5py安装后出现错误[重复]

这个问题在这里已经有答案了可能的重复在 OS X 上安装 h5py https stackoverflow com questions 6988010 installing h5py on os x 我正在尝试让 h5py 在我的 OS
Matlab没有优化以下内容吗？

我有一个很长的向量 1xrv 和一个很长的向量w1xs 和一个矩阵Arxs 它是稀疏的但维度非常大我期望 Matlab 对以下内容进行优化这样我就不会遇到内存问题 A v w 但看起来 Matlab 实际上是在尝试生成完整的v w矩阵
使用 pytables，哪个更有效：scipy.sparse 还是 numpy 稠密矩阵？

使用时pytables 没有支持据我所知 scipy sparse矩阵格式因此要存储矩阵我必须进行一些转换例如 def store sparse matrix self grp1 self getFileHandle createGr
有效积累稀疏 scipy 矩阵的集合

我有一个 O N NxN 的集合scipy sparse csr matrix 每个稀疏矩阵都有 N 个元素集我想将所有这些矩阵加在一起以获得一个常规的 NxN numpy 数组 N 约为 1000 矩阵内非零元素的排列使得所得总和肯定不
删除或更新 HDF5 中的数据集？

我想以编程方式更改与 HDF5 文件中的数据集关联的数据我似乎找不到一种方法来按名称删除数据集允许我使用修改后的数据再次添加它或按名称更新数据集我正在使用 HDF5 1 6 x 的 C API 但指向任何 HDF5 API 的指针都
HDF5 中的稀疏数组支持

我需要以某种方式在磁盘上存储 512 3 阵列并且我目前正在使用 HDF5 由于阵列稀疏大量磁盘空间被浪费 HDF5 是否提供对稀疏数组的支持一种解决方法是使用以下内容创建数据集compression option http docs
错误：超出了程序允许的最大变量大小。使用 sub2ind 时

请建议如何解决这个问题 nNodes 50400 adj sparse nNodes nNodes adj sub2ind nNodes nNodes ind ind 1 1 ind is a vector of indices Maxim

随机推荐

获取登录用户的 AppData\Local 文件夹

我目前正在使用 Environment GetFolderPath Environment SpecialFolder LocalApplicationData 检索当前用户的AppData Local小路该程序需要提升的权限并且在标准
限制 Three.js 中的帧速率以提高性能，requestAnimationFrame？

我在想对于我做的一些项目来说 60fps 是完全不需要的我想如果我能让它以 30 fps 的帧速率平稳运行我就可以拥有更多以 30 fps 运行的对象和事物我想如果我在 Three js 中编辑 requestAnimationFra
更改 SQL Server 中的身份种子（永久！）

有没有办法永久更改身份列的身份种子使用 DBCC CHECKIDENT 似乎只是设置了最后一个值如果表被截断所有值都会重置 dbcc checkident Test SeedIdent reseed 1000 select name
在 html/javascript 中请求撤消/重做事件

我有一个交互式 html5 canvas 的东西 http algorithmicassertions com quirk有时用户会想要撤消他们的操作我已经实现了执行此操作的逻辑但我不确定如何正确捕获用户想要撤消事件目前我只是监
在 Rails 中将一列添加到另一列之前

我想在我的桌子前面放一个柱子我知道你可以做到 add column customer first name after last name 但有什么办法吗 before 您可以使用以下命令在表格前面插入一列 first option add
Instagram直接打开UTI

我最近偶然发现了以下有趣的功能 Instagram iPhone 挂钩 http instagr am developer iphone hooks 我想知道是否能够立即通过 uidocumentinteractioncontroller
更改类文件后是否需要重新启动 tomcat？

为什么每当类文件更改时我们都需要重新启动tomcat服务器有没有其他方法您可以配置 Tomcat 并使您的 Web 应用程序可重新加载为此请添加reloadable true to the
git pull：无法快进，

你能帮我解决我的问题吗当我尝试从 dev 分支拉取时发生错误我浏览了解决方案它说我需要 rebase 但它对我来说没有成功 CT aohc MP1GYWQA MINGW64 c TCO source RAPMD Web Fronten
是什么导致 Xamarin Forms 构建上出现“无法识别的选择器发送到类”错误？

首先是关于我的系统的一些事情 Mac 操作系统版本 10 13 6 Xcode 版本 10 Visual Studio for Mac 7 6 6 我对 Xamarin 表单完全陌生想要尝试和学习我想做的只是创建一个新的 xamarin
RabbitMQ React Native 发送示例

我正在尝试将 RabbitMQ 与 React Native 结合使用我找不到关于这个主题的例子我关注了这个伟大的 answer https stackoverflow com a 49559976 8565152我已从模拟器连接到服务
xml-node 中的 foreach 在 mule esb 中返回 null

我正在使用下面的流程
Snakemake：“无法从输出文件中确定输入文件中的通配符”

我使用 Snakemake 执行一些规则但我遇到了一个问题 rule filt SJ out input pass1 sample SJ out tab output pass1 SJ db shell gawk 6 1 6 0 7 gt
apple mach-o 链接器错误链接器命令失败，退出代码为 1（使用 -v 查看调用）

2 https i stack imgur com pMAAm png我正在使用 Objective C 处理核心数据出现错误 Apple Mach O Linker Error Linker command failed with ex
JE/JNE 和 JZ/JNZ 之间的区别

在 x86 汇编代码中有JE and JNE完全一样JZ and JNZ JE and JZ只是完全相同的事物的不同名称条件跳转时ZF 零标志等于 1 相似地 JNE and JNZ只是条件跳转的不同名称什么时候ZF等于 0 Yo
仅使用 HTML 和/或 CSS 的曲线

我需要在 HTML 中添加连接图表节点的曲线我想使用创建它们仅 HTML 和或 CSS 即使并非所有浏览器都支持我需要的功能特别是不太关心 IE8 及以下版本我也可以使用 CSS3 以下是我可以使用的解决方案以及反对它们的理由画布
typescript util 类型，可以将所有函数签名/重载的返回类型更改为新类型

我在库中有一个类型我想通过更改该类型中每个函数签名的返回类型来修改该类型 interface Chainer
XAML中无限旋转矩形

如何定义XAML无限旋转矩形到目前为止我找到了一个带有代码但没有 xaml 的解决方案 http www codeproject com Articles 23257 Beginner s WPF Animation Tutorial
创建具有精确尺寸且无填充的图形（以及轴外的图例）

我正在尝试为一篇科学文章制作一些图形因此我希望我的图形具有特定的尺寸我还看到 Matplotlib 默认情况下在图形边框上添加了大量填充这是我不需要的因为图形无论如何都会在白色背景上要设置特定的图形尺寸我只需使用plt figu
获取最顶层的 UIViewController

我似乎无法到达最顶端UIViewController无法访问UINavigationController 这是我到目前为止所拥有的 UIApplication sharedApplication keyWindow rootViewCont
HDF5 中的稀疏数组支持

我需要以某种方式在磁盘上存储 512 3 阵列并且我目前正在使用 HDF5 由于阵列稀疏大量磁盘空间被浪费 HDF5 是否提供对稀疏数组的支持一种解决方法是使用以下内容创建数据集compression option http docs

HDF5 中的稀疏数组支持

HDF5 中的稀疏数组支持 的相关文章

随机推荐

热门标签

HDF5 中的稀疏数组支持的相关文章