是否可以使用h5py将大数据直接加载到numpy int8数组中？

2024-02-08

我有一个非常大的数据文件（1000 x 1400000 数组），其中包含整数 0、1、2 和 4。使用 h5py 将这些大数据加载到 numpy 数组中需要很长时间，因为我的内存（4GB）无法容纳这么多并且程序使用交换空间。由于数据中只有 4 个数字，因此我想使用 8 位整数数组。目前我加载数据并将其转换为 8 位 int 数组。

with h5py.File("largedata", 'r') as f:

    variables = f.items()
    # extract all data
    for name, data in variables:
        # If DataSet pull the associated Data
        if type(data) is h5py.Dataset:
            value = data.value
            if(name == 'foo'):
                # convert to 8 bit int
                nparray = np.array(value, dtype=np.int8)

是否可以将数据直接加载到8位int数组中以在加载时节省内存？

来自数据集文档页面

 astype(dtype)

 Return a context manager allowing you to read data as a particular type. 
 Conversion is handled by HDF5 directly, on the fly:

>>> dset = f.create_dataset("bigint", (1000,), dtype='int64') 
>>> with dset.astype('int16'): 
      out = dset[:] 
>>> out.dtype 
       =dtype('int16')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Arrays

NumPy

h5py

是否可以使用h5py将大数据直接加载到numpy int8数组中？的相关文章

TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
Tweepy StreamListener 到 CSV

我是 python 新手我正在尝试开发一个应用程序使用 Tweepy 和 Streaming API 从 Twitter 检索数据并将数据转换为 CSV 文件问题是此代码不会创建输出 CSV 文件也许是因为我应该将代码设置为在实现例
更新 Sqlalchemy 中的多个列

我有一个在 Flask 上运行的应用程序并使用 sqlalchemy 与数据库交互我想用用户指定的值更新表的列我正在使用的查询是 def update table value1 value2 value3 query update T
更改 Altair 中的构面标题位置？

如何将方面标题在本例中为年份移动到每个图的上方默认值似乎位于图表的一侧这可以轻易改变吗 import altair as alt from vega datasets import data df data seattle weat
可以用 Django 制作移动应用程序吗？

我想知道我是否可以在我的网站上使用 Django 代码并以某种方式在移动应用程序 Flutter 等框架中使用它那么是否可以使用我现在拥有的 Django 后端并在移动应用程序中使用它所以就像models views etc 是的有
Python Fabric - 未找到主机。请指定用于连接的（单个）主机字符串：

如何获取找不到主机请指定用于连接的单个主机字符串面料如何解决 def bootstrap host ec2 54 xxx xxx xxx compute 1 amazonaws com env hosts host env use
python是带有字符串的运算符行为[重复]

这个问题在这里已经有答案了我无法理解以下行为我正在创建 2 个字符串并使用 is 运算符来比较它对于第一种情况它的工作方式有所不同对于第二种情况它按预期工作当我使用逗号或空格时它显示是什么原因False与比较is当没有使用
Apache Spark 中的高效字符串匹配

我使用 OCR 工具从屏幕截图中提取文本每个大约 1 5 句话然而当手动验证提取的文本时我注意到时不时会出现一些错误鉴于文本你好我真的很喜欢 Spark 我注意到 1 像 I 和 l 这样的字母被替换 2 表情符号未被正确提
Pandas 滚动窗口 Spearman 相关性

我想使用滚动窗口计算 DataFrame 两列之间的 Spearman 和或 Pearson 相关性我努力了df corr df col1 rolling P corr df col2 P为窗口尺寸但我似乎无法定义该方法添加meth
`list()` 被认为是一个函数吗？

list显然是内置类型 https docs python org 3 library stdtypes html list在Python中我看到底下有一条评论this https stackoverflow com a 53645813
Python多处理错误“ForkAwareLocal”对象没有属性“连接”

下面是我的代码我面临着多处理问题我看到这个问题之前已经被问过我已经尝试过这些解决方案但它似乎不起作用有人可以帮我吗 from multiprocessing import Pool Manager Class X def init
java中如何重新初始化int数组

class PassingRefByVal static void Change int pArray pArray 0 888 This change affects the original element pArray new int
django-admin.py makemessages 不起作用

我正在尝试翻译一个字符串 load i18n trans Well Hello there how are you to Hola amigo que tal 我的 settings py 文件有这样的内容 LOCALE PATHS os
如何使用 paramiko 查看（日志）文件传输进度？

我正在使用 Paramiko 的 SFTPClient 在主机之间传输文件我希望我的脚本打印文件传输进度类似于使用 scp 看到的输出 scp my file user host user host password my file 1
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
Pandas - 合并数据框以将所有值保留在左侧，如果“左侧没有键”，则从右侧“插入”值，否则“更新”左侧现有的“键”

我有两个数据框 df1 和 df2 np random seed 0 df1 pd DataFrame key A B C D id 2 23 234 2345 2021 np random randn 4 df2 pd DataFrame
如何缩短 PHP if 语句？

我有一个 if 语句我需要将单个字符串与许多不同的选项进行比较我在下面发布的代码非常清楚地表明了我的意思我知道有两种方法可以做到这一点但另一种甚至更长那么是否有任何函数可以以更短的方式实现类似的功能我的要求可能看起来很愚蠢但
为什么 JavaScript 中是 [1,2] + [3,4] = "1,23,4" ？

我想将一个数组的元素添加到另一个数组中所以我尝试了以下方法 1 2 3 4 它的回应是 1 23 4 到底是怎么回事 The 操作员没有为数组定义发生的事情是 JavaScript将数组转换为字符串并将它们连接起来 Update 由于这
如何获取所有mysql元组结果并转换为json

我能够从表中获取单个数据但是当我试图获取表上的所有数据时我只得到一行 cnn execute sql rows cnn fetchall column t 0 for t in cnn description for row in ro
使用 urllib 编码时保持 url 参数有序

我正在尝试用 python 模拟 get 请求我有一个参数字典并使用 urllib urlencode 对它们进行 urlencode 我注意到虽然字典的形式是 k1 v1 k2 v2 k3 v3 urlencoding 后参数的顺序切

随机推荐

网格的 VBO 不正确：某些三角形已连接且不应连接 [2D]

我正在用这段代码生成我的VBO int SCREEN WIDTH 800 int SCREEN HEIGHT 480 int PIXEL PER VERTEX 4 int CAVERN TEXTURE WIDTH 1024 int CAVE
调整白色图像大小后获得灰色边框

我在谷歌上搜索某种解决方案我找到了一个我尝试在我的代码中实现它但它不起作用问题是调整白色图像的大小后它们会得到灰色边框这是我找到的解决方案的链接 It says 出现此问题的原因是您将图像数据插值到新尺寸但沿边缘没有可插入
如果 jQuery 尚未加载，如何加载它？

我有一个初始化程序 js其中包含以下内容 if typeof jQuery undefined var headTag document getElementsByTagName head 0 var jqTag document crea
在文档准备好时触发 jQuery 更改函数

我的更改功能允许用户从一个国家切换到另一个国家并获得不同的文本和功能它在更改国家地区选择时起作用但在初始页面加载时它不会触发 jQuery 更改来设置默认初始国家地区的隐藏和显示文本 div 两个 div 都会在初始页面加载时显
是否有工具可以知道一个值是否具有精确的二进制表示形式作为浮点变量？

我的 C API 有一个函数它将作为输入double 只有 3 或 4 个值是有效输入所有其他值都是无效输入并被拒绝我想检查是否可以准确表示所有有效输入值以便我可以避免 epsilon 检查以简化可读性是否有一个工具最好是在命令
Django 视图中的本地化日期 strftime

我想从 django 视图发送 JSON 格式的本地化日期正常文本翻译通过 ugettext is OK 以下代码在视图中没有效果 translation activate ru print datetime now strtime B
Python使用mechanize提交post数据

我必须提交到服务器的网址如下所示 www mysite com manager php checkbox 5B 5D 5 checkbox 5B 5D 4 checkbox 5B 5D 57 self 19 submit Go 21 帖子数
IE 中的本地存储

当我尝试从本地存储值获取项目时它在 IE8 中返回未定义我使用以下代码设置项目 var value document getElementById test value var key i x test y localStorage
将其放入 TCL 正则表达式中的转义字符串

I use Expect作为测试框架并编写一些辅助函数来简化匹配模式的键入expect命令因此我寻找将任何字符串转换为字符串的函数其中所有特殊的正则表达式语法都被转义例如和其他字符这样我就可以将任何字符串放入正则表达式中而不必
str.startswith 使用正则表达式

我可以理解为什么 str startswith 不处理 Regex 吗 col1 0 country 1 Country i e df col1 str startswith C c ountry 它返回所有值 False col1 0 F
C++ 编译时错误：预期标识符位于数字常量之前

我读过其他类似的帖子但我只是不明白我做错了什么我认为我对向量的声明是正确的我什至尝试声明没有尺寸但即使这样也不起作用出了什么问题我的代码是 include
如何使用 jquery 获取 select 的选定选项的文本？

如果我有这个选择
是什么让 Cassandra（以及一般的 NoSQL）成为 RDBMS 的更好解决方案？

嗯 NoSQL 现在是一个流行词所以我一直在研究它我还没有弄清楚 ColumnFamilies 和 SuperColumns 等但我一直在研究数据是如何映射的看完之后this http arin me blog wtf is a s
无法在 .NET 4 MVC 4 应用程序中加载文件或程序集系统，版本=2.0.5.0

找了好久找不到任何有用的东西这是我得到的异常 Could not load file or assembly System Version 2 0 5 0 Culture neutral PublicKeyToken 7cec85d7b
从rest api查询数据表，无需在html中预先定义表

我想通过来自 REST API 的 POST 请求查询 JSON http localhost post1 param1 1 返回以下内容 json table date 123 test hello2 date 19 test hello
NSKeyedArchiver archivedDataWithRootObject：

NSKeyedArchiver archivedDataWithRootObject 的参数应该是我要保存的数组还是转换为 NSData 的数组裕二的回答是对的但更准确地说您的数组元素必须实现协议并将您自己的代码填充到方法 init
如何呈现更小的视图控制器

我想要以比屏幕更小的尺寸呈现视图控制器 vc2 如何在 Swift 3 中做到这一点感谢帮助这是我的代码 IBAction func leftButtonPressed sender UIButton let vc2 self stor
调用定义的方法时 JavaScript“不是函数”错误

这是我的代码 request xml function http request false http request new XMLHttpRequest if http request overrideMimeType http req
Xcode 6 GM - CLLocationManager

我有一个使用 Xcode 5 制作的项目我有一个 ViewController 我在其中使用 CLLocationManager 获取手机位置我已经实现了这两个 void locationManager CLLocationManage
是否可以使用h5py将大数据直接加载到numpy int8数组中？

我有一个非常大的数据文件 1000 x 1400000 数组其中包含整数 0 1 2 和 4 使用 h5py 将这些大数据加载到 numpy 数组中需要很长时间因为我的内存 4GB 无法容纳这么多并且程序使用交换空间由于数据中只有 4

是否可以使用h5py将大数据直接加载到numpy int8数组中？

是否可以使用h5py将大数据直接加载到numpy int8数组中？ 的相关文章

随机推荐

热门标签

是否可以使用h5py将大数据直接加载到numpy int8数组中？的相关文章