是否可以使用 np 数组作为 h5py 数据集中的索引？

2024-04-21

我需要将多个数据集（每个数据集包含在一个单独的文件中）合并到属于最终文件的另一个数据集中。当部分数据集中的数据被复制到最终数据集中时，它们的顺序不会保留 - 部分数据集中的数据通过索引“映射”到最终数据集中。我创建了两个列表，final_indices 和partial_indices，并写道：

final_dataset   = final_hdf5file['dataset']
partial_dataset = partial_hdf5file['dataset']

# here partial ad final_indices are lists.
final_dataset[final_indices] = partial_dataset[partial_indices]

这样做的问题是性能非常糟糕 - 原因是final_和partial_indices都必须是列表。我的解决方法是从最终数据集和部分数据集创建两个 np 数组，并使用 np 数组作为索引。

final_array   = np.array(final_dataset)
partial_array = np.array(partial_dataset)
# here partial ad final_indices are nd arrays.
final_array[final_indices] = partial_array[partial_indices]

然后将最终数组重新写入最终数据集。

final_dataset[...] = final_array

然而，在我看来，这样做很不雅观。

是否可以使用 np.arrays 作为 h5py 数据集中的索引？

所以你正在为读取和写入做花式索引：

http://docs.h5py.org/en/latest/high/dataset.html#fancy-indexing http://docs.h5py.org/en/latest/high/dataset.html#fancy-indexing

它警告说，长列表可能会很慢。

我可以看到在哪里读取和写入整个集合以及在数组上进行映射会更快，尽管我还没有实际测试过。读/写速度更快，映射速度也更快

http://docs.h5py.org/en/latest/high/dataset.html#reading-writing-data http://docs.h5py.org/en/latest/high/dataset.html#reading-writing-data

我会使用切片符号（或value）来加载数据集，但这只是一个小问题。

final_array   = final_dataset[:]

如果函数中的代码看起来不优雅，请将其隐藏。

这个 oneliner 可能有用（我还没有测试过）。 RHS 更有可能发挥作用。

final_dataset[:][final_indices] = partial_dataset[:][partial_indices]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

NumPy

h5py

是否可以使用 np 数组作为 h5py 数据集中的索引？的相关文章

在 python 中使用 numpy.linalg.eig 后对特征值和关联的特征向量进行排序

我使用 numpy linalg eig 来获取特征值和特征向量的列表 A someMatrixArray from numpy linalg import eig as eigenValuesAndVectors solution eig
快速分类（分箱）

我有大量条目每个条目都是浮点数这些数据x可以通过迭代器访问我需要使用像这样的选择对所有条目进行分类10
使用 NaN 计算 numpy 数组中的移动平均值

我正在尝试计算包含 NaN 的大型 numpy 数组中的移动平均值目前我正在使用 import numpy as np def moving average a n 5 ret np cumsum a dtype float ret n
在 Chaquopy 中转换数组和张量

我该怎么做呢我看到你的帖子说你可以将 java 对象传递给 Python 方法但这不适用于 numpy 数组和 TensorFlow 张量以下以及其各种变体是我尝试过的但没有成功 double anchors new double
如何检查两个数据集的匹配列之间的相关性？

如果我们有数据集 import pandas as pd a pd DataFrame A 34 12 78 84 26 B 54 87 35 25 82 C 56 78 0 14 13 D 0 23 72 56 14 E 78 12 31
将 numpy 记录数组转换为字典列表的有效方法

如何转换下面的 numpy 记录数组 recs Bill 31 260 0 Fred 15 145 0 r rec fromrecords recs names name age weight formats S30 i2 f4 到字典列表
numpy 中的分层抽样

在 numpy 中我有一个这样的数据集前两列是索引我可以通过索引将数据集分成多个块即第一个块是 0 0 第二个块是 0 1 第三个块 0 2 然后是 1 0 1 1 1 2 等等每个块至少有两个元素索引列中的数字可能会有所不同我
向量化 numpy bincount

我有一个 2d numpy 数组 A我要申请np bincount 到矩阵的每一列A生成另一个二维数组B由原始矩阵每列的 bincounts 组成A 我的问题是 np bincount 是一个采用一维数组的函数它不是像这样的数组方法B A
如何“缩放”numpy 数组？

我想将形状 h w 的数组缩放 n 倍从而得到形状 h n w n 的数组其中假设我有一个 2x2 数组 array 1 1 0 1 我想将数组缩放为 4x4 array 1 1 1 1 1 1 1 1 0 0 1 1 0 0 1 1
打印总和时出现“内置方法总和”奇怪的消息

使用 Python NumPy 计算矩阵的列之和 import numpy from StringIO import StringIO fileName test2 csv myFile open fileName r print Read
将具有不同大小的行的数据加载到 Numpy 数组中

假设我有一个包含如下数据的文本文件 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 如何将它加载到 numpy 数组中使其看起来像这样 1 2 3 4 5 0 6 7 8 0 0 0 9 1
使用批量乘法的tensorflow的tensordot中的障碍

我正在张量流中实现 RBM 使用小批量实现参数更新存在障碍有2个张量第一个张量的形状是 100 3 1 第二个张量的形状是 100 1 4 数字 100 是批次大小所以我想将这些张量相乘得到 100 3 4 张量但是当我实现这样的
如何获取所有数字列（嵌套与否）的“.describe()”统计信息？

获取数据帧或列表或数组中任何列的简单描述性统计数据的最佳方法是什么无论是否嵌套一种高级 df describe 还包括带有数值的嵌套结构就我而言我有一个包含许多列的数据框有些列的每一行都有一个数字列表在我的例子中是时间序列结
使用 scipy、python、numpy 进行非线性 e^(-x) 回归

下面的代码为我提供了一条最佳拟合线的平坦线而不是沿着 e x 模型的一条适合数据的漂亮曲线谁能告诉我如何修复下面的代码以使其适合我的数据 import numpy as np import matplotlib pyplot as pl
`numpy.diff` 和 `scipy.fftpack.diff` 在微分时给出不同的结果

我正在尝试计算一些数据的导数并且正在尝试比较有限差分的输出和谱方法的输出但结果却截然不同我无法弄清楚到底为什么考虑下面的示例代码 import numpy as np from scipy import fftpack as sp
查找矩阵内的匹配子矩阵

我有一个 100x200 2D 数组表示为由黑色 0 和白色 255 单元组成的 numpy 数组它是一个位图文件然后我有 2D 形状最容易将它们视为字母它们也是 2D 黑白单元格我知道我可以天真地迭代矩阵但这将是我的代码的
由于“环境错误：[错误 13]：权限被拒绝：'usr/local/bin/f2py'”而无法安装软件包

我正在尝试在 macOS X 上安装 numpy 但执行命令后pip install numpy我收到错误环境错误错误13 权限被拒绝 usr local bin f2py 我如何解决它这对我有用 pip3 install user
如何计算总和的平方和？

我有一笔款项需要加快处理速度在一种情况下是 S x y k l Fu ku Fv lv Fx kx Fy ly 另一种情况是 S x y S k l Fu ku Fv lv Fx kx Fy ly 2 注意 S indices 是这些索引
为神经网络打乱两个 numpy 数组

我有两个 numpy 数组用于输入数据 X 和输出数据 y X np array 2 3 sample 1 x 16 4 dtype float sample 2 x y np array 1 0 sample 1 y 0 1 dtype
使用 Numpy 进行多维批量图像卷积

在图像处理和分类网络中一个常见的任务是输入图像与一些固定滤波器的卷积或互相关例如在卷积神经网络 CNN 中这是一种极其常见的操作我已将通用版本任务减少为 Given 一批 N 个图像 N H W D 和一组 K 个滤镜 K H W

随机推荐

ReactiveCommand 传递命令参数

我想用命令来实现文本框中的KeyDown事件我想让命令能够识别哪个键输入例如 KeyEventArgs 在 KeyDown Event 中执行操作并执行其他一些操作所以我想将命令参数传递给ReactiveCommand 就像Event
Python selenium：DevTools 监听 ws://127.0.0.1

今天当我使用 chromedriver 运行 selenium 时我在控制台上收到此消息我该如何抑制这种情况 DevTools listening on ws 127 0 0 1 12740 devtools browser 9710
更改 Integration Services 项目中的 .NET Framework

在 Visual Studio 2013 中创建新的 Integration Services 项目时我可以选择要定位的 NET 框架如何查看现有项目所针对的 NET 框架并可能对其进行更改您需要打开脚本任务之一并单击编辑脚本按钮
如何在 R 中按下传单弹出窗口时创建事件？

当我单击传单多边形时我想让 tabPanel 变为闪亮我对如何做到这一点有一些想法但我找不到实现它们所需的信息我在选项卡面板中有传单但我想在单击多边形时切换到另一个选项卡 leaflet llmap gt addTiles gt
使用 cmake 构建项目后如何运行 ctest

我希望每次成功构建项目时都启动测试如果某些测试被破坏我希望我的构建也被破坏默认情况下我需要通过运行来手动运行测试ctest命令 CTest 实际上可以构建项目但我使用调用的 IDEmake建立资源和make不运行测试我将此命令
php 7 无法初始化 sqlsrv

我搜索了一整天寻找 php 7 VC14 x64 Thread Safe 上 sqlsrv dll 的解决方案但没有找到解决方案有没有人解决这个问题 04 Oct 2015 19 48 05 UTC PHP Warning PHP S
UNNotificationServiceExtension：内存限制？

我正在尝试实现 UNNotificationServiceExtension 但我的代码似乎经常失败只需说明 Program ended with exit code 0 我正在尝试在扩展中使用 FMDB Sqlite3 模块似乎我可能
诊断 SQL Server 2005 中的死锁

我们在 Stack Overflow SQL Server 2005 数据库中发现了一些有害但罕见的死锁情况我附加了分析器使用设置了跟踪配置文件这篇关于解决死锁问题的优秀文章 http www simple talk com sql l
如何仅将缩进序列化应用于某些属性？

我想以人类可读的方式将 NET 对象序列化为 JSON 但我希望对对象的属性或数组的元素是否最终位于自己的一行上有更多的控制目前我正在使用 JSON NETJsonConvert SerializeObject object Format
如何改变字典中的数组？

我在操场上尝试过以下操作 var d1 String String d1 a String var a1 d1 a a1 append s1 println d1 输出是 a 我希望 a s1 改变字典中数组的正确方法是什么在 swift
C++：不同翻译单元中具有相同名称的不同类

考虑以下示例 usedclass1 hpp include
pmap 和线程数

user gt Runtime getRuntime availableProcessors 2 并评估这个例子 http clojuredocs org clojure core clojure core pmap example 684
“PKIX 路径构建失败”和“无法找到请求目标的有效证书路径”

我正在尝试使用 twitter4j 库为我的 java 项目获取推文该项目在幕后使用java net HttpURLConnection 如堆栈跟踪中所示第一次运行时我收到有关证书的错误sun security validator V
PyQt：QFileSystemModel 复选框过滤器

我正在尝试使用 python pyqt 创建一个实用程序来从QFileSystemModel 仅包括已检查的项目现在我想要控制QFileSystemModel使用文件名文件类型文件大小进行过滤的复选框我如何勾选取消勾选QFileS
MediatR 和 SimpleInjector 的依赖范围问题

我一直在使用中介者模式和 CQRS 进行实验MediatR https github com jbogard MediatR使用实体框架进行数据访问的 WinForms 应用程序中的库该应用程序用于批次制造工厂允许用户查看活动批次和已完
有没有办法在没有样式组件的情况下为整个反应应用程序设置默认字体系列？

我正在寻找一种方法来设置整个反应应用程序的默认字体系列但所有结果包都指向反应本机对于React 有没有一种方法可以默认全局字体设置而无需在每个CSS中指定font family 谢谢如果我正确理解你的问题应该这样做 import
C代码运行速度更快吗？

从 Objective C 调用 C 代码是否有任何性能提升我在某处读到与使用函数调用的其他语言相比消息传递速度较慢那么如果我从 Objective C 代码调用 C 函数我是否可以避免消息传递开销在优化性能时是否建议使用
如何在 Ubuntu 20.04 中安装 Python2.7 的 pip

有什么方法可以为 Python2 7 安装 pip 吗我可以通过安装 python2 7 sudo apt install python2 minimal 我尝试为此安装 pip sudo apt install python pip p
为什么我的 JQuery .ajax 请求没有并行发出？

我正在尝试使用 jQuery 并行发出两个 ajax 请求如下所示 var sources source1 source2 sources each function var source this ajax async true typ
是否可以使用 np 数组作为 h5py 数据集中的索引？

我需要将多个数据集每个数据集包含在一个单独的文件中合并到属于最终文件的另一个数据集中当部分数据集中的数据被复制到最终数据集中时它们的顺序不会保留部分数据集中的数据通过索引映射到最终数据集中我创建了两个列表 final ind

是否可以使用 np 数组作为 h5py 数据集中的索引？

是否可以使用 np 数组作为 h5py 数据集中的索引？ 的相关文章

随机推荐

热门标签

是否可以使用 np 数组作为 h5py 数据集中的索引？的相关文章