在 PyTables 中，如何创建可变长度的嵌套数组？

2024-01-09

我正在使用 PyTables 2.2.1 w/ Python 2.6，我想创建一个包含可变长度嵌套数组的表。

我搜索了 PyTables 文档和教程示例（PyTables 教程 3.8 http://www.pytables.org/docs/manual/ch03.html#id332794）展示了如何创建长度= 1的嵌套数组。但是对于这个例子，我如何向数据“info2/info3/x”和“info2/info3/y”添加可变行数？

为了也许更容易理解表结构，这是我自己开发的示例：

"""Desired Pytable output:

DIEM    TEMPUS  Temperature             Data
5       0       100         Category1 <--||-->  Category2
                         x <--| |--> y          z <--|
                        0           0           0
                        2           1           1
                        4           1.33        2.67
                        6           1.5         4.5
                        8           1.6         6.4
5       1       99
                        2           2           0   
                        4           2           2
                        6           2           4
                        8           2           6
5       2       96
                        4           4           0
                        6           3           3
                        8           2.67        5.33


Note that nested arrays have variable length.
"""

import tables as ts

tableDef =      {'DIEM': ts.Int32Col(pos=0),
                'TEMPUS': ts.Int32Col(pos=1), 
                'Temperature' : ts.Float32Col(pos=2),
                'Data': 
                    {'Category1': 
                        {
                        'x': ts.Float32Col(), 
                        'y': ts.Float32Col()
                        }, 
                    'Category2': 
                        {
                        'z': ts.Float32Col(), 
                        }
                    }
                }

# create output file
fpath = 'TestDb.h5'
fh = ts.openFile(fpath, 'w')
# define my table
tableName = 'MyData'
fh.createTable('/', tableName, tableDef)
tablePath = '/'+tableName
table = fh.getNode(tablePath)

# get row iterator
row = table.row
for i in xrange(3):
    print '\ni=', i
    # calc some fake data
    row['DIEM'] = 5
    row['TEMPUS'] = i
    row['Temperature'] = 100-i**2

    for j in xrange(5-i):
        # Note that nested array has variable number of rows
        print 'j=', j,
        # calc some fake nested data
        val1 = 2.0*(i+j)
        val2 = val1/(j+1.0)
        val3 = val1 - val2

        ''' Magic happens here...
        How do I write 'j' rows of data to the elements of 
        Category1 and/or Category2?

        In bastardized pseudo-code, I want to do:

        row['Data/Category1/x'][j] = val1
        row['Data/Category1/y'][j] = val2
        row['Data/Category2/z'][j] = val3
        '''

    row.append()
table.flush()

fh.close()

我在 PyTables 文档中没有发现任何迹象表明这种结构是不可能的......但如果这种结构实际上是不可能的，那么我对可变长度嵌套列的替代方案是什么？

电子阵列？ VL 数组？如果是这样，如何将这些数据类型集成到上述结构中？
还有其他想法吗？

非常感谢任何帮助！

编辑附加信息：看来 PyTables 专家已经解决了“这样的结构是否可能”的问题：

PyTables 邮件论坛 - 分层数据集 http://sourceforge.net/mailarchive/message.php?msg_id=18598716

那么有人找到了创建类似 PyTable 数据结构的方法吗？

再次感谢！

我有一个类似的任务：用可变长度的数组转储固定大小的数据。

我首先尝试使用固定大小的 StringCol(64*1024) 字段来存储可变长度数据（它们始终

经过几天的调查，我最终得出以下解决方案：

（剧透：我们将数组字段存储在单独的 EArray 实例中，每个数组字段一个 EArray）

我将固定大小的数据存储在常规 pytables 表中。

我向这些表添加了 2 个附加字段：arrFieldName_Offset and arrFieldName_Length:

class Particle(IsDescription):
   idnumber  = Int64Col()
   ADCcount  = UInt16Col()
   TDCcount  = UInt8Col()
   grid_i    = Int32Col()
   grid_j    = Int32Col()
   pressure  = Float32Col()
   energy    = FloatCol()
   buffer_Offset = UInt32() # note this field!
   buffer_Length = UInt32() # and this one too!

我还为每个数组字段创建一个 EArray 实例：

datatype = StringAtom(1)
buffer = h5file.createEArray('/detector', 'arr', datatype, (0,), "")

然后我添加与固定大小数据相对应的行：

row['idnumber'] = ...
...
row['energy'] = ...
row['buffer_Offset'] = buffer.nrows
# my_buf is a string (I get it from a stream)
row['buffer_Length'] = len(my_buf)
table.append(row)

哒哒！将缓冲区添加到数组中。

buffer.append(np.ndarray((len(my_buf),), buffer=my_buf, dtype=datatype))

这就是窍门。在我的实验中，这种方法比存储不规则的固定大小数组（如 StringAtom(HUGE_NUMBER)）快 2-10 倍，并且生成的数据库小几倍（2-5 倍）

获取缓冲区数据很容易。假设row是您从数据库中读取的一行：

# Open array for reading
buffer = h5file.createEArray('/detector', 'Particle.buffer', datatype, (0,), "")
...
row = ...
...
bufferDataYouNeed = buffer[ row['buffer_Offset'] : row['buffer_Offset'] + row['buffer_Length']]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pytables

在 PyTables 中，如何创建可变长度的嵌套数组？的相关文章

散景图只会弹出一个空白窗口

所以我最近一直在尝试学习散景一切都很顺利但突然间每当我尝试制作散景图时浏览器就会显示一个空白页面我没有收到任何错误代码只有空白页这是我几天前成功用来创建绘图的程序我什至尝试加载几周前制作的 html 绘图文件该文件在同事计
使用三个一维数组绘制等值线图

正如标题所示我想使用三个一维数组绘制等高线图这么说吧 x np array 1 2 3 and y np array 1 2 3 and z np array 20 21 45 为了在 matplotlib 中绘制等高线图我对x an
在二维数组中进行所有可能的组合

我正在尝试制作具有所有可能组合的 4x4 16 像素黑白图像数组我制作了以下数组作为模板 template 0 0 0 0 start with all white pixels 0 0 0 0 0 0 0 0 0 0 0 0 然后我想迭
需要根据数据框中的行号应用不同的公式

我正在努力在数据框中找到某种移动平均值该公式将根据正在计算的行数而变化实际场景是我需要计算Z列 Edit 2 以下是我正在使用的实际数据 Date Open High Low Close 0 01 01 2018 1763 95 176
按每个元素中出现的数字对字符串列表进行排序[重复]

这个问题在这里已经有答案了我有一个脚本其目的是对不断下载到服务器上的空间数据集文件进行排序和处理我的列表目前大致如下 list file t00Z wrff02 grib2 file t00Z wrff03 grib2 file t0
使用ideone时如何传入命令行参数？

我正在使用 ideone 在线解释器 http ideone com http ideone com 来测试一些 C 和 Python 程序如何指定命令行参数而不是使用 STDIN 输入看起来你不能但是快速破解应该做的伎俩 stati
caffe安装：opencv libpng16.so.16链接问题

我正在尝试在 Ubuntu 14 04 机器上使用 python 接口编译 caffe 我已经安装了 Anaconda 和 opencvconda install opencv 我还安装了咖啡中规定的所有要求并更改了注释块makefile
在Python中将大文件（25k条目）加载到dict中很慢？

我有一个大约有 25000 行的文件它是 s19 格式的文件每行就像 S214780010 00802000000010000000000A508CC78C 像这样的事情怎么样我做了一个测试文件只有一行S21478001000802
NumPy 数组与 SQLite

我在 Python 中见过的最常见的 SQLite 接口是sqlite3 但是有什么东西可以很好地与 NumPy 数组或 rearray 配合使用吗我的意思是它可以识别数据类型不需要逐行插入并提取到 NumPy rec 数组中有点
在多核上运行 python 线程

我知道Python 2 7不允许在不同的内核上运行多个线程你需要使用multiprocessing模块以实现某种程度的并发性我正在看concurrent futuresPython 3 4 中的模块是否使用ThreadPoolExec
pandas 数据框的最大大小

我正在尝试使用读取一个有点大的数据集pandas read csv or read stata功能但我不断遇到Memory Errors 数据帧的最大大小是多少我的理解是只要数据适合内存数据帧就应该没问题这对我来说不应该是问题还
lmfit模型拟合然后预测

我正在领养lmfit进行曲线拟合并使用拟合模型进行预测然而下面的代码并没有达到我想要的效果能否请你帮忙谢谢 import numpy as np from lmfit import Model def linearModel x a0
Python 中“is”运算符的语义是什么？

如何is运算符确定两个对象是否相同它是如何工作的我找不到它的记录来自文档 http docs python org reference datamodel html 每个对象都有一个身份一个类型和一个值对象的身份一旦发生就永远
Pandas 中每列的曲线拟合 + 外推值

我有一个包含大约 300 列的数据集每一列都与深度相关 Pandas DataFrame 的简化版本看起来像这样 import matplotlib pyplot as plt import numpy as np import pand
如何将 pandas DataFrame 转换为 TimeSeries？

我正在寻找一种将 DataFrame 转换为 TimeSeries 而不拆分索引和值列的方法有任何想法吗谢谢 In 20 import pandas as pd In 21 import numpy as np In 22 dates
解析整数集的字符串并列出间隔

I have 2 5 7 9 12 string 我想从中获取 2 5 7 8 9 12 列表 python中有没有内置的函数 Thanks UPD 我想直接的答案是No 不管怎样谢谢你的片段使用一个建议者斯文马尔纳克 s 2
JSONDecodeError：额外数据：Python [重复]

这个问题在这里已经有答案了我使用以下代码从文件加载 json file file name obj list with open file as f for json obj in f obj list append loads json
如何使用 keras.backend.gradients() 获取梯度值

我试图获得 Keras 模型的输出相对于模型输入 x 而不是权重的导数似乎最简单的方法是使用 keras backend 中的梯度它返回梯度张量 https keras io backend https keras io backe
将二进制数转换为包含每个二进制数的数组

我试图将二进制值转换为每个 1 0 的列表但我得到默认的二进制值而不是列表我有一个字符串我将每个字符转换为二进制它给了我一个列表其中每个字符都有一个字符串现在我试图将每个字符串拆分为值为 0 1 的整数但我什么也得不到 if
在Python中使用os.makedirs创建目录时出现权限问题

我只是想处理上传的文件并将其写入工作目录中该目录的名称是系统时间戳问题是我想以完全权限创建该目录 777 但我不能使用以下代码创建的目录755权限 def handle uploaded file upfile cTimeStamp

随机推荐

当 Cocoa 应用程序中的主线程被阻塞时，UI 不会更新

当我运行整个方法时我在主线程中使用 NSProgressIndicator 来更新进度现在当我最终从不同的类文件调用一个对象并等待该对象返回到我的主线程的值时我注意到 NSProgressIndicator 将消失我明白这是因为
如何填充 Woocommerce 手动订单的元字段

我为我的 Woocommerce 订单定义了两个自定义字段我用了WooCommerce 管理员自定义订单字段扩展 https docs woocommerce com document woocommerce admin custom o
枚举 configs.hasMoreElements() 给出 false

我正在 Android 中开发一个基于语音的应用程序遇到一些问题请参阅下面的代码 Java文件1 文件 wav 文件 public static AudioInputStream getAudioInputStream File fil
可以在 NetBeans 中查看方法/函数文档吗？

支持 Python 的 NetBeans 6 5 在自动完成时在弹出窗口中提供函数方法的文档字符串文档但是还有其他方法来查看文档字符串吗也许通过将鼠标悬停在函数方法名称上或单击某处来实现我似乎能做的最好的事情就是右键单击菜单中的
Java+jackson解析错误无法识别的字符转义

我需要使用 HttpClient 执行 POST json 字符串以下是我的代码从另一端 Json 被映射到一个对象 HttpClient client HttpClientBuilder create build HttpPost p
如何获取 T 函数中使用的属性名称字符串

我有一个场景我必须获取一个字符串数组这些字符串表示 Func 参数中使用的每个属性名称这是一个示例实现 public class CustomClass
Java中子类的排序

假设一个Superclass implements Comparable
将 ContextMenu 的 MenuItem 可见性绑定到 ListView 选择

我有一个带有 ListView 的用户控件其中包含 ObservableCollection 中的简单项目我希望该 ListView 的 ContextMenu 包含根据 ListView 中选择的内容的项目如果未选择任何项目则某些
Firebase 计划函数是否会在模拟器上自动运行？

我正在尝试使用模拟器在 Firebase 上构建计划功能我已按所示进行设置并已验证 PubSub 是否正在我的模拟器上运行然而什么也没有发生我有以下功能 exports scheduledFunction functions pu
Objective-C 中的静态 NSString

我经常在类实例方法中看到这样的代码片段 static NSString myString This is a string 我似乎不明白为什么这会起作用这是否只是 objc 等价于仅限于方法范围的 define 我认为我理解变量的静态
数组上的“each”/“map”会导致 create_time_zone_conversion_attribute 中的“当您没有预料到时，您有一个 nil 对象”？

我有一个按钮它通过 XHR 向 Rails 服务器中的特定操作发送 get 请求此操作调用我在模型类别中定义的函数该函数执行类似 x Category subcategories 的操作并在下一行中执行类似 x map id 或
如何将绘图保存到PDF文件中，周围没有大边距[重复]

这个问题在这里已经有答案了如果我打印一个情节EPS http en wikipedia org wiki Encapsulated PostScript格式时 EPS 文件的内容完全被绘图占据但如果我打印一个情节PDF http en
如何选择*加上另一列[重复]

这个问题在这里已经有答案了我试图从一个表中选择所有值然后选择仅运行这些列之一的函数的输出并将所有这些显示为我的 SQL 查询输出我这样做的目标是从 Geometry 列创建可用的 WKT 输出并将其包含在查询结果中这样我就可以在
FabricInvalidAddressException：尝试从 .NET Core 应用程序连接时出现 NamedEndpoint“V2Listener”

我正在尝试使用以下方式连接到 Service Fabric 应用程序ServiceProxy像这样的类 return ServiceProxy Create
php和mysql将记录从一个表复制到另一个表

我想通过将记录从一个表移动到另一个表来对学生进行存档这是我尝试使用的代码
您相信 ASP.Net MVC 已准备好投入生产吗？

我真的很喜欢 Microsoft 承诺将 MVC 引入 Web 为此我对将我现有的 ASP NET 应用程序之一转换为 MVC 感到兴奋并想知道我是否操之过急虽然这个网站正在使用 MVC 但它在技术上仍处于测试阶段您有什么想法从
Google 容器引擎：访问云存储

我无法让应用程序默认凭据在 Google 容器引擎中工作文档说它们适用于 App Engine 和 Compute Engine 但我被告知它们应该透明地传递到在 Container Engine 上运行的容器这是失败的代码 crede
iOS 7 状态栏与导航栏发生冲突

我的应用程序中有一个视图控制器在故事板中拖动了一个导航栏它在 iOS 6 中运行良好但在 iOS 7 中它看起来像这样状态栏和导航栏不应相互冲突我在堆栈溢出上看到过很多这样的问题但它们对我没有太大帮助有些问题说我应该使用这个
asp.net core 检查中间件中的路由属性

我正在尝试构建一些 ASP Net core 中间件需要查看当前路由是否标记为授权 eg public async Task Invoke HttpContext context if context Request Path Valu
在 PyTables 中，如何创建可变长度的嵌套数组？

我正在使用 PyTables 2 2 1 w Python 2 6 我想创建一个包含可变长度嵌套数组的表我搜索了 PyTables 文档和教程示例 PyTables 教程 3 8 http www pytables org docs ma

在 PyTables 中，如何创建可变长度的嵌套数组？

在 PyTables 中，如何创建可变长度的嵌套数组？ 的相关文章

随机推荐

热门标签

在 PyTables 中，如何创建可变长度的嵌套数组？的相关文章