PyTables 的优点是什么? [关闭]

2023-11-30

我最近开始学习PyTables,发现它非常有趣。我的问题是:

  • 当涉及到巨大的数据集时,PyTables 相对于数据库的基本优势是什么?
  • 这个包的基本目的是什么(我可以在 NumPy 和 Pandas 中进行相同类型的结构化,那么 PyTables 有什么大不了的)?
  • 它对于分析大数据集真的有帮助吗?任何人都可以借助示例和比较来详细说明吗?

谢谢你们。


当涉及到巨大的数据集时,PyTables 相对于数据库的基本优势是什么?

实际上,它is一个数据库。当然,它是一个分层数据库,而不是像这样的一级键值数据库dbm(这显然不太灵活)或像关系数据库sqlite3(更强大,但更复杂)。

但相对于非数字特定数据库的主要优势与 numpy 的优势完全相同ndarray在普通的Python上list。它针对执行大量矢量化数字运算进行了优化,因此如果您正在使用它执行此操作,则将花费更少的时间和空间。

这个包的基本目的是什么

引用第一行首页(或者,如果您愿意,第一行the FAQ):

PyTables 是一个用于管理分层数据集的包,旨在高效、轻松地处理极其大量的数据。

还有一个页面列出了主要特点,链接在首页顶部附近。

(我可以在 NumPy 和 Pandas 中进行相同类型的结构化,那么 PyTables 有什么大不了的)?

真的吗?你可以在只有 16GB RAM 的机器上处理 numpy 或 pandas 中的 64GB 数据吗?还是32位机器?

不,你不能。除非您将数据分成一堆单独的数据集,然后根据需要加载、处理和保存,但这会更加复杂,而且速度也会慢得多。

这就像问为什么需要 numpy,而你只用常规的 Python 列表和迭代器就可以做同样的事情。当你有一个包含 8 个浮点数的数组时,纯 Python 就很好用,但当你有一个 10000x10000 的浮点数数组时,纯 Python 就不行了。当您拥有几个 10000x10000 数组时,numpy 非常有用,但当您拥有十几个大小高达 20GB 的互连数组时,numpy 就不再适用了。

它对于分析大数据集真的有帮助吗?

Yes.

任何人都可以借助任何示例来详细说明吗?

是的。与其复制这里的所有示例,不如直接查看文档首页上的简单示例、源代码树中的大量示例以及从前面单击两次即可链接到实际用例的链接文档页面等?

如果您想让自己相信 PyTables 的实用性,请采用任何示例并将其扩展到 32GB 的数据,然后尝试弄清楚如何在 numpy 或 pandas 中执行完全相同的操作。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

PyTables 的优点是什么? [关闭] 的相关文章

随机推荐

  • subprocess.Popen("echo $HOME"... 和 subprocess.Popen(["echo", "$HOME"] 之间有什么区别

    我无法得到它是 bash 相关的或 python 子进程 但结果是不同的 gt gt gt subprocess Popen echo HOME shell True stdout subprocess PIPE communicate b
  • 如何使用 JavaScript 或 HTML 将文件输入设置为空?

    在我正在开发的网站上 我有一个文件输入 用户可以从中上传文件 它使用 Ajax 不是真正的 将文件发送到绑定到 iframe 的 php 文件 我的问题是 Firefox 自动填充文件输入元素 有没有办法让用户可以选择单击提交按钮而不发送文
  • 复制绘图区域在 Powerpoint VBA 中无法正常工作

    我拼凑了以下代码 将图表的格式从一个图表复制到另一个图表 代码仍然很混乱 因为我试图想出引用图表的最佳方法 欢迎任何想法 我无法准确复制主要是绘图区域和辅助访问的格式和位置 一个页面上必须有两个图表 首先选择源 然后选择目标 目前来看 它们
  • 自动滚动 Cypress 行为导致下拉菜单在 Cypress 测试中关闭。有解决方法吗?

    Cypress 的自动滚动行为正在关闭我试图在其中选择元素的下拉列表 这会导致测试失败 因为找不到第一个下拉项 我添加的解决方法是添加第二个 click 键入输入后重新打开下拉菜单 cy get selector click force t
  • SymPy:如何根据其他表达式返回一个表达式?

    我还很陌生SymPy并提出一个可能是基本问题的问题 或者我可能只是误解了 SymPy 的使用方式 有没有办法创建一个不由原子表示而是由其他表达式组合表示的表达式 Example gt gt gt from sympy physics uni
  • 当放入结构中时,值的寿命不够长

    我正在尝试使用 Rust 中的 LLVM这个板条箱 我正在尝试创建一个代码生成器结构来为我保存上下文 模块和构建器 但是当我尝试编译时 我收到一条错误消息 c does not live long enough 我怎样才能编译它 为什么 c
  • 铸造容器 C++ [重复]

    这个问题在这里已经有答案了 可能的重复 是否可以将 Base 类型的 STL 容器转换为 Derived 类型 这应该是一个简单的问题 如果我有一个基类的容器 例如 STL 列表 是否可以将整个容器转换为子类类型 例如 A inherits
  • @Query 注释使用 like %?1%

    我想写一个这样的查询 Query select p from Product p where p name 1 or p desc like 1 但这给了我例外 org hibernate hql ast QuerySyntaxExcept
  • 这个方法如何运作?

    我经常遇到这种注册动作侦听器的方式 虽然我最近一直在使用这种方法 但我不明白这是如何以及为什么的 这是一个 submit new JButton submit submit addActionListener new ActionListe
  • 绑定到 ICollectionView 时模拟数据不显示

    如果我绑定我的ListBox到视图模型ObservableCollection或 XAML 资源CollectionViewSource 模拟数据在设计时显示 有时CollectionViewSource由于某些 XAML 更改而停止显示此
  • Eclipse 在没有互联网连接的 PC 上间歇性挂起

    我从 Eclipse 3 2 开始就遇到过这个问题 但在较新的版本中 这个问题出现得更频繁 每当我访问某些配置菜单项或 Eclipse 解析包含指向某个 Internet URL 的 xmlns 变量的 XML 文件时 Eclipse ID
  • 从 DataTable 批量插入到 SQLCE DataSource

    这是一个使用 SQL CE 作为数据源的 C WPF 应用程序 我有一个 DataTable 显示为 DataGrid 和一个 SQL CE DataSource 我使用 DataAdapter DataSet 和 DataTable 从
  • 如何将 XML 文件读取到包含 null 元素的空字符串的 Dictionary>

    我有一个 xml 文件 例如
  • 雅虎财经 python 上的某些股票和页面出现 404 错误

    我正在尝试通过此 URL 从雅虎财经抓取数据https finance yahoo com quote AAPL key statistics p AAPL 运行下面的 python 代码后 我得到以下 HTML 响应 import num
  • 反转非唯一字典

    我有一本字典 需要根据非唯一值进行反转和分组 该字典根据现有的最佳答案而失败 gt gt gt graph a car red b car blue gt gt gt inv map gt gt gt for k v in graph it
  • 在处理中获取多个音频输入

    我目前正在编写一个需要访问多个音频输入的处理草图 但处理只允许访问默认线路 我尝试直接从 Java 混合器获取线路 在处理中访问 但我仍然只获得信号从我的机器上当前设置为默认值的那一行开始 我已经开始考虑按照建议通过 OSC 从 Super
  • 通过 AJAX 进行表单处理 - 避免生成 GET 和 POST 请求

    我正在尝试通过 AJAX 发送表单数据 但我看到 GET 和 POST 请求都正在生成 这是我的表单的提交处理程序
  • std::ostream 到 QDataStream

    我已经为 MyClass 重载了 friend std ostream operator lt lt std ostream out const MyClass Obj 现在我想将 std ostream 转换为 QDataStream 而
  • 为什么ld输出的二进制文件无法执行?

    我使用的是 Ubuntu 18 04 x86 64 这是我的程序的两个源文件 main c include stdio h int sum int a int n int array 2 1 2 int main int val sum a
  • PyTables 的优点是什么? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心以获得指导 我最近开始学习PyTabl