使用 Python 和 NumPy 的非常大的矩阵

2024-04-08

NumPy http://en.wikipedia.org/wiki/NumPy是一个非常有用的库,通过使用它,我发现它能够轻松处理相当大(10000 x 10000)的矩阵,但开始处理更大的矩阵(尝试创建 50000 x 50000 的矩阵失败) )。显然,这是因为大量的内存需求。

有没有办法以某种方式在 NumPy 中本地创建巨大的矩阵(比如 100 万乘 100 万)(无需几 TB 的 RAM)?


PyTables 和 NumPy 是最佳选择。

PyTables 将以 HDF 格式将数据存储在磁盘上,并可选择压缩。我的数据集通常会进行 10 倍压缩,这在处理数千万或数亿行时非常方便。它也非常快;我的 5 年旧笔记本电脑可以以 1,000,000 行/秒的速度处理数据,执行类似 SQL 的 GROUP BY 聚合。对于基于 Python 的解决方案来说还不错!

再次以 NumPy 重新数组的形式访问数据非常简单:

data = table[row_from:row_to]

HDF 库负责读取相关数据块并转换为 NumPy。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Python 和 NumPy 的非常大的矩阵 的相关文章

  • Django 的内联管理:一个“预填充”字段

    我正在开发我的第一个 Django 项目 我希望用户能够在管理中创建自定义表单 并向其中添加字段当他或她需要它们时 为此 我在我的项目中添加了一个可重用的应用程序 可在 github 上找到 https github com stephen
  • Pandas/Google BigQuery:架构不匹配导致上传失败

    我的谷歌表中的架构如下所示 price datetime DATETIME symbol STRING bid open FLOAT bid high FLOAT bid low FLOAT bid close FLOAT ask open
  • Python getstatusoutput 替换不返回完整输出

    我发现了这个很棒的替代品getstatusoutput Python 2 中的函数在 Unix 和 Windows 上同样有效 不过我觉得这个方法有问题output被构建 它只返回输出的最后一行 但我不明白为什么 任何帮助都是极好的 def
  • 独立滚动矩阵的行

    我有一个矩阵 准确地说 是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说 我想这样做 print np
  • 使用字典映射数据帧索引

    为什么不df index map dict 工作就像df column name map dict 这是尝试使用index map的一个小例子 import pandas as pd df pd DataFrame one A 10 B 2
  • 立体太阳图 matplotlib 极坐标图 python

    我正在尝试创建一个与以下类似的简单的立体太阳路径图 http wiki naturalfrequent com wiki Sun Path Diagram http wiki naturalfrequency com wiki Sun Pa
  • YOLOv8获取预测边界框

    我想将 OpenCV 与 YOLOv8 集成ultralytics 所以我想从模型预测中获取边界框坐标 我该怎么做呢 from ultralytics import YOLO import cv2 model YOLO yolov8n pt
  • datetime.datetime.now() 返回旧值

    我正在通过匹配日期查找 python 中的数据存储条目 我想要的是每天选择 今天 的条目 但由于某种原因 当我将代码上传到 gae 服务器时 它只能工作一天 第二天它仍然返回相同的值 例如当我上传代码并在 07 01 2014 执行它时 它
  • 如何在 Python 中解析和比较 ISO 8601 持续时间? [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在寻找一个 Python v2 库 它允许我解析和比较 ISO 8601 持续时间may处于不同单
  • Python,将函数的输出重定向到文件中

    我正在尝试将函数的输出存储到Python中的文件中 我想做的是这样的 def test print This is a Test file open Log a file write test file close 但是当我这样做时 我收到
  • Docker 中的 Python 日志记录

    我正在 Ubuntu Web 服务器上的 Docker 容器中测试运行 python 脚本 我正在尝试查找由 Python Logger 模块生成的日志文件 下面是我的Python脚本 import time import logging
  • 在 Sphinx 文档中*仅*显示文档字符串?

    Sphinx有一个功能叫做automethod从方法的文档字符串中提取文档并将其嵌入到文档中 但它不仅嵌入了文档字符串 还嵌入了方法签名 名称 参数 我如何嵌入only文档字符串 不包括方法签名 ref http www sphinx do
  • 如何通过索引列表从 dask 数据框中选择数据?

    我想根据索引列表从 dask 数据框中选择行 我怎样才能做到这一点 Example 假设我有以下 dask 数据框 dict A 1 2 3 4 5 6 7 B 2 3 4 5 6 7 8 index x1 a2 x3 c4 x5 y6 x
  • 为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍,而速度却没有任何提升?

    我正在测试 Python 3 4 我注意到 pickle 模块有一个新协议 因此 我对 2 个协议进行了基准测试 def test1 pickle3 open pickle3 wb for i in range 1000000 pickle
  • 如何在 pygtk 中创建新信号

    我创建了一个 python 对象 但我想在它上面发送信号 我让它继承自 gobject GObject 但似乎没有任何方法可以在我的对象上创建新信号 您还可以在类定义中定义信号 class MyGObjectClass gobject GO
  • 如何解决 PDFBox 没有 unicode 映射错误?

    我有一个现有的 PDF 文件 我想使用 python 脚本将其转换为 Excel 文件 目前正在使用PDFBox 但是存在多个类似以下错误 org apache pdfbox pdmodel font PDType0Font toUnico
  • 在本地网络上运行 Bokeh 服务器

    我有一个简单的 Bokeh 应用程序 名为app py如下 contents of app py from bokeh client import push session from bokeh embed import server do
  • Python ImportError:无法导入名称 __init__.py

    我收到此错误 ImportError cannot import name life table from cdc life tables C Users tony OneDrive Documents Retirement retirem
  • cv2.VideoWriter:请求一个元组作为 Size 参数,然后拒绝它

    我正在使用 OpenCV 4 0 和 Python 3 7 创建延时视频 构造 VideoWriter 对象时 文档表示 Size 参数应该是一个元组 当我给它一个元组时 它拒绝它 当我尝试用其他东西替换它时 它不会接受它 因为它说参数不是
  • Kivy - 单击按钮时编辑标签

    我希望 Button1 在单击时编辑标签 etykietka 但我不知道如何操作 你有什么想法吗 class Zastepstwa App def build self lista WebOps getList layout BoxLayo

随机推荐

  • 圆圈内的文本 UILabel Swift 3

    我知道这个问题在 SO 中被问了很多次 但我在 Swift 中找不到可靠的答案 甚至一般来说也找不到一个好的答案 我知道这对于 UITextField 是可能的 但 UILabel 是我想使用的 我问是否有人遇到过 UILabel 的扩展
  • 如何更改 Android O / Oreo / api 26 应用程序语言

    我想更改应用程序的语言 并且在 API 26 之前都可以正常工作 对于 api gt 25 我把Locale setDefault Locale Category DISPLAY mynewlanglocale before setCont
  • Android Chromium WebView 崩溃

    我有一个在 Android 5 1 1 设备上运行的应用程序 该应用程序有一个 webview 48 0 2564 106 该视图保持 24 7 有时应用程序会崩溃 因为 chromium webview 有未捕获的异常 最新版本的webv
  • 如何将元素推入数组的某个值之后[重复]

    这个问题在这里已经有答案了 所以我们都知道array push工作原理如下 所以结果是 Array 0 gt red 1 gt green 2 gt blue 3 gt yellow 但现在我需要知道如何附加blue and yellow在
  • 涉及伪类first-child和dropcap的CSS选择器

    我需要格式化类似于下面的 HTML 基本上一个报价是optional 我需要将正文段落的第一个字母大写
  • 将应用程序背景设置为与主屏幕壁纸相同

    我想将应用程序的背景设置为与主屏幕壁纸相同 如何获取activity xml中的主屏幕壁纸 我可以这样做吗 Use final WallpaperManager wallpaperManager WallpaperManager getIn
  • 如何在scala中使用java代理

    我有一个 Iface 接口 它有两个用 java 编写的方法 该接口是 Zzz 类的内部接口 我已经用 scala 编写了调用处理程序 然后我尝试在 scala 中创建一个新的代理实例 如下所示 val handler new ProxyI
  • 元素不会出现在 IE7 中,直到我通过开发人员工具栏编辑它

    这个让我难住了 我的页面上有一个具有绝对位置的元素 位于具有相对位置的容器内 在除 IE7 之外的所有浏览器中 它都显示在正确的位置 没有任何问题 在 IE7 中 该元素不会出现 直到我添加或编辑其任何 CSS 属性在开发者工具栏的 属性
  • 在 javascript 中解析 JSON 以获得多个 JSON 对象 [关闭]

    Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 应该是一个很常见的答案 但我还没有找到 使用客户端 JavaScript 我的客户端收到一些 JSON 字符串 response id1 v
  • 重新排列数组索引 Eloquent Laravel

    从 laravel eloquent 数组中删除元素后出现错误 物业有房间 foreach property gt rooms as key gt room if room gt type 1 and type 1 and room gt
  • Jquery 验证 - 在急切验证期间显示验证摘要?

    是否可以使用 jquery 验证来显示验证摘要 我正在使用 MVC 3 如果重要的话 并且当每个元素失去焦点时我的表单会进行验证 myform validate onfocusout function element element val
  • Google 负载均衡器 www 到非 www 重定向

    我在使用 google 负载均衡器进行 www 到非 www 重定向时遇到一些困难 目前我的 HTTP gt https 工作没有问题 但是 我还没有真正看到任何关于其工作原理的最新文档 我的负载均衡器设置可以运行 App Engine A
  • Pharo Smalltalk 中的 For 循环 for 数组

    我正在尝试创建一个包含随机数 仅 0 或 1 的数组 但是当我运行它时 它只打印以下内容 遇到语句列表结尾 gt 这是我的代码 GenList lista lista Array new 31 1 to 30 do i lista at i
  • 导入pygame失败

    我已经从这里安装了 python 2 6 6 和 pygame 2 6 http pygame org ftp pygame 1 9 1 win32 py2 6 msi http pygame org ftp pygame 1 9 1 wi
  • 如何统一使用两个 Vector3 点创建一条线?

    我知道存在一些函数 如 lineRenderer 等 但我想使用两个点 以 Vector3 形式 在场景中创建一条直线 我不想使用任何键或使用鼠标来绘制线条 我只想在触发某些事件时或单击播放按钮后看到场景中的线条 谁能帮我 For crea
  • 如何设置 TabControls TabItem 标题 FontSize

    我有一个 TabControl 其样式可以更改 TabItem 标题的 FontSize 当我数据绑定 ItemsSource 时 只有标题受 FontSize 影响 但是 当我在另一个 TabControl 上使用相同的样式并在 XAML
  • Terraform 的 for_each 中的迭代器功能是什么?

    我正在尝试理解iterator的特点是for each在 Terraform 0 12 中 这docs https www terraform io docs configuration expressions html say 迭代器 T
  • 如何从 HttpClient 解析 JSON 字符串?

    我通过调用外部 API 获取 JSON 结果 HttpClient client new HttpClient client BaseAddress new Uri url client DefaultRequestHeaders Acce
  • 已弃用的 com.apple.eawt.ApplicationListener 的替代方案是什么

    Apple 的 Java 中的 ApplicationListener 类已被弃用 还有什么选择呢 包 com apple eawt 如果您想挂钩 打开 首选项 关于 退出 菜单项 事件 请迁移到使用 com apple eawt Appl
  • 使用 Python 和 NumPy 的非常大的矩阵

    NumPy http en wikipedia org wiki NumPy是一个非常有用的库 通过使用它 我发现它能够轻松处理相当大 10000 x 10000 的矩阵 但开始处理更大的矩阵 尝试创建 50000 x 50000 的矩阵失