numpy.dot -> MemoryError，my_dot -> 非常慢，但有效。为什么？

2023-12-22

我正在尝试计算两个大小分别为 (162225, 10000) 和 (10000, 100) 的 numpy 数组的点积。但是，如果我调用 numpy.dot(A, B) 则会发生 MemoryError 。然后，我尝试编写我的实现：

def slower_dot (A, B):
    """Low-memory implementation of dot product"""
    #Assuming A and B are of the right type and size
    R = np.empty([A.shape[0], B.shape[1]])
    for i in range(A.shape[0]):
        for j in range(B.shape[1]):
            R[i,j] = np.dot(A[i,:], B[:,j])
    return R

它工作得很好，但当然很慢。您知道 1）此行为背后的原因是什么以及 2）我如何规避/解决该问题吗？

我在一台配备 64 位、16GB 内存、运行 Ubuntu 14.10 的计算机上使用 Python 3.4.2（64 位）和 Numpy 1.9.1。

您收到内存错误的原因可能是因为 numpy 试图在调用中复制一个或两个数组dot。对于中小型数组，这通常是最有效的选择，但对于大型数组，您需要对 numpy 进行微观管理以避免内存错误。你的slower_dot函数很慢主要是因为 python 函数调用开销，您会遭受 162225 x 100 次。当您想要平衡内存和性能限制时，这是处理这种情况的一种常见方法。

import numpy as np

def chunking_dot(big_matrix, small_matrix, chunk_size=100):
    # Make a copy if the array is not already contiguous
    small_matrix = np.ascontiguousarray(small_matrix)
    R = np.empty((big_matrix.shape[0], small_matrix.shape[1]))
    for i in range(0, R.shape[0], chunk_size):
        end = i + chunk_size
        R[i:end] = np.dot(big_matrix[i:end], small_matrix)
    return R

您需要选择最适合您的特定数组大小的 chunk_size 。通常，只要所有内容都适合内存，较大的块大小会更快。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

numpy.dot -> MemoryError，my_dot -> 非常慢，但有效。为什么？的相关文章

如何移动我的图像？ python 3.10.4 pygame

我会移动我的图像图像是matiskinfinal png 我尝试将像素添加到 x 或其他我不知道它是什么的东西因为我真的是 python 的初学者 pygame但是是 x x 变化但图像没有移动 import os import py
Python 按照层次结构按多个分隔符分割字符串

我只想根据多个分隔符例如 and 和按顺序分割字符串一次例子 121 34 adsfd gt 121 34 adsfd dsfsd and adfd gt dsfsd adfd dsfsd adfd gt dsfsd adfd dsf
Spyder 导入模块出错

我正在尝试在 Spyder 中使用 sklearn 一开始当我尝试导入它时我收到 ImportError No module named sklearn 然后我用 PYTHONPATH 管理器设置 PATH 然后使用工具菜单中的更新模
小数缓存是Python规范中定义的还是一个实现细节？

Python 似乎有一个所谓的小数字缓存用于存储 5 到 256 范围内的数字我们可以使用以下程序来演示这一点 for i in range 7 258 if id i id i 0 print i is cached else pr
了解 asyncio 已经运行的永久循环和挂起的任务

我在理解如何将新任务挂起到已经运行的事件循环中时遇到问题这段代码 import asyncio import logging asyncio coroutine def blocking cmd while True logging in
如何为 C 分配的 numpy 数组注册析构函数？

我想在 C C 中为 numpy 数组分配数字并将它们作为 numpy 数组传递给 python 我可以做的PyArray SimpleNewFromData http docs scipy org doc numpy reference
将多个数组合并为一个数组

如何将多个数组合并为一个二维数组鉴于我有以下输入 var arr1 1 2 3 var arr2 a b c var arr3 aa bb cc 我需要这样的输出 1 a aa 2 b bb 1 c cc 我认为你想要的是将三个数组组合成
如何在Python中求和

我想知道如何在 python 中表示总和而不需要像这样的循环here http docs scipy org doc scipy reference tutorial optimize html 我们有 def rosen x The Ro
读取文件特定行号的有效方法。（奖励：Python 手册印刷错误）

我有一个 100 GB 的文本文件它是来自数据库的 BCP 转储当我尝试导入它时BULK INSERT 我在第 219506324 行上收到一个神秘错误在解决此问题之前我想看看这一行但可惜的是我最喜欢的方法 import line
PyCharm 无法识别字典值类型

我有一个简单的代码片段其中我将字典值设置为空列表 new dict for i in range 1 13 new dict i 现在如果在下一行的循环内我会输入new dict i 并添加一个点我希望 PyCharm 向我显示可用于
如何在 C# 中定义文本框数组？

您好当我在 Windows 申请表上创建文本框时我无法将其命名为 box 0 box 1 等我这样做的目的是因为我想循环使用它们其实我发现TextBox array firstTextBox secondTextBox 也有效
pandas to_sql sqlalchemy 与 secure_transport 的连接

我正在尝试将数据发送到具有 require secure transport ON 的服务器上的 mysql 数据库当我尝试使用以下代码连接到它时 import pandas as pd import pymysql from sqlal
如何在 Pytorch 中将一维 IntTensor 转换为 int

如何将一维 IntTensor 转换为整数这 IntTensor int 给出错误 KeyError Variable containing 423 torch IntTensor of size 1 我所知道的最简单最干净的方法 In
如何测试列表中多个值的成员资格

我想测试两个或多个值是否在列表中具有成员资格但我得到了意外的结果 gt gt gt a b in b a foo bar a True 那么 Python 可以同时测试列表中多个值的成员资格吗这个结果意味着什么 See also How
如何在 Sublime 2 REPL Mac 中运行 Python 3

我的问题如下我安装了 sublime 2 和 sublime repl 插件一切正常我唯一需要的是更改在控制台内置的 sublimerepl 上运行的 python 版本我的意思是我有 python 2 7 5 预先安装了 mav
Celery：每个工作人员的 task_acks_late 的不同设置/向 celery 添加自定义选项

这个问题是后续问题django celery 禁用一个工作者的预取有错误吗 https stackoverflow com questions 58290045 django celery disable prefetch for one
使用 statsmodels.formula.api 中的 ols - 如何删除常数项？

我正在遵循第一个例子statsmodels教程 http statsmodels sourceforge net devel http statsmodels sourceforge net devel 如何指定在 ols 中不使用常数项进
当价格低于阈值时使用 pandas DataFrame 实施矢量化止损

给出这个示例数据框 date close signal positions 2017 01 02 27 90 0 0 0 0 2017 01 03 27 76 0 0 0 0 2017 01 04 28 65 1 0 1 0 2017 01
如何限制scrapy请求对象？

所以我有一个蜘蛛我认为它正在泄漏内存结果当我检查 telnet 控制台 gt gt gt prefs 时它只是从链接丰富的页面中抓取了太多链接有时它会超过 100 000 个现在我已经一遍又一遍地浏览文档和谷歌但我找不到一种方法
在至少 7 天内连续三天登录该产品的用户

我有一个用于用户参与的数据框 df 如下所示 time stamp user id 2013 01 01 10 05 23 1 2013 01 03 16 35 23 1 2013 01 06 11 06 35 1 2013 01 10 1

随机推荐

Hibernate、Java 9 和 SystemException

我一直在尝试在 Java 9 Spring Boot 1 5 x Maven 项目中运行 Hibernate 5 2 11 应用程序但缺少类 Caused by java lang NoClassDefFoundError javax t
找不到 com.google.android.gms:strict-version-matcher-plugin:1.1.0

无法解析配置类路径的所有文件找不到 com google android gms strict version matcher plugin 1 1 0 在以下位置进行了搜索 https jcenter bintray com com
当新值与上一个值相同时 StateFlow 不会发出

我有一个登录表格我用StateFlow发送LoginResult 调用API后来自ViewModel to Activity 在活动中如果登录失败我将显示错误对话框第一次运行良好但从第二次登录失败后错误对话框将不再显示我测试
Rails 3.1 间歇性“脚本头过早结束”

所以我开始将我们的应用程序从 Rails 3 0 9 升级到 Rails 3 1 它在开发环境中运行良好是时候将其放到临时服务器上了这样我们就可以运行一些完整的验收测试但是哦不我们正面临着可怕的内部服务器错误页面有一半的时间返
XML 漏洞

xml 一直是面向服务的应用程序 SOA 的支柱并且在未来它将变得非常有用由于 xml 简单灵活因此很容易受到攻击攻击者可以将其用于自己的目的因此一些攻击是强制解析攻击 XML外部实体 XEE 攻击 XML dos xdos
从 PowerShell 调用 exe 并获取有关成功或失败的反馈

如何在 PowerShell 中运行可执行文件并通过 if 语句确定它是成功还是失败更具体地说我试图让 devenv exe 从 PowerShell 脚本构建解决方案我需要知道它是成功还是失败失败是指构建失败并且我假设 deve
Ruby 将数组合并为一个字符串

在 Ruby 中有没有一种方法可以将所有数组元素组合成一个字符串数组示例 arr p Hello World p p This is a test p 示例输出 p Hello World p p This is a test p Us
为什么 C++ 中元组的使用不常见？

为什么似乎没有人在 C 中使用元组或者Boost元组库 http www boost org doc libs 1 39 0 libs tuple doc tuple users guide html或者 TR1 的标准库我读过很多 C
将组件对齐到所需位置

寻求帮助来设计如下所示的布局我面临的主要挑战是将组件对齐到所需的位置请参考三个按钮图标及其位置从字面上看就是发疯思考如何将它们准确地放置在所需的位置任何帮助深表感谢问候罗尼由于您使用了 Android 类别我假设您正
如何使用 JavaScript 触发“isTrusted=true”点击事件？

我正在尝试使用 Chrome 扩展来模拟用户点击和鼠标移动例如在我的内容脚本中有一个按钮单击 document querySelector SOME SELECTOR click 该行触发具有以下属性的单击事件 MouseEvent
Maven原型：修改artifactId

在进行项目时我的要求是创建一个模块该命令将类似于 mvn archetype generate DarchetypeCatalog local DartifactId test module 并且目标应该具有以下文件结构 test mo
PJSIP 库中的 TLSv1_2 (TLS1.2) 支持

我正在使用最新的PJSIP http www pjsip org 我的 Android iOS 应用程序中的库我想在我的项目中使用 TLSv1 2 连接 PJSIP 支持哪个 TLS 版本从源代码来看它似乎支持TLSv1 0 有没有办法
如何获取checkbox的值

如何获取复选框的值 var tb new Ext Toolbar tb add xtype checkbox boxLabel Expand Groups by Default id GetChkBoxValue checked true
应用程序终止自身最暴力的方式是什么（linux）

我想模拟暴力系统关闭即在应用程序级别尽可能接近断电我们正在讨论 Linux 上的 c c 应用程序我需要应用程序自行终止目前我看到几个选项 call exit http linux die net man 3 exit call e
SortedSet - 存储类对象时的自定义顺序

我正在考虑用 SortedSet 替换 HashSet 因为它更适合我存储的数据然而到目前为止我看到的所有示例都与存储简单对象有关整数字符串等我想为具有多个属性的自定义类实现此功能但是该类还包含一个我想用作索引器的日期问题
将长时间运行的任务分配到多个帧上的最佳方法是什么？

我有多个长时间运行的任务例如超过 10 毫秒这会影响浏览器的响应能力最糟糕的事情例如从文件加载和解析 3D 模型已经被卸载到 Web Workers 这样它们就不会影响渲染循环然而有些任务不容易移植到 Workers 因此必须
警告：sprintf() [function.sprintf]：第 132 行 /home/inrunitc/public_html/chek/chek.php 中的参数太少

Warning sprintf function sprintf Too few arguments in home inrunitc public html chek chek php on line 132 Query was empt
在hive中向外部表添加分区需要花费大量时间

我想知道向外部表添加分区的最佳方法是什么我在 hive 的 S3 上有一个外部表分区为车辆日期小时现在可以在一天中的任何时间添加新车辆并且有些车辆在一天中的几个小时或几天内没有数据几种可能的解决方案 msck修复表需要
如何解决 Apache-Beam 中的 Beam DeprecationWarning

第一的生成简单数据后将数据存储在谷歌云平台bigQuery表中的代码导入 Apache Beam 库并使用它跑步者使用了 Google Cloud Platform Dataflow 这里是代码 from apache beam op
numpy.dot -> MemoryError，my_dot -> 非常慢，但有效。为什么？

我正在尝试计算两个大小分别为 162225 10000 和 10000 100 的 numpy 数组的点积但是如果我调用 numpy dot A B 则会发生 MemoryError 然后我尝试编写我的实现 def slower do

numpy.dot -> MemoryError，my_dot -> 非常慢，但有效。为什么？

numpy.dot -> MemoryError，my_dot -> 非常慢，但有效。为什么？ 的相关文章

随机推荐

热门标签

numpy.dot -> MemoryError，my_dot -> 非常慢，但有效。为什么？的相关文章