numpy float：算术运算比内置函数慢 10 倍？

2024-05-01

我对以下代码的计时非常奇怪：

import numpy as np
s = 0
for i in range(10000000):
    s += np.float64(1) # replace with np.float32 and built-in float

内置浮子：4.9秒
float64: 10.5 秒
float32: 45.0 秒

Why is float64比慢两倍float？为什么是float32比float64慢5倍？

有什么办法可以避免使用惩罚np.float64，并且有numpy函数返回内置float代替float64?

我发现使用numpy.float64比 Python 的 float 慢得多，并且numpy.float32甚至更慢（即使我在 32 位机器上）。

numpy.float32在我的 32 位机器上。因此，每次我使用各种 numpy 函数，例如numpy.random.uniform，我将结果转换为float32（以便进一步的操作将以 32 位精度执行）。

有没有办法在程序或命令行中的某个位置设置单个变量，并使所有 numpy 函数返回float32代替float64?

EDIT #1:

numpy.float64 是10 times在算术计算中比 float 慢。糟糕的是，即使在计算之前转换为浮点型再转换回来，程序的运行速度也会快 3 倍。为什么？我能做些什么来解决它吗？

我想强调的是，我的时间安排不是由于以下任何原因造成的：

该函数调用
numpy 和 python float 之间的转换
对象的创建

我更新了我的代码以更清楚问题所在。使用新代码，我似乎看到使用 numpy 数据类型的性能提高了十倍：

from datetime import datetime
import numpy as np

START_TIME = datetime.now()

# one of the following lines is uncommented before execution
#s = np.float64(1)
#s = np.float32(1)
#s = 1.0

for i in range(10000000):
    s = (s + 8) * s % 2399232

print(s)
print('Runtime:', datetime.now() - START_TIME)

时间安排是：

float64: 34.56s
float32: 35.11s
浮动：3.53s

只是为了它，我也尝试过：

从日期时间导入日期时间将 numpy 导入为 np

START_TIME = datetime.now()

s = np.float64(1)
for i in range(10000000):
    s = float(s)
    s = (s + 8) * s % 2399232
    s = np.float64(s)

print(s)
print('Runtime:', datetime.now() - START_TIME)

执行时间为13.28秒；实际上转换速度快了 3 倍float64 to float然后返回而不是按原样使用它。尽管如此，转换还是要付出代价的，所以总的来说，与纯 python 相比，它慢了 3 倍多float.

我的机器是：

英特尔酷睿 2 双核 T9300 (2.5GHz)
WinXP 专业版（32 位）
ActiveState Python 3.1.3.5
numpy 1.5.1

EDIT #2:

感谢您的回答，他们帮助我了解如何处理这个问题。

但我仍然想知道下面的代码运行速度慢 10 倍的确切原因（也许基于源代码）float64比与float.

EDIT #3:

我在 Windows 7 x64 (Intel Core i7 930 @ 3.8GHz) 下重新运行代码。

同样，代码是：

from datetime import datetime
import numpy as np

START_TIME = datetime.now()

# one of the following lines is uncommented before execution
#s = np.float64(1)
#s = np.float32(1)
#s = 1.0

for i in range(10000000):
    s = (s + 8) * s % 2399232

print(s)
print('Runtime:', datetime.now() - START_TIME)

时间安排是：

浮点64：16.1秒
浮动32：16.1秒
浮球：3.2秒

现在两者np浮点数（64 或 32）比内置浮点数慢 5 倍float。尽管如此，还是存在显着差异。我正试图弄清楚它从哪里来。

编辑结束

CPython 浮点数以块的形式分配

将 numpy 标量分配与float类型是CPython总是分配内存float and int大小为 N 的块中的对象。

在内部，CPython 维护一个块链表，每个块足够大以容纳 Nfloat对象。你打电话时float(1)CPython 检查当前块中是否有可用空间；如果不是，则分配一个新块。一旦当前块中有空间，它就会简单地初始化该空间并返回指向它的指针。

在我的机器上每个块可以容纳 41float对象，所以第一个有一些开销float(1)调用但接下来的 40 个运行速度要快得多，因为内存已分配并准备就绪。

慢 numpy.float32 与 numpy.float64

看起来 numpy 在创建标量类型时可以采用 2 条路径：快速和慢速。这取决于标量类型是否具有可以推迟参数转换的 Python 基类。

因为某些原因numpy.float32被硬编码以采用较慢的路径（定义为_WORK0 macro) https://github.com/numpy/numpy/blob/v1.5.1/numpy/core/src/multiarray/scalartypes.c.src#L2101, while numpy.float64有机会走更快的路（定义为_WORK1 macro) https://github.com/numpy/numpy/blob/v1.5.1/numpy/core/src/multiarray/scalartypes.c.src#L2101。注意scalartypes.c.src是一个生成的模板scalartypes.c在构建时。

您可以在 Cachegrind 中直观地看到这一点。我提供了屏幕截图，显示了构建一个float32 vs. float64:

float64采取快速路径

float32走慢路

Updated- 哪种类型采用慢速/快速路径可能取决于操作系统是 32 位还是 64 位。在我的测试系统 Ubuntu Lucid 64 位上，float64类型快 10 倍float32.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

numpy float：算术运算比内置函数慢 10 倍？的相关文章

在 Python 中静默打印 PDF

我正在尝试使用 Python 打印 PDF 而不打开 PDF 查看器应用程序 Adobe Foxit 等我还需要知道打印何时完成以删除文件 Here http permalink gmane org gmane comp python
每当我尝试在 VPS 上使用 Discord 机器人登录时，都会收到“SSL：Certificate_verify_failed”

我正在将我的机器人从旧的坏掉的笔记本电脑转移到合适的 VPS 我使用的是较旧的异步版本的 Discord py 0 16 0 因为我在重写之前很长时间就开始研究这个东西了而且我对 Linux 没有太多经验因此迁移到 Windows S
为什么 takewhile() 会跳过第一行？

我有一个这样的文件 1 2 3 TAB 1 2 3 TAB 我想将 TAB 之间的行作为块读取 import itertools def block generator file with open file as lines for li
根据另一个非索引数组中的值从 numpy 数组中选择元素

假设我有以下两个数组 a array 1 L 74 423088306605 5 H 128 05441039929008 2 L 68 0581377353869 0 H 88 15726964130869 4 L 97 45015825
python-messaging 无法处理 HTTP 请求

我正在使用下面的代码尝试使用 python messaging 发送彩信https github com pmarti python messaging blob master doc tutorial mms rst https gith
在内连接中重用 mysql 子查询

我正在尝试优化查询试图避免重复用指示的查询复杂查询使用两次结果相同原始查询 SELECT news FROM news INNER JOIN SELECT myposter FROM SELECT COMPLEX QUERY U
如何处理 ValueError：索引包含使用 df.pivot 或 pd.pivot_table 的重复条目？

我有一张显示累计小时数的表格 dataframe values 不同的专家 ID 已完成一系列四项任务 Task1 Tas2 Task3 Tas4 像这样 Input ID Task1 Task2 Task3 Task4 0 10 1 3
ValueError：设置 random_state 无效，因为 shuffle 为 False。您应该将 random_state 保留为默认值（无），或设置 shuffle=True

当我尝试在 pycaret 中训练某些内容时我收到此错误消息 ValueError Setting a random state has no effect since shuffle is False You should leave
python中的unicode错误[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 在下面的代码中我收到错误mailSe
使用 matplotlib 在 python3 中对多个形状进行动画处理

尝试在 python3 中使用 matplotlib 动画函数同时对多个对象进行动画处理下面写的代码是我到目前为止的位置我能够创建多个对象并将它们显示在图中我通过使用包含矩形补丁函数的 for 循环来完成此操作从这里开始我希望通过
适用于 Python 的 GitLab CI 共享 Windows 运行器

我在 GitLab 中有一个 python 项目仓库我看到 GitLab 共享了可用的测试版 Windows 运行程序请参阅this https about gitlab com blog 2020 01 21 windows shar
Python UPnP/IGD 客户端实现？

我正在寻找一个开源实现UPnP http elinux org UPnPPython 中的客户端更具体地说是它的互联网网关设备 http en wikipedia org wiki Internet Gateway Device Prot
将 scipy 稀疏矩阵的几行采样到另一个中

如何对 scipy 稀疏矩阵的某些行进行采样并从这些采样的行中形成一个新的 scipy 稀疏矩阵例如如果我有一个 10 行的 scipy 稀疏矩阵 A 并且我想创建一个新的 scipy 稀疏矩阵 B 其中 A 的第 1 3 4 行该
改进C++逐行读取文件的能力？

我正在解析大约 500GB 的日志文件我的 C 版本需要 3 5 分钟我的 Go 版本需要 1 2 分钟我正在使用 C 的流来流式传输文件的每一行以进行解析 include
在 Python 中，如果我有 unix 时间戳，如何将其插入 MySQL 日期时间字段？

我正在使用 Python MySQLDB 我想将其插入 Mysql 中的 DATETIME 字段我该如何使用cursor execute 来做到这一点要将 UNIX 时间戳转换为 Python 日期时间对象请使用datetime fr
使用 Python 3.x 基本获取 URL 的 HTML 正文

我是Python新手我对 Python 2 x 中的旧 urllib 和 urllib2 与 Python 3 中的新 urllib 之间的差异有点困惑除此之外我不确定数据在发送到 urlopen 之前何时需要编码我一直在尝试使用
在 unix 中编译 dhrystone 时出错

我是使用基准测试和 makefile 的新手我已经从下面的链接下载了 Dhrystone 基准测试我正在尝试编译它但我遇到了奇怪的错误我尝试解决它但没有成功有人可以帮助我运行 dhrystone 基准测试吗以下是我尝试编译的两
Django中的自动递增值

我在 django 中有一个表并尝试自动递增它的序列号在自定义模板中 for 循环用于变量自定义模板 for i in getodeskview tr td 1 td td i odesk id td td i hours td td
如何提高大规模数据帧上 lambda 函数的性能

我有一个df超过数亿行 latitude longitude time VAL 0 39 20000076293945312500 140 80000305175781250000 1972 01 19 13 00 00 1 2000000
python 根据日期创建目录结构

我使用以下函数根据今天的日期创建目录 usr bin python import time datetime os today datetime date today todaystr today isoformat os mkdir to

随机推荐

React 未捕获的不变违规：在 ApolloConsumer 的上下文中找不到“客户端”。将根组件包装在中

我有一个使用 React 应用程序react apollo 2 5 8以及我通过 NPM 安装并在应用程序中使用的自定义组件库图书馆有react apollo 2 5 8列在对等和开发依赖项中自从我将 React apollo 升级到
如何解决：使用 .csv Dictreader 导入文件的 Python 因未定义字符而失败

首先我发现下列 https stackoverflow com questions 38019379 python unicodedecodeerror utf8 codec cant decode byte 0x91这与我的问题基本相同
如何链接到 WordPress 管理插件上的自定义 php 页面？

我对 WordPress 开发很陌生我正在编写一个管理插件来处理证书创建我实现了创建插件并通过 add menu page 将其放在管理菜单中这是插件的概念我使用 WP List Table 来显示用户列表我添加了带有一些用户元
如何将 .h 文件中的常量导入到 python 模块中

将 c 风格不是 c 只是普通的旧 c h 文件中定义的一堆常量导入到 python 模块中的推荐方法是什么以便它可以在项目的 python 部分中使用在项目中我们使用混合语言在 Perl 中我可以通过使用 h2xs 实用程序生
JavaScript 中的整数

MDN https developer mozilla org en JavaScript A re introduction to JavaScript Numbers states JavaScript 中的数字是双精度 64 位格式
如何在eclipse中更改genymotion安装目录路径？

当Genymotion提示选择安装目录时我不小心选择了错误的文件夹我该如何改变它查看窗口 gt 首选项 gt Genymobile gt Genymotion 然后您将能够修改之前的条目
C# Dns.GetHostEntry() - 异常：没有这样的主机已知

From 文档 https learn microsoft com en us dotnet api system net dns gethostentry view netframework 4 8 Dns GetHostEntry 将主
找出分区号/id

Spark中有没有一种方法方法可以找出分区ID 编号在这里举这个例子 val input1 sc parallelize List 8 9 10 3 val res input1 reduce x y gt println Insid
Mercurial Eclipse 插件

在哪里可以找到好的 Eclipse Mercurial 插件 MercurialEclipse https bitbucket org mercurialeclipse main 更新站点 https bitbucket org mercu
Python导入Django管理命令的问题

不管出于什么原因当我刚接触 Python 和 Django 时我在 models py 文件的顶部编写了一些像这样的导入语句 from django contrib import auth 我会这样使用它 class MyModel m
使用 hg 存储库作为网站

这与我的安全问题有些相关here https stackoverflow com questions 2361626 security deny access to hg via mod rewrite 对实时网站使用 hg Mercuri
Json.Net 根据值选择对象

我有一个 Json 对象如下所示 wvw matches wvw match id 1 4 red world id 1011 blue world id 1003 green world id 1002 start time 2013
在 Dart 中打印不带括号的列表

我想在打印时从列表中删除括号 Dart Code void main var lst new List 3 for int i 0 i lt 3 i lst i i print lst 电流输出 0 1 2 预期输出 0 1 2 您可以使用
多个 aiohttp Application() 在同一进程中运行？

Can two aiohttp web Application 对象在同一进程中运行例如在不同的端口上我看到了一堆 aiohttp 代码的示例例如 from aiohttp import web app web Application
如何在画布的右上角绘制位图

我正在尝试绘制位图top right hand corner of the Canvas 到目前为止我已经做了以下事情 100x40 dimensions for the bitmap bitmap BitmapFactory decode
当参数具有相同名称时如何恢复内置函数？ [复制]

这个问题在这里已经有答案了我知道你是不应该 https stackoverflow com questions 2417979 can i use variable name type as function argument in p
如何将 Pandas DataFrame 中加载的嵌入转换为 Gensim 模型？

我有一个 DataFrame 其中索引是单词并且有 100 个带有浮点数的列这样对于每个单词我将其嵌入为 100d 向量我想将我的 DataFrame 对象转换为gensim 模型对象 https radimrehurek com
Qt - 如何在 QGraphicsPixmapItem 中显示 gif（动画）图像

我正在尝试在 QGraphicsPixmapItem 中使用一张闪烁的图像显示的图像没有动画效果下面是原始图像下面是在 QGraphicsPixmapItem 中使用此图像的 QGraphicsScene 有人能说一下如何实现这一目标
QML 适合所有分辨率的屏幕

大家好我的 QML 代码有问题我犯了一个错误我给元素设置了一定的大小现在我在将应用程序放在其他设备上时遇到了问题我会将我的代码粘贴到有宽度和高度的位置以便您可以更改它以向我展示如何使用动态调整大小我需要说我正在使用以下代码从
numpy float：算术运算比内置函数慢 10 倍？

我对以下代码的计时非常奇怪 import numpy as np s 0 for i in range 10000000 s np float64 1 replace with np float32 and built in float 内

numpy float：算术运算比内置函数慢 10 倍？

numpy float：算术运算比内置函数慢 10 倍？ 的相关文章

随机推荐

热门标签

numpy float：算术运算比内置函数慢 10 倍？的相关文章