CPython 和 PyPy 小数运算性能

2023-11-29

我想使用数百万个数据点（以小数表示）运行 100k+ 次模拟。我选择小数而不是浮点数是为了浮点精度和易于对我的逻辑进行单元测试（因为0.1 + 0.1 + 0.1对于浮点数不等于 0.3...）。

我希望通过使用 PyPy 来加快模拟速度。但在我的测试过程中我遇到 PyPy 不处理decimal.Decimal甚至_pydecimal.Decimal一点也不差——而且比 CPython 解释器（使用 C 语言）慢得多decimal.Decimal算术）。所以我复制/粘贴了我的整个代码库并替换了所有Decimals with float并且性能提升巨大：PyPy 比 CPython 快 60-x70 倍 - 但牺牲了准确性。

是否有任何解决方案可以在 PyPy 中使用小数精度并具有性能优势？我“可以”维护两个代码库：float对于批量运行 100k 次模拟，Decimal用于稍后检查有趣的结果 - 但这需要维护两个代码库的开销......

这是我在上面运行的一些简单测试Raspberry Pi 4 (Ubuntu Server 20.10, 4 x 1.5GHZ ARM Cortex-A72, 8GB RAM)用于复制：

test_decimal.py

import time
from decimal import Decimal

start = time.time()
val = Decimal('1.0')
mul = Decimal('1.000001')
for i in range(10 * 1000 * 1000):
    val *= mul
end = time.time()
print(f"decimal.Decimal: {val:.8f} in {round(end-start,4)} sec")

test_pydecimal.py

import time
from _pydecimal import Decimal

start = time.time()
val = Decimal('1.0')
mul = Decimal('1.000001')
for i in range(10 * 1000 * 1000):
    val *= mul
end = time.time()
print(f"pydecimal.Decimal: {val:.8f} in {round(end-start,4)} sec")

test_float.py

import time
from decimal import Decimal

start = time.time()
val = float('1.0')
mul = float('1.000001')
for i in range(10 * 1000 * 1000):
    val *= mul
end = time.time()
print(f"float: {val:.8f} in {round(end-start,4)} sec")

Results

Test	Python 3.8.6 (GCC 10.2.0)	Python 3.6.9 -PyPy 7.3.1 with GCC 10.2.0
test_decimal	5.1131 sec	55.0829 sec
test_pydecimal	315.4012 sec	40.1771 sec
test_float	2.5607 sec	0.1273 sec

Edit #1:

更新了示例（使用预先计算的乘法器，测量时间之外print）和结果表：PyPy 和 CPython 在小数上的总体比较保持不变。
模拟主要由对具有变化值的时间序列数据进行基本数学运算（加、减、乘、除）组成。

您可以使用双精度比任意精度算术（即，Decimal）并且比双精度更准确（即float）。双双精度通常比四精度稍差，但大多数平台通常不支持后者。

The 双双Python 包实现了这一点并且与 PyPy 兼容。它不支持字符串解析和格式化，但您可以使用以下两种缓慢的方法来实现：

from decimal import Decimal
from doubledouble import DoubleDouble

def ddFromStr(s):
    hi = float(s)
    lo = float(Decimal(s) - Decimal(hi))
    return DoubleDouble(hi, lo)

def ddToStr(dd):
    return str(Decimal(dd.x) + Decimal(dd.y))

以下是如何使用它：

start = time.time()
val = ddFromStr('1.0')
mul = ddFromStr('1.000001')
for i in range(10 * 1000 * 1000):
    val *= mul
end = time.time()
print(f"doubledouble.DoubleDouble: {ddToStr(val)} in {round(end-start,4)} sec")

以下是我机器上的结果：

CPython:
  float: 22026.35564471 in 0.6692 sec
  decimal.Decimal: 22026.35566283 in 1.4355 sec
  doubledouble.DoubleDouble: 22026.35566283 in 11.62 sec

PyPy:
  float: 22026.35564471 in 0.011 sec
  decimal.Decimal: 22026.35566283 in 16.3268 sec
  doubledouble.DoubleDouble: 22026.355662823 in 0.1184 sec

如你看到的，the doubledoublePyPy 上的包明显更快比DecimalCPython 上的包，而在这种情况下，两者提供同样准确（截断）的结果。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CPython 和 PyPy 小数运算性能的相关文章

ImportError：尝试在没有已知父包的情况下进行相对导入[重复]

这个问题在这里已经有答案了我正在学习使用 python 编程并且在从包中的模块导入时遇到问题我正在使用 Visual Studio 代码和 Python 3 8 2 64 位我的项目目录 https i stack imgur co
当加载图标且 tk.mainloop 位于线程中时，Tkinter 会锁定 Python

这是测试用例 import Tkinter as tk import thread from time import sleep if name main t tk Tk thread start new thread t mainloop
如何从字符串读取 NumPy 二维数组？

如何从字符串中读取 Numpy 数组取一个像这样的字符串 0 5544 0 4456 0 8811 0 1189 并将其转换为数组 a from string 0 5544 0 4456 0 8811 0 1189 where a成为对象
如何让服务器监听多个端口

我想用同一台服务器监听 100 个不同的 TCP 端口这是我目前正在做的事情 import socket import select def main server socket socket socket socket AF INET
使用 numba 计算向量和矩阵中的行之间的余弦相似度

找到了这个gist https gist github com FedericoV 0e7d6d8c8794a99a7a42使用 numba 快速计算余弦相似度 import numba numba jit target cpu nopyt
将ast节点转换为python对象

给定一个ast可以自行计算的节点但字面意义不够ast literal eval例如列表理解 src i 2 for i in range 10 a ast parse src Now a body 0 is an ast Expr and
计算5个城市之间的地理距离以及每个城市所有可能的组合

所以我有一个 csv 文件其中包含 3 列城市纬度经度我已经使用此代码从这个 csv 文件在 python 中创建了一个数据框 data pd read csv lat long csv nrows 10 Lat data lat
使用 QtDesigner 的 pyQt 信号/槽

我正在尝试编写一个与 QGraphicsView 交互的程序我想在 QGraphicsView 中发生事件时收集鼠标和键盘事件例如如果用户单击 QGraphicsView 小部件我将获得鼠标位置类似的东西我可以很容易地对其进行硬
Python中基于行输入的条件求和

我正在尝试用Python 做一个条件和积简化的思路如下 A 1 1 2 3 3 3 B 0 50 0 25 0 99 0 80 0 70 0 20 我想要作为输出 Total1 0 50 1 0 25 1 Total2 0 99 2 To
读取Excel文件时的Pandas数据框和字符编码

我正在阅读一个包含多个数值和分类数据的 Excel 文件 name string 列包含外语字符当我尝试查看 name string 列的内容时我得到了我想要的结果但外来字符在 Excel 电子表格中正确显示以错误的编码显示这是
向类添加属性的更 Pythonic 方式？

我正在使用来自两个不同网页的数据集但对于同一个人数据集是合法信息一些数据在第一页上可用因此我使用正确的信息初始化被告对象并将我当前没有数据的属性设置为null 这是班级 class Defendant object holds d
pip 安装与本地包具有相同命名空间的包

我使用的是 Python 3 6 5 通过 miniconda 安装我的问题是由于我正在安装一个与本地包具有相同命名空间的包 pip 安装此包后我无法再从本地包导入我收到一个ModuleNotFoundError错误如果可能的话命
python中根据变量类型处理数据子集

我将以下数据存储在 csv df sample csv 中我将列名放在名为 cols list 的列表中 df 数据样本 df data sample pd DataFrame new video BASE SHIVER PREFER
如何在 Python 中将列表变量传递给 subprocess.call 命令

我有一个清单 apps apps append wq35a5huqlja45jsyukrpmwuiayovrmh apps append q7mimvgduueernwvw4y22t5huemykntw apps append pmudbp
如果 Django 中的表单字段与 Python 关键字同名，如何声明该字段？

我在 Django 中有一个简单的表单看起来像这样 class SearchForm forms Form text forms CharField from forms DateField until forms DateField 失
在matplotlib中绘制曲线连接点

所以我试图绘制曲线来连接点这是我正在使用的代码 def hanging line point1 point2 a point2 1 point1 1 np cosh point2 0 np cosh point1 0 b point1 1
Python 中字典的 enumerate()

我知道我们用enumerate用于迭代列表但我在字典上尝试过但没有给出错误 CODE enumm 0 1 1 2 2 3 4 4 5 5 6 6 7 7 for i key in enumerate enumm print i key
导入后属性未添加到模块中

我做了以下实验室 vagrant ubuntu xenial test tree pack1 init py mod1 py pack2 init py mod2 py mod3 py test py 2 directories 6 fil
如何将目录导入为 python 模块

如果有目录 home project aaa 我知道它是一个Python包那么我如何通过知道它的路径来导入这个模块这意味着我希望代码能够正常工作 aaa load module home project aaa 我知道的唯一方法是
为什么“模型尚未加载”？

我正在尝试使用 customUser 安装 django registration redux 我已将其包含在我的 settings py 中 AUTH USER MODEL app customUser 注册表位于目录 registrat

随机推荐

事务回滚，但插入一条记录

大家好我已经使用 jsf spring 3 0 hybernate JPA 和atomikos 进行了 XA 交易管理 mysql 是我的后端这里一切正常但是插入操作当异常抛出时交易应该回滚但是它没有发生这是我们应用程序的一个
使用jquery附加vue js组件

我正在尝试动态附加vue使用 jquery 将组件添加到我的应用程序中但什么也没有发生附加元素没有渲染 div div 我想要的结果是附加时
HSM 和自定义模块

我们正在实施安全关键系统其中FIPS 140 2需要兼容的 HSM 硬件安全模块来生成和存储密钥材料执行加密解密以及运行自定义代码并为自定义模块设置以下要求模块可通过 RPC 访问模块可以访问所有 HSM 密钥和服务模块具有
php shell命令错误GLIBCXX_3.4.9未找到

我试图从 php 执行 shell 命令将文件转换为 pdf 但出现此错误有人可以详细解释我如何修复它吗我不太擅长linux 而且如果我直接通过终端执行命令一切都会正常 usr lib libreoffice program oos
我为什么可以在 std::vector 中使用前向声明的类？

我认为您只能创建指向前向声明类的引用或指针成员然而我惊讶地发现这个有效 include
在 GAE 上使用 boto3 - 遇到 Popen 问题

我正在尝试在 Google App Engine 中运行一些 python 代码该代码向 Amazon SQS 发送消息我已经安装了 boto3 但在尝试将其导入我的 AppEngine 服务时遇到错误 File base data h
使用 R 中的 Match 函数查找“第一次出现”

我是 R 和 Stackoverflow 的新手所以请原谅我提出这个非常基本的问题我正在尝试在我的数据集中找到第一个女性的索引代码快照我的整个数据集称为自行车所以首先我认为分配一个仅包含性别的新向量是个好主意 bike gen
使用填充堆叠不同长度的 Numpy 数组

a np array 1 2 3 b np array 4 5 l a b 我想要一个功能stack padding这样 assert stack padding l np array 1 2 3 4 5 0 numpy 是否有实现的标准方
Prolog 将分钟转换为小时

这是我创建的代码 mins to hours In H M In lt 60 H 0 M is In mins to hours In H M In gt 60 H is H1 1 In1 is In 60 mins to hours In
jQuery AJAX 请求 302 重定向 - 哪些回调可用？

我正在使用一个使用 jQuery 1 2 6 的旧系统我正在通过以下方式发送 AJAX 请求jQuery ajax功能它所访问的 URL 正在发送 302 HTTP 重定向响应并最终以 200 HTTP OK 响应结束我已经注册了两
如何将 $SHELL 变量传递到 perl 搜索和替换中

我有以下两个命令 value grep o Logs txt textFILE perl i wpe s onclick img document getElementById img 1 img style display img sty
ftplib.FTP 超时行为不一致

我正在尝试使用ftplib FTP 使用超时选项作为特定主机名的超时值但我遇到了奇怪的行为为了测试它我编写了一段非常简单的代码 import ftplib from ftplib import FTP ftp ftplib FTP g
将表达式作为参数传递：关键字不能是表达式

这是我的行动 gt gt gt def show d print d gt gt gt test result True gt gt gt show test result True gt gt gt show test info Some
使用 SDL 2 和 -static 进行编译时收到对各种 Windows 库的未定义引用？

我正在对 SDL2 中的 Wolfenstein 3D 引擎进行修改使用 Wolf4SDL 作为基础并且遇到了一个问题在链接器选项中使用 static 时我得到了对各种事物的大量未定义引用这是我的构建日志来说明我的意思 Build
将数据集动态绑定到 RDLC 报告

我想将动态数据集绑定到 rdlc 如果我在 ASPX 文件中使用内联数据源静态绑定我可以查看报告但是如果我使用以下代码报告查看器将继续显示正在加载图像我已经检查了数据集名称如果我将数据集名称更改为 Orders2 它会显示
如何修复 AttributeError: 'NoneType' 对象没有属性 'text'...循环时

我是初学者这个论坛上的答案非常宝贵我正在使用 Python 3 和 Beautiful Soup 通过循环页码从同一网站上的多个网页中抓取非表数据它有效但我不断收到 AttributeError NoneType object
触摸设备（iOS、Android）

触摸输入上有刻度吗我知道有灵敏度设置可以说明是否触摸但它也有硬压力和低压的刻度吗如果有规模是多少 0 到 1 或 0 255 或者什么可能性嗯这完全取决于 API 以 Android 为例有一个getPressure Moti
如何在android中播放来自url的动画GIF图像？

我正在将 giphy 集成到我的 Android 应用程序中我怎样才能玩animated gifAndroid 中的 URL 中的图像我应该使用ImageView WebView VideoViewETC 例如如果我想播放动画this
无法在 JavaScript 警报框中添加新行？

我在 PHP 中生成一个字符串然后最终将该字符串传递到 JavaScript 警报框中我的问题是我实际上无法在警报框中添加换行符我的代码如下所示 str This is a string n alert str This is the
CPython 和 PyPy 小数运算性能

我想使用数百万个数据点以小数表示运行 100k 次模拟我选择小数而不是浮点数是为了浮点精度和易于对我的逻辑进行单元测试因为0 1 0 1 0 1对于浮点数不等于 0 3 我希望通过使用 PyPy 来加快模拟速度但在我的测试过程中我

CPython 和 PyPy 小数运算性能

CPython 和 PyPy 小数运算性能 的相关文章

随机推荐

热门标签

CPython 和 PyPy 小数运算性能的相关文章