Numpy 的舍入方式与 Python 不同

2024-05-08

The code

import numpy as np
a = 5.92270987499999979065
print(round(a, 8))
print(round(np.float64(a), 8))

gives

5.92270987
5.92270988

知道为什么吗？

在 numpy 来源中找不到任何相关内容。

Update:
我知道处理这个问题的正确方法是以这种差异无关紧要的方式构建程序。我就是这么做的。我在回归测试中偶然发现了它。

Update2:
关于@VikasDamodar 评论。人们不应该相信repr()功能：

>>> np.float64(5.92270987499999979065)
5.922709875
>>> '%.20f' % np.float64(5.92270987499999979065)
'5.92270987499999979065'

Update3:
在 python3.6.0 x32、numpy 1.14.0、win64 上测试。也在 python3.6.4 x64、numpy 1.14.0、debian 上。

Update4:
只是要确定：

import numpy as np
a = 5.92270987499999979065
print('%.20f' % round(a, 8))
print('%.20f' % round(np.float64(a), 8))

5.92270987000000026512
5.92270988000000020435

Update5:
下面的代码演示了差异发生在哪个阶段，而不使用str:

>>> np.float64(a) - 5.922709874
1.000000082740371e-09
>>> a - 5.922709874
1.000000082740371e-09
>>> round(np.float64(a), 8) - 5.922709874
6.000000496442226e-09
>>> round(a, 8) - 5.922709874
-3.999999442783064e-09

显然，在应用“round”之前，它们是相同的数字。

Update6:
与@user2357112的答案相反，np.round大约比圆形慢 4 倍：

%%timeit a = 5.92270987499999979065
round(a, 8)

1.18 µs ± 26.5 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)  

%%timeit a = np.float64(5.92270987499999979065)
round(a, 8)

4.05 µs ± 43.9 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

也在我看来np.round甚至比内置的四舍五入效果更好round：最初我通过将 11.84541975 除以二得到这个 5.92270987499999979065 数字。

float.__round__ https://github.com/python/cpython/blob/v3.6.4/Objects/floatobject.c#L905使用正确舍入的双精度到字符串算法，特别注意生成正确舍入的结果。

NumPy 没有。这NumPy 文档 https://docs.scipy.org/doc/numpy/reference/generated/numpy.around.html#numpy.around提到这一点

由于 IEEE 浮点标准 [R9] 中十进制小数的不精确表示，结果也可能令人惊讶按 10 次方缩放时引入的错误.

这更快，但会产生更多舍入误差。它会导致像您所观察到的错误，以及更明确地低于截止值的数字仍然被四舍五入的错误：

>>> x = 0.33499999999999996
>>> x
0.33499999999999996
>>> x < 0.335
True
>>> x < Decimal('0.335')
True
>>> x < 0.67/2
True
>>> round(x, 2)
0.33
>>> numpy.round(x, 2)
0.34000000000000002

NumPy 的舍入时间变慢，但这与哪种舍入算法较慢没有任何关系。 NumPy 和常规 Python 数学之间的任何时间比较都可以归结为 NumPy 针对整个数组运算进行了优化。对单个 NumPy 标量进行数学运算会产生大量开销，但对整个数组进行舍入numpy.round轻松击败对浮点数列表进行四舍五入round:

In [6]: import numpy

In [7]: l = [i/7 for i in range(100)]

In [8]: a = numpy.array(l)

In [9]: %timeit [round(x, 1) for x in l]
59.6 µs ± 408 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

In [10]: %timeit numpy.round(a, 1)
5.27 µs ± 145 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

至于哪个更准确，那肯定是float.__round__。你的数字更接近 5.92270987，而不是 5.92270988，而且它是圆形的 -ties- 为偶数，而不是所有内容都为偶数。这里没有领带。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Numpy 的舍入方式与 Python 不同的相关文章

使用 python 进行串行数据记录

Intro 我需要编写一个小程序来实时读取串行数据并将其写入文本文件我在读取数据方面取得了一些进展但尚未成功地将这些信息存储在新文件中这是我的代码 from future import print function import se
如何正确地将 MIDI 刻度转换为毫秒？

我正在尝试将 MIDI 刻度增量时间转换为毫秒并且已经找到了一些有用的资源 MIDI Delta 时间刻度到秒 http www lastrayofhope co uk 2009 12 23 midi delta time ticks
pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
如何在 pytest 中将单元测试和集成测试分开

根据维基百科 https en wikipedia org wiki Unit testing Description和各种articles https techbeacon com devops 6 best practices inte
Pandas 中允许重复列

我将一个大的 CSV 包含股票财务数据文件分割成更小的块 CSV 文件的格式不同像 Excel 数据透视表之类的东西第一列的前几行包含一些标题公司名称 ID 等在以下列中重复因为一家公司有多个属性而不是一家公司只有一栏在前几行
从零开始的 numpy 形状意味着什么

好的我发现数组的形状中可以包含 0 对于将 0 作为唯一维度的情况这对我来说是有意义的它是一个空数组 np zeros 0 但如果你有这样的情况 np zeros 0 100 让我很困惑为什么这么定义呢据我所知这只是表达空数组的
如何创建一个语句来打印以特定单词开头的单词？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何在 python 中打印从特定字母开始的单词而不使用函数而是使用方法或循环 1 我有一个字符串想要打印以 m 开头的单词 S
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
从 python 发起 SSH 隧道时出现问题

目标是在卫星服务器和集中式注册数据库之间建立 n 个 ssh 隧道我已经在我的服务器之间设置了公钥身份验证因此它们只需直接登录而无需密码提示怎么办我试过帕拉米科它看起来不错但仅仅建立一个基本的隧道就变得相当复杂尽管代码示例将受
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
奇怪的 MySQL Python mod_wsgi 无法连接到 'localhost' (49) 上的 MySQL 服务器问题

StackOverflow上也有类似的问题但我还没有发现完全相同的情况这是在使用 MySQL 的 OS X Leopard 机器上一些起始信息 MySQL Server version 5 1 30 Apache 2 2 13 Uni
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
将 JSON 对象传递给带有请求的 url

所以我想利用 Kenneth 的优秀请求模块 https github com kennethreitz requests 在尝试使用时偶然发现了这个问题自由库API http wiki freebase com wiki API 基本上
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
mac osx 10.8 上的初学者 python

我正在学习编程并且一直在使用 Ruby 和 ROR 但我觉得我更喜欢 Python 语言来学习编程虽然我看到了 Ruby 和 Rails 的优点但我觉得我需要一种更容易学习编程概念的语言因此是 Python 但是我似乎找不到适用于
具有自定义值的 Django 管理外键下拉列表

我有 3 个 Django 模型 class Test models Model pass class Page models Model test models ForeignKey Test class Question model M
如何读取Python字节码？

我很难理解 Python 的字节码及其dis module import dis def func x 1 dis dis func 上述代码在解释器中输入时会产生以下输出 0 LOAD CONST 1 1 3 STORE FAST 0 x
Elastic Beanstalk 中的 enum34 问题

我正在尝试在 Elastic Beanstalk 中设置 django 环境当我尝试通过requirements txt 文件安装时我遇到了python3 6 问题 File opt python run venv bin pip li

随机推荐

使填充的值成为ggplot2中的实际填充

有没有办法让填充的值标签成为填充本身例如在堆积条形图中我有 require ggplot2 big votes movies movies movies votes gt 100000 p ggplot big votes mov
Objective-c：如何创建不同深浅的颜色

是否有任何算法可以为给定的十六进制或 RGB 值创建不同的阴影我尝试过增加和减少 alpha 但浅色例如白色看起来不太好实现此目的的最佳方法是使用 HSB 色彩空间这就是我在最新的应用程序中完成键盘左手部分的方式颜色的阴影
如何在rails中定义自定义路径？

我有一个用户模型如果我做 def my action user User new end then I get undefined method users path for
在 Cocoa 中实现源代码语法高亮的最佳方法是什么？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在开发 Cocoa 应用程序它应该能够分析和突出显示用 Objective C SQL JavaS
git am：补丁格式检测失败

我以前从未在 Git 中使用过补丁我需要一些帮助我正在尝试将补丁应用到 Git 存储库来测试 Wine 补丁特别是这个补丁在这里 https bugs winehq org attachment cgi id 60752 所以我做了以
如何从同一网络中的另一台计算机访问我的 nodejs-express 本地主机服务器？

我努力了this https stackoverflow com questions 5524116 accessing localhost xampp from another computer over lan network how
xpath 的多个 string() 结果？

string 在我试图从中提取文本的某个网页上效果很好具有类似的结构对于 bing 我尝试过的 xpath 是 string h3 a 即使有强标签等它也能很好地获取搜索结果但只返回第一个结果有没有类似 strings 的东西这
将 for 循环中的值传递给事件侦听器 - Javascript [重复]

这个问题在这里已经有答案了可能的重复使用 Google Maps API v3 循环遍历标记问题 https stackoverflow com questions 2670356 looping through markers wit
闪亮的如何阻止用户访问选项卡？

我需要阻止用户访问其他选项卡直到完成某些操作在这个可重现的示例中我想阻止用户访问Tab 2直到他按下按钮该应用程序如下所示这是该应用程序的代码 library shiny ui lt shinyUI navbarPage tabP
如何真正释放 Linux 中的大页面以供新进程使用？

真的找不到太多关于此的信息希望有人可以提供帮助我正在假脱机使用 100GB java 堆作为大数据缓存为了避免与文件系统缓存等内容发生冲突并且因为它通常性能更好我将其分配在大页面中我保留了 51 200 x 2MB 大页面一切
如何在 VS Code 中集成 babun shell

我尝试过更改设置 terminal integrated shell windows to babun mintty地点但是 babun shell 窗口单独打开并且不与 VS code 集成有人知道如何实现这一目标吗经过2个小时的
如何强制send_data在浏览器中下载文件？

好吧我的问题是我正在使用send data on my Rails 3应用程序向用户发送文件AWS S3类似的服务 Base establish connection access key id gt my key secret acce
Python 使用 pandas 和 str.strip 崩溃

这段最少的代码使我的 Python 崩溃了设置 pandas 0 13 0 python 2 7 3 AMD64 Win7 import pandas as pd input file r c3 csv input df pd read
Google Pub/Sub 是否有队列或主题？

我熟悉 JMS 对 Google Pub Sub 还很陌生在 JMS 中有 2 个选项 Queue 只有一个消费者可以接受消息 Topic 每个消费者接受来自主题的每条消息我相信 Google Pub Sub 应该支持这样的东西但是快
如何通过值获取 JavaScript“Map”中的键？

我有一个像这样的 JavaScript 地图 let people new Map people set 1 jhon people set 2 jasmein people set 3 abdo 我想要某种方法按值返回键 let jhon
通过vba在每个空间范围之间添加求和公式

我试图进行自动化但我被困在这里我需要在空间范围之间动态添加总和公式我完全迷失了使用 VBA 添加公式的能力任何人都可以帮助我先感谢您我假设您想要的是如果单元格中有空白您希望将所有其他元素相加并将结果放置在该空白中可能有很多
没有找到任务运行程序配置？

我有新安装的 Visual Studio Professional 2017 V 15 9 4 视觉工作室解决方案 https learn microsoft com en us visualstudio ide solutions an
尝试使用 python 连接 mongodb atlas 时连接超时

我正在尝试连接到我的 mongodb atlas 集群但是当我尝试对我的数据库执行某些操作时我总是超时我使用的数据库是在 mongoshell 中创建的也是我在 mongodb compass 中检查它们是否存在的集合 ERROR
工作站和嵌入式程序员之间的心态差异[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Numpy 的舍入方式与 Python 不同

The code import numpy as np a 5 92270987499999979065 print round a 8 print round np float64 a 8 gives 5 92270987 5 92270

Numpy 的舍入方式与 Python 不同

Numpy 的舍入方式与 Python 不同 的相关文章

随机推荐

热门标签

Numpy 的舍入方式与 Python 不同的相关文章