循环和内置函数之间的数值不一致

2023-12-05

我正在尝试计算随机数数组的总和。但是，当我一次执行一个元素与使用内置函数时，结果之间似乎不一致。此外，当我降低数据精度时，误差似乎会增加。

import torch
columns = 43*22
rows    = 44
torch.manual_seed(0)
array = torch.rand([rows,columns], dtype = torch.float64)
array_sum = 0
for i in range(rows):
    for j in range(columns):
        array_sum += array[i, j]

torch.abs(array_sum - array.sum())

结果是：

tensor(3.6380e-10, dtype=torch.float64)

using dtype = torch.float32结果是：

tensor(0.1426)

using dtype = torch.float16结果（哇！）：

tensor(18784., dtype=torch.float16)

我很难相信没有人问过这个问题。然而，我还没有在SO中找到类似的问题。

任何人都可以帮我找到一些解释或这个错误的根源吗？

第一个错误是这样的：你应该将求和行更改为

array_sum += float(array[i, j])

对于 float64 来说这不会造成问题，对于其他值来说这是一个问题，解释如下。

首先：在进行浮点运算时，您应该始终记住，由于舍入误差而存在小错误。最简单的查看方法是在 python shell 中：

>>> .1+.1+.1-.3
5.551115123125783e-17

但你如何考虑这些错误呢？当将 n 个正整数相加为总和时，分析相当简单，规则是：

错误(tot)

其中因子 n 通常是总体高估，而机器 epsilon 取决于浮点数的类型（表示大小）。并且大约是：

float64: 2*10^-16
float32: 1*10^-7
float16: 1*10^-3

人们通常认为误差大约在 tot*machine_epsilon 的合理因子内。

对于我对 float16 的测试，我们得到（总是 +-40000 个变量，总和为 +- 20000）：

error(float64) = 3*10^-10 ≈ 80* 20000 * 2*10^-16
error(float32) = 1*10^-1  ≈ 50* 20000 * 1*10^-7

这是可以接受的。

然后浮点数 16 还有另一个问题。有机器 epsilon = 1e-4，你可以看到问题

>>> ar = torch.ones([1], dtype=float16)
>>> ar
tensor([2048.], dtype=torch.float16)
>>> ar[0] += .5
>>> ar
tensor([2048.], dtype=torch.float16)

这里的问题是，当达到值 2048 时，该值不够精确，无法添加 1 或更少的值。更具体地说：使用 float16，您可以“表示”值 2048，也可以表示值 2050，但不能表示介于两者之间的值，因为对于该精度来说，它的位数太少。通过将总和保存在 float64 变量中，您可以解决这个问题。解决这个问题我们得到了 float16：

error(float16) = 16  ≈ 8* 20000 * 1*10^-4

虽然很大，但作为相对于 float16 表示的 20000 的值是可以接受的。

如果您问自己，这两种方法中哪一种是“正确的”，那么答案不是这两种方法，它们都是具有相同精度的近似值，但误差不同。但正如您可能猜到的那样，使用 sum() 方法更快、更好、更可靠。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Pytorch

循环和内置函数之间的数值不一致的相关文章

具有多个输入的kerasvalidation_data

我尝试使用validation data方法但是有问题 model fit X macd train X rsi train X ema train Y train sample weight sample weight validati
当默认 pip 为 pip2 时，升级 pip3 的正确格式是什么？

我为两者开发Python 2 and 3 因此我必须同时使用pip2 and pip3 使用时pip3 我收到此升级请求最后两行 pip3 install arrow Requirement already satisfied use
如何让Python的socket服务器永远运行

我有这段代码创建了一个简单的Python套接字服务器但是每次客户端断开连接时它都会关闭如何让它永远运行 import socket HOST PORT 8000 s socket socket socket AF INET socket
使用 Pillow 和 Numpy 进行图像推导

I have two images and 我想导出一个只有红色 Hello 的图像例如所以我正在运行一个简单的推导python脚本 from PIL import Image import numpy as np root root
顶级棉花糖模式验证

From 棉花糖 validation http marshmallow readthedocs org en latest quickstart html validation 我知道我可以在架构中的特定字段上注册验证器如果验证器失败
sphinx 中的分组方法文档字符串

是否可以使用 sphinx 的 autodoc 功能将多个方法文档字符串分组以便将它们列在一起 class Test object def a self A method of group foo def b self A method
是否可以在 Sphinx 中隐藏 Python 函数参数？

假设我有以下函数该函数记录在Numpydoc 风格 https github com numpy numpy blob master doc HOWTO DOCUMENT rst txt 并且文档是自动生成的Sphinx http sph
查找 python 数据框中每行的最高值

我想找到每行中的最高值并返回 python 中该值的列标题例如我想找到每行的前两个 df A B C D 5 9 8 2 4 1 2 3 我希望我的输出看起来像这样 df B C A D 您可以使用字典理解来生成largest n数据帧
Python Pandas 从宽到长的格式更改以及列标题拆分

我有一个包含以下列标题和行示例的表 Subject Test1 Result1 Test1 Result2 Test2 Result1 Test2 Result2 0 John 10 0 5 20 0 3 我想将其改造成 Subject l
如何使用 boto3 从 AWS Cognito 获取经过身份验证的身份响应

我想使用 boto3 获取访问 AWS 服务的临时凭证用例是这样的我的 Cognito 用户池中的用户登录到我的服务器我希望服务器代码为该用户提供访问其他 AWS 服务的临时凭证我有一个存储我的用户的 Cognito 用户池我有一
[python]没有属性“TessBaseAPI”

当我编译代码时出现错误 import tessercat api tesseract TessBaseAPI 错误是 AttributeError 模块对象没有属性 TessBaseAPI 我已经安装了tesseract via pip
Python 列表理解不适用于 itertools.groupby 解码

我正在尝试解码结果itertools groupby到一个值列表中我的来源是 x 1 2 2 1 6 3 6 5 1 3 最初的方法是使用 for 语句来实现如下所示 keyfunc itemgetter 0 groups unique
Python代码执行时自动打开浏览器

我正在 Python Flask 中实现 GUI Flask 的设计方式是必须手动打开本地主机以及端口号有没有一种方法可以使其自动化以便在运行代码时自动打开浏览器本地主机我尝试使用 webbrowser 包但它在会话终止后打
如何将一串Python代码编译成一个可以调用函数的模块？

在 Python 中我有一串 Python 源代码其中包含以下函数 mySrc def foo print foo def bar print bar 我想将这个字符串编译成某种形式类似模块的对象这样我就可以调用代码中包含的函数这是我
获取 HTML 代码的结构

我正在使用 BeautifulSoup4 我很好奇是否有一个函数可以返回 HTML 代码的结构有序标签这是一个例子 h1 Simple example h1 p This is a simple example of html page
Microsoft Azure 数据仓库和 SqlAlchemy

我正在尝试使用 python 的 sqlalchemy 库连接到 microsoft azure 数据仓库并收到以下错误 pyodbc Error HY000 HY000 Microsoft ODBC SQL Server Driver
将 for 循环替换为 pyspark 中的并行进程

我在脚本中使用 for 循环来为 size DF 数据帧的每个元素调用函数但这需要很多时间我尝试通过地图删除 for 循环但没有得到任何输出 size DF 是我从表中获取的大约 300 个元素的列表用于 import call
使用 plone.api 创建文件的 Python 脚本在设置文件时出现错误 WrongType

Dears 我正在创建一个脚本python来在Plone站点中批量上传文件安装是UnifiedInstaller Plone 4 3 10 该脚本读取了一个txt 并且该txt以分号分隔在新创建的项目中设置文件时出现错误下面是脚本 f
Docker Build 找不到 pip

尝试关注一些 1 https aws amazon com blogs aws run docker apps locally using the elastic beanstalk eb cli 2 http docs aws amazo
使用Python的线程模块调用ctypes函数比使用多处理更快？

我一生都无法找出这个问题的答案我编写了一个可以执行数百次繁重计算的脚本我有一个绝妙的主意将这些计算任务编写为 C 然后使用 Python 的 ctypes 与它们交互我心想我什至可以使用并行性进一步优化它我最初的方法是使用线程

随机推荐

为画布上的矩形设置 zindex 不会将其置于前面

我对画布和在其上绘制的矩形有疑问他们以相反的创建顺序获得事件最新的在顶部而不是 zindex 的顺序我已将 ItemsControl 与资源列表绑定然后有一个画布作为项目面板
是否有微数据标签来指定值是数字、字符串还是布尔值？

有一个 HTML5 属性称为datetime指示值类型是日期时间但我看不出有什么办法可以表明是否itemprop值在spantag 是字符串布尔值或数字我认为没有办法将此类信息包含在微观数据中对吗如果是这样是否有某种原因应省略此
PHP解码json

这里有人可以帮我用 php 解码 json 吗我正在尝试解码 json api url 这是我现在所拥有的 string username someusername unconfirmed reward 0 08681793 send t
通过 api/cli 启用和禁用 S3 复制规则

我已在 S3 存储桶上设置了复制规则以填充 preprod 存储桶以进行测试这意味着我希望能够轻松地打开和关闭复制并可能根据需要转储和刷新复制存储桶我正在为此创建一个脚本但很难找到一种在使用 AWS 控制台之外轻松打开和关闭复制规
TripleDES 加密和解密给出奇怪的结果

我有一个有效的实施TripleDESCng 针对一些测试向量进行测试但会发生以下情况当我加密纯文本时This is a sample message 24 字节因此这将是 3 个块十六进制为546869732069732061207
DynamicJasper - 如何添加子报表作为列？

Overview 我有一个 Java 类其中有一个ArrayList必须打印到 jasperReport 作为子报表我正在使用 DynamicJasper 库关于这个问题的示例已被修改因此可以复制然而实际情况的数据有所不同 Pr
将单列分成 3 列，保留原始列 (R)

我有一个独特的字符列位于 DD HH MM 中我试图将该列分成 3 个新的numeric列我对单独函数的问题是它替换了原始列并且我不知道如何传递多个条件SEP 请注意并非每个观察结果都有 DD 我当前的代码如下所示 separat
IPC 性能：命名管道与套接字

每个人似乎都说命名管道比套接字 IPC 更快他们快了多少我更喜欢使用套接字因为它们可以进行双向通信并且非常灵活但如果速度相当大我会选择速度而不是灵活性您将获得的最佳结果共享内存解决方案命名管道仅比 16 好TCP 套接字结果
C# 与 C++/CLI 中的 Unicode 字符串文字

C char z u201D int i int z C CLI wchar t z u201D int i int z In C i正如我所期望的那样变成了 8221 201D 另一方面在 C CLI 中它变成了 65428 FF9
Java 获取 MIB 中 OID 的名称/描述

我正在编写一个网络管理系统并且需要能够打印出从 SNMP 陷阱接收到的 OID 后面有意义的名称由于该系统的性质大小对于正在使用的每台设备上的每个 MIB 手动将每个 OID 映射到有意义的名称并不是一个好主意话虽如此是否有一种
更快的 iPhone PNG 动画

目前我的计时器上有一个 PNG 动画每 0 01 秒触发一次然而性能并不是最佳的而且动画速度明显很慢我有超过 2000 张图片有更好的方法来实现这一点吗我在下面发布了与我的方法类似的内容 timer NSTimer sche
R 中向量的指数移动平均值

我有一个简单的向量如下 x c 14 24 13 82 12 75 12 92 12 94 13 00 14 14 16 28 20 64 17 64 我正在尝试使用以下函数找到该向量的滚动 EMA library TTR y EMA x
matplotlib 错误 - 没有名为 tkinter 的模块 [重复]

这个问题在这里已经有答案了我尝试在 Windows 10 上通过 Pycharm IDE 使用 matplotlib 包当我运行这段代码时 from matplotlib import pyplot 我收到以下错误 ImportErro
Java Swing、JComboBox 下拉列表在单击之前更改侦听器

我有一个 JComboBox 其中包含 MIDI 文件列表我想知道以下操作是否可行当我单击 JComboBox 时会打开一个下拉列表当我将鼠标移到 midi 文件上时它会播放 10 秒的示例声音因此我知道该文件包含什么内容在我单
CakePHP 不使用我的模型

我有这两个 CakePHP V 2 4 5 模型 class Owner extends AppModel public name Owner public hasMany array Car and class Car extends A
使用python将csv转为json，json按行排列

我想使用 Python 将 CSV 转换为一组 JSON 对象并按行格式化我尝试了下面的脚本将几个 SO 答案放在一起但格式如下 key value key value etc 我想将其格式化为 key value key valu
更改 Microsoft Azure Blob - PHP 的默认服务版本

this gt blobClient ServicesBuilder getInstance gt createBlobService azureString properties this gt blobClient gt getServ
Web Speech API Grammar 是否向开发人员公开？

我目前正在对 Webkit 语音识别进行一些研究我想创建一个特定于应用程序的语法文件根据W3C的定义我写了下面的代码但它似乎并没有显示出对这些单词的识别效果有所改善您能提供一些帮助吗 var 识别 new webkitSpeechR
当数组中元素的长度大于 2 时，出现“太多值无法解压（预期为 2）”

也许问这个问题会很奇怪因为我当然不明白例如如果我们有a 1 2 3 4 操作有效 for x y in a print x y 但是一旦我们向这些元组添加任何其他元素 a 1 2 3 4 5 6 for x y in a print
循环和内置函数之间的数值不一致

我正在尝试计算随机数数组的总和但是当我一次执行一个元素与使用内置函数时结果之间似乎不一致此外当我降低数据精度时误差似乎会增加 import torch columns 43 22 rows 44 torch manual see

循环和内置函数之间的数值不一致

循环和内置函数之间的数值不一致 的相关文章

随机推荐

热门标签

循环和内置函数之间的数值不一致的相关文章