浮点乘法性能不一致

2024-03-07

在测试 .NET 中浮点数的性能时，我偶然发现了一个奇怪的情况：对于某些值，乘法似乎比正常情况慢得多。这是测试用例：

using System;
using System.Diagnostics;

namespace NumericPerfTestCSharp {
    class Program {
        static void Main() {
            Benchmark(() => float32Multiply(0.1f), "\nfloat32Multiply(0.1f)");
            Benchmark(() => float32Multiply(0.9f), "\nfloat32Multiply(0.9f)");
            Benchmark(() => float32Multiply(0.99f), "\nfloat32Multiply(0.99f)");
            Benchmark(() => float32Multiply(0.999f), "\nfloat32Multiply(0.999f)");
            Benchmark(() => float32Multiply(1f), "\nfloat32Multiply(1f)");
        }

        static void float32Multiply(float param) {
            float n = 1000f;
            for (int i = 0; i < 1000000; ++i) {
                n = n * param;
            }
            // Write result to prevent the compiler from optimizing the entire method away
            Console.Write(n);
        }

        static void Benchmark(Action func, string message) {
            // warm-up call
            func();

            var sw = Stopwatch.StartNew();
            for (int i = 0; i < 5; ++i) {
                func();
            }
            Console.WriteLine(message + " : {0} ms", sw.ElapsedMilliseconds);
        }
    }
}

Results:

float32Multiply(0.1f) : 7 ms
float32Multiply(0.9f) : 946 ms
float32Multiply(0.99f) : 8 ms
float32Multiply(0.999f) : 7 ms
float32Multiply(1f) : 7 ms

为什么 param = 0.9f 的结果如此不同？

测试参数：.NET 4.5、发布版本、代码优化开启、x86、未附加调试器。

正如其他人所提到的，当涉及非正常浮点值时，各种处理器不支持正常速度计算。这要么是一个设计缺陷（如果该行为会损害您的应用程序或造成其他麻烦），要么是一个功能（如果您更喜欢更便宜的处理器或通过不使用门来实现这项工作而启用的硅的替代使用）。

理解为什么在 0.5 处发生转变是很有启发性的：

Suppose you are multiplying by p. Eventually, the value becomes so small that the result is some subnormal value (below 2^-126 in 32-bit IEEE binary floating point). Then multiplication becomes slow. As you continue multiplying, the value continues decreasing, and it reaches 2^-149, which is the smallest positive number that can be represented. Now, when you multiply by p, the exact result is of course 2^-149p, which is between 0 and 2^-149, which are the two nearest representable values. The machine must round the result and return one of these two values.

Which one? If p is less than ½, then 2^-149p is closer to 0 than to 2^-149, so the machine returns 0. Then you are not working with subnormal values anymore, and multiplication is fast again. If p is greater than ½, then 2^-149p is closer to 2^-149 than to 0, so the machine returns 2^-149, and you continue working with subnormal values, and multiplication remains slow. If p is exactly ½, the rounding rules say to use the value that has zero in the low bit of its significand (fraction portion), which is zero (2^-149 has 1 in its low bit).

您报告说 0.99f 看起来很快。这应该以缓慢的行为结束。也许您发布的代码并不完全是您使用 .99f 测量快速性能的代码？也许起始值或迭代次数发生了变化？

有多种方法可以解决这个问题。一是硬件具有指定将使用或获得的任何次正规值更改为零的模式设置，称为“非正规为零”或“刷新为零”模式。我不使用 .NET，因此无法建议您如何在 .NET 中设置这些模式。

另一种方法是每次添加一个微小的值，例如

n = (n+e) * param;

where e is at least 2^-126/param. Note that 2^-126/param should be calculated rounded upward, unless you can guarantee that n is large enough that (n+e) * param does not produce a subnormal value. This also presumes n is not negative. The effect of this is to make sure the calculated value is always large enough to be in the normal range, never subnormal.

Adding e这样当然会改变结果。但是，例如，如果您正在处理具有某种回声效果（或其他过滤器）的音频，则e太小，不会造成人类收听音频时可观察到的任何影响。它可能太小，无法在生成音频时导致硬件行为发生任何变化。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

浮点乘法性能不一致的相关文章

链接 .Net 程序集

这都是假设所以请耐心等待假设我正在用 C 编写一个名为 Foo 的工具输出是 foo exe 我发现了一些我喜欢使用的非常棒的库称为 Bar 我可以在我的项目中将其引用为 bar dll 当我构建项目时我的输出目录中有 foo e
使用 C# 和 ASP.NET 在电子邮件附件中发送 SQL 报告

我正在尝试使用 ASP NET 和 C 从 sql reportserver 2008 作为电子邮件附件发送报告到目前为止我学会了如何获取 PDF 格式的报告 http weblogs asp net srkirkland archive
防止控制台应用程序中的内存工作集最小化？

我想防止控制台应用程序中的内存工作集最小化在Windows应用程序中我可以这样做覆盖 SC MINIMIZE 消息 http support microsoft com kb 293215 en us fr 1 但是如何在控制台应用程
混合模型优先和代码优先

我们使用模型优先方法创建了一个 Web 应用程序一名新开发人员进入该项目并使用代码优先方法使用数据库文件创建了一个新的自定义模型这这是代码第一个数据库上下文 namespace WVITDB DAL public class D
如何向 Mono.ZeroConf 注册服务？

我正在尝试测试 ZeroConf 示例http www mono project com Mono Zeroconf http www mono project com Mono Zeroconf 我正在运行 OpenSuse 11 和 M
为什么这个 makefile 在“make clean”上执行目标

这是我当前的 makefile CXX g CXXFLAGS Wall O3 LDFLAGS TARGET testcpp SRCS main cpp object cpp foo cpp OBJS SRCS cpp o DEPS SRCS
来自嵌入图像的 BitmapSource

我的目标是在 WPF 窗口上重写 OnRender 方法中绘制图像 someImage png 它是嵌入资源 protected override void OnRender System Windows Media DrawingCont
LinkLabel 无下划线 - Compact Framework

我正在使用 Microsoft Compact Framework 开发 Windows CE 应用程序我必须使用 LinkLabel 它必须是白色且没有下划线因此在设计器中我将字体颜色修改为白色并在字体对话框中取消选中下划线
条件类型定义

如果我有一小段这样的代码 template
C# 获取数据表中所有重复行的计数

我通过运行存储过程来填充数据集并且从数据集中填充数据表 DataSet RawDataSet DataAccessHelper RunProcedure storedprocedureName this will just return
MySQL 连接器 C++ 64 位在 Visual Studio 2012 中从源代码构建

我正在尝试建立mySQL 连接器 C 从源头在视觉工作室2012为了64 bit建筑学我知道这取决于一些boost头文件和C 连接器跑步CMake生成一个项目文件但该项目文件无法编译因为有一大堆非常令人困惑的错误这些错误可能与包含
SQLAPI++ 的免费替代品？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有任何免费也许是开源的替代品SQLAPI http www sqlapi com 这个库看起来
如何获取带有某个属性注释的所有属性？

我刚刚从 Roslyn 开始我想找到所有用属性名称 OneToOne 注释的属性我启动了 SyntaxVisualizer 并能够获取对该节点的引用但我想知道是否有更简单的方法来实现此目的这就是我所拥有的 var prop docu
任何人都可以清楚地告诉如何在不使用像这样的预定义函数的情况下找到带有小数值或小数值的指数吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案例如 2 0 5 1 414 所以想要我是 c 的新手所以请解释简单的逻辑如果不是复杂的逻辑也足够了在数学中从整数取幂到实数
将键码转换为相关的显示字符

在 C Windows Forms 项目中我有一个不提供 KeyPressed 事件的控件它是一个 COM 控件 ESRI 映射它仅提供 KeyUp 和 KeyDown 事件包含关键事件参数 http msdn microsoft
winform c# 中的弹出窗口

我正在开发一个需要弹出窗口的项目但问题是我还希望能够通过表单设计器在此弹出窗口中添加文本框等所以基本上我有一个按钮当您单击它时它将打开我在表单设计器中设计的另一个窗口我一直在谷歌搜索但还没有找到我需要的东西所以我希望你们能帮助
声明一个负长度的数组

当创建负长度数组时 C 中会发生什么例如 int n 35 int testArray n for int i 0 i lt 10 i testArray i i 1 这段代码将编译并且启用 Wall 时不会出现警告并且似乎您可以分配
如何在 C# 中获取 CMD/控制台编码

我需要指定正确的代码页来使用 zip 库打包文件正如我所见我需要指定控制台编码在我的例子中为 866 C Users User gt mode Status for device CON Lines 300 Columns 130 K
如何为有时异步的操作创建和实现接口

假设我有数百个类它们使用计算方法实现公共接口一些类将执行异步例如读取文件而实现相同接口的其他类将执行同步代码例如将两个数字相加为了维护和性能对此进行编码的好方法是什么到目前为止我读到的帖子总是建议将异步等待方法冒泡给调
如何在 ASP.NET Core 中注入泛型的依赖关系

我有以下存储库类 public class TestRepository Repository

随机推荐

psql：找不到命令 Mac

我通过图形安装安装了 PostgreSQLhttp www postgresql org download macosx http www postgresql org download macosx 我在我的应用程序中看到它并且在我的应
关于WPF MVVM和用户控件的菜鸟问题

我正在开始 WPF 并且在实现数据绑定方面遇到了一些困难具体来说我创建了一个简单的用户控件其中包含一个标签和一个按钮对于这个用户控件我创建了一个 ViewModel 它只包含两个属性 string 文本和SimpleEnum 地
Python：将元组列表（可变大小）转换为具有固定形状的类似数组的结构

我有一个元组列表例如 a 1 2 3 4 5 np shape 2 我想将其转换为类似数组的结构但形状固定即 a 1 2 3 4 5 0 np shape 2 3 In 69 maxlen max len i for i in a g
使用 Open XML 添加日期到 Excel [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我想使用 Open XML 将日期值
aws cli 中的 ls 返回“PRE”。为什么以及如何摆脱它

在 git bash 中使用 awscli 命令 aws s3 ls s3 directory 返回一个列表 PRE filename 这很不方便因为我需要对输出执行进一步的命令并且我只需要给定目录中的文件目录名称例如如果能够执行
getopt 不适用于一个参数

这只是我为了练习 getopt 和结构而编写的一个简单程序 typedef struct int age float body fat personal typedef struct const char name personal spe
一台机器上可以有多个Java SDK吗？

我的机器上可以安装多个 java SDK 版本吗爪哇1 4 爪哇2 爪哇6 爪哇7 请告知因为我必须在 Java 1 4 和 Java 2 中为 Maximo 开发解决方案另外我想学习 Java 6 和 7 的开发 Thanks 我的
将 imageView 中的图像与底部中心对齐

我有一个简单的 imageView 我希望图像显示在底部的中心目前它显示在右下角
SQL Server 2008 Spatial：在多边形中找到一个点

我正在使用 SQL Server 2008 空间数据类型我有一个表其中所有状态作为多边形作为数据类型 GEOMETRY 现在我想检查一个点的坐标纬度经度作为数据类型 GEOGRAPHY 是否位于该州内我找不到任何使用新空间数
Sass 在嵌套选择器中使用 & 符号引用父选择器

正当我认为 Sass 是自切片面包以来最酷的东西时它不得不消失并让我失望我正在尝试使用符号来选择嵌套项目的父项这是一个复杂的选择它返回了一些意想不到的结果 My sass page about us a text decorati
何时在 docker 中使用 --hostname ？

Is hostname就像docker容器环境中的域名系统一样可以替换 ip当引用其他容器时 The hostnameflag 仅更改容器内的主机名如果您的应用程序需要主机名的特定值则可能需要这样做它不会更改 docker 外部的 D
带有打字稿接口的 Aurelia DI

我已经浏览了 Aurelia DI 的文档并查看了源代码并想分享我想要实现的目标这样如果我遗漏了一些明显的东西我就可以被击落我看过样品here https github com cmichaelgraham对于 Aurelia 的
持久的 Python 命令行历史记录

我希望能够向上箭头指向我在以前的 Python 解释器中输入的命令我已经找到了readline模块提供以下功能 read history file write history file and set startup hook 我还不
在 Woocommerce 中使用动态数据自定义电子邮件主题[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案不是重复的在 Woocommerce 订单电子邮件通知中显示含税和不含增值税的订单总额 https stackover
具有核心数据和 iPhone 故事板选项卡控制器的通用主从应用程序将无法识别的选择器发送到实例错误

我在 X Code 中启动了一个主从应用程序我选择了通用核心数据和 git repo 选项当应用程序出现时我进入 iPhone 故事板添加一个选项卡视图控制器将其开头的导航表格详细视图移动到选项卡控制器中作为第三个选项卡实
将 UTC 日期时间转换为另一个时区

我有一个来自数据库记录的 UTC 日期时间值我还有一个用户指定的时区 TimeZoneInfo 的实例如何将该 UTC 日期时间转换为用户的本地时区另外如何确定用户指定的时区当前是否遵守夏令时我正在使用 NET 3 5 谢谢标记
JQuery/JavaScript - 突出显示输入或文本区域中的部分文本[重复]

这个问题在这里已经有答案了可能的重复如何使用 Javascript 或 JQuery 在 HTML 中突出显示输入文本字段的一部分 https stackoverflow com questions 10341843 how to hi
如何以使用不同模型的形式实现kartik yii2 FileInput

这是位于 myyiiapp backend views product form php 的代码 div class product form div
为什么需要将AD服务器包含在“userWorkstations”中？

将 Java 应用程序连接到 AD 服务器时出现以下错误 javax naming AuthenticationException LDAP error code 49 80090308 LdapErr DSID 0C0903A9 com
浮点乘法性能不一致

在测试 NET 中浮点数的性能时我偶然发现了一个奇怪的情况对于某些值乘法似乎比正常情况慢得多这是测试用例 using System using System Diagnostics namespace NumericPerfTest

浮点乘法性能不一致

浮点乘法性能不一致 的相关文章

随机推荐

热门标签

浮点乘法性能不一致的相关文章