为什么 g++（4.6 和 4.7）将此除法的结果提升为双精度？我可以阻止吗？

2023-12-05

我正在编写一些模板代码来对使用浮点数和双精度数的数值算法进行基准测试，以便与 GPU 实现进行比较。

我发现我的浮点代码速度较慢，在使用 Intel 的 Vtune Amplifier 进行调查后，我发现 g++ 正在生成额外的 x86 指令（cvtps2pd/cvtpd2ps 和 unpcklps/unpcklpd），以将一些中间结果从 float 转换为 double，然后再转换回来。此应用程序的性能下降了近 10%。

在使用 -Wdouble-promotion 标志（顺便说一句，-Wall 或 -Wextra 中不包含该标志）进行编译后，g++ 果然警告我结果正在升级。

我将其简化为如下所示的简单测试用例。请注意，C++ 代码的顺序会影响生成的代码。复合语句 (T d1 = log(r)/r;) 会产生警告，而分离版本则不会 (T d = log(r); d/=r;)。

以下是用 g++-4.6.3-1ubuntu5 和 g++-4.7.3-2ubuntu1~12.04 编译的，结果相同。

编译标志是：

g++-4.7 -O2 -Wdouble-promotion -Wextra -Wall -pedantic -Werror -std=c++0x test.cpp -o test

#include <cstdlib>
#include <iostream>
#include <cmath>

template <typename T>
T f()
{
        T r = static_cast<T>(0.001);

        // Gives no double promotion warning
        T d = log(r);
        d/=r;
        // Promotes to double
        T d1 = log(r)/r;

        return d+d1;
}

int main()
{
        float f1 = f<float>();
        std::cout << f1 << std::endl;
}

我意识到 c++11 标准允许编译器自行决定。但为什么顺序很重要呢？

我可以明确指示 g++ 仅使用浮点数进行此计算吗？

编辑：由迈克·西摩解决。需要使用 std::log 来确保获取日志的重载版本，而不是调用 Cdouble log(double)。不会为分离的语句生成警告，因为这是转换而不是升级。

问题是

log(r)

在这个实现中，似乎唯一的log全局命名空间中是C库函数，double log(double)。请记住，未指定 C++ 库中的 C 库标头是否将其定义转储到全局命名空间以及namespace std.

You want

std::log(r)

以确保 C++ 库定义的额外重载可用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 g++（4.6 和 4.7）将此除法的结果提升为双精度？我可以阻止吗？的相关文章

如何从字符串中提取子字符串直到遇到第二个空格？

我有一个像这样的字符串 o1 1232 5467 1232 5467 1232 5467 1232 5467 1232 5467 1232 5467 如何仅提取 o1 1232 5467 要提取的字符数并不总是相同因此我只想提取直到遇到
与 for_each 或 std::transform 一起使用时，如何调用 C++ 函子构造函数

我以前从未使用过 C 函子所以我只是想了解它们是如何工作的例如假设我们有这个函子类 class MultiplyBy private int factor public MultiplyBy int x factor x int ope
静态构造函数和 BeforeFieldInit？

如果类型没有静态构造函数则将执行字段初始值设定项就在使用该类型之前或者在某个时间点突发奇想运行时为什么这段代码 void Main start Dump Test EchoAndReturn Hello end Dump clas
捕获 .aspx 和 .ascx 页面中的异常

问题说明了一切请看以下示例代码 ul li li ul
EntityHydrate 任务失败

我最近安装了 Visual Studio 11 Beta 和 Visual Studio 2010 之后我无法在 Visual Studio 2010 中构建依赖于 PostSharp 的项目因此我卸载了 Visual Studio 1
为什么 C 程序使用 Scanf 给出奇怪的输出？

我目前正在学习 C 编程并且遇到了这个奇怪的输出 Program will try functionalities of the scanf function include
在 C 语言中，为什么数组的地址等于它的值？

在下面的代码中指针值和指针地址与预期不同但数组值和地址则不然怎么会这样 Output my array 0022FF00 my array 0022FF00 pointer to array 0022FF00 pointer to a
如何在 C# 中将 Json 转换为对象

我想将 Json 转换为 C 中的对象这里的 Json 是值 e920ce0f e3f5 4c6f 8e3d d2fbc51990e4 如何使用 Object 问题看似愚蠢但其实并不那么愚蠢我没有简单的 Json 我有 IEnume
if constexpr 中的 not-constexpr 变量 – clang 与 GCC

struct A constexpr operator bool const return true int main auto f auto v if constexpr v A a f a clang 6 接受该代码 GCC 8 拒绝它
C# 根据当前日期传递日期时间值

我正在尝试根据 sql server 中的两个日期获取记录 Select from table where CreatedDate between StartDate and EndDate我通过了5 12 2010 and 5 12 20
OpenGL：如何检查用户是否支持glGenBuffers()？

我检查了文档它说 OpenGL 版本必须至少为 1 5 才能制作glGenBuffers 工作用户使用的是1 5版本但是函数调用会导致崩溃这是文档中的错误还是用户的驱动程序问题我正在用这个glGenBuffers 对于VBO 我如
让网络摄像头在 OpenCV 中工作

我正在尝试让我的网络摄像头在 Windows 7 64 位中的 OpenCV 版本 2 2 中捕获视频但是我遇到了一些困难 OpenCV 附带的示例二进制文件都无法检测到我的网络摄像头最近我发现这篇文章表明答案在于重新编译一个文件 o
我们可以通过指针来改变const定义的对象的值吗？

include
MySQL 连接器 C++ 64 位在 Visual Studio 2012 中从源代码构建

我正在尝试建立mySQL 连接器 C 从源头在视觉工作室2012为了64 bit建筑学我知道这取决于一些boost头文件和C 连接器跑步CMake生成一个项目文件但该项目文件无法编译因为有一大堆非常令人困惑的错误这些错误可能与包含
SQLAPI++ 的免费替代品？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有任何免费也许是开源的替代品SQLAPI http www sqlapi com 这个库看起来
读取依赖步行者输出

I am having some problems using one of the Dlls in my application and I ran dependency walker on it i am not sure how to
C：设置变量范围内所有位的最有效方法

让我们来int举个例子 int SetBitWithinRange const unsigned from const unsigned to To be implemented SetBitWithinRange应该返回一个int其中所有
在 C# 的 WebAPI 中的 ApiController 上使用“传输编码：分块”提供数据

我需要服务分块传输使用编码数据API控制器因为我无权访问HttpContext or the Http请求我有点不知道在哪里写入响应以及在哪里刷新它设置如下 public class MyController ApiControlle
如何高效计算连续数的数字积？

我正在尝试计算数字序列中每个数字的数字乘积例如 21 22 23 98 99 将会 2 4 6 72 81 为了降低复杂性我只会考虑连续的数字 http simple wikipedia org wiki Consecutive in
如果将变量设置为等于新对象，旧对象会发生什么？

假设我们有一个 X 类not有一个超载的operator 功能 class X int n X n 0 X int n n n int main X a 1 an object gets constructed here more code

随机推荐

Javascript检测div外部的点击事件[重复]

这个问题在这里已经有答案了我有一个 id content area 的 div 当用户单击该 div 外部时我想提醒他们他们单击了该 div 外部我将如何使用 JavaScript 来解决这个问题 div div Display Co
双击打开引导模式

我正在尝试打开模态双击我正在使用这段代码但它不起作用 link dblclick function myModal modal toggle 在这里小提琴 http jsfiddle net labanino JKEj3 Thanks
为什么 a+=b*pow(10,c-i-1) == 99 c++？ [复制]

这个问题在这里已经有答案了我写了这段代码第一次循环结果是 99 为什么结果是 99 而它应该是 100 include
使用 SSJS 的“保存”按钮不会在 Web xpage 中打开 xe:dialog，但适用于移动 xpage

以下保存按钮代码在移动 xpage 上运行良好 var checkBox31 com ibm xsp component xp XspInputCheckbox getComponent checkBox31 var customerID1
PowershellWhere-Object似乎没有过滤

我正在尝试对 Azure 策略进行一些报告我最终将过滤日期但无法过滤任何内容因此提供以下示例 PS C gt defstrings az policy definition list management group mgsandbo
根据点击的导航链接显示内容

我有一个如下所示的菜单选择 ul class menu li a href about class aboutNav About a li li a href contact class contactNav Contact a li li
std::jthread 从另一个成员函数运行一个成员函数

这是我的代码 include
如何在 Blackberry OS 5 中以实时模式扫描 QR 码

Google Zxing 需要一张图像有人可以告诉我如何让它干净利落地进行实时扫描即用户将设备指向二维码并进行扫描用户不必拍摄图像我遇到的情况有以下两个方面一些线程建议使用计时器和事件注入来连续拍照但这种方法可能会在设备上产生太
用两个条件分割字符串

我有一个字符串如下所示字符串样本类 class1 class2 class3 class4 class5 class6 class7 我需要从此示例字符串创建单词列表 WORD 是一个以句点开头并以以下内容结尾的字符串一个空格或另
如何防止报表中数据重复显示？

样本报告设计样本报告预览 XML代码文件
配置 CXF JAX-WS 服务以与 MOXY 配合使用

虽然我添加了带有 MOXY 工厂的 jaxb properties 并且我看到 JAXB 已切换为 moxy 但 CXF 在 JAXBUtils 类中有一个名为 createRIContext 的方法该方法加载硬编码的 sun JAXB
为什么“substring(startIndex, endIndex)”不会抛出“超出范围”

在Java中我使用的是substring 方法我不确定为什么它没有抛出索引外错误字符串abcde索引从 0 到 4 开始但是substring 方法将 startIndex 和 endIndex 作为参数基于我可以调用 foo
将 XML 数据分解为 SQL Server 数据库列的最佳方法

将 XML 数据分解为各种数据库列的最佳方法是什么到目前为止我主要使用节点和值函数如下所示 INSERT INTO some table column1 column2 column3 SELECT Rows n value colu
当数据大小较小时，内存到内存 DMA 传输是否需要权衡？

我正在学习 STM32 F4 微控制器我正在尝试找出使用 DMA 的限制根据我的理解和研究我知道如果数据量较小即设备使用DMA生成或消耗少量数据则开销会增加因为DMA传输需要DMA控制器执行操作从而不必要地增加系统成本我做了
有没有办法缩放背景图像样式？

如果我将常规的 img 标签放入 html 中我基本上可以指定宽度和高度浏览器将缩放图像只要尺寸与原始尺寸相差不太远结果就不错例如即使原始图像为 45x45 头像图像也会缩放为 32x32 img width 32 height
当另一个元素具有特定值时，需要 XSD 中的 XML 元素吗？

仅当选择了枚举的特定值时我才需要必需的属性或元素下面的例子
如何将列表写入 csv 文件？

我有一个包含以下数据的列表 a b 1 c d 3 a c 2 c d 1 如何将此列表列表写入 csv 文件我尝试过这个但没有成功 with open output csv w as f f write list csv csvwri
应用 PropertyTemplate 边框时，Apache POI 用黑色而不是所需的自定义颜色填充 XSSF 单元格

我正在编写一个程序该程序应该制作一个 Excel 电子表格其中一些单元格填充为橙色给定文本并使用PropertyTemplate 我已经成功编写了在 HSSF 中执行此操作的代码但我现在正在处理 XSSF 并且无法让它工作发生的
ClearCase diff 中的输入输出错误。不当论证

我有一个用户在尝试访问他人的视图时遇到错误当他们尝试进行差异时他们输入输出错误在 UNIX 和 Windows 中的 xcompare 上他们收到无法显示元素的版本树浏览器遇到不正确的参数在窗户一侧从任何一个用户的角度来看我都没
为什么 g++（4.6 和 4.7）将此除法的结果提升为双精度？我可以阻止吗？

我正在编写一些模板代码来对使用浮点数和双精度数的数值算法进行基准测试以便与 GPU 实现进行比较我发现我的浮点代码速度较慢在使用 Intel 的 Vtune Amplifier 进行调查后我发现 g 正在生成额外的 x86 指令 c

为什么 g++（4.6 和 4.7）将此除法的结果提升为双精度？我可以阻止吗？

为什么 g++（4.6 和 4.7）将此除法的结果提升为双精度？我可以阻止吗？ 的相关文章

随机推荐

热门标签

为什么 g++（4.6 和 4.7）将此除法的结果提升为双精度？我可以阻止吗？的相关文章