未使用的功能会改变性能

2024-03-29

在尝试估计之间的性能差异时push_back and std::inserter我遇到了一个非常奇怪的性能问题。

让我们考虑以下代码：

#include <vector>
using container = std::vector<int>;
const int size  = 1000000;
const int count = 1000;

#ifdef MYOWNFLAG
void foo(std::insert_iterator<container> ist)
{
    for(int i=0; i<size; ++i)
        *ist++ = i;
}
#endif

void bar(container& cnt)
{
    for(int i=0; i<size; ++i)
        cnt.push_back(i);
}
int main()
{
    container cnt;
    for (int i=0; i<count; ++i)
    {
        cnt.clear();
        bar(cnt);
    }
    return 0;
}

在这种情况下，无论是否MYOWNFLAG定义后，函数 foo 未被调用。然而，该标志的值会对性能产生影响：

$ g++ -g -pipe -march=native -pedantic -std=c++11 -W -Wall -Wextra -Werror -O3 -o bin/inserter src/inserter.cc && time ./bin/inserter
./bin/inserter  4,73s user 0,00s system 100% cpu 4,728 total

$ g++ -g -pipe -march=native -pedantic -std=c++11 -W -Wall -Wextra -Werror -O3 -o bin/inserter src/inserter.cc -DMYOWNFLAG && time ./bin/inserter
./bin/inserter  2,09s user 0,00s system 99% cpu 2,094 total

请注意，如果我更改原型foo to use std::back_insert_iterator我得到了类似的表现，就好像我没有设置标志一样。

编译器的优化发生了什么？？？

EDIT

我使用 gcc 4.9.2 20150304（预发布）

转载

由 Stefan 在 ideone 上转载
我在另一台机器上用 gcc 4.9.2 复制了
我没有在另一台带有 gcc 4.6.3 和标志 -std=c++0x 的机器上重现

首先，我将向您展示如何在没有垃圾函数的情况下实现这一目标的神奇技巧。然后我将向您展示垃圾函数为何有效。所以技巧：

原来无效（注意我的机器大约快两倍）：

g++ -g -pipe -march=native -pedantic -std=c++11 -W -Wall -Wextra -Werror -O3 -o bin/inserter src/inserter.cc --param inline-unit-growth=200 && time ./bin/inserter
real    0m2.197s
user    0m2.200s
sys     0m0.000s

现在开始了（你的定义仍然处于非活动状态）：

g++ -g -pipe -march=native -pedantic -std=c++11 -W -Wall -Wextra -Werror -O3 -o bin/inserter src/inserter.cc --param inline-min-speedup=2 && time ./bin/inserter
real    0m1.114s
user    0m1.100s
sys 0m0.010s

注意：区别在于看起来奇怪的论证--param inline-min-speedup=2

现在我简单介绍一下调查情况：

快和慢有什么区别？在慢速版本中，我们确实有无效的调用emplace_back_aux inside bar()，当您的 foo 未注释时，它会神奇地内联。所以我们可以得出结论，这个栏非常热门，而内联在这里至关重要。而且很可能所有这些错误都与内联有关。
现在有选项-fdump-ipa-inline-details让我们看看内联转储。您将看到不同的时间/大小考虑因素。它很难阅读，我不想在这里粘贴所有细节。但研究此信息的一般结果是：GCC 认为，模块大小（百分比）的增长不值得估计加速。
该怎么办？两种可能性：

3.1.要么增加模块大小，要么增加未使用的总体加速估计foo代码，即使用正确的类型（如 insert_iterator 来调用 emplace_back 并移动比率更大并达到内联限制）（请注意，这种方式非常不稳定 - 在具有改进的内联算法的其他编译器版本中，所有内容都可能会爆炸，并且您还需要真的很幸运能猜出代码来工作）。

3.2.或者移动内联限制。我对 GCC 提供的参数所说的是“请考虑以更少的加速内联甚至大的函数”。

那是。 GCC 内部还有很多其他参数以及您可以使用它们执行的其他技巧。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

performance

gcc

未使用的功能会改变性能的相关文章

如何将动态数据写入 MVC 3 Razor 中的页面布局？

我有带有 Razor 引擎的 MVC 3 C 项目将动态数据写入 Layout cshtml 的方法和最佳实践是什么例如也许我想在网站的右上角显示用户名该名称来自会话数据库或基于用户登录的任何内容更新我也在寻找将某些数据渲染到
从 unsigned char* 到 char* 的转换无效

这是一个代码 1 int main int argc char argv 2 3 signed char S psc 4 unsigned char U pusc 5 char C pc 6 7 C S 8 C U 9 10 pc psc
为什么迭代器类型推导失败？ [复制]

这个问题在这里已经有答案了为什么这在 C 中不起作用为什么我不能限制foo的参数为std vector
如何进行Visual Studio格式字典初始化？

所有 Visual Studio 也包括 2012 不格式化以下内容 messageProcessor new Dictionary
为什么下面的重叠比较总是评估为 true

我不明白为什么以下代码有警告指出重叠比较始终评估为真接下来的语句永远不会被执行 QVariant MainModel data const QModelIndex index int role const if index isVali
在关键服务器上对字符串进行内存受限的外部排序，并合并和计算重复项（数十亿个文件名）

我们的服务器生成如下文件 c521c143 2a23 42ef 89d1 557915e2323a sign xml在其日志文件夹中第一部分是GUID 第二部分是名称模板我想计算具有同名模板的文件的数量例如我们有 c521c143
如何在控制器中使用多个 DBContext

如何在控制器中使用多个 DBContext 我尝试以不同的方式重载构造函数一些控制器 public C1 DBContext1 a DBContext2 b DBContext3 c public C1 DBContext1 a publ
无法在 Visual Studio 和 vcpkg 中构建 cmake 项目（致命错误 C1083）

我今天安装了vcpkg 启用了与Visual Studio的集成即 vcpkg集成安装并开始安装库我基本上安装了 cpprestsdk 并触发了 boost 库的安装然后我在 Visual Studio CMake 中打开该项目当
如何使用 Selenium Webdriver .NET 绑定设置 Chrome 首选项？

这是我正在使用的用户代理可以成功设置而下载首选项则不能 Windows 7 Chrome 26 Selenium dotnet 2 31 2 chromedriver win 26 0 1383 0 ChromeOptions chro
哪个更快？按引用传递与按值传递 C++

我认为按引用传递应该比按值传递更快因为计算机不复制数据它只是指向数据的地址但是请考虑以下 C 代码 include
Bazel：将编译标志添加到默认 C++ 工具链

我想向默认的 C 工具链添加一些编译器和链接器标志以便我构建的所有目标本地或导入共享它们我知道可以定义我自己的工具链但我不想这样做因为它非常复杂且容易出错理想情况下我想要这样的东西 cc toolchain cc defaul
VS C# 中的依赖地狱，找不到依赖项

我创建了一个图表 C 库我们称之为chartlibrary 它本身依赖于多个第三方 dll 文件在另一个可执行项目中我们称之为chartuser 我参考了chartlibrary项目两个项目位于 Visual Studio 中的同一
使用 C# 的异步 WebRequest

您好我有一个函数它将 url Get 参数传递到网络服务器上的 php 文件并等待文件的响应通常需要 10 20 秒我想将其放入一个循环中因为我必须一次将这些 Get 请求发送到大约 5 个不同的 php 文件但是当我尝试将其
OpenSSL：无需 SSL_read() / SSL_write() 即可执行加密/解密

我已经用 C 语言编写了一个基于事件的网络库现在我想通过 OpenSSL 添加 SSL TLS 支持而不是使用SSL read and SSL write 我宁愿让 OpenSSL 只执行传出传入数据的加密解密让我自己传输接收数
在 C++ 中什么时候首选传递指针而不是引用传递？

我可以想象一种情况其中输入参数可以为 NULL 以便首选传递指针而不是传递引用有人可以添加更多案例吗在传递的对象实际上将被修改的情况下有些人更喜欢传递指针当对象通过引用传递时它们使用 pass by const referenc
为什么 getch 不可移植？

是什么使得 getch 本质上无法作为标准 C 函数包含在内对于控制台界面来说它是如此直观和优雅如果没有它要求输入单个字符总是会产生误导因为用户可以输入多个键更糟糕的是您经常需要确保在读取控制台输入后清除标准输入这甚至不是作
查找文本文件中每行的行大小

如何计算每行中的字符或数字数量是否有类似 EOF 的东西更像是行尾您可以遍历行中的每个字符并不断增加计数器直到行尾 n 遇到确保以文本模式打开文件 r 而不是二进制模式 rb 否则流不会自动将不同平台的行结束序列转换为 n 人物这是
使用 List.Contains 方法为 LINQ 构建表达式树

Problem 我正在重构一些LINQ查询我们的 Web 应用程序中的多个报告并且我尝试将一些重复的查询谓词移至它们自己的中IQueryable扩展方法以便我们可以将它们重新用于这些报告以及将来的报告正如您可能推断的那样我已经重构了
VB.NET 是否优化字符串文字的串联？

如同this https stackoverflow com questions 288794 does c optimize the concatenation of string literals问题但对于 VB NET 来说因为我
C#“var”关键字在 VB.NET 中的等价物是什么？

例如我如何获得 VB NET静态类型局部变量是static赋值右侧的表达式的类型像这样 Dim http msdn microsoft com en us library 7ee5a7s1 aspx我的变量 3 你还需要选项推断 ht

随机推荐

Java - 嵌套内嵌套的Gson解析

我必须与 API 进行交互并且响应格式根据我所读到的似乎结构很差我发现谷歌小组回复了一个有点类似的问题here http groups google com group google gson browse thread threa
如何在 SQL/Spark/GraphFrames 中进行此转换

我有一个包含以下两列的表 Device Id Account Id d1 a1 d2 a1 d1 a2 d2 a3 d3 a4 d3 a5 d4 a6 d1 a4 Device Id 是安装我的应用程序的设备的唯一 ID Account I
java.lang.ClassCastException：Jboss Resteasy 日志记录

我正在使用 Jboss7 0 1 Final 来部署我的 Web 应用程序但我不想使用 Jboss 提供的默认 Resteasy jar 所以我做了以下更改jboss deployment structure xml
linq：随机排序

我如何更改下面的代码以便每次从数据库中获取 50 个不同的随机数据 return from examQ in idb Exam Question Int Tbl where examQ Exam Tbl ID exam id select
Hangfire.Autofac 与 MVC 应用程序 - 注入失败

我正在尝试创建一个简单的 Hangfire 测试但它不起作用以下是所有重要的代码以及我如何使用 Hangire Autofac 配置它不知道我在这里缺少什么我在 hangfire dashbaord 中遇到的异常也在下面 publ
如何在 PHP 中的 echo 中添加换行符？ [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我试图为句子添加换行符然后我添加了 n在下面的代码中 echo Thanks for your email n Your ord
Flash CSS 颜色在先前颜色和新颜色之间

假设我有一个div添加了颜色background color red or green 我想让这个闪光变成另一种颜色其中非闪光是以前的颜色值 HTML div class red make green flash div LESS r
ReasonML 与 TypeScript

ReasonML 之间的权衡是什么 https reasonml github io https reasonml github io 和 TypeScript https www typescriptlang org https www
递归和内存泛滥：启动 Gradle 守护进程，1 个繁忙和 6 个停止的守护进程无法重用，请使用 --status 了解详细信息

我正在使用这个插件https github com mozilla rust android gradle https github com mozilla rust android gradle 这需要我添加 tasks whenTask
访问 tf.keras.callbacks.Callback 中已弃用的属性“validation_data”

我决定从 keras 切换到 tf keras 按照推荐here https www pyimagesearch com 2019 10 21 keras vs tf keras whats the difference in tensor
“heroku run rake asset:clean” 不会清理任何东西

我执行 heroku run rake assets clean Running rake assets clean attached to terminal up run 2 usr local bin ruby app vendor b
Git commit hook - 如何使用 commit-msg 挂钩检查消息中的字符串？

我需要创建一个 commit msg 挂钩来检查提交消息的任何部分是否包含 app asana 我搜索了一些参考资料和文档我知道我需要为此使用 commit msg 我必须使用 Perl 或 Bash 来完成此操作有人对此有线索吗或者
使用 JQ 解析 JSON 行以按顺序翻转键值

我有一个包含 json 行的文件需要根据每个 json 的抖动 alert status 值的序列来验证其有效性有效 json 行的示例 id 123 code foo severity Critical severityCode 1
Python 2 和 3 中的字符串到字节

我的函数需要将输入作为字符串或二进制数据例如从文件中读取如果它是一个字符串我想将其转换为原始数据 bytes or bytearray 在Python 3中我可以做data bytes data utf8 然而这在 Python
AWS lambda 和数据库[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我一直在理论上了解到创建与数据库的新连接是昂贵的操作因此我们应该保持打开的连接池并将其用于数据库操作在考虑 AWS lambda 时假
如何将 JSON 响应包装在父对象中

我的 Spring REST 服务的当前响应如下 id 5cc81d256aaed62f8e6462f4 email email protected cdn cgi l email protection id 5cc81d386aaed62
Android 上的 Youtube API 播放器每 2 秒自动暂停一次

我正在制作一个使用 YouTube API 来播放 YouTube 视频的应用程序当我进入全屏模式时我将播放器样式切换为 CHROMELESS 因为我想创建自己的媒体控件集我开发了一套手势来映射音量亮度和搜索的变化当这些变化发生时
Cakephp REST API 消除了 .format 的必要性

我正在努力创建一个仅获取和返回 JSON 数据的 REST api 我正在遵循蛋糕指南我的默认路线是这样的 GET recipes format GET recipes 123 format POST recipes format PUT
MongoDB 按数组中的元素进行分组

我有一个看起来像这样的集合 id id1 tags a b id id2 tags b c id id3 tags a c 如何进行按 tags 数组中的每个元素进行分组的查询以便结果如下所示 a 2 b 2 c 2 其中2是它出现的次数
未使用的功能会改变性能

在尝试估计之间的性能差异时push back and std inserter我遇到了一个非常奇怪的性能问题让我们考虑以下代码 include

未使用的功能会改变性能

EDIT

转载

未使用的功能会改变性能 的相关文章

随机推荐

热门标签

未使用的功能会改变性能的相关文章