为什么gcc不能内联可以确定的函数指针？

2023-11-27

以下程序在 centos 上的 gcc 4.6.2 下使用 -O3 编译：

#include <iostream>
#include <vector>
#include <algorithm>
#include <ctime>
using namespace std;

template <typename T>
class F {
public:
     typedef void (T::*Func)();

     F(Func f) : f_(f) {}

     void operator()(T& t) {
         (t.*f_)();
     }
private:
     Func f_;
};

struct X {
    X() : x_(0) {}

    void f(){
        ++x_;
    }

    int x_;
};

int main()
{
     const int N = 100000000;
     vector<X> xv(N);
     auto begin = clock();
     for_each (xv.begin(), xv.end(), F<X>(&X::f));
     auto end = clock();
     cout << end - begin << endl;
}

objdump -D显示循环生成的代码是：

  40097c:       e8 57 fe ff ff          callq  4007d8 <clock@plt>
  400981:       49 89 c5                mov    %rax,%r13
  400984:       0f 1f 40 00             nopl   0x0(%rax)
  400988:       48 89 ef                mov    %rbp,%rdi
  40098b:       48 83 c5 04             add    $0x4,%rbp
  40098f:       e8 8c ff ff ff          callq  400920 <_ZN1X1fEv>
  400994:       4c 39 e5                cmp    %r12,%rbp
  400997:       75 ef                   jne    400988 <main+0x48>
  400999:       e8 3a fe ff ff          callq  4007d8 <clock@plt>

显然 gcc 没有内联该函数。为什么 gcc 不能进行这种优化？是否有任何编译器标志可以使 gcc 进行所需的优化？

我认为，GCC试图优化整体main函数，但失败（大量间接调用全局函数来分配/释放内存xv，获取定时器值、输入/输出等）。因此，您可以尝试将代码拆分为两个（或更多）独立的部分，如下所示：

inline
void foobar(vector<X>& xv)
{
  for_each (xv.begin(), xv.end(), F<X>(&X::f));
}

int main()
{
  const int N = 100000000;
  vector<X> xv(N);
  auto begin = clock();
  foobar(xv);
  auto end = clock();
  cout << end - begin << endl;
}

所以，现在我们有了和以前一样的“等效”代码，但是 GCC 的优化器现在有更容易完成的任务。我没有看到任何电话ZN1X1fEv现在在汇编程序列表中。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

gcc

为什么gcc不能内联可以确定的函数指针？的相关文章

c和java语言中的换行符

现在行分隔符取决于系统但在 C 程序中我使用 n 作为行分隔符无论我在 Windows 还是 Linux 中运行它都可以正常工作为什么在java中我们必须使用 n 因为它与系统相关那么为什么我们在c中使用 n 作为新行而不管我
使用Physics.Raycast 和Physics2D.Raycast 检测对象上的点击

我的场景中有一个空的游戏对象带有 2D 组件盒碰撞器我将脚本附加到该游戏对象 void OnMouseDown Debug Log clic 但是当我点击我的游戏对象时没有任何效果你有什么想法如何检测我的盒子碰撞器上的点击使用光
如何检查QProcess是否正确执行？

QProcess process sdcompare QString command sdcompare QStringList args sdcompare command sdcompare diff args sdcompare lt
如何在 C# 中从 UNIX 纪元时间转换并考虑夏令时？

我有一个从 unix 纪元时间转换为 NET DateTime 值的函数 public static DateTime FromUnixEpochTime double unixTime DateTime d new DateTime 19
互斥体实现可以互换（独立于线程实现）

所有互斥体实现最终都会调用相同的基本系统硬件调用吗这意味着它们可以互换吗具体来说如果我使用 gnu parallel算法使用openmp 并且我想让他们称之为线程安全的类我可以使用boost mutex用于锁定或者我必须编写自己
XamlReader.Load 在后台线程中。是否可以？

WPF 应用程序具有从单独的文件加载用户控件的操作使用XamlReader Load method StreamReader mysr new StreamReader pathToFile DependencyObject rootOb
读取文件特定行号的有效方法。（奖励：Python 手册印刷错误）

我有一个 100 GB 的文本文件它是来自数据库的 BCP 转储当我尝试导入它时BULK INSERT 我在第 219506324 行上收到一个神秘错误在解决此问题之前我想看看这一行但可惜的是我最喜欢的方法 import line
在 C# 中循环遍历文件文件夹的最简单方法是什么？

我尝试编写一个程序使用包含相关文件路径的配置文件来导航本地文件系统我的问题是在 C 中执行文件 I O 这将是从桌面应用程序到服务器并返回和文件系统导航时使用的最佳实践是什么我知道如何谷歌并且找到了几种解决方案但我想知道各种功
用于检查项目文件中的项目变量和引用路径的 api

我正在研究一个 net application VS2010 与 x 没有解和变量号这些解决方案中的项目数量我需要检查项目属性特定于一定数量的项目是否同质并且检查验证构建期间的参考路径有没有一个API是这样的吗如果没有我该
获取 WPF 控件的所有附加事件处理程序

我正在开发一个应用程序在其中动态分配按钮的事件现在的问题是我希望获取按钮单击事件的所有事件因为我希望删除以前的处理程序我尝试将事件处理程序设置为 null 如下所示 Button Click null 但是我收到了一个无法分配 n
如何在 Linq 中获得左外连接？

我的数据库中有两个表如下所示顾客 C ID city 1 Dhaka 2 New york 3 London 个人信息 P ID C ID Field value 1 1 First Name Nasir 2 1 Last Name U
如何使用 watin 中的 FileUploadDialogHandler 访问文件上传对话框

我正在使用 IE8 和 watin 并尝试通过我的网页测试上传文件我不能简单地使用 set 方法设置上传文件例如 ie FileUpload Find ById someId Set C Desktop image jpg 因为上传文本
使用 Moq 使用内部构造函数模拟类型

我正在尝试模拟 Microsoft Sync Framework 中的一个类它只有一个内部构造函数当我尝试以下操作时 var fullEnumerationContextMock new Mock
如何使用 Mongodb C# 驱动程序连接多个集合

我需要将 3 个集合与多个集合合并在一起 lookup我在 C 驱动程序中尝试过它允许我 lookup用户采集但无法执行秒 lookup用于设置集合有人可以帮忙吗 db Transactions aggregate lookup fro
如何编写一个同时需要请求和响应Dtos的ServiceStack插件

我需要提供本地化数据服务所有本地化的响应 Dto 都共享相同的属性 IE 我定义了一个接口 ILocalizedDto 来标记那些 Dto 在请求端有一个ILocalizedRequest对于需要本地化的请求 Using IPlugin
std::async 与重载函数

可能的重复 std bind 重载解析 https stackoverflow com questions 4159487 stdbind overload resolution 考虑以下 C 示例 class A public int f
Server.MapPath - 给定的物理路径，预期的虚拟路径

我正在使用这行代码 var files Directory GetFiles Server MapPath E ftproot sales 在文件夹中查找文件但是我收到错误消息说给定物理路径但虚拟路径预期的我对在 C 中使用 Sys
有没有办法强制显示工具提示？

我有一个验证字段的方法如果无法验证该字段将被清除并标记为红色我还希望在框上方弹出一个工具提示并向用户显示该值无效的消息有没有办法做到这一点并且可以控制工具提示显示的时间我怎样才能让它自己弹出而不是鼠标悬停时弹出 If the
检查Windows控制台中是否按下了键[重复]

这个问题在这里已经有答案了可能的重复 C 控制台键盘事件 https stackoverflow com questions 2067893 c console keyboard events 我希望 Windows 控制台程序在按下某个
如何使用 Word Automation 获取页面范围

如何使用办公自动化找到 Microsoft Word 中第 n 页的范围似乎没有 getPageRange n 函数并且不清楚它们是如何划分的这就是您从 VBA 执行此操作的方法转换为 Matlab COM 调用应该相当简单 Pub

随机推荐

是否可以/正确地在一个页面中以两种不同的形式使用多个 @Html.AntiForgeryToken() ？

我一直面临着严重的问题 Html AntiForgeryToken 我有一个注册控制器它有一个创建视图来创建注册新成员因此我使用了 Html AntiForgeryToken 在我的主提交表单中不使用任何 SALT 现在我想在用户名
在 mac 中总是出现 zsh: command not found: [关闭]

Closed 这个问题不符合堆栈溢出指南目前不接受答案我正在使用 z Shell zsh 而不是默认的 bash 并且发生了一些错误导致所有曾经有效的命令不再被识别 ls zsh command not found ls open e
R - ggplot - geom_bar 的圆形末端

这是我的条形图的一个简单示例 x lt data frame aa c 0 2 0 6 0 1 dd c 1 2 3 x lt melt x dd y lt data frame bb c 0 4 0 5 dd c 1 2 y lt mel
通过 Lambda 集成保护 AWS API 网关

我正在使用 API Gateway 创建一个公开可用的 API 该 API 由 lambda 函数支持来进行一些处理我使用自定义安全标头来保护它该标头实现带有时间戳的 hmac 身份验证以防止重放攻击据我了解 API Gateway
请求被中止：无法创建 SSL/TLS 安全通道

我的客户向我报告了他们的 SSL 和 Internet Explorer 的问题他们表示在访问该 URL 时会遇到信任问题我正在通过 HTTPS 访问 JSON 该网站位于一台服务器上我正在本地计算机上使用控制台应用程序我试图绕过
Discord.js 13channel.join不是一个函数

我最近安装了 Discord js 13 1 0 但我的音乐命令坏了因为显然 channel join 不是一个函数尽管我已经在 12 5 3 上使用它几个月了有人知道解决这个问题吗我的加入命令的某些部分 const channe
PyCharm 未将源根目录添加到“sys.path”

在 PyCharm 的运行配置中我检查了以下两项 Add content roots to PYTHONPATH Add source roots to PYTHONPATH 但我无法导入相对于我的源根目录的文件这是 PyCharm 的
numactl --physcpubind

我使用的是 numactl 带有 physcpubind 选项手册说 physcpubind cpus C cpus Only execute process on cpus Etc 假设我的 NUMA 系统有 3 个 NUMA 节点每
Android：用透明度覆盖图片（jpg）

I have a picture jpg that I want to display on the screen Additionally the picture should be covered partially by a tran
React.children.only 期望接收单个 React 元素子导航器

我尝试了太多的主题帮助但这并不能帮助我解决这个错误也许因为我是反应原生的新手这是给出错误的代码 render return
在哪里可以找到 Mac OS 的 jni 标头

我不是问在哪里可以找到它我自己的电脑我想问一下哪里可以买到我已经完成了谷歌作业但没有在这些路径中找到标题我的 System Library Java JavaVirtualMachines 中甚至没有 Header 文件夹而且我的
如何使 SecPKCS12Import 正确导入有效的 p12 文件

我已经解决了之前将 XML RSA 私钥转换为 PEM 文件的问题但遇到了另一个问题即在导入 P12 私钥时得到空数据以下是我的步骤将 PEM 文件转换为 P12 文件 openssl gt pkcs12 export in rsa
Javascript 拦截的“Ctrl+O”无法打开我的文件对话框

我有一个
嵌套的 app.config (web.config) 文件

是否可以有两个 app config 文件其中一个 app config 作为第二个嵌套 app config 文件的容器我想从外部文件引用嵌套文件的特定部分为什么我需要这个是因为源代码控制问题详细描述参见this 任何其他解决根
如何将 ko.validation 错误与相关视图模型字段名称联系在一起

我正在使用 Knockout Validation 我希望能够显示错误摘要其中每行显示错误消息显然以及与其相关的视图模型上的字段名称例如年龄请输入数字出生日期请输入正确的日期到目前为止我已经有了一个 validObser
Java中的前后自增

我只是想创建一个小小的 Java Puzzle 但我自己也感到困惑谜题的一部分是下面这段代码的作用是什么 public class test public static void main String args int i 1 i i
try、catch 和finally 的确切执行顺序是什么？

在这段java代码中 import java io IOException public class Copy public static void main String args if args length 2 System err
无法使用 SQL Server 管理控制台连接到远程 SQL 数据库（错误 53）

我已在防火墙上打开端口 1433 但每次尝试使用 SQL Server 管理控制台连接到远程 SQL 数据库时我都会收到 Microsoft SQL Server 错误 53 https social technet microsoft
如何在应用程序开始运行代码之前运行迁移？

我在 swift 应用程序中使用realm io 自从我有一个正在生产的应用程序以来这是我第一次必须运行迁移我更改了其中一个模型并为其添加了几个额外的字段我按照文档中的示例进行操作然后在不起作用时引用了 github 存储库的示例
为什么gcc不能内联可以确定的函数指针？

以下程序在 centos 上的 gcc 4 6 2 下使用 O3 编译 include

为什么gcc不能内联可以确定的函数指针？

为什么gcc不能内联可以确定的函数指针？ 的相关文章

随机推荐

热门标签

为什么gcc不能内联可以确定的函数指针？的相关文章