BOOST_LIKELY 和 __builtin_expect 仍然相关吗？

2024-04-14

我明白所解释的内容here https://stackoverflow.com/questions/7346929/why-do-we-use-builtin-expect-when-a-straightforward-way-is-to-use-if-else这些还包括对 CPU 进行静态分支预测的提示。

我想知道这些在英特尔 CPU 上的相关性如何，因为如上所述，英特尔 CPU 已经放弃了对静态预测提示的支持here http://en.wikipedia.org/wiki/Branch_predictor#Static_prediction。另外，如果我现在了解它是如何工作的，路径中的分支指令的数量将是编译器可以控制的唯一东西，并且预测、获取和解码哪个分支路径是在运行时决定的。

鉴于此，是否存在代码中的分支提示对于针对最新英特尔处理器的软件仍然有用的情况，可能使用条件返回或在嵌套 if/else 语句的情况下避免关键路径中的分支指令数量？

另外，如果这些仍然相关，那么有关 gcc 和其他流行编译器的任何细节都值得赞赏。

附：我不赞成过早优化或用这些宏填充代码，但我对此主题很感兴趣，因为我正在处理一些时间关键的代码，并且仍然希望尽可能减少代码混乱。

Thanks

正如在您的问题的评论部分中您正确地发现：

Intel x86 CPU 上的操作码映射中不再有静态分支预测提示；
“冷”条件跳转的动态分支预测往往会预测失败路径；
编译器可以使用__builtin_expect重新排序 if-then-else 构造的路径将作为生成的程序集中的失败案例放置。

现在，考虑正在编译的代码库multiple目标架构，而不仅仅是 Intel x86。其中很多确实具有静态分支提示、不同复杂度的动态分支预测器，或两者兼而有之。

例如，英特尔安腾架构确实为所有类型的指令提供了广泛的预测提示系统：控制流、加载/存储等。安腾的设计目的是让编译器对代码进行广泛优化，并在其中包含所有这些静态分配的指令槽。捆绑包和提示。

所以，__builtin_expect仍然与以下（罕见）情况相关：1）编译器很难自动推导出正确的分支预测信息，2）至少一种目标架构上的底层硬件也已知无法可靠地动态预测它们。鉴于某些低功耗处理器包含不跟踪分支历史但始终选择失败路径的原始分支预测器，它开始看起来很有用。对于现代 Intel x86 硬件来说，情况并非如此。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

BOOST_LIKELY 和 __builtin_expect 仍然相关吗？的相关文章

使用 Easy 68K (68000) 组装范围内的随机数

我正在使用 Easy 68K 模拟器创建一个简单的黑杰克游戏需要使用随机数来分配牌我的牌必须在 2 到 11 的范围内我似乎每次都得到相同的数字但它不在我预期的范围内我的卡值需要以 D3 结束因此我有以下随机数代码 CLR L
无法运行bjam编译boost python教程

我正在尝试跟随本教程 http www boost org doc libs 1 55 0 libs python doc tutorial doc html python hello html关于为 Windows 的 python 包装
寄存器寻址模式与直接寻址模式

我在试卷中遇到过这个问题它指出哪种给定的寻址模式更快为什么寄存器寻址方式直接寻址方式现在根据我的说法寄存器寻址模式应该更快因为寄存器是计算机中最快的存储位置这是正确答案吗请帮忙谢谢两种寻址模式之间的区别是地址的来源
分析 ELF 部分和符号大小的工具

我需要一种方法来分析 ARM 的 GCC 编译器的输出文件我正在为裸机进行编译并且我非常关心大小我可以用arm none eabi objdump由交叉编译器提供但如果存在用于此任务的工具则解析输出并不是我渴望做的事情您知道存在
如何在编译C代码时禁用警告？

我正在使用 32 位 Fedora 14 系统我正在使用编译我的源代码gcc 有谁知道如何在编译c代码时禁用警告 EDIT 是的我知道最好的办法是修复这些警告以避免任何未定义未知的行为但目前在这里我第一次编写了巨大的代码并且在
在 Linux 上将 libquadmath 与 C++ 链接

我有一个示例代码 include
使用 Boost program_options 指定级别（例如 --verbose）

我的一些选择有多个级别例如的冗长我希望我的用户在以下两种等效样式之间进行选择 no argument verbosity of 1 my program v count the v s verbosity of 4 my progra
后缀和前缀运算符作为函数参数 - 为什么会发生这种情况？ [复制]

这个问题在这里已经有答案了在执行以下简单的 C 程序时我发现了一个非常有趣的事实 include
为什么我的空循环在 Intel Skylake CPU 上作为函数调用时运行速度是原来的两倍？

我正在运行一些测试来比较 C 和 Java 并遇到了一些有趣的事情在 main 调用的函数中而不是在 main 本身中运行具有优化级别 1 O1 的完全相同的基准代码导致性能大约翻倍我正在打印 test t 的大小以毫无疑问地验
AVX-512CD（冲突检测）与原子变量访问有何不同？

所以我在看他们展示了如何 void Histogram const float age int const hist const int n const float group width const int m const float o
如何在 Linux x86_64 上模拟 iret

我正在编写一个基于 Intel VT 的调试器由于当 NMI Exiting 1 时 iret 指令在 vmx guest 中的性能发生了变化所以我应该自己处理vmx主机中的NMI 否则 guest会出现nmi可重入错误我查了英特尔手
在 boost 元组、zip_iterator 等上使用 std::get 和 std::tie

我有哪些使用选择std get lt gt and std tie lt gt 与增强结构一起例子我想使用基于范围的 for 循环在多个容器上进行迭代我可以实施zip函数它使用boost zip iterator include
无法将 C 代码链接到 lapack / blas：未定义的引用

我已经尝试了好几个小时了这让我发疯我得到的最后一个错误是 demo cblas c text 0x83 undefined reference to clapack sgetrf demo cblas c text 0xa3 undef
如何在 Debian 上编译 DOS 程序？

在我的汇编语言课程中我们使用 DPMI 编写 DOS 程序不幸的是我无法一直使用 32 位 Windows 机器我在我使用的几乎每台计算机上都安装了 Debian 虚拟机我已经安装了 DOSBox 和 DOSEMU 有什么办法可以
为什么 ld 无法从 /etc/ld.so.conf 中的路径找到库？

我想添加 opt vertica lib64进入系统库路径所以我执行以下步骤 1 添加 opt vertica lib64 into etc ld so conf 然后运行ldconfig 2 检查 bash ldconfig p gre
为什么如果内存组织为字，则程序计数器加 1；如果内存组织为字节，则程序计数器加 2？

如果在计算机中一条指令是 16 位并且如果存储器被组织为 16 位字则通过在当前指令的地址中加 1 来计算下一条指令的地址如果内存是按字节组织的可以单独寻址那么我们需要在当前指令地址上加二得到顺序执行的下一条指令的地址为什么会
错误：“uint16_t”未声明？ [复制]

这个问题在这里已经有答案了我有代码 include
boost::algorithm::join 的一个很好的例子

我最近想用提升算法加入 http www boost org doc libs 1 41 0 doc html string algo reference html header boost algorithm string join
从模板类创建对象时出错

我一直在尝试找到一种方法从 C 中的多元正态分布中采样随机向量同时具有均值向量和协方差矩阵就像 Matlab 的那样mvnrnd功能有效我找到了实现此功能的类的相关代码这一页 http lost found wandering bl
gcc 中的“假设”子句

gcc 最新版本 4 8 4 9 是否有类似于以下的假设子句 assume 内置icc支持吗例如 assume n 8 0 从 gcc 4 8 2 开始 gcc 中没有 assume 的等效项我不知道为什么这会非常有用马夫索建议

随机推荐

Rails 会话中存储的对象变成了字符串？

通常我不会在 Rails 会话中存储对象但我正在使用需要此功能的库我遇到了一个非常奇怪的问题其中存储的对象在重定向后显示为字符串为了重现我创建了一个示例 Rails 4 1 应用程序 rails new session test
如何编写从配置文件中获取值的自定义正则表达式验证器？

我必须在模型中对用户名属性使用正则表达式验证器我从配置文件中获取这个正则表达式 RegularExpression UsernameValidationExpression UsernameValidationExpression val
如何在打字中安装express？

我正在尝试在我的应用程序中使用expressjs 安装后使用typings install express ambient save I run tsc 但我收到两个错误 types main ambient express index d
使用 OpenCV 对非正面图像进行人脸检测

我正在尝试使用 opencv 来检测人脸脸部不是正面相机从侧面拍摄脸部因此只能看到一只眼睛和部分嘴巴我尝试了具有多种配置的 HaarDetectObjects 但没有获得任何好处我改变了级联并进行了测试 haarcascade f
在折线图中的特定点添加标记

我正在绘制一个绘图线图并希望使用标记突出显示线图上的特定点其中数据框中的另一列不是 NA 此外当我将鼠标悬停在绘图上时我只想查看位于标记点上的 y 值而不是绘图的其余部分这是一个可重现的示例到目前为止我已经尝试做到这一点 li
使用 Python 检测 OpenCV 中的线条和形状

我一直在使用 OpenCV cv2 并检测线条和形状假设我女儿画了一幅图画如下所示我正在尝试编写一个Python脚本来分析绘图并将其转换为硬线条形状例如话虽这么说我已经安装了 opencv 并尝试使用它但除了能够在图像中绘制
如何设置扭曲的日志记录级别？

我正在使用带有twisted的autobahn包它会在每次连接到websocket时显示调试消息我尝试将日志记录级别切换为信息但没有成功 import logging logging basicConfig level logging
如何通过 Java 运行我的 haskell 函数

假设我有一个 haskell 函数add in math hs 我怎样才能运行add通过Java程序运行函数并将输出存储为变量也许像下面这样 public int runHaskell String haskellFile int out
如何在 MATLAB 中编写向量化函数

我刚刚学习MATLAB 我发现很难理解循环与矢量化函数的性能因素在我之前的问题中 MATLAB 中的嵌套 for 循环非常慢预分配 https stackoverflow com q 7811239 518169我意识到使用向量化函数与
从传递给 C# 的 F# 列表中检索项目

我在 C 中有一个在 F 中调用的函数将其参数传递到Microsoft FSharp Collections List 如何从 C 函数中的 F 列表中获取项目 EDIT 我找到了一种函数式风格的方式来循环它们并且可以将它们传递给如
docker-compose 构建镜像或构建上下文[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我想构建自定义 Dockerfile 但我收到以下消息 gt Starting build app ERROR The Compose f
iText 列表项或 JTextArea 中的行间距

我需要在 GUI 中同步 PDF 列表项和 JTextArea 的行距我可以通过调整其中之一来做到这一点在列表项或 JTextArea 超过一行在 JTextArea 中将换行设置为 true 之前这一切都运行良好我可以调整两个
根据属性检查 firebase 是否存在现有对象，防止重复

我想检查我的 firebase 看看我是否已经存储了一个与两个属性匹配的对象为了将这个问题放在上下文中想象一个仅存储歌曲的应用程序具有艺术家和歌曲名等属性如下所示 var wishlist new Firebase http
在 Windows 10 家庭版 docker-compose.yml 文件中设置卷

尝试设置 docker 以便当我在 Windows 计算机上更改项目文件时它们会在我的 docker 容器中更新从这个问题 https stackoverflow com questions 41925212 changing my p
如何按日期在 R 中对大型数据框 (ffdf) 进行子集化？

我正在尝试按日期对 FFDF 进行子集化下面我使用普通数据框成功创建了这样的子集但我需要一些帮助才能将其应用到 FFDF 我的尝试以及错误消息都列在代码注释中提前谢谢了 Create a normal data frame in p
如何保持片段视图状态？

我对碎片系统有疑问我有两个片段例如A and B 如果我搬家A to B Navigation findNavController v navigate R id B Now A片段 onDestroyView 被称为我知道这是正常的
使用 Imagick 将图像从 RGB 转换为 CMYK

我正在尝试将 RGB 图像转换为 CMYK 因为它们需要打印我正在使用这段代码
JavaScript 中 /// 是什么意思？

双正斜杠是 JavaScript 中的注释但是三重正斜杠是什么意思意思是我问的原因是当我删除具有以下内容的行时代码会中断这让我相信不是评论可能是一个参考指令 https stackoverflow com questions
使用 Bluebird 进行 Mongoose 承诺的正确方法是什么？

我一直在阅读文档和文章每个人似乎都描述了一起使用 Mongoose 和 Bluebird 的不同方式甚至 Mongoose 官方文档说了些什么 http mongoosejs com docs promises html蓝鸟文档说另一件
BOOST_LIKELY 和 __builtin_expect 仍然相关吗？

我明白所解释的内容here https stackoverflow com questions 7346929 why do we use builtin expect when a straightforward way is to us

BOOST_LIKELY 和 __builtin_expect 仍然相关吗？

BOOST_LIKELY 和 __builtin_expect 仍然相关吗？ 的相关文章

随机推荐

热门标签

BOOST_LIKELY 和 __builtin_expect 仍然相关吗？的相关文章