__builtin_expect
是GCC编译器提供的一个内置函数,用于告诉编译器一个分支的执行概率,以便编译器在生成机器码时进行优化。它的语法如下:
__builtin_expect (long exp, long c)
其中,exp
是一个表达式,c
是一个常量。__builtin_expect
的返回值是exp
的值,但是编译器会根据c
的值来优化代码,使得exp
的执行更加高效。
__builtin_expect
的使用背景是,现代CPU的分支预测机制可以预测分支的执行概率,从而提高程序的执行效率。但是,如果分支的执行概率与预测不符,就会导致CPU的流水线被清空,从而降低程序的执行效率。因此,为了让CPU的分支预测机制更加准确,我们可以使用__builtin_expect
来告诉编译器一个分支的执行概率,从而让编译器生成更加优化的机器码。
具体来说,如果一个分支的执行概率很高,编译器会将这个分支的代码放在CPU的指令缓存中,从而加速分支的执行。如果一个分支的执行概率很低,编译器会将这个分支的代码放在CPU的指令缓存之外,从而避免浪费CPU的指令缓存。
一般使用的话我们需要封装一下宏
#ifdef __GNUC__
# define SDK_LIKELY(x) __builtin_expect(!!(x), 1)
# define SDK_UNLIKELY(x) __builtin_expect(!!(x), 0)
#else
# define SDK_LIKELY(x) (x)
# define SDK_UNLIKELY(x) (x)
#endif
下面是一个demo
#include <iostream>
#include <chrono>
int main() {
auto start = std::chrono::high_resolution_clock::now();
int sum = 0;
for (int i = 0; i < 100000000; ++i) {
if (SDK_LIKELY(i % 2 == 0)) {
sum += i;
} else {
sum -= i;
}
}
auto end = std::chrono::high_resolution_clock::now();
std::cout << "Sum: " << sum << "\n";
std::cout << "Time: " << std::chrono::duration_cast<std::chrono::milliseconds>(end - start).count() << "ms\n";
return 0;
}
该代码耗时215ms
不加SDK_LIKELY耗时219ms,提升效果不是很明显
需要注意的是:
__builtin_expect
指令只有在分支的执行概率与预测不符的情况下才能提高程序的执行效率。如果分支的执行概率与预测相符,那么__builtin_expect
指令就没有任何作用。因此,如果程序中的分支都已经被CPU的分支预测机制正确预测了,那么使用__builtin_expect
指令也无法提高程序的执行效率。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)