优化为除以众所周知,gcc 对常量进行了很好的优化:)
现在我想知道如何dividing常数被优化。 gcc 不能帮助我,clang 也是如此。
也许我不擅长搜索这些信息,但我找不到关于优化的材料除常数。 (相比之下,除以常数介绍得很好。)
#include <stdio.h>
int f(int x)
{
// can I optimize off the idiv opcode here?
return 33659/x;
}
int main()
{
int x;
scanf("%d", &x);
printf("%d", f(x));
return 0;
}
EDIT1:
#include <stdio.h>
#define DIVIDEND 33
void f ( unsigned int* arr, int n )
{
for ( int i = 0; i < n ; i++ )
{
arr[i] = DIVIDEND / arr[i];
}
}
int main()
{
const int n = 1024;
unsigned int buf[n];
for ( int i = 0; i < n; i++ )
{
scanf ( "%u", buf + i );
}
f ( buf, n );
for ( int i = 0; i < n; i++ )
{
printf ( "%d", buf[i] );
}
return 0;
}
优化为clang -O3 -march=native div.c -o div
仅展开循环,同时:
#include <stdio.h>
#define DIVIDEND 33
#define DIVISOR DIVIDEND
void f ( unsigned int* arr, int n )
{
for ( int i = 0; i < n ; i++ )
{
//arr[i] = DIVIDEND / arr[i];
arr[i] = arr[i] / DIVISOR;
}
}
int main()
{
const int n = 1024;
unsigned int buf[n];
for ( int i = 0; i < n; i++ )
{
scanf ( "%u", buf + i );
}
f ( buf, n );
for ( int i = 0; i < n; i++ )
{
printf ( "%d", buf[i] );
}
return 0;
}
使用相同的命令行将产生一堆可怕的 AVX2 代码。 (记住除以常数被重写为shift+mul+add,它可以向量化!)
编辑2:
感谢@user2722968!应用 RCPPS 将使程序运行得更快。
这是我使用 RCPPS 进行快速恒定股息除法的实验实现:
https://github.com/ThinerDAS/didactic-spoon/blob/master/div.c https://github.com/ThinerDAS/didactic-spoon/blob/master/div.c
但是,我不确定如何在不产生大量开销的情况下使其更准确。