理解内联 asm 的关键是理解每个 asm 语句都有两部分:
-
实际汇编器内容的文本,编译器将在其中进行文本替换,但是不明白.
这是汇编模板在文档中(直到第一个的所有内容:
in the __asm__()
).
-
汇编器的作用的描述,就编译器而言确实明白.
这就是: OutputOperands : InputOperands : Clobbers
in 文档 https://gcc.gnu.org/onlinedocs/gcc/Extended-Asm.html.
这必须告诉编译器汇编器如何适应编译器围绕它生成的所有代码。代码生成忙于分配寄存器来保存值、决定执行操作的顺序、将操作移出循环、消除未使用的代码片段、丢弃不再需要的值等等。
实际的汇编器是一个黑匣子,它接受此处描述的输入,产生所描述的输出,并且副作用可能会“破坏”一些寄存器和/或内存。这must是汇编器功能的完整描述...否则编译器在模板周围生成的汇编语言将与其发生冲突并依赖于错误的假设。
有了这些信息compiler可以决定汇编器可以使用哪些寄存器,并且您应该让它这样做。
所以,你的片段:
asm volatile(
"movq %0 , %%rax\n"
"rol %%rax\n"
"rol %%rax\n"
:"=r"(X)
:"r"(X)
);
有几个“问题”:
除此之外,一切都很棒。以下是安全的,并且避免了mov
操作说明:
asm("rol %0\n"
"rol %0\n" : "+r"(X));
where "+r"(X)
表示需要一个组合的输入和输出寄存器,取旧值X
并退回一件新的。
现在,如果您不想更换X
,然后假设Y
是结果,你可以:
asm("mov %1, %0\n"
"rol %0\n"
"rol %0\n" : "=r"(Y) : "r"(X));
但最好让编译器来决定是否需要mov
或者是否可以让输入被销毁。
有几条规则输入操作数值得一提的是:
在上面,如果你实际上没有使用X
编译器可以再次分配%0
and %1
到同一个寄存器!但是(多余的)mov
仍然会被汇编——记住编译器真的不理解汇编模板。所以,一般来说,你最好在 C 中调整值,而不是在 C 中调整值。asm()
. See https://gcc.gnu.org/wiki/DontUseInlineAsm https://gcc.gnu.org/wiki/DontUseInlineAsm and C++ 循环移位(旋转)操作的最佳实践 https://stackoverflow.com/q/776508
所以这里有一个主题的四种变体,以及生成的代码(gcc -O2):
// (1) uses both X and Y in the printf() -- does mov %1, %0 in asm()
void Never_Inline footle(void) Dump of assembler code for function footle:
{ mov $0x492782,%edi # address of format string
unsigned long X, Y ; xor %eax,%eax
mov $0x63,%esi # X = 99
X = 99 ; rol %rsi # 1st asm
__asm__("\t rol %0\n" rol %rsi
"\t rol %0\n" : "+r"(X) mov %rsi,%rdx # 2nd asm, compiler using it as a copy-and-rotate
) ; rol %rdx
rol %rdx
__asm__("\t mov %1, %0\n" jmpq 0x4010a0 <printf@plt> # tailcall printf
"\t rol %0\n"
"\t rol %0\n" : "=r"(Y) : "r"(X)
) ;
printf("%lx %lx\n", X, Y) ;
}
// (2) uses both X and Y in the printf() -- does Y = X in 'C'
void Never_Inline footle(void) Dump of assembler code for function footle:
{ mov $0x492782,%edi
unsigned long X, Y ; xor %eax,%eax
mov $0x63,%esi
X = 99 ; rol %rsi # 1st asm
__asm__("\t rol %0\n" rol %rsi
"\t rol %0\n" : "+r"(X) mov %rsi,%rdx # compiler-generated mov
) ; rol %rdx # 2nd asm
rol %rdx
Y = X ; jmpq 0x4010a0 <printf@plt>
__asm__("\t rol %0\n"
"\t rol %0\n" : "+r"(Y)
) ;
printf("%lx %lx\n", X, Y) ;
}
// (3) uses only Y in the printf() -- does mov %1, %0 in asm()
void Never_Inline footle(void) Dump of assembler code for function footle:
{ mov $0x492782,%edi
unsigned long X, Y ; xor %eax,%eax
mov $0x63,%esi
X = 99 ; rol %rsi
__asm__("\t rol %0\n" rol %rsi
"\t rol %0\n" : "+r"(X) mov %rsi,%rsi # redundant instruction because of mov in the asm template
) ; rol %rsi
rol %rsi
__asm__("\t mov %1, %0\n" jmpq 0x4010a0 <printf@plt>
"\t rol %0\n"
"\t rol %0\n" : "=r"(Y) : "r"(X)
) ;
printf("%lx\n", Y) ;
}
// (4) uses only Y in the printf() -- does Y = X in 'C'
void Never_Inline footle(void) Dump of assembler code for function footle:
{ mov $0x492782,%edi
unsigned long X, Y ; xor %eax,%eax
mov $0x63,%esi
X = 99 ; rol %rsi
__asm__("\t rol %0\n" rol %rsi
"\t rol %0\n" : "+r"(X) rol %rsi # no wasted mov, compiler picked %0=%1=%rsi
) ; rol %rsi
jmpq 0x4010a0 <printf@plt>
Y = X ;
__asm__("\t rol %0\n"
"\t rol %0\n" : "+r"(Y)
) ;
printf("%lx\n", Y) ;
}
希望这能演示编译器忙于将值分配给寄存器,跟踪需要保留的值,最小化寄存器/寄存器移动,并且通常很聪明。
所以诀窍是与编译器一起工作,了解:
输出操作数:
输入操作数:
Clobbers是您描述汇编器正在做什么的地方。