GCC 发出 ARM idiv 指令(续)

2024-01-25

我想知道这对于 Krait 400 CPU 是否可行。我遵循了一些建议here https://stackoverflow.com/questions/15782089/gcc-to-emit-arm-idiv-instructions

当我使用 mcpu=cortexa15 进行编译时,代码会编译并有效地在程序集转储中看到 udiv 指令。

不过,我想知道:

  1. 是否可以让它与 March=armv7-a 一起工作? (不指定CPU;这就是我最初的方式)
  2. 我尝试使用 mcpu=krait2,但由于我没有使用 snapdragon llvm(我还不知道这需要多少努力),所以它无法识别它。是否可以从 llvm 获取 cpu 定义并以某种方式使其可供我的编译器使用?
  3. 还有其他方法/补丁/技巧吗?

我的编译器选项如下:

 /development/android-ndk-r8e/toolchains/arm-linux-androideabi-4.7/prebuilt/linux-x86_64/bin/arm-linux-androideabi-gcc  -DANDROID -DNEON -fexceptions -Wno-psabi --sysroot=/development/android-ndk-r8e/platforms/android-14/arch-arm -fpic -funwind-tables -funswitch-loops -finline-limit=300 -fsigned-char -no-canonical-prefixes -march=armv7-a -mfloat-abi=softfp -mfpu=neon -fdata-sections -ffunction-sections -Wa,--noexecstack  -marm -fomit-frame-pointer -fstrict-aliasing -O3 -DNDEBUG

我得到的错误是:

Error: selected processor does not support ARM mode `udiv r1,r1,r3'

作为旁注,我不得不说我才刚刚开始理解整个计划,因此我想将其分成小步骤来理解我在做什么。

提前致谢。

EDIT 1:

我尝试编译一个仅包含 udiv 指令的单独模块。该模块是使用 -mcpu=cortex-a15 参数编译的,而应用程序的其余部分是使用 -march=armv7-a 参数编译的。结果是(不知何故预期)函数调用开销影响了应用程序的时间性能。我无法获得内联代码,因为尝试获得内联导致了与最初相同的错误。在尝试重新发明轮子之前,我会切换到 Snapdragon,看看是否有更好的性能。感谢大家的回答和提示。


idiv- 表示两者的混合体sdiv and udiv支持是可选的Cortex-A操作说明。的支持Cortex-A可以通过以下方式查询ID_ISAR0cp15 寄存器,位 [27:24]。

  /* Get idiv support. */
  unsigned int ISAR0;
  int idiv;
  __asm ("mrc 15, 0, %0, c0, c2, 0" :"=r" (ISAR0));
#ifdef __thumb2__
  idiv = (ISAR0 & 0xf000000UL) ? 1 : 0;
#else
  idiv = (ISAR0 & 0xf000000UL) == 0x2000000UL ? 1 : 0;
#endif

位[27:24]是0001,如果只有thumb2支持udiv and sdiv指示。如果位[27:24]是0010,则两种模式都支持该指令。

作为 gcc 标志-march=armv7-a等意味着代码应该可以工作ALL这种类型的 CPU 和该指令是可选的,gcc 发出该指令将是一个错误。

您可以使用不同的标志编译不同的模块,例如,

gcc -march=armv7-a -o general.o -c general.c 
gcc -mcpu=cortex-a15 -D_USE_IDIV_=1 -o fast_idiv.o -c fast_div.c 

这些模块可以链接在一起,并且上述代码可用于在运行时选择适当的例程。例如,两个文件可能都有,

  #include "fir_template.def"

这个文件可能有,

#ifdef _USE_IDIV_
  #define _FUNC(x) idiv_ ## x
#else
  #define _FUNC(x) x
#endif

int _FUNC(fir8)(FILTER8 *filter, SAMPLE *data,)
{
   ....
}

如果您知道您的代码只能在皮质-a15,然后使用-mcpu选项。如果你想让它运行得更快IF它可以并且是通用的(支持所有armv7-a CPU),那么您必须如上所述ID CPU并动态选择代码。

附录:上面的文件(通用.c and fast_idiv.c) 可以放入具有相同 API 的单独共享库中。然后审问/proc/cpuinfo看看是否idiv是支持的。设置LD_LIBRARY_PATH (or dlopen()) 到适当的版本。选择将取决于涉及的代码量。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

GCC 发出 ARM idiv 指令(续) 的相关文章

随机推荐