ICC 与 GCC - 优化和 CPU 架构

2023-11-27

我有兴趣了解 GCC 在优化级别和迎合特定处理器架构方面与英特尔的 ICC 有何不同。我正在使用适用于 Linux 的 GCC 4.1.2 20070626 和 ICC v11.1。

ICC 的优化级别（O1 到 O3）与 GCC 有何不同（如果有的话）？

ICC 能够专门满足不同的体系结构（IA-32、intel64 和 IA-64）。我读到 GCC 有-march我认为类似的编译器选项，但我找不到要使用的选项列表。我使用的是 64 位 Intel Xeon X5570。我可以使用任何其他 GCC 编译器选项来满足我的 64 位 Intel CPU 的应用程序的需求吗？

icc -O2 -unroll2大致相当于gcc -O3 -ffast-math -fno-cx-limited-range -funroll-loops --param max-unroll-times=2
gcc -O1 不会为任一编译器启用 SIMD 自动矢量化，因此差异较小。

没有选项的 ICC 默认启用优化并且-fp-model=fast=1（比gcc -ffast-math），但 GCC 默认为-O0。（还-fno-fast-math即使gcc -O3. Only gcc -Ofast启用像 ICC 默认值一样的快速数学。）

-march=native是使用构建机器的完整指令集的 GCC 选项。国际商会支持-march=native相当于自己的-xHost选项。在提出这个问题时，该 ICC 选项可能仅适用于 Intel CPU。

GCC 可以配置为-m64 or -m32作为默认值，但同一编译器可以编译任一位数的二进制文件。 ICC 提供单独构建的编译器以针对 64 位或 32 位模式；如果两者都安装了，icc 希望您通过获取其路径设置脚本来进行选择。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ICC 与 GCC - 优化和 CPU 架构的相关文章

无法将 C 代码链接到 lapack / blas：未定义的引用

我已经尝试了好几个小时了这让我发疯我得到的最后一个错误是 demo cblas c text 0x83 undefined reference to clapack sgetrf demo cblas c text 0xa3 undef
程序集比较标志理解

我正在努力理解汇编程序中的以下代码片段 if EAX gt 5 EBX 1 else EBX 2 在汇编程序中可以写如下根据我的书模拟jge操作说明 https www felixcloutier com x86 jcc您通常会使用
为什么 ld 无法从 /etc/ld.so.conf 中的路径找到库？

我想添加 opt vertica lib64进入系统库路径所以我执行以下步骤 1 添加 opt vertica lib64 into etc ld so conf 然后运行ldconfig 2 检查 bash ldconfig p gre
C 中的 N 依赖注入 - 比链接器定义的数组更好的方法？

Given a 库模块在下文中称为Runner 它作为可重复使用的组件无需重新编译即静态链接库中应用程序分区架构的而不是主分区请注意它仅包含main 出于演示目的 Given a set 顺序无关调用的其他模块对象Call
带有适用于 MS-Windows 的工具链的预构建 MIPS 交叉编译器

我在我的 Linux 机器上使用 MIPS 交叉编译器效果很好现在我需要在 Windows 上编译相同的应用程序我正在网上搜索一些适用于 MS Windows 的预构建 MIPS 交叉编译器带有工具链但没有成功由于我不确定该怎么
INT_MIN % -1 是否会产生未定义的行为？

gcc 生成浮动代码引发SIGFPE对于以下代码 include
如何将输入传递到扩展汇编中？

考虑这段代码来自我的先前的问题 https stackoverflow com questions 37955538 segfault on movq instruction int main asm movq 100000000 rcx
无法执行'x86_64-conda_cos6-linux-gnu-gcc'：没有这样的文件或目录（pysam安装）

我正在尝试安装 pysam 执行后 python path to pysam master setup py build 这个错误的产生是 unable to execute x86 64 conda cos6 linux gnu gcc
linux x86 汇编语言 sys_read 调用的第一个参数应为 0 (stdin)

我正在编写一个简单的汇编程序来从标准输入读取如 scanf 这是我的代码 section bss num resb 5 section txt global start start mov eax 3 sys read mov ebx 0
X86 预取优化：“计算 goto”线程代码

我有一个相当重要的问题我的计算图有循环和多个计算路径我没有制作一个调度程序循环其中每个顶点将被一一调用而是将所有预先分配的框架对象放置在堆中代码数据这有点类似于线程代码甚至更好 CPS 只是在堆中跳转执行代码每个代
Visual Studio 2012 本机 C++ DLL x86 编译

我最近将我的工具集从 Win 7 x86 Visual Studio 2010 升级到 Win 8 x64 Visual Studio 2012 但是现在我的本机 C dll 编译为 x64 而不是 x86 除了将代码移至新操作系统并将其
在 x86 程序集中存储大量布尔值的最佳方法是什么？

最近我一直在处理充满布尔值的大型数组目前我将它们存储在 bss部分有一个 space指令它允许我创建字节数组但是由于我只需要存储布尔值因此我希望从数组中逐位读取和写入数据目前我能想到的最好方法是有一个 space指令所需存储
为什么我的代码显示垃圾？

当我也想打印列表中的每个数字时我的代码显示垃圾有什么问题吗输出应如下所示给定的数组是 2G 4 PT为什么这是垃圾总数是 7 Code ASSUME CS CODE DS DATA SS STK ORG 0000H DATA SEG
为什么 Linux perf 使用事件 l1d.replacement 来处理 x86 上的“L1 dcache misses”？

在英特尔 x86 上 Linux用途 https stackoverflow com a 52172985 149138事件l1d replacements来实施其L1 dcache load misses event 该事件定义如下计数
clang 是否提供类似于 GCC 6.x 的函数多版本控制 (target_clones) 的功能？

我读了这篇 LWN 文章 https lwn net Articles 691932 饶有兴趣执行摘要 GCC 6 x 支持所谓的函数多版本控制它可以构建同一函数的多个版本并针对不同的指令集进行优化假设您有一台支持 AVX2 的机器
gcc 与 clang：符号剥离

gcc 和 AMD Open64 opencc 都有一个 s选项剥离符号表和重定位信息到目前为止我还没能在 Clang LLVM 中找到相同的选项它存在吗您可以使用stripbinutils 中的实用程序实际上 llvm ld 有
为什么 printf 使用浮点和整数格式说明符打印随机值

我在64位机器上写了一个简单的代码 int main printf d 2 443 所以这就是编译器的行为方式它将识别第二个参数为双精度型因此它将在堆栈上压入 8 个字节或者可能只是在调用之间使用寄存器来访问变量 d需要 4 字节整
汇编器8086将32位数字除以16位数字

我尝试将 32 位数字除以 16 位数字例如 10000000h 除以 2000h 根据我尝试做的设计除以右 4 位数字除以除数然后左 4 位数字除以除数这是我的代码 DATA num dd 10000000h divisor dw
要求编译器发出无分支/恒定时间代码

在密码学中任何依赖于秘密数据例如私钥的代码都必须在恒定时间内执行以避免侧信道定时攻击 https en wikipedia org wiki Timing attack 目前最流行的架构 x86 64 和 ARM AArch64 都
Grub 和进入实模式（低级汇编语言编程）

我一直在开发一个玩具操作系统并一直使用 grub 作为我的引导加载程序最近尝试使用 VGA 时我发现无法使用硬件中断我发现这是因为我被 grub 置于保护模式有人知道如何在不删除 grub 的情况下回到实模式吗如果您使用 GRU

随机推荐

重置 C/C++ 预处理器 #line 物理文件/行

我有一个代码生成器它将获取一些用户编写的代码并将其块嵌入到更大的生成文件中我希望底层编译器在用户代码中存在缺陷时提供良好的诊断但我也不希望生成的代码中的缺陷在不应该的情况下被错误地归因于源代码我打算发射 line lineNum s
从不同数据框中的Excel读取多个选项卡

我正在尝试将电子表格中的多个选项卡读取到不同的数据帧一旦所有带有数据的选项卡都结束程序就应该停止对于第一部分我想做类似的事情 xls pd ExcelFile Unique xlsx for i in range 1 n n sho
在groovy中创建Arraylist和Hashmap有哪些不同的方法

我创建了一个如下所示的 ArrayList def list new ArrayList 但 Codenarc 报告警告如下 ArrayList objects are better instantiated using the form
WebView拒绝显示图像

我读过很多关于这个问题的帖子其中大部分都是旧的所以我正在创建一个新的帖子从 React Native v0 61 5 开始我的问题我正在检索网页及其引用的文件将它们写入应用程序的文档文件夹并尝试将它们加载到 WebView 中
如何在Checkstyle中检查“局部变量/字段的值未使用”？

如何检查The value of the local variable is not used and The value of the field is not used使用检查样式 Eclipse 中有一个关于此的警告但Checkst
我如何知道我的系统支持哪个opengl版本

看一下这个非常基本的 C 代码 if glfwInit return 1 glfwWindowHint GLFW SAMPLES 4 glfwWindowHint GLFW CONTEXT VERSION MAJOR 3 glfwWindo
Android 权限（我们在清单文件中定义）与相应 API 调用/方法之间的映射

在哪里可以找到 Android 权限我们在清单文件中定义与相应 API 调用方法之间的映射例如 GET ACCOUNTS is a permission type which maps to getAccountsByType ge
“导入模块”是否比“从模块导入函数”更好的编码风格？

Let from module import function称为 FMIF 编码风格 Let import module称为 IM 编码风格 Let from package import module称为 FPIM 编码风格为什么 I
具有多线程服务的数据库连接池

我有一个 NET 4 C 服务它使用 TPL 库进行线程处理我们最近将其切换为也使用连接池因为一个连接正在成为处理的瓶颈以前我们使用 lock 子句来控制连接对象上的线程安全当工作备份时队列将作为任务存在并且许多线程任务
从没有虚拟析构函数的类继承

我一直听说你不应该从没有虚拟析构函数的类继承并且我没有太注意因为我只是不经常使用继承即使您不想使用多态性但您只想要类的所有功能并且想要添加更多功能此规则是否也适用具体来说只要我不以多态方式使用以下类它是否安全且具有明确定义
将 Boost FileSystem3 迭代器转换为 const char*

我正在使用 Boost FileSystem 3 循环遍历目录中的某些文件我需要将文件名转换为另一个库的 char 不幸的是我的 C foo 缺少任何人都可以帮忙吗 int main int argc char argv path p
编写每 5 分钟执行一次的 python 脚本

我需要编写一个 python 脚本该脚本在启动时自动启动并在树莓派上每 5 分钟执行一次如何才能做到这一点特别是如何避免脚本锁定运行无限循环的 cpu 等待 5 分钟结束您可以轻松使用cron用于此任务安排运行 Python
强制具有特定注释的方法具有特定参数/签名

我有一个注释 import java lang annotation ElementType import java lang annotation Retention import java lang annotation Retenti
Android：让 WebView 显示位图的最简单方法？

我有一些从存储在位图变量中的远程源加载的图像我想显示它们除了在这些图像之间切换之外用户还应该能够缩放和平移它们我的第一个想法是以某种方式通过意图将它们传递到内置图库应用程序但这似乎不可能在多个地方建议的解决方案是使用 WebVi
检测是否支持事件监听器

是否可以检测某些浏览器是否支持某些事件我可以检测浏览器是否支持document addEventListener 但我需要知道它是否支持该事件DOMAttrModified Firefox 和 Opera 支持它但 Chrome 和其他
javax.net.ssl.SSLProtocolException：证书链长度 (11) 超出允许的最大长度 (10)

我很挣扎因为我的 java MVC Web 应用程序在尝试创建具有特定 https 地址的 WebService 时开始抛出异常 https barramento caixa gov br sibar ManutencaoCobranca
如何从 C# 调用 JavaScript - Cordova/PhoneGap

我正在使用 cordova phonegap 制作一个 Windows Phone 应用程序我试图在事件触发时从 C 调用脚本有办法做到这一点吗到目前为止这是我的课程 public void register string opti
如何从Spring Batch Processor process()方法向Spring Batch作业启动方法抛出异常？

我有 Web 服务方法来启动 Spring Batch 作业如果 Spring Batch 处理中发生任何异常控制将返回到处理器处理方法但我需要控制器返回到网络服务方法我必须捕获并编码以通过电子邮件发送该异常网络服务方法 publ
如何在 Mac OSX 上轻松切换 PHP 版本？

我想在 PHP 5 3 到 PHP 8 2 上测试我的应用程序在哪里以及如何安装版本以及如何通过运行小脚本来切换它们如果您安装了两个版本的 PHP 则可以使用以下命令在版本之间切换link and unlink brew命令例如在
ICC 与 GCC - 优化和 CPU 架构

我有兴趣了解 GCC 在优化级别和迎合特定处理器架构方面与英特尔的 ICC 有何不同我正在使用适用于 Linux 的 GCC 4 1 2 20070626 和 ICC v11 1 ICC 的优化级别 O1 到 O3 与 GCC 有何不同

ICC 与 GCC - 优化和 CPU 架构

ICC 与 GCC - 优化和 CPU 架构 的相关文章

随机推荐

热门标签

ICC 与 GCC - 优化和 CPU 架构的相关文章