compileroptimization

没有编译器优化的 SSE 内在函数

我是 SSE 内在函数的新手并尝试通过它来优化我的代码这是我的程序用于计算等于给定值的数组元素我将代码更改为 SSE 版本但速度几乎没有改变我想知道我是否以错误的方式使用SSE 此代码用于不允许我们启用编译器优化选项的分配无

c compileroptimization SIMD SSE

pow 函数中发生了什么？

我在这里看到了各种描述奇怪行为的答案powC 中的函数但我在这里有一些不同的问题要问在下面的代码中我已经初始化了int x pow 10 2 and int y pow 10 n int n 2 在第一种情况下当我打印它显示的结果时1

c gcc compileroptimization pow gcc49

加快 Xcode Swift 构建时间

随着我的项目在过去一年中不断增长其构建时间也不断增长在过去的几个月里它从 4 分钟缩短到了 7 分钟左右时间包括 GitHub 拉取单元测试等我调查过 Xfrontend debug time function bodies找到

swift xcode compileroptimization compiletime

Python 是否优化循环中的函数调用？

假设我有一段代码它从循环中调用某个函数数百万次并且我希望代码能够快速运行 def outer function file for line in file inner function line def inner function l

python Optimization compileroptimization

未定义的行为追溯是否意味着不能保证早期可见的副作用？

在 C 中如果我正确理解措辞编译器可以假设不会发生 UB 从而影响将遇到 UB 但尚未遇到的执行路径中的行为甚至是 I O 等可见的副作用在抽象机遇到 UB 之前 C 是否需要正确执行程序直至最后可见的副作用编译器似乎以这种方

c gcc languagelawyer compileroptimization undefinedbehavior

程序员什么时候使用空基优化（EBO）

我正在阅读有关空基优化 EBO 的内容阅读过程中我的脑海中浮现出以下问题使用空类作为基类有什么意义它对派生类没有任何贡献无论是功能方面还是数据方面 In 我读到了这个 S为空类结构 T S 整数x 请注意我们没有丢失任何数据或代

c class Optimization memorymanagement compileroptimization

如何解决指针数组中的数据依赖性？

如果我们有一个整数指针数组它们都指向同一个 int 并对其进行循环操作它会比那些指向两个不同 int 的指针慢 100 这是一个具体的例子 int data 2 int a b a b 0 for auto i 0ul i lt 2

c performance compileroptimization microoptimization

如何有条件地设置模板头的编译器优化

I found 一个有趣的问题 https stackoverflow com q 29358105 3258851 并继续尝试回答这个问题作者希望使用 AVX 优化来编译一个源文件依赖于模板库而项目的其余部分则不使用 AVX 因此

c templates visualc compileroptimization

由于缓存委托，C# 编译器的奇怪行为

假设我有以下程序 static void SomeMethod Func

c clr compileroptimization

为什么 GCC 发出“lea”而不是“sub”来进行减法？

我正在查看一些通过反汇编一些 C 程序生成的程序集我对经常重复看到的单个优化感到困惑当我没有对 GCC 编译器进行优化时使用subl减法指令但是当我打开优化时 O3准确地说编译器使用leal指令而不是减法示例如下没有优化 83

gcc Assembly x86 compileroptimization gnuassembler

Binutils LD 创建巨大文件

我正在尝试创建尽可能小的 ELF 我创建了一个像这样的测试文件 NASM 语法 SECTION text dd 0xdeadbeef 使用此链接描述文件 SECTIONS text text 然后我检查了平面二进制文件的大小并通过两种方式

ld compileroptimization binutils

我的编译器在做什么？（优化memcpy）

我正在 VC 2010 中使用以下设置编译一些代码 O2 Ob2 Oi Ot 但是我在理解生成的程序集的某些部分时遇到了一些困难我在代码中添加了一些问题作为注释另外现代 cpu 上通常建议的预取距离是多少我可以在我自己的 cpu

c Assembly SSE compileroptimization

为什么 Clang 自动向我的函数添加属性？

我有一段代码正在尝试将其转换为 LLVM 位代码 int main volatile double n 0 45 for int j 0 j lt 32 j n j return 0 我对其运行以下命令 clang O0 S emit ll

c Assembly LLVM compileroptimization

执行次数减少3倍，但执行效率几乎不变。在C中

在C中我将循环执行总数减少了近3倍但是通过测试执行时间我发现这样做几乎没有任何改进所有优化级别均已测试结果基本相同包括O0 O1 O2和O3 我猜是编译器的问题但我想知道是什么原因导致这种情况以及如何做才能使结果达到预期代

c performance x8664 compileroptimization

基于整数溢出的GCC优化

最近我讨论了有人想像这样检查signed int 溢出if A B lt 2 max A B 让我们暂时忽略逻辑本身是错误的并在 C C 上下文中讨论有符号整数溢出我相信这完全继承了C标准的这一部分哪些类型的需要有符号整数溢出的检查将

c gcc compileroptimization integeroverflow

web.config 中 system.codedom 中多个编译器定义的影响

我所有的 ASP NET Web 项目都是专门用 VB NET 开发的卫星 DLL 项目也是如此它可能不太相关当我查看默认的 web config 文件时在

aspnet performance webconfig compileroptimization

JavaScript 每次调用函数时都会编译该函数吗？

假设我有这个功能 function A function B return 1 return 1 B 是否起作用B每次调用函数时都会编译A 我记得有人说不会但我的记忆力已经生锈了找不到参考资料 JavaScript 标准规定 JavaS

javascript compileroptimization

如何优化这些循环（禁用编译器优化）？

我需要优化一些for在不使用编译器优化标志的情况下循环提高速度用于学校作业给定一个特定的Linux服务器学校拥有的一个令人满意的改进是使其运行时间低于7秒一个很大的改进是使其运行时间低于5秒我这里的这段代码大约需要 5 6 秒

c loops Optimization compileroptimization

AVX2 编译的程序仍然可以使用支持 AVX-512 的 CPU 的 32 个寄存器吗？

假设以 AVX2 为目标的编译和 C 内在函数如果我编写一个 nbody 算法每个 body body 计算使用 17 个寄存器第 17 个寄存器可以间接寄存器重命名硬件或直接 Visual Studio 编译器 gcc 编译器

x86 compileroptimization cpuarchitecture cpuregisters avx512

如何制作一个不会被优化掉的无限空循环？

The C11标准似乎暗示具有常量控制表达式的迭代语句不应被优化我的建议来自这个答案其中特别引用了标准草案中的第 6 8 5 节其控制表达式不是常量表达式的迭代语句可以由实现假定终止在那个答案中它提到了一个像这样的循环while

c Clang languagelawyer compileroptimization