Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
没有编译器优化的 SSE 内在函数
我是 SSE 内在函数的新手 并尝试通过它来优化我的代码 这是我的程序 用于计算等于给定值的数组元素 我将代码更改为 SSE 版本 但速度几乎没有改变 我想知道我是否以错误的方式使用SSE 此代码用于不允许我们启用编译器优化选项的分配 无
c
compileroptimization
SIMD
SSE
pow 函数中发生了什么?
我在这里看到了各种描述奇怪行为的答案powC 中的函数 但我在这里有一些不同的问题要问 在下面的代码中我已经初始化了int x pow 10 2 and int y pow 10 n int n 2 在第一种情况下 当我打印它显示的结果时1
c
gcc
compileroptimization
pow
gcc49
加快 Xcode Swift 构建时间
随着我的项目在过去一年中不断增长 其构建时间也不断增长 在过去的几个月里 它从 4 分钟缩短到了 7 分钟左右 时间包括 GitHub 拉取 单元测试等 我调查过 Xfrontend debug time function bodies找到
swift
xcode
compileroptimization
compiletime
Python 是否优化循环中的函数调用?
假设我有一段代码 它从循环中调用某个函数数百万次 并且我希望代码能够快速运行 def outer function file for line in file inner function line def inner function l
python
Optimization
compileroptimization
未定义的行为追溯是否意味着不能保证早期可见的副作用?
在 C 中 如果我正确理解措辞 编译器可以假设不会发生 UB 从而影响将遇到 UB 但尚未遇到的执行路径中的行为 甚至是 I O 等可见的副作用 在抽象机遇到 UB 之前 C 是否需要 正确 执行程序直至最后可见的副作用 编译器似乎以这种方
c
gcc
languagelawyer
compileroptimization
undefinedbehavior
程序员什么时候使用空基优化(EBO)
我正在阅读有关空基优化 EBO 的内容 阅读过程中 我的脑海中浮现出以下问题 使用空类作为基类有什么意义它对派生类没有任何贡献 无论是功能方面还是数据方面 In 我读到了这个 S为空类结构 T S 整数x 请注意 我们没有丢失任何数据或 代
c
class
Optimization
memorymanagement
compileroptimization
如何解决指针数组中的数据依赖性?
如果我们有一个整数指针数组 它们都指向同一个 int 并对其进行循环 操作 它会比那些指向两个不同 int 的指针慢 100 这是一个具体的例子 int data 2 int a b a b 0 for auto i 0ul i lt 2
c
performance
compileroptimization
microoptimization
如何有条件地设置模板头的编译器优化
I found 一个有趣的问题 https stackoverflow com q 29358105 3258851 并继续尝试回答这个问题 作者希望使用 AVX 优化来编译一个源文件 依赖于模板库 而项目的其余部分则不使用 AVX 因此
c
templates
visualc
compileroptimization
由于缓存委托,C# 编译器的奇怪行为
假设我有以下程序 static void SomeMethod Func
c
clr
compileroptimization
为什么 GCC 发出“lea”而不是“sub”来进行减法?
我正在查看一些通过反汇编一些 C 程序生成的程序集 我对经常重复看到的单个优化感到困惑 当我没有对 GCC 编译器进行优化时 使用subl减法指令 但是当我打开优化时 O3准确地说 编译器使用leal指令而不是减法 示例如下 没有优化 83
gcc
Assembly
x86
compileroptimization
gnuassembler
Binutils LD 创建巨大文件
我正在尝试创建尽可能小的 ELF 我创建了一个像这样的测试文件 NASM 语法 SECTION text dd 0xdeadbeef 使用此链接描述文件 SECTIONS text text 然后我检查了平面二进制文件的大小 并通过两种方式
ld
compileroptimization
binutils
我的编译器在做什么? (优化memcpy)
我正在 VC 2010 中使用以下设置编译一些代码 O2 Ob2 Oi Ot 但是 我在理解生成的程序集的某些部分时遇到了一些困难 我在代码中添加了一些问题作为注释 另外 现代 cpu 上通常建议的预取距离是多少 我可以在我自己的 cpu
c
Assembly
SSE
compileroptimization
为什么 Clang 自动向我的函数添加属性?
我有一段代码正在尝试将其转换为 LLVM 位代码 int main volatile double n 0 45 for int j 0 j lt 32 j n j return 0 我对其运行以下命令 clang O0 S emit ll
c
Assembly
LLVM
compileroptimization
执行次数减少3倍,但执行效率几乎不变。在C中
在C中 我将循环执行总数减少了近3倍 但是通过测试执行时间 我发现这样做几乎没有任何改进 所有优化级别均已测试 结果基本相同 包括O0 O1 O2和O3 我猜是编译器的问题 但我想知道是什么原因导致这种情况 以及如何做才能使结果达到预期 代
c
performance
x8664
compileroptimization
基于整数溢出的GCC优化
最近我讨论了有人想像这样检查signed int 溢出if A B lt 2 max A B 让我们暂时忽略逻辑本身是错误的 并在 C C 上下文中讨论有符号整数溢出 我相信这完全继承了C标准的这一部分 哪些类型的需要有符号整数溢出的检查将
c
gcc
compileroptimization
integeroverflow
web.config 中 system.codedom 中多个编译器定义的影响
我所有的 ASP NET Web 项目都是专门用 VB NET 开发的 卫星 DLL 项目也是如此 它可能不太相关 当我查看默认的 web config 文件时 在
aspnet
performance
webconfig
compileroptimization
JavaScript 每次调用函数时都会编译该函数吗?
假设我有这个功能 function A function B return 1 return 1 B 是否起作用B每次调用函数时都会编译A 我记得有人说不会 但我的记忆力已经生锈了 找不到参考资料 JavaScript 标准规定 JavaS
javascript
compileroptimization
如何优化这些循环(禁用编译器优化)?
我需要优化一些for在不使用编译器优化标志的情况下循环提高速度 用于学校作业 给定一个特定的Linux服务器 学校拥有的 一个令人满意的改进是使其运行时间低于7秒 一个很大的改进是使其运行时间低于5秒 我这里的这段代码大约需要 5 6 秒
c
loops
Optimization
compileroptimization
AVX2 编译的程序仍然可以使用支持 AVX-512 的 CPU 的 32 个寄存器吗?
假设以 AVX2 为目标的编译和 C 内在函数 如果我编写一个 nbody 算法 每个 body body 计算使用 17 个寄存器 第 17 个寄存器可以间接 寄存器重命名硬件 或直接 Visual Studio 编译器 gcc 编译器
x86
compileroptimization
cpuarchitecture
cpuregisters
avx512
如何制作一个不会被优化掉的无限空循环?
The C11标准似乎暗示具有常量控制表达式的迭代语句不应被优化 我的建议来自这个答案 其中特别引用了标准草案中的第 6 8 5 节 其控制表达式不是常量表达式的迭代语句 可以由实现假定终止 在那个答案中它提到了一个像这样的循环while
c
Clang
languagelawyer
compileroptimization
«
1 ...
4
5
6
7
8
9
10
»