禁用 GCC 中特定循环的展开

2023-12-11

我有以下 4x4 矩阵向量乘法代码：

double const __restrict__ a[16];
double const __restrict__ x[4];
double       __restrict__ y[4];

//#pragma GCC unroll 1 - does not work either
#pragma GCC nounroll
for ( int j = 0; j < 4; ++j )
{
    double const* __restrict__ aj = a + j * 4;
    double const xj = x[j];

    #pragma GCC ivdep
    for ( int i = 0; i < 4; ++i )
    {
        y[i] += aj[i] * xj;
    }
}

我编译用-O3 -mavx旗帜。内部循环是矢量化的（单个 FMAD）。然而，gcc（7.2）不断展开外循环 4 次，除非我使用-O2或较低的优化。

有没有办法覆盖-O3展开特定循环？

注意。相似的#pragma nounroll如果我使用 Intel icc 就可以。

根据文档，#pragma GCC unroll 1如果你这样放置的话，应该可以工作。如果没有，那么您应该提交错误报告。

或者，您可以使用函数属性来设置优化，我认为：

void myfn () __attribute__((optimize("no-unroll-loops")));

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

gcc

Optimization

pragma

loopunrolling

禁用 GCC 中特定循环的展开的相关文章

有没有办法用 gcc 查询直接模块依赖关系？

给定一个模块 a m cc export module A import B import C import D h 有没有一种调用 gcc 的方法类似于 M 对标头所做的操作来列出对其他模块和导入标头即 B C 和 D h 的直接依
调度算法，找到设定长度的所有非重叠区间

我需要为我的管理应用程序实现一种算法该算法将告诉我何时可以将任务分配给哪个用户我实现了一个蛮力解决方案它似乎有效但我想知道是否有更有效的方法来做到这一点为了简单起见我重写了算法以对数字列表进行操作而不是数据库查询等下面我将尝
编译器如何如此好地优化这个阶乘函数？

所以我一直在研究一些神奇的东西O3在 GCC 中实际上我正在使用 Clang 进行编译但这与 GCC 相同我猜优化器的很大一部分是从 GCC 转移到 Clang 的考虑这个 C 程序 int foo int n if n 0 ret
字段的 __attribute__((packed)) 如何影响包含该字段的结构？

如果我有一个打包字段为什么我的整个结构会被打包 Example include
同一索引操作上的不同估计行？

简介和背景我必须优化一个简单的查询下面的示例重写几次后我认识到同一个索引操作的估计行数会根据查询的编写方式而有所不同最初该查询执行了聚集索引扫描因为生产中的表包含二进制列该表相当大大约 100 GB 并且全表扫描执行起来需
glibc 堆一致性检查

根据2008年的帖子我现在找不到 glibc 堆检查 http www gnu org s libc manual html node Heap Consistency Checking html在多线程环境中不起作用现在还是2010年
-ffast-math 可以安全地用于典型项目吗？

在回答我建议的问题时 ffast math 有评论指出这是危险的我个人的感觉是在科学计算之外是可以的我还假设严肃的金融应用程序使用定点而不是浮点当然如果你想在你的项目中使用它最终的答案是在你的项目上测试它看看它有多大影响但
C：带有 MinGW 的正则表达式库

如何将 C 正则表达式安装到 MinGW 中我正在使用它的 GCC 我正在运行 Windows XP 我更喜欢更新的您有几个选择 mingw libgnurx http sourceforge net projects mingw fi
“丢失”jni.h 文件导致 JPostal 构建失败

我想建设日本邮政 https github com openvenues jpostal building jpostal但发出命令后出现以下错误 gradlew assemble checking for gcj no checking
在 CentOS 7 上找不到 GLIBCXX_3.4.21

我最近将 CentOS 上的 gcc 版本从 4 7 更新到 5 4 但现在编译程序时出现以下错误 lib64 libstdc so 6 version GLIBCXX 3 4 21 not found 我找到了一些解决方案 https s
MySQL INSERT 语句在大表中是否会变慢？

我可以看到如何SELECT and UPDATE随着表的不断增长语句会变得越来越慢但是呢INSERT INSERT也会变慢特别是如果你有很多indexes也必须更新但不同的存储引擎之间存在差异 MyISAM对于很多人来说更快SELE
mingw gcc 上的 __uint128_t

我正在尝试在 mingw gcc 下编译 c 程序该程序正在使用一个 uint128 t整数当我尝试在同一台 64 位机器上的标准 ubuntu gcc 下编译它时它完美地工作了但是当我尝试在 mingw 下为 Windows 编
Olve Maudal 的 C++ 测验背后的解释（别名模板）

以下代码来自http www pvv org oma PubQuiz ACCU Apr2014 pdf http www pvv org oma PubQuiz ACCU Apr2014 pdf 6 第 34 页的解决方案目标是猜测以下的
循环中的恒定条件：编译器优化[重复]

这个问题在这里已经有答案了考虑以下代码 Preprocessor include
gcc 使用 c++11 标准，即使 98 明确指定

我收到一个奇怪的错误我怀疑与我的系统配置有关我正在使用 g version 编译链接一个简单的 C 程序g Ubuntu 5 4 0 6ubuntu1 16 04 4 5 4 0 20160609 默认语言标准记录为 c 98 但即使
超越堆栈采样：C++ 分析器

黑客的故事日期是 2010 年 2 月 12 日圣诞节前的日子已经过去了作为一名 Windows 程序员我几乎遇到了一个主要障碍我一直在使用 AQTime 我尝试过 sleepy shiny very sleepy 就在我们说话的
约束优化 R：另一个例子

我正在尝试在 R 中执行约束优化我已经查看了这些帖子和其他一些帖子 R 中的约束优化 https stackoverflow com questions 5436630 constrained optimization in r R 中的
C++ init-list：使用未初始化的成员来初始化其他成员不会给出警告

g 4 4 和 4 6 clang 3 2 和 coverity 都没有使用 Wall 和 Wextra 其他一些或 Weverything 分别给我以下代码片段的警告 class B char t2 char t public B t
gcc 的错误？模板类中友元函数的访问控制问题

我有一个模板类并在类中定义了一个友元函数 include
排序数组最快的搜索方法是什么？

正在回答另一个问题 https stackoverflow com questions 4752028 whats wrong with this interpolation search implementation 4752042 47

随机推荐

重复一个字符N次

有没有其他方法可以在php中打印40点我心里有这个想法但我认为这是错误的也许有这样的方法可以这样做吗不使用循环是的使用str repeat功能 echo str repeat 40
在绘图上绘制日期和时间

我有几个数据集我想用日期作为 X 轴时间作为 Y 轴来绘制我正在 Jupyter Notebook 中工作 from datetime import date time from plotly import offline as py
当未找到搜索词时，在 R 中使用 -which() 会出现意外行为

我一直用Rwhich函数从数据框中删除行我最近发现如果搜索词不在 data frame 中则结果是空字符 1 returns A Q S Z as expected LETTERS which LETTERS R 2 returns
如何在 Scala 中测试对象的私有方法

我有一个示例对象 object Foo private def sayFoo Foo 我想测试私有 sayFoo 方法而不使用以下解决方法 1 没有定义为package private 2 不将其定义为 protected 并在测试类中继承
给定一种颜色的十六进制，如何使该颜色变浅或变深？ [复制]

这个问题在这里已经有答案了假设我有一个十六进制例如 5fc9f8 是否有一个函数接受黑暗级别 10 到 10 并返回反映该级别的十六进制值我所说的黑暗是指在颜色中添加黑色删除黑色 import UIKit extension St
lxml unicode实体解析问题

我使用 lxml 来解析从另一个系统导出的 XML 文件 xmldoc open filename etree parse xmldoc 但我得到 lxml etree XMLSyntaxError 实体 eacute 未定义第 4495
什么是“对于（x：y）”？

所以我在互联网上查找有关线程的内容然后我找到了有关线程的博客教程但令我困惑的是他使用的这条线 for auto thread threads 不太确定那是做什么的这是我正在谈论的博客的链接LINK感谢为我回答这个问题的人PS你能给我一
如何使用 jQuery 通过 Ajax 使用 Google 翻译？

我在用Ajax通过 jQuery 我正在尝试使用谷歌翻译服务该服务似乎不适合我我究竟做错了什么我将如何在我的网络应用程序中使用它你可以这样做 ajax url https ajax googleapis com ajax servi
如何从 main() 返回大于 8 位的数字？

据我所知退出代码从返回r0仅使用该寄存器的最低 8 位如何返回高于 8 位的值这是 ARMv7 代码 looping s calculates sum of integers from 1 to 100 text balign 4 g
Azure 间接对等互连

假设我的对等互连设置如下 ABC 并且希望在 vnet A 和 C 之间路由流量目前这可能吗也许 B 中的 vnet 网关和 UDR 的使用 Thanks 目前来看这是不可能的 VNet 对等互连位于两个虚拟网络之间不存在派生的传递
Symfony2 身份验证“login_check”路径未找到

我是 Symfony2 的新手我正在尝试创建一个基本的注册登录系统因此在 Symfony2 文档的帮助下我创建了这个 security yml security encoders TestCompany InternetBundl
Angular 数据表中的自定义加载

我试图在角度数据表中实现我的自定义加载我检查了文档 https l lin github io angular datatables overrideLoadingTpl 建议实施 angular module showcase data
从标准输入读取数组，忽略括号和逗号

我的代码的示例输入是 1 2 3 4 我希望忽略大括号和逗号并将数字读入数组我怎样才能做到这一点嗯这可能有用 Ignore all characters up to and including the open curly brac
如何在php中的echo中连接if语句？ [复制]

这个问题在这里已经有答案了是否可以在 php 的 echo 中连接 if 语句如何将一些基于条件的 html 附加到 echo 内的 html 类似如下它会对你有所帮助尝试这个
TLD 优先的类域标识符有何意义？

TLD first 类域标识符虽然拗口但这就是我能想到的全部多年来我在不同的地方看到过这些用法并且想知道这个约定背后的历史原因是什么因为您可能会认为有一种真正的方式来提及域我不使用 Java 但我通过探索发现命名空间通常是这样
在xcode中添加不同的图像到不同的注释视图

我试图将不同的图像添加到不同的注释视图中换句话说我想要一张独特的图片对应于每个独特的引脚这是我正在尝试的 MKAnnotationView mapView MKMapView mapView viewForAnnotation id
在 Python 中使用 Selenium 下载 Chrome 无头文件

在无头模式下 Chrome 默认禁止文件下载然而最近他们在 DevTools 中添加了一个选项来启用此行为 https chromedevtools github io devtools protocol tot Page method
AFHTTPRequestOperationManager 的子类？

我发现自己重复了很多代码AFHTTPRequestOperationManager在我的代码中所以我正在考虑对其进行子类化这样我就可以将其设置为单例并将所有代码放入子类中而不是将其分散到我的项目中然而在 AFNetworking
如何将滑块添加到 QMenu 中？

我的上下文菜单有很多项目我需要一个滑块来控制它但我没有找到任何功能可以做到这一点我该怎么办从 Stack Overflow 上的另一个帖子中我发现了这个技巧 submenu gt setStyleSheet QMenu menu
禁用 GCC 中特定循环的展开

我有以下 4x4 矩阵向量乘法代码 double const restrict a 16 double const restrict x 4 double restrict y 4 pragma GCC unroll 1 does not

禁用 GCC 中特定循环的展开

禁用 GCC 中特定循环的展开 的相关文章

随机推荐

热门标签

禁用 GCC 中特定循环的展开的相关文章