limit 关键字在 gcc/g++ 中是否提供了显着的好处？

2024-05-03

有没有人见过关于是否使用 C/C++ 的任何数字/分析restrictgcc/g++ 中的关键字实际上在现实中（而不仅仅是理论上）提供了任何显着的性能提升？

我读过各种推荐/贬低其使用的文章，但我还没有遇到任何实际数字可以证明双方的论点。

EDIT

我知道restrict不是 C++ 的正式一部分，但它受到一些编译器的支持，我读过一篇论文克里斯特·埃里克森 http://realtimecollisiondetection.net/强烈建议使用它。

limit 关键字有不同的作用。

在某些情况下（图像处理），我已经看到了 2 倍甚至更多的改进。大多数时候，差异并没有那么大。大约10%。

这是一个说明差异的小例子。我编写了一个非常基本的 4x4 矢量 * 矩阵变换作为测试。请注意，我必须强制该函数不被内联。否则，GCC 会检测到我的基准代码中没有任何别名指针，并且由于内联而限制不会产生影响。

我也可以将转换函数移动到不同的文件中。

#include <math.h>

#ifdef USE_RESTRICT
#else
#define __restrict
#endif


void transform (float * __restrict dest, float * __restrict src, 
                float * __restrict matrix, int n) __attribute__ ((noinline));

void transform (float * __restrict dest, float * __restrict src, 
                float * __restrict matrix, int n)
{
  int i;

  // simple transform loop.

  // written with aliasing in mind. dest, src and matrix 
  // are potentially aliasing, so the compiler is forced to reload
  // the values of matrix and src for each iteration.

  for (i=0; i<n; i++)
  {
    dest[0] = src[0] * matrix[0] + src[1] * matrix[1] + 
              src[2] * matrix[2] + src[3] * matrix[3];

    dest[1] = src[0] * matrix[4] + src[1] * matrix[5] + 
              src[2] * matrix[6] + src[3] * matrix[7];

    dest[2] = src[0] * matrix[8] + src[1] * matrix[9] + 
              src[2] * matrix[10] + src[3] * matrix[11];

    dest[3] = src[0] * matrix[12] + src[1] * matrix[13] + 
              src[2] * matrix[14] + src[3] * matrix[15];

    src  += 4;
    dest += 4;
  }
}

float srcdata[4*10000];
float dstdata[4*10000];

int main (int argc, char**args)
{
  int i,j;
  float matrix[16];

  // init all source-data, so we don't get NANs  
  for (i=0; i<16; i++)   matrix[i] = 1;
  for (i=0; i<4*10000; i++) srcdata[i] = i;

  // do a bunch of tests for benchmarking. 
  for (j=0; j<10000; j++)
    transform (dstdata, srcdata, matrix, 10000);
}

结果：（在我的 2 Ghz Core Duo 上）

nils@doofnase:~$ gcc -O3 test.c
nils@doofnase:~$ time ./a.out

real    0m2.517s
user    0m2.516s
sys     0m0.004s

nils@doofnase:~$ gcc -O3 -DUSE_RESTRICT test.c
nils@doofnase:~$ time ./a.out

real    0m2.034s
user    0m2.028s
sys     0m0.000s

执行速度比拇指快 20%that system.

为了显示它在多大程度上取决于架构，我让相同的代码在 Cortex-A8 嵌入式 CPU 上运行（稍微调整了循环计数，因为我不想等待那么久）：

root@beagleboard:~# gcc -O3 -mcpu=cortex-a8 -mfpu=neon -mfloat-abi=softfp test.c
root@beagleboard:~# time ./a.out

real    0m 7.64s
user    0m 7.62s
sys     0m 0.00s

root@beagleboard:~# gcc -O3 -mcpu=cortex-a8 -mfpu=neon -mfloat-abi=softfp -DUSE_RESTRICT test.c 
root@beagleboard:~# time ./a.out

real    0m 7.00s
user    0m 6.98s
sys     0m 0.00s

这里的差异仅为 9%（顺便说一句，相同的编译器。）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

gcc

g

restrictqualifier

limit 关键字在 gcc/g++ 中是否提供了显着的好处？的相关文章

访问私人成员[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案通过将类的私有成员转换为 void 指针然后转换为结构来访问类的私有成员是否合适我认为我无权修改包含我需要访问的数据成员的类如果不道德我
获取按下的按钮的返回值

我有一个在特定事件中弹出的表单它从数组中提取按钮并将标签值设置为特定值因此如果您要按下或单击此按钮该函数应返回标签值我怎样才能做到这一点我如何知道点击了哪个按钮此时代码返回 DialogResult 但我想从函数返回 Tag
未解决的包含：“cocos2d.h” - Cocos2dx

当我在 Eclipse 中导入 cocos2dx android 项目时我的头文件上收到此警告 Unresolved inclusion cocos2d h 为什么是这样它实际上困扰着我该项目可以正确编译并运行但我希望这种情况消失
实时服务器上的 woff 字体 MIME 类型错误

我有一个 asp net MVC 4 网站我在其中使用 woff 字体在 VS IIS 上运行时一切正常然而当我将 pate 上传到 1and1 托管实时服务器时我得到以下信息网络错误 404 未找到 http www co
将布尔参数传递给 SQL Server 存储过程

我早些时候问过这个问题我以为我找到了问题所在但我没有我在将布尔参数传递给存储过程时遇到问题这是我的 C 代码 public bool upload false protected void showDate object sende
在 Visual Studio 2008 上设置预调试事件

我想在 Visual Studio 中开始调试程序之前运行一个任务我每次调试程序时都需要运行此任务因此构建后事件还不够好我查看了设置的调试选项卡但没有这样的选项有什么办法可以做到这一点吗你唯一可以尝试的 IMO 就是尝试Co
C - 找到极限之间的所有友好数字

首先是定义一对友好的数字由两个不同的整数组成其中第一个整数的除数之和等于第二个整数并且第二个整数的除数之和等于第一个整数完美数是等于其自身约数之和的数我想做的是制作一个程序询问用户一个下限和一个上限然后向他她提供这两个限
C#：如何防止主窗体过早显示

在我的 main 方法中我像往常一样启动主窗体 Application EnableVisualStyles Application SetCompatibleTextRenderingDefault false Application
C 预处理器库

我的任务是开发源分析工具C程序并且我需要在分析本身之前预处理代码我想知道什么是最好的图书馆我需要一些重量轻便于携带的东西与其推出自己的为什么不使用cpp这是的一部分gcc suite http gcc gnu org onlin
如果使用 SingleOrDefault() 并在数字列表中搜索不在列表中的数字，如何返回 null？

使用查询正数列表时SingleOrDefault 当在列表中找不到数字时如何返回 null 或像 1 这样的自定义值而不是类型的默认值在本例中为 0 你可以使用 var first theIntegers Cast
WPF TabControl，用C#代码更改TabItem的背景颜色

嗨我认为这是一个初学者的问题我搜索了所有相关问题但所有这些都由 xaml 回答但是我需要的是后台代码我有一个 TabControl 我需要设置其项目的背景颜色我需要在选择取消选择和悬停时为项目设置不同的颜色非常感谢你的帮助
如何将单个 char 转换为 int [重复]

这个问题在这里已经有答案了我有一串数字例如 123456789 我需要提取它们中的每一个以在计算中使用它们我当然可以通过索引访问每个字符但是如何将其转换为 int 我研究过 atoi 但它需要一个字符串作为参数因此我必须将每个字
Qt表格小部件，删除行的按钮

我有一个 QTableWidget 对于所有行我将一列的 setCellWidget 设置为按钮我想将此按钮连接到删除该行的函数我尝试了这段代码它不起作用因为如果我只是单击按钮我不会将当前行设置为按钮的行 ui gt table
clang 实例化后静态成员初始化

这样的代码可以用 GCC 编译但 clang 3 5 失败 include
当操作繁忙时，表单不执行任何操作（冻结）

我有一个使用 C 的 WinForms 应用程序我尝试从文件中读取一些数据并将其插入数据表中当此操作很忙时我的表单冻结并且无法移动它有谁知道我该如何解决这个问题这可能是因为您在 UI 线程上执行了操作将文件和数据库操作移至另一个
插入记录后如何从SQL Server获取Identity值

我在数据库中添加一条记录identity价值我想在插入后获取身份值我不想通过存储过程来做到这一点这是我的代码 SQLString INSERT INTO myTable SQLString Cal1 Cal2 Cal3 Cal4 SQ
WCF：将随机数添加到 UsernameToken

我正在尝试连接到用 Java 编写的 Web 服务但有些东西我无法弄清楚使用 WCF 和 customBinding 几乎一切似乎都很好除了 SOAP 消息的一部分因为它缺少 Nonce 和 Created 部分节点显然我错过了一
const、span 和迭代器的问题

我尝试编写一个按索引迭代容器的迭代器 AIt and a const It两者都允许更改容器的内容 AConst it and a const Const it两者都禁止更改容器的内容之后我尝试写一个span
防止索引超出范围错误

我想编写对某些条件的检查而不必使用 try catch 并且我想避免出现 Index Out of Range 错误的可能性 if array Element 0 Object Length gt 0 array Element 1 Ob
恢复上传文件控制

我确实阅读了以下帖子 C 暂停恢复上传 https stackoverflow com questions 1048330 pause resume upload in c 使用 HTTP 恢复上传 https stackoverflow

随机推荐

在react-query中使用（isLoading或isFetching）的原因

我是一个使用react的用户我在使用react query时没有很好地使用isloading函数在ui方面我认为正在加载用于向用户显示加载屏幕我认为我不必显示加载因为数据获取速度很快但突然我想到了这个想法如果你把 props
Selenium RC：如何检查元素是否具有给定属性？

我有一些带有onclick属性和一些没有属性我想检查指定的元素是否具有onclick属性我怎样才能做到这一点 getAttribute 当有属性值时返回该属性值如果没有它会抛出 RuntimeException 并停止测试即使我将
Owncloud上传文件到特定文件夹-curl

我想通过我自己的云服务器上的特定文件夹中的curl上传文件例如 http www myowncloudserver com remote php webdav MY FOLDER 目前我无法将文件上传到我自己的云服务器上的文件夹有任何想
ASP.NET 列表视图->单击行->执行操作

我需要以下方面的帮助我有一个用隐藏代码填充的列表视图 Linq gt Sql ListView1 DataSource from x in database ITEMS select x ListView1 DataBind 项目内容 I
Python打开Microsoft SQL Server MDF文件

如何在 Python 中打开 Microsoft SQL Server MDF 文件 Edit 我试过了pyodbc connect但这需要合法的服务器连接您不能简单地打开 MDF 文件 pyodbc connect driver SQ
如何在 C# 中的 HttpClient 中使用凭据？

我在使用 HttpClient 类访问 Delicious API 时遇到一些问题我有以下代码 try const string uriSources https api del icio us v1 tags bundles all p
ASP.Net Core，检测控制器中的调试与不调试

我正在编写我的第一个 ASP Net 代码 Web 应用程序在我的控制器中我希望有一个if检查我是否处于调试模式的语句我知道在 Startup cs 文件中我可以检查env IsDevelopment 但那是因为IHostingEnvi
多维数组到数据框

R 中的以下问题对你们中的许多人来说可能看起来很简单但由于我对此相对较新如果您能帮助我那将非常有帮助我想本质上编写一个多维 3 个维度数组作为我可以更轻松地操作的数据框我正在处理 1891 年 1 月 1 日至 2015 年 1
使用 Google App Engine 和 ndb 时是否见过重复的 ID？

class Entries ndb Model description ndb StringProperty seqid ndb IntegerProperty link ndb StringProperty group ndb Strin
使用位图的保存方法覆盖图像

我有一个 ASP NET C 页面我正在其中调整文件夹中图像的大小我正在使用 GDI 来执行此操作我想调整图像大小并替换为旧图像因此当我尝试使用现有名称保存时 Save 方法会抛出错误但如果我给出不同的名称它就会被保存但我希
TEdit onclick 全选？

每当用户单击 TEdit1 或单击选择其中的某些文本时如何选择 TEdit1 的所有文本执行超出默认行为的任何操作都可能非常危险TEdit控制您的用户知道标准 Windows 控件的行为方式任何偏离此的行为都可能导致混乱默认情况下
在 ggplot2 facet_wrap 标签上使用半填充的正方形

我正在尝试使用标签上的一半以及四分之一填充方块来生成 ggplot2 图表但 Mac 上的 ggplot2 似乎不支持某些符号例如当我输入 print u25E9 它显示一个半黑的正方形但是当我尝试在 ggplot 中使用它时
如何检查一组行中是否至少有一个具有特定值

我需要找到属于满足特定条件的任何组的所有行我将组定义为共享组列中的值的几行相关组必须至少包含一行且 Eligible 设置为 true 并且该组中至少有两行在 Group 或 Eligible 以外的任何列中必须彼此不同示例表 G
为什么 ThreadLocal 实用程序在 Spring MVC 应用程序中总是返回 null？

我编写了这个实用程序类来在 Spring MVC 应用程序中保存临时数据 public abstract class FooUtil private static final ThreadLocal
对 python 2.7 的支持结束了吗？

是否有一个已知的日期时间范围将不再支持 python 2 7 转而支持 python 3 截至 2014 年 4 月 13 日从http hg python org peps rev 76d43e52d978 http hg pyth
ruby 1.9 如何将数组转换为不带括号的字符串

我的问题是关于如何在 ruby 1 9 中将数组元素转换为字符串而不需要括号和引号我有一个数组数据库提取我想用它来创建定期报告 myArray Apple Pear Banana 2 15 12 在 ruby 1 8 中我有以下行 r
如何让iOS 7下的UISwitch不采用其后面视图的背景颜色？

关闭时看起来像这样虽然我更喜欢灰色背景我真的必须使用 UIImageView 吗以下是我更改 iOS7 UISwitch 的填充颜色的方法首先您需要导入 QuartzCore import
C++中的引用类型是POD类型吗？

C 中的引用类型也是POD类型吗是int 是POD类型吗那么呢 struct Q int i 有人可以帮助我吗 No 设置引用某些内容的成员的唯一方法是通过用户声明的构造函数因此您的结构是非 POD 的 Update 答案仍然是否定
如何检查并关闭Excel文件是否已在Java中打开[重复]

这个问题在这里已经有答案了可能的重复 Java 检查文件是否已打开 https stackoverflow com questions 1390592 java check if file is already open 我正在制作一个
limit 关键字在 gcc/g++ 中是否提供了显着的好处？

有没有人见过关于是否使用 C C 的任何数字分析restrictgcc g 中的关键字实际上在现实中而不仅仅是理论上提供了任何显着的性能提升我读过各种推荐贬低其使用的文章但我还没有遇到任何实际数字可以证明双方的论点 EDIT 我

limit 关键字在 gcc/g++ 中是否提供了显着的好处？

limit 关键字在 gcc/g++ 中是否提供了显着的好处？ 的相关文章

随机推荐

热门标签

limit 关键字在 gcc/g++ 中是否提供了显着的好处？的相关文章