利用 SSE 和其他 CPU 扩展

2024-05-06

在我的代码库中有几个地方，对于大型数据集，相同的操作会重复很多次。在某些情况下，处理这些需要花费相当长的时间。

我相信使用SSE来实现这些循环应该可以显着提高它们的性能，特别是在对同一组数据执行许多操作的情况下，因此一旦数据最初被读入缓存，就不应该有任何缓存未命中而停顿它。不过我不确定是否要去做这件事。

是否有一种独立于编译器和操作系统的方式编写代码来利用 SSE 指令？我喜欢 VC++ 内在函数，其中包括 SSE 操作，但我还没有找到任何交叉编译器解决方案。
我仍然需要支持一些没有 SSE 支持或 SSE 支持有限的 CPU（例如 Intel Celeron）。是否有某种方法可以避免必须制作不同版本的程序，例如使用某种“运行时链接器”，在进程启动时根据运行该代码的 CPU 来链接基本代码或 SSE 优化代码？
那么其他CPU扩展呢，查看各种Intel和AMD CPU的指令集，发现有几个？

对于你的第二点，只要你能将差异分离到不同的函数中，就有几种解决方案：

普通的旧 C 函数指针
动态链接（通常依赖于 C 函数指针）
如果您使用 C++，拥有不同的类来表示对不同体系结构的支持并使用虚拟函数可以对此有很大帮助。

请注意，因为您依赖于间接函数调用，所以抽象不同操作的函数通常需要表示更高级别的功能，否则您可能会失去从调用开销中的优化指令中获得的任何收益（换句话说，不要这样做） t 抽象各个 SSE 操作 - 抽象您正在做的工作）。

这是使用函数指针的示例：

typedef int (*scale_func_ptr)( int scalar, int* pData, int count);


int non_sse_scale( int scalar, int* pData, int count)
{
    // do whatever work needs done, without SSE so it'll work on older CPUs

    return 0;
}

int sse_scale( int scalar, in pData, int count)
{
    // equivalent code, but uses SSE

    return 0;
}


// at initialization

scale_func_ptr scale_func = non_sse_scale;

if (useSSE) {
    scale_func = sse_scale;
}


// now, when you want to do the work:

scale_func( 12, theData_ptr, 512);  // this will call the routine that tailored to SSE 
                                    // if the CPU supports it, otherwise calls the non-SSE
                                    // version of the function

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

gcc

crossplatform

visualc

SIMD

利用 SSE 和其他 CPU 扩展的相关文章

Qt 5 和 QProcess 使用信号/槽 read 重定向标准输出

这个问题困扰着我因为它应该有效但遗憾的是它没有我试图实现的是读取某个进程的标准输出并让另一个进程处理它即打印出来产生输出的过程如下所示 include
VS Code：自定义关键字的注入语法范围在 C++ 中被覆盖

我想制作一个小型 VS Code 扩展为 C C 代码中的少数自定义关键字添加语法突出显示我正在尝试通过注入语法来做到这一点source c and source cpp语言范围遵循VS Code 语法高亮指南 https code
将 LUIS 与 FormFlow 集成

我创建了一个机器人里面有一个 FormFlow 现在如果您输入我想启动产品 LUIS 将告诉它必须转到哪个对话框 internal static IDialog
C# 3 新功能帖子（与 .Net 3.5 功能无关）[关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions Net F
使用 C# 使用证书进行 SSL 客户端身份验证

我需要创建一个 C 应用程序该应用程序必须使用 SSL 向服务器发送 API 请求我需要创建客户端身份验证我已经拥有服务器 CA 证书客户端证书 cer 客户端私钥 pem 和密码我找不到有关如何创建客户端连接的示例有人可以建议
获取在 Unity 中实现接口的所有类型

如果您只想知道解决方案请跳至更新我有一个应用程序它使用以下代码来获取并运行许多工作方法 var type typeof IJob var types AppDomain CurrentDomain GetAssemblies Sele
unique_ptr需要存储删除器怎么可能没有开销呢？

先看看C Primer讲了什么unique ptr and shared ptr 16 1 6 美元效率和灵活性我们可以确定的是shared ptr不将删除者视为直接成员因为删除器的类型直到运行时才知道因为删除器的类型是a类型的一部
如何从 nuget 包中排除子目录和内容

所以我有一个网站正在尝试打包用于 Octopus Deploy 我有以下文件夹结构 Web Views WantThis Dontwantthis WantThis1 WantThis2 lots more Scripts 我试图排除 Do
未构建 csproj 时抑制 AfterBuild 目标

我在 MSBuild 中有一个构建后目标来复制一些构建输出这是 linkedin 作为对AfterBuild目标暴露于Microsoft CSharp targets
根据值更改 DataGrid 单元格颜色

我有一个 WPF 数据网格我想要根据值使用不同的单元格颜色我的 xaml 上有以下代码 Style TargetType DataGridCell 但不是只选择一个单元格而是选择所有行我缺少什么如果您尝试设置DataGrid Cel
如何设置环境名称（IHostingEnvironment.EnvironmentName）？

默认 ASP NET Core Web 项目包含以下行Startup cs if string Equals env EnvironmentName Development StringComparison OrdinalIgnoreCas
C# 如何在没有 GacUtil 的情况下在 GAC 中注册程序集？

我需要使用批处理文件在 GAC 中注册程序集有没有办法找到安装位置GacUtil exe或者有没有办法在没有 GacUtil 的情况下注册程序集 Your bestbet is to use a powershell script tha
了解C/C++中函数调用的堆栈框架？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我也是 C C 和汇编语言的新手这
DateTimeFormat.AbbreviatedMonthNames 在月份名称末尾添加一个点

昨晚我们将 Web 服务层从物理 Windows 2008 r2 迁移到虚拟 Windows 2012 我们的日志中收到大量有关 DateTime 无效格式的事件这很奇怪因为我们仔细检查了区域设置长话短说 CultureInfo G
CGAL：如何有效计算多面体的面面积？

我有一个多面体其面是三角形我知道在 CGAL 中 Triangle 3 类提供了 squared area 方法通过它我们可以计算三角形的面积有什么方法可以将其应用到多面体方面吗或者关于如何计算每个面的面积有什么想法吗这是一个例
计算距离早上 8 点还有多少小时

我知道如何计算两个日期之间的差异但如何计算给定日期与下一个上午 8 点之间的时间 var now DateTime Now var tomorrow8am now AddDays 1 Date AddHours 8 double tota
在信号/槽处理期间删除 QObject

我知道从槽处理中删除 QObject 可能会使应用程序崩溃因为它可能有其他排队的事件因此我将使用 obj gt deleteLater 而不是使用 delete obj 据我所知 obj 等待处理所有排队的事件然后删除 obj Q
是一对一的关系不好的策略

用户始终拥有一个钱包一个钱包始终属于一位用户由于我想分离与钱夹相关的属性我创建了 Wallet 对象并能够跟踪钱交易我创建了 public Wallet Entity
使用抽象类作为模板类型

我对c 还是很陌生来自java 我有一个 stl 类型列表Actor When Actor仅包含真实方法就没有问题我现在想将这个类扩展到几个类并且需要将一些方法更改为抽象的因为它们不再具有具体的意义正如我从文档中预期的那样
qt 如何知道按钮被点击？

我正在尝试编写一个程序用声音进行一些操作我的问题是我有 3 个播放按钮和 3 个标签我希望无论我单击播放按钮都应该播放按钮附近标签中名称的声音我有一个没有任何参数的播放插槽那么如何分别连接到每个播放按钮和每个标签呢实际上

随机推荐

是否可以使用perl读取pdf文件中的文本？

我想在 perl 中解析 pdf 文件中的文本而不将 pdf 转换为任何其他格式是否可以是的你可以看看CAM PDF http search cpan org dist CAM PDF 包裹您可以使用此模块来提取文本 my pdf
了解 rxjs 中的背压 - 仅缓存 5 个等待上传的图像

我正在开发一个节点项目需要提交数千张图像进行处理在将这些图像上传到处理服务器之前需要调整它们的大小因此我有一些类似的内容 imageList map image gt loadAndResizeImage merge 3 map i
java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument(ZLjava/lang/String;I)V 通过 Java 使用 IE 和 Selenium

我正在尝试将 selenium 与 sikuli 一起使用所以 sikuli 不会使用当前的 java 设置在 64 位上运行因此在我的项目中将运行时更改为指向 32 位运行时环境并使用 32 位 iewebdriver 添加我的 s
如何使用 PHP 获取格林威治标准时间？

我有一台设置为 EST 的服务器并且数据库中的所有记录都设置为 EST 我想知道如何将其设置为 GMT 我想为我的用户提供时区选项 I would strongly建议避免弄乱 UNIX 时间戳使其看起来像不同的时区这是我从惨痛的教训
UITableViewCell - 理解“可重用”

UITableViewCell tableView UITableView tableView cellForRowAtIndexPath NSIndexPath indexPath static NSString reuseIdentif
从 IL 创建方法的副本

我试图在运行时使用反射创建方法的副本我有以下代码 public static R CopyMethod
尝试使用 x86 程序集 GNU GAS 在数组索引处赋值时出现错误

我在用x86GNU 与 GCC 的程序集并尝试实现相当于以下内容的程序集c c int x 10 x 0 5 但是当我尝试运行使用命令 a out 我的汇编代码如下第一次编译后gcc filename s 错误Segmentatio
javascript while循环在节点和浏览器中给出不同的结果

我正在执行以下看似简单的代码 var number 0 while number lt 12 console log number number number 2 我在浏览器和 Node 中得到不同的结果当我在 Firefox v 32
无法在 R 中安装插入符号包（在我的 Linux 机器中）

我在尝试在 R 中安装插入符号包时遇到以下错误 g error tmp Rtmp2Tos7n R INSTALL2e6e30153a74 nloptr nlopt 2 4 2 lib libnlopt cxx a No such file
动态改变ListView中TextView字体颜色

我正在将 XML 文档绑定到自定义适配器列表中的所有项目最初的字体颜色均为白色 XML 文档中的一个节点有一个我正在检查的属性如果设置了该属性我想将 ListView 中该项目的字体颜色更改为较深的颜色我的代码似乎最初可以工作但是
Gnuplot：具有置信区间的线点

我有以下数据我想绘制一个图表显示所有 x 与线线点连接的平均值并显示所有置信区间 ci lower ci upper 我设法使用 2 个图来做到这一点 set xrange 0 1100000 set yrange 0 5000
如何用 Java 或 C# 等语言实现统一算法？

我正在读我拿到的人工智能教科书我已经解决了我的部分的最后一个作业问题以您选择的任何语言实施第 69 页概述的统一算法在第 69 页您有以下统一算法的伪代码 function unify E1 E2 begin case both E
Codeigniter - 错误 - 没有要更新的数据

我本来要更新数据库但收到错误没有要更新的数据这是我的脚本我创建了一个简单的切换来更新数据库切换使用户处于活动状态 is active 1 或非活动状态 is active 0 我遇到的问题是虽然对象从 1 更改为 0 或 0 更
如何在 Node.js 中等待

这是一个关于我认为 Node js 中的简单模式的问题这是我在 CoffeeScript 中的示例 db is open false db open gt db is open true wait gt wait until db is
如何使ggplot2图形与R中的黑白打印（复印友好）兼容？

有没有办法转换ggplot2绘制成黑白版本而不重写大部分代码以便黑白版本保持可读性例如要替换scale fill gradient with scale fill grey 或者自动进行适合复印的转换如网站http colorbre
使用带有代码分割的汇总时，有什么方法可以保留包的目录结构吗？

Context 给定这样的项目结构 src a module js b module js util js 两者都在哪里module js文件导入util js 使用以下配置 export default experimentalCodeS
自 1.4.0 版本以来，sphinx_rtd_theme 不再是硬依赖项

C Users Administrator Desktop item code serv documents api gt 制作 html 运行 Sphinx v1 6 2 加载腌制环境失败无法获取属性 WarningStream
Spring MVC 415 不支持的媒体类型

我正在使用 Spring 3 2 并尝试使用 ajax post 请求来提交 json 对象数组如果这是相关的我转义了所有特殊字符我收到的 HTTP 状态为 415 我的控制器是 RequestMapping value save p
类型特征的 _t 别名和 _v 变量模板的目的是什么？

有a lot of v and t后缀例如std is same v std invoke result t result of t以及数百万个其他此类功能 Why它们到底存在吗在任何情况下公开实施细节例如std result of
利用 SSE 和其他 CPU 扩展

在我的代码库中有几个地方对于大型数据集相同的操作会重复很多次在某些情况下处理这些需要花费相当长的时间我相信使用SSE来实现这些循环应该可以显着提高它们的性能特别是在对同一组数据执行许多操作的情况下因此一旦数据最初被读入缓存就

利用 SSE 和其他 CPU 扩展

利用 SSE 和其他 CPU 扩展 的相关文章

随机推荐

热门标签

利用 SSE 和其他 CPU 扩展的相关文章