SSE (SIMD)：向量乘标量

2024-01-12

我在程序中执行的常见操作是按标量缩放向量（V*s，例如 [1,2,3,4]*2 == [2,4,6,8]）。除了首先在向量中的每个位置加载标量（例如 _mm_set_ps(2,2,2,2)）然后相乘之外，是否有 SSE（或 AVX）指令可以执行此操作？

这就是我现在所做的：

__m128 _scalar = _mm_set_ps(s,s,s,s);
__m128 _result = _mm_mul_ps(_vector, _scalar);

我正在寻找类似的东西...

__m128 _result = _mm_scale_ps(_vector, s);

根据您的编译器，您可能可以通过使用来稍微改进代码生成_mm_set1_ps:

const __m128 scalar = _mm_set1_ps(s);
__m128 result = _mm_mul_ps(vector, scalar);

然而，像这样的标量常量只需要在任何循环之外初始化一次，因此性能成本应该是无关紧要的。（除非标量值在循环内发生变化？）

与往常一样，您应该查看编译器生成的代码，并尝试在合适的分析器下运行代码，以查看热点的真正位置。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

x86

SSE

SIMD

SSE (SIMD)：向量乘标量的相关文章

赋值运算符和复制构造函数有什么区别？

我不明白C 中赋值构造函数和复制构造函数之间的区别是这样的 class A public A cout lt lt A A lt lt endl The copy constructor A a b The assignment cons
添加对共享类的多个 WCF 服务的服务引用

我正在尝试将我的 WCF Web 服务拆分为几个服务而不是一个巨大的服务但是 Visual Studio Silverlight 客户端复制了两个服务共享的公共类这是一个简单的例子来说明我的问题在此示例中有两个服务两者都返回类
在 C++ 中分割大文件

我正在尝试编写一个程序该程序接受一个大文件任何类型并将其分成许多较小的块我想我已经有了基本的想法但由于某种原因我无法创建超过 12 kb 的块大小我知道谷歌等上有一些解决方案但我更感兴趣的是了解这个限制的根源是什么然后实际
Guid 应包含 32 位数字和 4 个破折号

我有一个包含 createuserwizard 控件的网站创建帐户后验证电子邮件及其验证 URL 将发送到用户的电子邮件地址但是当我进行测试运行时单击电子邮件中的 URL 时会出现以下错误 Guid should contain
TextBox 焦点的 WinForms 事件？

我想添加一个偶数TextBox当它有焦点时我知道我可以用一个简单的方法来做到这一点textbox1 Focus并检查布尔值但我不想那样做我想这样做 this tGID Focus new System EventHandler thi
ZLIB 解压缩

我编写了一个小型应用程序该应用程序应该解压缩以 gzip deflate 格式编码的数据为了实现这一点我使用 ZLIB 库使用解压缩功能问题是这个功能不起作用换句话说数据不是未压缩的我在这里发布代码 int decompre
为什么 std::allocator 在 C++17 中丢失成员类型/函数？

一边看着std 分配器 http en cppreference com w cpp memory allocator 我看到成员 value type pointer const pointer reference const refer
禁用 LINQ 上下文的所有延迟加载或强制预先加载

我有一个文档生成器目前包含约 200 个项目的查询但完成后可能会超过 500 个我最近注意到一些映射表示延迟加载这给文档生成器带来了一个问题因为它需要根据生成的文档来访问所有这些属性虽然我知道DataLoadOptions可以指
C++派生模板类继承自模板基类，无法调用基类构造函数[重复]

这个问题在这里已经有答案了我试图从基类模板继承派生类也是模板它们具有相同的类型 T 我收到编译错误非法成员初始化 Base 不是基类或成员为什么如何调用基类构造函数 include
范围和临时初始化列表

我试图将我认为是纯右值的内容传递到范围适配器闭包对象中除非我将名称绑定到初始值设定项列表并使其成为左值否则它不会编译这里发生了什么 include
用于从字符串安全转换的辅助函数

回到 VB6 我编写了一些函数让我在编码时无需关心字符串的 null 和数字的 null 和 0 等之间的区别编码时没有什么比添加特殊情况更能降低我的工作效率了用于处理可能导致一些不相关错误的数据的代码 9999 10000 如果我
在 C 中复制两个相邻字节的最快方法是什么？

好吧让我们从最明显的解决方案开始 memcpy Ptr const char a b 2 调用库函数的开销相当大编译器有时不会优化它我不会依赖编译器优化但即使 GCC 很聪明如果我将程序移植到带有垃圾编译器的更奇特的平台上我也不
如何检测 C# 中该字典键是否存在？

我正在使用 Exchange Web 服务托管 API 和联系人数据我有以下代码即功能性的但并不理想 foreach Contact c in contactList string openItemUrl https service
运行代码首先迁移更新数据库时出错

我在迁移到数据库时遇到问题并且似乎找不到我遇到的错误的答案 System MissingMethodException Method not found System Data Entity Migrations Builders Tab
过度使用委托对性能来说是一个坏主意吗？ [复制]

这个问题在这里已经有答案了考虑以下代码 if IsDebuggingEnabled instance Log GetDetailedDebugInfo GetDetailedDebugInfo 可能是一个昂贵的方法因此我们只想在调试模式
如何查明CONFIG_FANOTIFY_ACCESS_PERMISSIONS是否启用？

我想利用fanotify 7 http man7 org linux man pages man7 fanotify 7 html我遇到的问题是在某些内核上CONFIG FANOTIFY ACCESS PERMISSIONS不起作用虽然C
为什么 Ajax.BeginForm 在 Chrome 中不起作用？

我正在使用 c NET MVC2 并尝试创建一个 ajax 表单来调用删除数据库记录 RemoveRelation 的方法删除记录的过程正在按预期进行删除记录后表单应调用一个 JavaScript 函数从视觉效果中删除该记录 Rem
从类模板参数为 asm 生成唯一的字符串文字

我有一个非常特殊的情况我需要为类模板中声明的变量生成唯一的汇编程序名称我需要该名称对于类模板的每个实例都是唯一的并且我需要将其传递给asm关键字 see here https gcc gnu org onlinedocs gcc 12
如何使用 std::array 模拟 C 数组初始化“int arr[] = { e1, e2, e3, ... }”行为？

注意这个问题是关于不必指定元素数量并且仍然允许直接初始化嵌套类型这个问题 https stackoverflow com questions 6111565 now that we have stdarray what uses are
如何创建向后兼容 Windows 7 的缩放和尺寸更改每显示器 DPI 感知应用程序？

我是 WPF 和 DPI 感知 API 的新手正在编写一个在 Windows 7 8 1 和 10 中运行的应用程序我使用具有不同每个显示器 DPI 设置的多个显示器并且有兴趣将我的应用程序制作为跨桌面配置尽可能兼容我已经知道可以将

随机推荐

EndUpdateResource() 抛出错误 110 系统无法打开在输出位置打开 windowsexplorer 时指定的设备或文件

仅当在 D test output 可执行文件复制到的位置打开 Windows 资源管理器时以下代码才会在 EndUpdateResource 调用上引发 110 错误 std ifstream in C Windows notepad
密码盐如何帮助抵御彩虹表攻击？

我在理解密码盐的用途时遇到一些困难据我了解主要用途是阻止彩虹表攻击然而我所见过的实现这一点的方法似乎并没有真正使问题变得更加困难我看过很多教程建议盐的使用方式如下 hash md5 salt password 原因是散列现在映射的
ASP.NET 验证器比较两个日期相差不超过 12 个月

我有两个TextBox控制开始日期和结束日期输入我必须验证结束日期不大于开始日期并且开始日期和结束日期之间的差异不超过 12 个月你将不得不使用一个CustomValidator http msdn microsoft com en
带有 plesk 的 nginx 反向代理

我已经在这里看到了一些答案但似乎没有一个解决方案有效我有安装了 wordpress 的domain com 以及在domain com 6000上运行的脚本我希望能够让 script domain com 显示 domain com
何时使用 deferred.reject()？

我很困惑什么时候使用deferred resolve and deferred reject 快速示例 var doSomething function var deferred Deferred if typeof myVar objec
如何使用 Angular 验证表行数据？

I have table with ng repeat对于表行我想对单行数据进行内联编辑和验证但不可能使用form or ng form里面的表对于内联编辑我使用输入ng show inside td 所以我有两个问题这是内联编
具有大量 UNION 的 SPARQL 查询的替代方案

我在 Virtuoso 中存储了一些命名图表我想从提供的列表中找到与最多术语匹配的图表我的查询是以编程方式构建的如下所示 SELECT DISTINCT graph count DISTINCT match as matches WH
ModuleNotFoundError：没有名为“tensorflow.python.tools”的模块； “tensorflow.python”不是一个包

Tensorflow 完全可以在 Jupyter Notebook 上工作但是当我尝试 import tensorflow 在 pycharm 或只是在终端中我得到 Traceback most recent call last Fil
React-Native-Styled-Components：类型“DefaultTheme”上不存在属性“backgroundColor”

我正在为我的应用程序使用react native Typescript 我的样式组件版本是 styled components 5 3 0 我已经创建了自定义ThemeProvider并包装到我的根应用程序我的应用程序有切换深色主题我的
如何使用 IBM Bluemix Track & Plan 管理多个组件

我们有一个由多个不同组件不同功能语言组成的应用程序在 IBM Bluemix 中是否可以使用单个 Track Plan 功能来管理组件的工作项但将源代码保留在单独的 git 存储库中例如我希望整个应用程序有一个积压工作然后由
如何通过 FTP 访问我的 Azure 应用服务文件？ wwwroot 目录为空

使用 Azure 门户中应用服务页面导航上的部署中心链接我能够找到我的 FTP 凭据并使用它们轻松登录但是 wwwroot 文件夹中除了hostingstart html 之外没有任何文件但是当我使用 Azure 控制台时我的所有
Android NDK 无法使用两个 gradle 插件调试本机代码

我使用 NDK 和实验性 gradle 插件最初我能够调试我的本机代码然后我看到了这个问题https github com googlesamples android ndk issues 119 https github com go
如何在Android文件系统上模拟文件的“tail”命令？

我的 SD 卡上有文件我的应用程序使用它作为日志文件是否可以通过 adb 实时监视文件的所有更改喜欢与tail f sdcard myfile log命令这似乎对我很有用 adb shell while true do cat sl
如何使用OKHTTP发出post请求？

我读了一些将 json 发布到服务器的示例有人说 OkHttp 是 HttpUrlConnection 接口的实现由Java提供它提供了一个用于写入内容的输入流不知道或关心该内容是什么格式现在我想使用名称和密码参数向 URL
提取 Objective-c 二进制文件

是否可以提取二进制文件获取二进制文件背后的代码使用类转储您可以看到实现地址但是是否也可以看到实现地址中的代码有什么办法可以做到吗您的所有代码都会编译为单个指令并放置在可执行文件的文本部分中编译器负责将高级语言转换为更简单的处
简单的、结构类型的 XML 数据绑定（无需代码生成或反射）

我正在寻找一个 Java 库它允许我将 XML 编组到 Java 对象树反之亦然有很多库可以让我将 XML 绑定到JavaBeans由某些代码生成工具生成但是我不需要这些 JAXB JiBX Castor 等我需要的是一个工具
如何做 pd.get_dummies 或其他方式？

实际上我的问题是基于是否有更快的方法根据条件更新数据框列值 https stackoverflow com questions 46678400 is there a faster way to update dataframe col
WCF 数据服务支持的 Linq

我正在寻找与 WCF 数据服务兼容的受支持 linq 扩展方法的完整列表通过反复试验我发现 First Func 和 Single Func 不受支持还有其他吗 This http msdn microsoft com en us l
Java - 如何检查字符串中的重复字符？

我需要编写一个函数来检查字符串中是否有重复值并返回唯一字符的计数如果计数大于 3 则应返回 true 如果计数小于 3 则应该为 false 这是我一直在尝试的注意我是java新手 private boolean isFormatVal
SSE (SIMD)：向量乘标量

我在程序中执行的常见操作是按标量缩放向量 V s 例如 1 2 3 4 2 2 4 6 8 除了首先在向量中的每个位置加载标量例如 mm set ps 2 2 2 2 然后相乘之外是否有 SSE 或 AVX 指令可以执行此操作这就是我

SSE (SIMD)：向量乘标量

SSE (SIMD)：向量乘标量 的相关文章

随机推荐

热门标签

SSE (SIMD)：向量乘标量的相关文章