_mm_shuffle_ps() 相当于整数向量 (__m128i)？

2023-11-25

The _mm_shuffle_ps()内在允许将浮点输入交错为输出的低 2 个浮点和高 2 个浮点。

例如：

R = _mm_shuffle_ps(L1, H1, _MM_SHUFFLE(3,2,3,2))

将导致：

R[0] = L1[2];
R[1] = L1[3];
R[2] = H1[2];
R[3] = H1[3]

我想知道整数数据类型是否有类似的内在可用？需要两个人的东西__m128i变量和交错掩码？

The _mm_shuffle_epi32()内在的，只需要一个 128 位向量，而不是两个。

不，没有与此等效的整数。所以你要么模仿它，要么作弊。

一种方法是使用_mm_shuffle_epi32() on A and B。然后屏蔽掉所需的术语并将它们重新组合在一起。

这往往很混乱并且有大约 5 条指令。（如果您使用 SSE4.1 混合指令，则为 3。）

这是 SSE4.1 解决方案，有 3 条指令：

__m128i A = _mm_set_epi32(13,12,11,10);
__m128i B = _mm_set_epi32(23,22,21,20);

A = _mm_shuffle_epi32(A,2*1 + 3*4 + 2*16 + 3*64);
B = _mm_shuffle_epi32(B,2*1 + 3*4 + 2*16 + 3*64);

__m128i C = _mm_blend_epi16(A,B,0xf0);

我更喜欢的方法是实际作弊 - 和浮点洗牌，如下所示：

__m128i Ai,Bi,Ci;
__m128  Af,Bf,Cf;

Af = _mm_castsi128_ps(Ai);
Bf = _mm_castsi128_ps(Bi);
Cf = _mm_shuffle_ps(Af,Bf,_MM_SHUFFLE(3,2,3,2));
Ci = _mm_castps_si128(Cf);

其作用是将数据类型转换为浮点，以便可以使用 float-shuffle。然后将其转换回来。

请注意，这些“转换”是按位转换（也称为重新解释）。实际上没有完成任何转换，并且它们不映射到任何指令。在汇编中，整数或浮点SSE寄存器之间没有区别。这些强制转换内在函数只是为了绕过 C/C++ 强加的类型安全。

但是，请注意，这种方法会因在整数和浮点 SIMD 执行单元之间来回移动数据而产生额外的延迟。所以它会比单纯的 shuffle 指令更昂贵。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

SSE

_mm_shuffle_ps() 相当于整数向量 (__m128i)？的相关文章

用 C++ 进行服装建模 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在编写一些软件最终会绘制一个人体框架可以配置各种参数并且计划是在假人身上放置某种衣服我研究
VB.NET 相当于 C# 属性简写吗？

是否有与 C 等效的 VB NET public string FirstName get set 我知道你能做到 Public Property name As String Get Return name ToString End Ge
如何读取扩展文件属性/文件元数据

因此我按照教程使用 ASP net core 将文件上传到本地路径这是代码 public IActionResult About IList
C++ 中本地类中的静态成员变量？

我知道我们不能宣布static本地类中的成员变量但其原因尚不清楚那么请问有人可以解释一下吗另外为什么我们不能访问非static函数内部定义的变量内部已经定义了局部类直接在局部类成员函数中在下面给出的代码中 int main i
Unix网络编程澄清

我正在翻阅这本经典书籍Unix网络编程 https rads stackoverflow com amzn click com 0139498761 当我偶然发现这个程序时第 6 8 节第 179 180 页 include unp h
如何访问另一个窗体上的ListView控件

当单击与 ListView 所在表单不同的表单中的按钮时我试图填充 ListView 我在 Form1 中创建了一个方法以在 Form2 中使用并将参数传递给 Form1 中的方法然后填充 ListView 当我调试时我得到了传递的
使用 C 语言使用 strftime() 获取缩写时区

我看过this https stackoverflow com questions 34408909 how to get abbreviated timezone and this https stackoverflow com ques
Rx 中是否有与 Task.ContinueWith 运算符等效的操作？

Rx 中是否有与 Task ContinueWith 运算符等效的操作我正在将 Rx 与 Silverlight 一起使用我正在使用 FromAsyncPattern 方法进行两个 Web 服务调用并且我想这样做同步地 var o1
未定义的行为或误报

我基本上在野外遇到过以下情况 x x 5 显然它可以在早期版本的 gcc 下编译干净在 gcc 4 5 1 下生成警告据我所知警告是由 Wsequence point 生成的所以我的问题是这是否违反了标准中关于在序列点之间操
如何使用 watin 中的 FileUploadDialogHandler 访问文件上传对话框

我正在使用 IE8 和 watin 并尝试通过我的网页测试上传文件我不能简单地使用 set 方法设置上传文件例如 ie FileUpload Find ById someId Set C Desktop image jpg 因为上传文本
Visual Studio 中的测试单独成功，但一组失败

当我在 Visual Studio 中单独运行测试时它们都顺利通过然而当我同时运行所有这些时有些通过有些失败我尝试在每个测试方法之间暂停 1 秒但没有成功有任何想法吗在此先感谢您的帮助你们可能有一些共享数据检查正在使用
将 log4net 与 Autofac 结合使用

我正在尝试将 log4net 与 Autofac 一起使用我粘贴了这段代码http autofac readthedocs org en latest examples log4net html http autofac readthed
如何编写一个同时需要请求和响应Dtos的ServiceStack插件

我需要提供本地化数据服务所有本地化的响应 Dto 都共享相同的属性 IE 我定义了一个接口 ILocalizedDto 来标记那些 Dto 在请求端有一个ILocalizedRequest对于需要本地化的请求 Using IPlugin
有人可以提供一个使用 Amazon Web Services 的 itemsearch 的 C# 示例吗

我正在尝试使用 Amazon Web Services 查询艺术家和标题信息并接收回专辑封面使用 C 我找不到任何与此接近的示例所有在线示例都已过时并且不适用于 AWS 的较新版本有一个开源项目CodePlex http www c
.NET中的LinkedList是循环链表吗？

我需要一个循环链表所以我想知道是否LinkedList是循环链表吗每当您想要移动列表中的下一个块时以循环方式使用它的快速解决方案 current current Next current List First 电流在哪里Linke
线程和 fork()。我该如何处理呢？ [复制]

这个问题在这里已经有答案了可能的重复多线程程序中的fork https stackoverflow com questions 1235516 fork in multi threaded program 如果我有一个使用 fork 的
英特尔 Pin 与 C++14

问题我有一些关于在 C 14 或其他 C 版本中使用英特尔 Pin 的问题使用较新版本从较旧的 C 编译代码很少会出现任何问题但由于 Intel Pin 是操作指令级别的如果我使用 C 11 或 C 14 编译它是否会出现任何不良
Linq-to-entities，在一个查询中获取结果+行数

我已经看到了有关此事的多个问题但它们已经有 2 年或更长的历史了所以我想知道这方面是否有任何变化基本思想是填充网格视图并创建自定义分页所以我还需要结果和行数在 SQL 中这将类似于 SELECT COUNT id Id N
防止在工厂方法之外实例化对象

假设我有一个带有工厂方法的类 class A public static A newA Some code logging return new A 是否可以使用 a 来阻止此类对象的实例化new 那么工厂方法是创建对象实例的唯一方法吗当
在客户端系统中安装后桌面应用程序无法打开

我目前正在使用 Visual Studio 2017 和 4 6 1 net 框架我为桌面应用程序创建了安装文件安装程序在我的系统中完美安装并运行问题是安装程序在其他计算机上成功安装但应用程序无法打开 edit 在客户端系统中下载了

随机推荐

防止递归函数中出现 StackOverFlow

我有一个递归函数BaseClass这依赖于一个protected virtual函数的返回条件子类可能会错误地覆盖此函数并导致StackOverFlow例外最糟糕的是有一些缓慢的网络调用并且异常不会很快发生许多资源浪费了很长一段时间
Swift DateFormatter 可选毫秒[重复]

这个问题在这里已经有答案了我有以下代码来解析 ISO8601 日期 let dateFormatter DateFormatter dateFormatter dateFormat yyyy MM dd T HH mm ss SSSZZZ
Jsoup.parse() 与 Jsoup.parse() - 或者 Jsoup 中的 URL 检测如何工作？

Jsoup 有 2htmlparse 方法解析字符串 html 由于没有指定基本 URI 因此是绝对 URL 检测依赖于包含标签的 HTML 解析字符串 html 字符串 baseUri HTML 所在的 URL 被检索自用于将相对
如何在 Mac OS X 中实现全局键盘挂钩？

我知道这可以在 Windows 上完成XGrabKeyX11可以用但是Mac OS X呢我想创建一个类允许设置即使应用程序窗口处于非活动状态也可以调用的快捷键 Cocoa 中还没有不支持这一点您仍然可以使用旧的 Carbon 库
在 IPython Notebook 中同时使用 Python 2.x 和 Python 3.x

我使用 IPython 笔记本并且希望能够选择在 IPython 中创建 2 x 或 3 x python 笔记本我最初有Anaconda 使用 Anaconda 时必须更改全局环境变量以选择所需的 Python 版本然后才能启动
Mysql 错误 1452 - 无法添加或更新子行：外键约束失败

我遇到了一个奇怪的问题我正在尝试向引用另一个表的一个表添加外键但由于某种原因失败了由于我对 MySQL 的了解有限唯一可能怀疑的是另一张表上有一个外键引用了我试图引用的表我做了一个SHOW CREATE TABLE对两个表进行查询
如何使用copy_from_user的正确方法？

我正在尝试使用以下函数将值从用户空间复制到内核空间 static ssize t device write struct file filp const char buff size t len loff t off unsigned lo
D3D11：如何将 GDI 文本绘制到 GXDI 表面？（无 D2D）

我需要一些帮助来使用 GDI 和 D3D11 将文本绘制到纹理我尝试使用 D2D DirectWrite 但它仅支持 D3D10 而不支持我需要的 D3D11 到目前为止我尝试的一切都失败了现在我想使用GDI方法来写入纹理所以我用这个
打字稿错误：Map.values() 给出 IterableIterator 不是 Iterable

当我尝试迭代返回的值时 Typescript 给了我这个错误Map values 其中 Map 的类型为错误 TS2495 类型 IterableIterator 不是数组类型或字符串类型根据 ES6doc Map values 应该返
如何让 numpy 在 Anaconda Python 3.7.6 中正常工作

我正在尝试在 Python 中使用 NumPy 我刚刚安装了 Anaconda Python 3 7 一切似乎都很顺利但是我无法导入 numpy 使用行import numpy 当我这样做时我收到以下错误 C Users jsmith
停止Java中的循环线程

我正在使用一个不断从队列中读取数据的线程就像是 public void run Object obj while true synchronized objectsQueue if objectesQueue isEmpty try ob
我自己针对 Kotlin 缺少 try-with-resources 的解决方案

Kotlin 提供了use函数为Closeable对象但似乎他们忘记考虑AutoCloseable 例如 DB 准备好的语句用于 try with resources 完整的 Java 等效项我已经实施了下一个自制解决方案 inl
如何在 Java 中将 List 转换为 int[]？ [复制]

这个问题在这里已经有答案了我怎样才能转换List
FeedReaderContract 的目的是什么以及如何在 OpenHelper 类中定义内部类 [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心我正在android中学习SQLite 对于 SQLi
配置spring通过ssl连接mysql

我正在从 Java 应用程序通过 SSL 连接到 MySQL 我已将 MYSQL 配置为支持 SSL 并生成客户端证书我已将服务器 CA 证书和客户端证书导入密钥库这就是我的代码目前的样子 String url jdbc mysql 1
如何在 Android 应用程序中打开 Youtube 视频链接？

我的问题与有关如何打开 YouTube 链接的其他问题不同我的问题是如何打开 YouTube 链接然后当它在应用程序中打开时它应该关闭 YouTube 应用程序并再次调用我的MainActivity这将打开 YouTube 应用但是
这段代码如何在没有任何 print 语句的情况下打印 Hello World

我在 Python 中找到了这段代码它在不使用字符串 Hello World 的情况下打印 Hello World 这是一行代码一个表达式即没有打印语句 lambda getattr import True class name cl
如何在C++中做集合向量？

我可以做一个简单的集合数组 set lt char gt words new set lt char gt 10 我怎样才能做一个集合向量这会导致编译器错误 vector lt set lt char gt gt v 谢谢各位的解答 If
WiFi 状态未启用

我正在尝试创建一个用于启用和禁用 wifi 的小部件 if myWifiManager isWifiEnabled System out println Toggle Wifi Enabled going to disable myWifi
_mm_shuffle_ps() 相当于整数向量 (__m128i)？

The mm shuffle ps 内在允许将浮点输入交错为输出的低 2 个浮点和高 2 个浮点例如 R mm shuffle ps L1 H1 MM SHUFFLE 3 2 3 2 将导致 R 0 L1 2 R 1 L1 3 R 2 H

_mm_shuffle_ps() 相当于整数向量 (__m128i)？

_mm_shuffle_ps() 相当于整数向量 (__m128i)？ 的相关文章

随机推荐

热门标签

_mm_shuffle_ps() 相当于整数向量 (__m128i)？的相关文章