AVX2浮点比较并得到0.0或1.0而不是全0或全1位

2024-04-06

基本上，在生成的向量中，我想为所有输入浮点值 > 1 保存 1.0，而为所有输入浮点值

float f[8] = {1.2, 0.5, 1.7, 1.9, 0.34, 22.9, 18.6, 0.7};
float r[8]; // Must be {1, 0, 1, 1, 0, 1, 1, 0}

__m256i tmp1 = _mm256_cvttps_epi32(_mm256_loadu_ps(f));
__m256i tmp2 = _mm256_cmpgt_epi32(tmp1, _mm256_set1_epi32(1));
_mm256_store_ps(r, _mm256_cvtepi32_ps(tmp2));

for(int i = 0; i < 8; i++)
    std::cout << f[i] << " : " << r[i] << std::endl;

但我没有得到正确的结果。这就是我得到的。为什么 AVX2 关系操作对我来说不能正常工作？

1.2 : 0
0.5 : 0
1.7 : 0
1.9 : 0
0.34 : 0
22.9 : -1
18.6 : -1
0.7 : 0

我认为最好使用_mm256_cmp_ps对于你的问题。为此，我实施了以下计划。这超出了您想要的。如果你想保存，你应该设置全部mask元素到1，但如果您想保存另一个数字，您可以将掩码值更改为您想要的任何值。

//gcc 6.2, Linux-mint, Skylake 
#include <stdio.h>
#include <x86intrin.h>

float __attribute__(( aligned(32))) f[8] = {1.2, 0.5, 1.7, 1.9, 0.34, 22.9, 18.6, 1.0};
// float __attribute__(( aligned(32))) r[8]; // Must be {1, 0, 1, 1, 0, 1, 1, 0}
// in C++11, use alignas(32).  Or C11 _Alignas(32), instead of GNU C __attribute__.

void printVecps(__m256 vec)
{
    float tempps[8];
    _mm256_store_ps(&tempps[0], vec);
    printf(" [0]=%3.2f, [1]=%3.2f, [2]=%3.2f, [3]=%3.2f, [4]=%3.2f, [5]=%3.2f, [6]=%3.2f, [7]=%3.2f \n",
    tempps[0],tempps[1],tempps[2],tempps[3],tempps[4],tempps[5],tempps[6],tempps[7]) ;

}

int main()
{

    __m256 mask = _mm256_set1_ps(1.0), vec1, vec2, vec3;

    vec1 = _mm256_load_ps(&f[0]);                   printf("vec1 : ");printVecps(vec1); // load vector values from f[0]-f[7]
    vec2 = _mm256_cmp_ps ( mask, vec1, _CMP_LT_OS /*0x1*/);
                                                    printf("vec2 : ");printVecps(vec2); // compare them to mask (less)
    vec3 = _mm256_min_ps (vec2 , mask);             printf("vec3 : ");printVecps(vec3); // select minimum from mask and compared results

    return 0;
}

输出为mask = {1,1,1,1,1,1,1,1} is :

vec1 :  [0]=1.20, [1]=0.50, [2]=1.70, [3]=1.90, [4]=0.34, [5]=22.90, [6]=18.60, [7]=1.00 
vec2 :  [0]=-nan, [1]=0.00, [2]=-nan, [3]=-nan, [4]=0.00, [5]=-nan, [6]=-nan, [7]=0.00 
vec3 :  [0]=1.00, [1]=0.00, [2]=1.00, [3]=1.00, [4]=0.00, [5]=1.00, [6]=1.00, [7]=0.00

And for mask = {2,2,2,2,2,2,2,2} is :

vec1 :  [0]=1.20, [1]=0.50, [2]=1.70, [3]=1.90, [4]=0.34, [5]=22.90, [6]=18.60, [7]=1.00 
vec2 :  [0]=0.00, [1]=0.00, [2]=0.00, [3]=0.00, [4]=0.00, [5]=-nan, [6]=-nan, [7]=0.00 
vec3 :  [0]=0.00, [1]=0.00, [2]=0.00, [3]=0.00, [4]=0.00, [5]=2.00, [6]=2.00, [7]=0.00

这取决于非交换行为_mm256_min_ps使用 NaN 将 NaN 元素替换为 1.0。NaN > 1.0 : NaN : 1.0 = 1.0，因为NaN > anything总是假的。

当心7.0之前的gcc对待128b_mm_min_ps即使没有，本质上也是可交换的-ffast-math https://stackoverflow.com/questions/40196817/what-is-the-instruction-that-gives-branchless-fp-min-and-max-on-x86/40199125#40199125（尽管它知道minps指令不是）。使用最新的 gcc，或者确保 gcc 选择按照该算法所需的顺序使用操作数来编译代码。（或使用 clang）。 gcc 可能永远不会与 AVX 交换操作数，而只会与 SSE 交换（以避免额外的操作）movapd说明），但最安全的是使用 gcc7 或更高版本。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

AVX2浮点比较并得到0.0或1.0而不是全0或全1位的相关文章

电话号码的正则表达式，不允许全零

需要您的正则表达式帮助我当前的正则表达式是 d 8 最小长度为 8 不允许包含字母特殊字符和空格我还想禁止全零如 00000000 Thanks 该模式应该可以满足您的需求 0 d 8 The 0 部分是负前瞻将阻止仅输入零 Ex
setContextProperty 和对象的 setProperty 之间的区别

我现在真的很困惑有什么区别 QQmlApplicationEngine engine engine rootContext setContextProperty myObject userData and object gt setPro
在动态事件处理程序中引用“this”

在我的 myClass 类中我使用 Reflection Emit 为 myClass 类成员之一动态编写事件处理程序我已经成功地做到了这一点现在我想修改事件处理程序以调用 myClass 类中的实例方法之一但是我无法弄清楚如何
如何从RichTextBox中获取显示的文本？

如何获得显示的RichTextBox 中的文本我的意思是如果 RichTextBox 滚动到末尾我只想接收那些对我来说可见的行 P S 获得第一个显示的字符串就足够了您想使用 RichTextBox GetCharIndexFrom
键盘加速器在 UWP 应用中停止工作

我正在尝试将键盘加速器添加到 UWP 应用程序中的 CommandBar 菜单项当应用程序启动时这工作正常但在我第一次打开溢出菜单后加速器停止工作这似乎不会发生在主要命令菜单之外上只有溢出菜单内的辅助命令才会发生此外单击
是否允许将类模板类型参数键入相同的名称？

这似乎可以在 MSVC 中按预期编译甚至工作但它是合法的 C 代码吗它是否能保证执行此处所期望的操作即将模板类型导出到结构体的同名用户 template
找到的程序集的清单定义与程序集引用不匹配

我试图在 C Windows 窗体应用程序 Visual Studio 2005 中运行一些单元测试但出现以下错误 System IO FileLoadException 无法加载文件或程序集实用程序版本 1 2 0 200 文化中
如何在不实例化一个类的情况下检查它是否继承了另一个类？ [复制]

这个问题在这里已经有答案了假设我有一个如下所示的类 class Derived some inheritance stuff here 我想在我的代码中检查类似的内容 Derived is SomeType 但看起来像is运算符需要 De
序列化和反序列化 Visual Studio 解决方案文件 - 或以编程方式编辑？

我想以编程方式添加和删除项目解决方案文件夹和其他项目例如解决方案的资源文件但我不确定最好的方法是什么对于那些不知道的人高度简化解决方案文件 sln 通常如下所示 Microsoft Visual Studio Solution
我可以仅在少数情况下关闭模拟吗

我有一个始终使用模拟的应用程序但是当用户以管理员身份登录时一些操作需要他们写入服务器本身现在如果这些用户在实际服务器上没有权限有些用户没有则不会让他们写入我想做的是关闭几个命令的模拟有没有办法做这样的事情 using Ho
C# datagridview 列转入数组

我正在用 C 构建一个程序并在其中包含一个 datagridview 组件 datagridview 有固定数量的列 2 我想将其保存到两个单独的数组中但行数确实发生了变化我怎么能这样做呢假设一个名为 dataGridView1 的
手动将 ClientBase 集合类型从 Array[] 更改为 List<>

我将自己的 WCF 代理与 Client Base 一起使用我想做一些类似于 svc util 中的 ct 属性的操作并告诉代理返回 List 集合类型我不能使用 List 因为实体由 nhibernate 管理所以我必须使用 IL
防止GDB中的PLT（过程链接表）断点

在最新版本的 GDB 中在库函数调用上设置断点会导致多个实际断点调用过程链接表 PLT 实际的函数调用这意味着当调用库函数时我们每次都会经历两次中断在以前的 GDB 版本中只会创建 2 因此您只能得到一次中断那么问题来了是否
在VisualStudio DTE中，如何获取ActiveDocument的内容？

我正在 VisualStudio 中编写脚本并尝试获取当前 ActiveDocument 的内容这是我当前的解决方案 var visualStudio new API VisualStudio 2010 var vsDTE visual
系统错误 124 - SHFileOperation 的 ERROR_INVALID_LEVEL

我在使用时遇到问题SHFileOperation SHFileOperation SHFILEOPSTRUCT https stackoverflow com questions 9191415 shfileoperation shfile
设计 Javascript 前端 <-> C++ 后端通信

在我最近的将来我将不得不制作一个具有 C 后端和 Web 前端的系统要求目前我对此了解不多我认为前端将触发数据传输而不是后端所以不需要类似 Comet 的东西由于在该领域的经验可能很少我非常感谢您对我所做的设计决策的评论
如何使用收益返回和递归获得字母的每个组合？

我有几个像这样的字符串列表可能有几十个列表 1 A B C 2 1 2 3 3 D E F 这三个仅作为示例用户可以从几十个具有不同数量元素的类似列表中进行选择再举个例子这对于用户来说也是一个完全有效的选择 25 empty 4 1
如何访问窗口？

我正在尝试使用其句柄访问特定窗口即System IntPtr value Getting the process of Visual Studio program var process Process GetProcessesByNam
ASP.NET Core Razor Page 多路径路由

我正在使用 ASP NET Core 2 0 Razor Pages 不是 MVC 构建系统但在为页面添加多个路由时遇到问题例如所有页面都应该能够通过 abc com language 访问segment shop mypage 或
如何将对象转换为传递给函数的类型？

这不会编译但我想做的只是将对象转换为传递给函数的 t public void My Func Object input Type t t object ab TypeDescriptor GetConverter t ConvertFro

随机推荐

为什么 new Thread() 接受方法名称，即使没有一个构造函数重载似乎允许这样做？ [复制]

这个问题在这里已经有答案了可能的重复 new Thread void Target 和 new Thread new ThreadStart void Target 有什么区别 https stackoverflow com questi
C 编程语言中定义的“int”和“char”类型在哪里？

我正在研究C语言是如何工作的我可以找到类似类型的定义int8 t intptr t等在
我们如何将 JSON 与数据表一起使用？

我是 flutter 的新手但我做了很多工作来学习我的项目所需的一切我有一个由服务器使用 HTTP 发送的 JSON equipe1 PSG equipe2 DIJON type prono 1N2 equipe1 MONACO equ
来自 Github 的 hg-git 克隆给出“中止：存储库不相关”

我有一个项目其主要 Mercurial 存储库位于 SourceForge 上但在 Bitbucket Mercurial 和 Github Git 上有克隆现在我一直在使用hg git https bitbucket org dur
如何在数组中获取在 Discord.js 中具有角色的所有用户

我正在努力让所有成员都扮演一定的角色例如我的 Discord 服务器中有 gurdian 角色 ID 为 872029521484873779 我想要数组中所有在我的服务器中拥有 gurdian 角色的用户 Name 的列表我的代码如
MethodImplAttribute(InternalCall, Runtime) 对 COM Interop 接口的方法有何作用？

In NET Framework 的 Windows API 代码包 http archive msdn microsoft com WindowsAPICodePack COM Interop接口的许多方法都用MethodImplAttr
如何在python中比较和合并两个文件

我有两个文本文件名称是 one txt 和 Two txt 在 one txt 中内容是 AAA BBB CCC DDD 在two txt中内容是 DDD EEE 我想要一个Python代码来确定one txt中是否存在two txt
Gridview 行编辑 - 动态绑定到 DropDownList

我试图让 ASP NET 3 5 GridView 在显示时将选定的值显示为字符串并显示 DropDownList 以允许我在编辑时从给定的选项列表中选择一个值看起来很简单吗我的 gridview 看起来像这样简化
Facebook PHP SDK 出现错误

我正在尝试运行 Facebook 的 PHP SDK 附带的示例但出现以下错误致命错误未捕获的 CurlException 60 SSL证书问题请验证 CA 证书没问题细节错误 14090086 SSL 例程 SSL3 GET
命名类的最佳方法是什么？

为类想出好的精确的名称是出了名的困难如果做得好它可以使代码更加自我记录并提供用于在更高抽象级别推理代码的词汇表实现特定设计模式的类可能会根据众所周知的模式名称例如 FooFactory FooFacade 来命名而直接建模域概
SVG API：单个线段的长度

是否可以使用 Javascript API 获取 SVG 路径中单个段从锚点到锚点的长度我制作了弗朗西斯海姆舍解决方案的一些整洁版本这是完整的源代码 function getSegmentLengths path let segL
if() 和 ifelse() 函数之间的区别

我想要虚拟代码即为物种列创建标志变量我写了下面的代码 create dummies lt function data categorical preds if categorical preds setosa data setosa
Git 删除本地而非远程索引的文件

我使用 GitHub 进行多服务器部署一台是生产服务器一台是开发服务器有些配置文件我们称之为 config php 需要特定于服务器但是出于备份目的我们需要将产品的配置文件保留在 GitHub 服务器上然而在开发服务器上
（如何）我可以在 MyBatis 的 SQL 查询中安全且与数据库无关地使用“LIKE”吗？

In MyBatis http www mybatis org 您可以标记参数应插入到 SQL 中的位置如下所示从人员中选择其中 id id 此语法会激活正确的转义等以避免 SQL 注入攻击等如果您有可信输入并且想要跳过转义您可
为什么 array.index 比 array.include 快？

我正在处理一些大型数据集并尝试提高性能我需要确定一个对象是否包含在数组中我正在考虑使用index or include 所以我对两者进行了基准测试 require benchmark a 1 1 000 000 to a num 10
Kotlin：类继承了包含伴生对象的接口，但无法访问该接口的常量

这是界面 interface SomeInterface companion object const val MY CONST the constant 然后类没有主体因为只是一个例子 class SomeClass SomeInt
IIS 连接超时和连接字符串超时属性

我对这两个术语感到困惑我想知道连接字符串内的超时和 IIS 配置内的超时之间有什么区别 data source xxxx Initial Catalog Test User yy Password yyyy Timeout 10 DB连接超
只需找到服务器的IP地址

以下代码用于查找实际的本地 IP 地址例如192 168 1 X 主机服务器在开发机器上运行良好 ip getHostByName getHostName 将其传输到另一台服务器开始输出127 0 0 1 看来 getHostName 返
Oracle周计算问题

我正在使用 Oracle 的 to char 函数将日期转换为周数 1 53 select pat id pat enc csn id contact date to char contact date ww week ww 开关为我提供了
AVX2浮点比较并得到0.0或1.0而不是全0或全1位

基本上在生成的向量中我想为所有输入浮点值 gt 1 保存 1 0 而为所有输入浮点值 float f 8 1 2 0 5 1 7 1 9 0 34 22 9 18 6 0 7 float r 8 Must be 1 0 1 1 0 1

AVX2浮点比较并得到0.0或1.0而不是全0或全1位

AVX2浮点比较并得到0.0或1.0而不是全0或全1位 的相关文章

随机推荐

热门标签

AVX2浮点比较并得到0.0或1.0而不是全0或全1位的相关文章