AVX/SSE 轮向下浮动并返回整数向量？

2024-01-05

有没有办法使用 AVX/SSE 获取浮点数向量，向下舍入并生成整数向量？所有底层内在方法似乎都会产生一个最终的浮点向量，这很奇怪，因为四舍五入会产生一个整数！

SSE 可以根据您选择的截断（向零）或当前舍入模式（通常是 IEEE 默认模式，最接近的平局舍入到偶数）从 FP 转换为整数。nearbyint()，不像round()其中抢七局距离为 0。如果您需要 x86 上的舍入模式，你必须模仿它，也许用截断作为构建块 https://stackoverflow.com/questions/485525/round-for-float-in-c/24348037?noredirect=1#comment81665514_47329084.)

相关说明是CVTPS2DQ http://www.felixcloutier.com/x86/CVTPS2DQ.html and CVTTPS2DQ http://www.felixcloutier.com/x86/CVTTPS2DQ.html转换打包单精度floats to 有符号双字整数。助记符中带有额外 T 的版本执行截断而不是当前的舍入模式。

; xmm0 is assumed to be packed float input vector
cvttps2dq xmm0, xmm0
; xmm0 now contains the (rounded) packed integer vector

或者使用内在函数，__m128i _mm_cvt[t]ps_epi32(__m128 a)

对于 x86 在硬件中提供的其他两种舍入模式，floor（朝 -Inf）和 ceil（朝 +Inf），一种简单的方法是使用此 SSE4.1/AVXROUNDPS http://www.felixcloutier.com/x86/ROUNDPS.html转换为整数之前的指令。

代码如下所示：

roundps  xmm0, xmm0, 1    ; nearest=0, floor=1,  ceil=2, trunc=3
cvtps2dq xmm0, xmm0       ; or cvttps2dq, doesn't matter
; xmm0 now contains the floored packed integer vector

对于 AVX ymm 向量，请在指令前添加“V”前缀，并将 xmm 更改为 ymm。

ROUNDPS 的工作原理如下

对 xmm2/m128 中的压缩单精度浮点值进行四舍五入，并将结果放入 xmm1 中。舍入模式由imm8决定。

舍入模式（立即数/第三个操作数）可以具有以下值（取自表4-15 - Rounding Modes and Encoding of Rounding Control (RC) Field当前英特尔文档）：

Rounding Mode               RC Field Setting   Description
----------------------------------------------------------
Round to nearest (even)     00B                Rounded result is the closest to the infinitely precise result. If two values are equally close, the result is nearest (even) the even value (i.e., the integer value with the least-significant bit of zero).
Round down (toward −∞)      01B                Rounded result is closest to but no greater than the infinitely precise result.
Round up (toward +∞)        10B                Rounded result is closest to but no less than the infinitely precise result.
Round toward 0 (truncate)   11B                Rounded result is closest to but no greater in absolute value than the infinitely precise result.

舍入操作的返回向量的可能原因是float并不是int可能是这样，进一步的操作始终可以是浮点操作（对舍入值）并转换为int如图所示，这将是微不足道的。

相应的内在函数可以在引用的文档中找到。将上述代码转换为内在函数的示例（这取决于Rounding Control (RC) Field) is:

__m128 dst = _mm_cvtps_epi32( _mm_floor_ps(__m128 src) );

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

AVX/SSE 轮向下浮动并返回整数向量？的相关文章

静态只读字符串数组

我在我的 Web 应用程序中使用静态只读字符串数组基本上数组有错误代码我将所有类似的错误代码保存在一个数组中并检查该数组而不是检查不同常量字符串中的每个错误代码 like public static readonly string m
如何捕获未发送到 stdout 的命令行文本？

我在项目中使用 LAME 命令行 mp3 编码器我希望能够看到某人正在使用什么版本如果我只执行 LAME exe 而不带参数我会得到例如 C LAME gt LAME exe LAME 32 bits version 3 98 2
以编程方式读取 SQL Server 查询计划建议的 SQL 特定执行的索引？

如果我在 SSMS 中运行此命令 set showplan xml on GO exec some procedure arg1 arg2 arg3 GO set showplan xml off GO 我获得查询执行中涉及的完整调用堆栈的
ComboBox DataBinding 导致 ArgumentException

我的几个类对象 class Person public string Name get set public string Sex get set public int Age get set public override string
如何填充 ToolStripComboBox？

我发现它很难将数据绑定到ToolStripComboBox 好像没有这个ValueMember and DisplayMember特性怎么绑定呢访问toolstripcombobox中包装的组合框并访问其ValueMember Disp
当一组凭据下的计划任务启动的进程在另一组凭据下运行另一个程序时，Windows 是否有限制

所以我有一个简单的例子其中我有应用程序 A 它对用户 X 本地管理员有一些硬编码的凭据然后它使用硬编码的绝对路径启动带有这些凭据的应用程序 B A 和 B 以及 dotnet 控制台应用程序但是它们不与控制台交互只是将信息写入文件
从同一个类中的另一个构造函数调用构造函数

我有一个带有两个构造函数的类 C 这是代码片段 public class FooBar public FooBar string s constructor 1 some functionality public FooBar int i
C# 存档中的文件列表

我正在创建一个 FileFinder 类您可以在其中进行如下搜索 var fileFinder new FileFinder new string C MyFolder1 C MyFolder2 new string
保护 APK 中的字符串

我正在使用 Xamarin 的 Mono for Android 开发一个 Android 应用程序我目前正在努力使用 Google Play API 添加应用内购买功能为此我需要从我的应用程序内向 Google 发送公共许可证密钥
等待 IAsyncResult 函数直至完成

我需要创建等待 IAsyncResult 方法完成的机制我怎样才能做到这一点 IAsyncResult result contactGroupServices BeginDeleteContact contactToRemove Uri
使 Guid 属性成为线程安全的

我的一个类有一个 Guid 类型的属性该属性可以由多个线程同时读写我的印象是对 Guid 的读取和写入不是原子的因此我应该锁定它们我选择这样做 public Guid TestKey get lock testKeyLock ret
打印大型 WPF 用户控件

我有一个巨大的数据我想使用 WPF 打印我发现WPF提供了一个PrintDialog PrintVisual用于打印派生的任何 WPF 控件的方法Visual class PrintVisual只会打印一页因此我需要缩放控件以适合页面
WebBrowser.Print() 等待完成。。网

我在 VB NET 中使用 WebBrowser 控件并调用 Print 方法我正在使用 PDF 打印机进行打印当调用 Print 时它不会立即启动它会等到完成整个子或块的运行代码我需要确保我正在打印的文件也完整并继续处理该文件
OpenGL：仅获取模板缓冲区而没有深度缓冲区？

我想获取一个模板缓冲区但如果可能的话不要承受附加深度缓冲区的开销因为我不会使用它我发现的大多数资源表明虽然模板缓冲区是可选的例如排除它以利于获得更高的深度缓冲区精度但我还没有看到任何请求并成功获取仅 8 位模板缓冲区的代码
这个可变参数模板示例有什么问题？

基类是 include
可访问性不一致：参数类型的可访问性低于方法

我试图在两个表单之间传递一个对象基本上是对当前登录用户的引用目前我在登录表单中有一些类似的内容 private ACTInterface oActInterface public void button1 Click object s
堆栈是向上增长还是向下增长？

我在 C 中有这段代码 int q 10 int s 5 int a 3 printf Address of a d n int a printf Address of a 1 d n int a 1 printf Address of a
如何在richtextbox中使用多颜色[重复]

这个问题在这里已经有答案了我使用 C windows 窗体并且有 richtextbox 我想将一些文本设置为红色一些设置为绿色一些设置为黑色怎么办呢附图片 System Windows Forms RichTextBox有一个
如何将十六进制字符串转换为无符号长整型？

我有以下十六进制值 CString str str T FFF000 如何将其转换为unsigned long 您可以使用strtol作用于常规 C 字符串的函数它使用指定的基数将字符串转换为 long long l strtol str
不区分大小写的字符串比较 C++ [重复]

这个问题在这里已经有答案了我知道有一些方法可以进行忽略大小写的比较其中涉及遍历字符串或一个good one https stackoverflow com questions 11635 case insensitive string

随机推荐

null 作为类型参数的实例

好吧我知道最好不要使用空值作为设计选择但在这种情况下我必须这样做为什么以下内容不能编译 def test T lt AnyRef o Option T T o getOrElse null Error 19 53 type misma
pgAdmin III：如何查看 blob？

我知道 PostgreSQL 将 BLOB 内容写入单独的表但是有没有办法从 pgAdmin 内部以简单方便的方式查看 blob 内容 SELECT encode blobdata bytea escape FROM table as o
为什么 Scala 基元在 Java 反射中不显示为类型参数？

给定以下案例类别 case class Foo bar Int baz Boolean qux Option Int quux Option Boolean quuux Option Integer 我期望以下内容 for f lt cla
如何让 conda 命令匹配 Vscode 集成终端和普通终端中的行为？

我被推迟了因为conda info envs不显示与我的终端相同的内容终端 automl brandBrandoParetoopareto anaconda3 envs conda info envs conda environment
py2app 错误：在 find_needed_modules 中 TypeError：“NoneType”对象没有属性“__getitem__”

我在使用 py2app 时遇到了一些麻烦由于某种原因我开发的所有脚本总是出现相同的错误目前我正在使用最新的 MacPorts 版本经过两天的测试我无法找出问题所在 py2app 的 setup py 文件之一是 from setup
使用 mutate 计算表 6 列之间的所有绝对差异？ [复制]

这个问题在这里已经有答案了我有一个包含 6 列 Z1 到 Z6 的表我想计算每列之间差异的绝对值到目前为止我列举了 mutate 命令中的所有差异 FactArray lt FactArray gt mutate diff12 ab
检查 write()/send() 是否可以无阻塞地处理整个缓冲区，否则失败（无部分写入）

我正在使用 SOCK SEQPACKET 连接确保通过单个 write send 调用发送整个缓冲区对我来说至关重要我还使用设备驱动程序进行操作该驱动程序旨在通过单个调用处理完整的数据块同时我想处理 write send 由于缓冲区
ASP.NET MVC 和 Oracle DB 之间的互操作 (12c)

我在 Oracle DB 和 ASP NET MVC 之间确实遇到了严重的问题 How to use Oracle DB in Visual Studio 我的环境是 Oracle 数据库 12c 视觉工作室 2015 带有 VMware
单个命令即可创建文件并设置其权限

我使用以下 2 个命令创建一个 0B 文件并将其扩展名设置为 644 touch filename ext chmod 777 filename txt 我的问题是 unix korn shell 中是否有任何单个命令可以同时完成这两件事
WPF 画布 - 单像素网格

我有一个自定义的 WPF Canvas 我想在其上显示一个网格我通过重写 Canvas 上的 OnRender 方法并使用 DrawingContext 绘图函数来实现这一点 IsGridVisible GridWidth GridHei
easy_install M2Crypto 在 Windows 平台上失败

我正在尝试在 Windows XP 平台上安装 M2Crypto 我安装了 Python easy install 和 SWIG 但是当我尝试easy install M2Crypto我得到以下信息 SWIG m2crypto i 31 E
如何在 pandas.multiindex 级别应用条件？

我的数据看起来像这样 ch 频道 det 探测器 ch det time counts 1 1 0 123 2 0 121 3 0 125 2 1 0 212 2 0 210 3 0 210 1 1 1 124 2 1 125 3 1 12
Google 可视化 API (gviz) 查询并从电子表格获取数据

我正在使用 Google Visualization API 来查询电子表格如果我将 URL 粘贴到浏览器中 https docs google com spreadsheets d 14dIMLkVwHRo bkvdIhaDwC rGB
PHP MySQL 对话流

我正在使用 PHP webhook 设置聊天机器人 dialogflow 我想要做的是获取用户输入来查询 MySQL 表并将结果传递回对话流 API到目前为止我成功地将文本字符串传递回 API 但我不明白如何查询数据库并将结果传递回对话流
c# 和 Encoding.ASCII.GetString

byte header new byte 255 216 string ascii Encoding ASCII GetString header 我希望 ASCII 等于 FFD8 JPEG SOI 标记相反我得到在这种情况下您最
如何在 C# 中为 PPTX 文件生成缩略图？

有没有办法使用 OpenXML 库自动为 PPTX 文件创建缩略图我正在构建一个小型 C ASP NET Web 应用程序用于从 PPTX 文件库构建 PPTX 文件要求之一是显示库中每个 PPTX 文件的缩略图我想将其自动化因为
Doctrine_RawSql 查询中的聚合值

是否可以在 Doctrine RawSql 查询中使用聚合值这就是我想做的 q new Doctrine RawSql q gt select q AVG a value AS avg q gt from complex from cla
未捕获的类型错误：尝试访问对象时调用非对象的 Object.keys

我正在尝试使用访问对象内部的数组Object keys obj arr 方法如果我像下面一样直接访问数组那么它会给出正确的输出 alert Object keys obj arr 但如果我使用参数传递数组名称则会出现错误 var se
在两个 Arduino Mega 上使用 pyfirmata 读取模拟值时出现问题

对于我的项目我需要读取两个 Arduino Mega 上的多个模拟引脚其他任务如PWM工作得很好但在读取模拟引脚时我只能读取其中一块板的值其他显示无 A0板1 0 5601 A0 板 2 无如果我只使用一块板那么它们都可以读取
AVX/SSE 轮向下浮动并返回整数向量？

有没有办法使用 AVX SSE 获取浮点数向量向下舍入并生成整数向量所有底层内在方法似乎都会产生一个最终的浮点向量这很奇怪因为四舍五入会产生一个整数 SSE 可以根据您选择的截断向零或当前舍入模式通常是 IEEE 默认模式最

AVX/SSE 轮向下浮动并返回整数向量？

AVX/SSE 轮向下浮动并返回整数向量？ 的相关文章

随机推荐

热门标签

AVX/SSE 轮向下浮动并返回整数向量？的相关文章