_ftol2_sse，有更快的选择吗？

2024-04-25

我有调用很多的代码

int myNumber = (int)(floatNumber);

这总共占用了我大约 10% 的 CPU 时间（根据分析器）。虽然我可以就这样，但我想知道是否有更快的选择，所以我尝试四处搜索，并偶然发现

http://devmaster.net/forums/topic/7804-fast-int-float-conversion-routines/ http://devmaster.net/forums/topic/7804-fast-int-float-conversion-routines/ http://stereopsis.com/FPU.html http://stereopsis.com/FPU.html

我尝试实现那里给出的 Real2Int() 函数，但它给出了错误的结果，并且运行速度较慢。现在我想知道，是否有更快的实现将双精度/浮点值转换为整数，或者 SSE2 版本是否尽可能快？我发现的页面可以追溯到很久以前，所以它可能只是过时了，而较新的 STL 在这方面速度更快。

当前的实现是：

013B1030  call        _ftol2_sse (13B19A0h)

013B19A0  cmp         dword ptr [___sse2_available (13B3378h)],0  
013B19A7  je          _ftol2 (13B19D6h)  
013B19A9  push        ebp  
013B19AA  mov         ebp,esp  
013B19AC  sub         esp,8  
013B19AF  and         esp,0FFFFFFF8h  
013B19B2  fstp        qword ptr [esp]  
013B19B5  cvttsd2si   eax,mmword ptr [esp]  
013B19BA  leave  
013B19BB  ret

我发现的相关问题：

ARM 上的快速浮点到整数转换和浮点精度 (iPhone 3GS/4) https://stackoverflow.com/questions/3483670/fast-float-to-int-conversion-and-floating-point-precision-on-arm-iphone-3gs-4

在 x86 上将 float 转换为 int 的最快方法是什么 https://stackoverflow.com/questions/78619/what-is-the-fastest-way-to-convert-float-to-int-on-x86

由于两者都很旧，或者都是基于 ARM 的，我想知道当前是否有方法可以做到这一点。请注意，它说最好的转换是不会发生的转换，但我需要它，所以这是不可能的。

如果您的目标是通用 x86 硬件，则很难击败它。运行时不确定目标机器是否具有 SSE 单元。如果确实如此，它可以执行 x64 编译器的操作并内联cvttss2si操作码。但由于运行时必须检查 SSE 单元是否可用，因此您只能使用当前的实现。这就是执行的内容ftol2_sse做。更重要的是，它会传递 x87 寄存器中的值，然后在 SSE 单元可用时将其传输到 SSE 寄存器。

您可以告诉 x86 编译器以具有 SSE 单元的机器为目标。那么编译器确实会发出一个简单的cvttss2si内联操作码。这将是您能达到的最快速度。但如果你在旧机器上运行代码，那么它就会失败。也许您可以提供两种版本，一种适用于具有 SSE 的机器，另一种适用于没有 SSE 的机器。

这不会给你带来太多好处。这只是为了避免所有的开销ftol2_sse这发生在你真正到达之前cvttss2si完成这项工作的操作码。

要从 IDE 更改编译器设置，请使用项目 > 属性 > 配置属性 > C/C++ > 代码生成 > 启用增强指令集。在命令行上它是 /arch:SSE 或 /arch:SSE2。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

floatingpoint

_ftol2_sse，有更快的选择吗？的相关文章

访问特征矩阵的行向量时复制或引用

我正在使用的代码Eigen http eigen tuxfamily org index php title Main Page矩阵库我注意到在整个代码中有如下访问器 RowVector3f V size t vertex index
如何将动态数据写入 MVC 3 Razor 中的页面布局？

我有带有 Razor 引擎的 MVC 3 C 项目将动态数据写入 Layout cshtml 的方法和最佳实践是什么例如也许我想在网站的右上角显示用户名该名称来自会话数据库或基于用户登录的任何内容更新我也在寻找将某些数据渲染到
如何在 Asp.Net Core 6 中向类型化 HttpClient 添加承载令牌身份验证

我正在尝试使用 ASP Net Core 6 设置一个 Web api 以便用户可以到达我的端点然后我使用特权帐户在幕后的 D365 中执行一些工作我正在使用类型化的 HTTP 客户端但我不确定如何插入承载身份验证以便来自该客户端的
为什么迭代器类型推导失败？ [复制]

这个问题在这里已经有答案了为什么这在 C 中不起作用为什么我不能限制foo的参数为std vector
ptrace和waitpid有什么关系？

我正在练习使用ptrace但我不太了解它和之间的关系waitpid 这是我的测试程序 int main int argc char argv pid t pid 22092 if ptrace PTRACE ATTACH pid NULL
这种对有效类型规则的使用是否严格遵守？

C99和C11中的有效类型规则规定没有声明类型的存储可以用任何类型写入并且存储非字符类型的值将相应地设置存储的有效类型抛开 INT MAX 可能小于 123456789 的事实不谈以下代码对有效类型规则的使用是否严格符合 inclu
如何将 mat 转换为 array2d？

我为dlib http dlib net face landmark detection ex cpp html那里的面部地标代码使用 array2d 来获取图像但我喜欢使用 Mat 读取图像并转换为 array2d 因为 dlib 仅支
使用正则表达式解析日志文件

我目前正在为我们的内部日志文件由 log4php log4net 和 log4j 生成开发一个解析器到目前为止我有一个很好的正则表达式来解析日志除了一个烦人的一点一些日志消息跨越多行我无法正确匹配我现在的正则表达式是这样的
在关键服务器上对字符串进行内存受限的外部排序，并合并和计算重复项（数十亿个文件名）

我们的服务器生成如下文件 c521c143 2a23 42ef 89d1 557915e2323a sign xml在其日志文件夹中第一部分是GUID 第二部分是名称模板我想计算具有同名模板的文件的数量例如我们有 c521c143
如何在 C# 中创建 PKCS12 .p12 文件？

这可能是一个n00b问题但我在这方面确实没有任何经验我需要创建一个包含 X509 证书和私钥的 p12 捆绑包我当前有两个对象 X509Certificate2 和包含关键信息的 RSAParameters 对象如何将它们合并到 p
如何在控制器中使用多个 DBContext

如何在控制器中使用多个 DBContext 我尝试以不同的方式重载构造函数一些控制器 public C1 DBContext1 a DBContext2 b DBContext3 c public C1 DBContext1 a publ
我如何模拟 UserManager 和 RoleManager 进行单元测试

我模拟了抽象类来测试类的具体方法如下所示 var mock new Mock
为什么 std::atomic 比 volatile bool 慢很多？

多年来我一直使用 volatile bool 来控制线程执行并且效果很好 in my class declaration volatile bool stop In the thread function while stop do th
多个包含带有变量定义的头文件

我只是构建一个简单的 C 项目代码如下所示 head h ifndef HEAD H define HEAD H int my var 100 endif src1 cpp include head h src2 cpp include
OpenSSL：无需 SSL_read() / SSL_write() 即可执行加密/解密

我已经用 C 语言编写了一个基于事件的网络库现在我想通过 OpenSSL 添加 SSL TLS 支持而不是使用SSL read and SSL write 我宁愿让 OpenSSL 只执行传出传入数据的加密解密让我自己传输接收数
在 C++ 中什么时候首选传递指针而不是引用传递？

我可以想象一种情况其中输入参数可以为 NULL 以便首选传递指针而不是传递引用有人可以添加更多案例吗在传递的对象实际上将被修改的情况下有些人更喜欢传递指针当对象通过引用传递时它们使用 pass by const referenc
为什么 getch 不可移植？

是什么使得 getch 本质上无法作为标准 C 函数包含在内对于控制台界面来说它是如此直观和优雅如果没有它要求输入单个字符总是会产生误导因为用户可以输入多个键更糟糕的是您经常需要确保在读取控制台输入后清除标准输入这甚至不是作
曲线/路径骨架二值图像处理

我正在尝试开发一个可以处理图像骨架的路径曲线的代码我想要一个来自两点之间骨架的点向量该代码在添加一些点后结束我没有找到解决方案 include opencv2 highgui highgui hpp include opencv2
Cordova 上的 ClearCookiesAsync()

我正在尝试使用 wp8 cordova 中的插件来清除 WebBrowser cookie 我已经让它与 JavaScript 进行通信并且我的 c 文件中有类似这样的内容 using WPCordovaClassLib Cordova
在地图上使用 find

如何使用 find 和 aconst iterator如果你有一个地图定义为 typedef std pair

随机推荐

初始化 PHP 交互

我经常发现PHP的交互模式 php a 非常有用但如果我可以启动它并立即执行一些命令来初始化我的环境那会更有用比如运行自动加载器设置一些use命名空间的快捷方式等这是一个例子 include autoloader php use
Spark 数据集编码器：kryo() 与 bean()

在 Spark 中处理数据集时我们需要指定编码器来序列化和反序列化对象我们可以选择使用Encoders bean Class
Python CTRL+C 退出解释器？

Python 2 73 Why is it on my laptop when I hit CTRL C I can exit the interpreter and on my desktop hitting CTRL C will ma
输出字符串末尾的空白不与字符串一起打印，而是与其后的下一个打印行一起打印

我尝试打印一行要求用户输入获取输入然后再次打印一些行问题是在我获得输入后第一个打印行末尾的空白不是打印在该行的末尾而是打印在第二个打印行的开头我对 C 完全陌生所以我不能真正尝试太多但我尝试在没有提示用户输入的部分的情况
Spring消息标签javascript转义

当我们尝试使用 spring 标签显示属性文件中的标签时我们可以编写
我可以获取标准库中定义的函数的地址吗？

考虑以下代码 include
使用 Windows.Services.Store Addons 模拟购买

我编写了一个基于 Windows Services Store 的应用内购买系统现在我希望确保我的用户得到他们所付出的代价在旧的 API 中我可以模拟购买我怎样才能让每次购买成功而不需要每次都从我的信用卡贝宝中注入真钱我无法返
了解事件的前一个处理程序是否返回 false。 IE < 9 中的默认阻止？

我设置了一个全局模式正在加载请稍候 div 在一个应用程序中它每次都会显示 a or a div
Visual Studio Code 安装位置

我几天前安装了 Visual Studio Code 但现在在我的计算机上找不到可执行文件它在哪里我已经检查了程序和功能我还检查了我的路径由于某种原因它也不在其中更新 10 11 2018 如果您进行完全重新安装包括卸载计算机
函数定义上的纯说明符

在 GCC 上编译时我得到了错误函数定义上的纯说明符但当我使用 VS2005 编译相同的代码时则不然 class Dummy error pure specifier on function definition VS2005 comp
如果我是 Python 新手，我应该使用哪个版本的 Python？

如果我对 Python 完全陌生并且正在阅读有关将语句打印到控制台变量类型集合等的内容我应该使用哪个版本的 Python 我知道有大量适用于 Python 2 6 x 的第三方库但我担心我会学到一些不能很好地移植到 Python
Vala vapi 文件文档

我想使用 Vala 破解现有的基于 GLib 的 C 项目基本上我正在做的是在构建过程开始时使用 valac 从 vala 文件生成 c 和 h 文件然后像编译任何 c 或 h 文件一样编译生成的文件这可能不是最好的方法但在大多
Total Blank Unity / Microsoft Store Build 未通过 WACK 测试

我一直在努力为我的游戏取得成功统一 2018 2 1f1 and 视觉工作室 2017 15 8 0 尝试为 Windows 商店成功构建打包 WACK 失败后所有每个不同的配置我尝试了完全空白默认Unity UWP平台应用程序生成
下边框边距

有什么方法可以只在边框上添加边距吗只有边框应该有边距而不是文本我正在尝试移动边框而不是文本字段需要缩小移动边框而不是文本 CSS margin check border bottom 1px solid d2d7da margin
（已解决）插件选项不允许使用多个值 androidx.compose.compiler.plugins.kotlin:reportsDestination

我正在使用 Android Studio 与 Kotlin 进行 Android 开发我的项目中有40多个Android模块其中一些是Java模块一些主题是android模块 Kotlin Version 1 8 20 Hilt Ve
在 WinForms 表单之间传递数据[重复]

这个问题在这里已经有答案了我在项目中创建了一个辅助表单它可以从主表单获取数据并且在单击按钮时应将一些数据传递到主表单这是代码 Add cs private void button1 Click object sender Event
将响应缓冲区转换为 JSON

在 AWS 中我使用 https 模块通过 Lambda 发出 get 请求我能够返回数据但当我调用时它是缓冲区格式的callback null obj https get options res gt res on data d g
为什么我无法计算正确的 HMAC 签名？

我正在尝试在 Google Apps 脚本中计算 HMAC 签名但文档并未 100 清楚地说明我需要如何传递参数并且我无法获得预期的输出为了确定我是否获得正确的输出我将结果与已知良好的 PHP 代码进行比较该代码是 key a2V
如何为一系列任务设计执行引擎

我正在尝试用 Java 编写一个问题我必须执行一堆任务 Problem 执行由多个任务组成的作业并且这些任务之间具有依赖关系一个作业将有一个任务列表每个这样的任务将进一步有一个后续任务列表每个后续任务将有自己的后续任务您可以在此
_ftol2_sse，有更快的选择吗？

我有调用很多的代码 int myNumber int floatNumber 这总共占用了我大约 10 的 CPU 时间根据分析器虽然我可以就这样但我想知道是否有更快的选择所以我尝试四处搜索并偶然发现 http devmaster

_ftol2_sse，有更快的选择吗？

_ftol2_sse，有更快的选择吗？ 的相关文章

随机推荐

热门标签

_ftol2_sse，有更快的选择吗？的相关文章