有没有办法使用 i387 fsqrt 指令获得正确的舍入？

2024-05-09

有没有办法使用 i387 fsqrt 指令获得正确的舍入？...

...除了改变精确模式在 x87 控制字中 - 我知道这是可能的，但这不是一个合理的解决方案，因为它存在令人讨厌的重入型问题，如果 sqrt 操作中断，精度模式将出错。

我正在处理的问题如下：x87fsqrt操作码以 fpu 寄存器的精度执行正确舍入（根据 IEEE 754）平方根运算，我假设是扩展（80 位）精度。但是，我想用它来实现高效的单精度和双精度平方根函数，并且结果正确舍入（根据当前舍入模式）。由于结果精度过高，将结果转换为单精度或双精度的第二步再次舍入，可能会留下舍入不正确的结果。

通过一些操作，可以通过偏差来解决这个问题。例如，我可以通过添加 2 的幂形式的偏差来避免加法结果中的精度过高，该偏差强制双精度值的 52 个有效位进入 63 位扩展精度尾数的最后 52 位。但我没有看到任何明显的方法可以用平方根来完成这样的技巧。

有什么巧妙的想法吗？

（也标记为 C，因为预期的应用程序是 C 的实现sqrt and sqrtf功能。）

首先，让我们明确一点：您应该使用 SSE 而不是 x87。上交所sqrtss and sqrtsd指令完全按照您的要求执行，所有现代 x86 系统都支持，并且速度也显着加快。

现在，如果您坚持使用 x87，我将从好消息开始：您不需要为浮动做任何事情。你需要2p + 2位以 p 位浮点格式计算正确舍入的平方根。因为80 > 2*24 + 2，附加舍入到单精度将始终正确舍入，并且您有一个正确舍入的平方根。

现在坏消息是：80 < 2*53 + 2，所以双精度就没有这样的运气了。我可以建议几种解决方法；这是我脑海中想到的一个简单的好方法。

let y = round_to_double(x87_square_root(x));
使用 Dekker（头尾）积来计算a and b这样y*y = a + b确切地。
计算残差r = x - a - b.
if (r == 0) return y
if (r > 0), let y1 = y + 1 ulp，并计算a1, b1 s.t. y1*y1 = a1 + b1。比较r1 = x - a1 - b1 to r，并返回y or y1，取决于哪一个具有较小的残差（或者低位为零的残差，如果残差大小相等）。
if (r < 0)，做同样的事情y1 = y - 1 ulp.

此过程仅处理默认舍入模式；然而，在定向舍入模式中，简单地舍入到目标格式就可以做到正确的事情。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

有没有办法使用 i387 fsqrt 指令获得正确的舍入？的相关文章

在搜索 List 时，为什么 Enumerable.Any(Func predicate) 比带有 if 语句的 foreach 慢

最近有件事引起了我的好奇心 Why is the Enumerable Any Func
如何在 Android NDK 中创建新的 NativeWindow 而无需 Android 操作系统源代码？

我想编译一个 Android OpenGL 控制台应用程序您可以直接从控制台启动 Android x86 运行或者从 Android x86 GUI 内的 Android 终端应用程序运行这个帖子如何在 Android NDK 中创
C# 中的接口继承

我试图解决我在编写应用程序时遇到的相当大的对我来说问题请看这个为了简单起见我将尝试缩短代码我有一个名为的根接口IRepository
如何使用recv()检测客户端是否仍然连接（并且没有挂起）？

我写了一个多客户端服务器程序C on SuSE Linux 企业服务器 12 3 x86 64 我为每个客户端使用一个线程来接收数据我的问题是我使用一个终端来运行服务器并使用其他几个终端来运行服务器telnet到我的服务器作为客户端
ASP MVC：服务应该返回 IQueryable 的吗？

你怎么认为你的 DAO 应该返回一个 IQueryable 以便在你的控制器中使用它吗不您的控制器根本不应该处理任何复杂的逻辑保持苗条身材模型而不是 DAO 应该将控制器返回给视图所需的所有内容我认为在控制器类中看到查询甚至
如何识别 WPF 文本框中的 ValidationError 工具提示位置

我添加了一个箭头来指示工具提示中的文本框当文本框远离屏幕边缘时这非常有效但是当它靠近屏幕边缘时工具提示位置发生变化箭头显示在左侧 Here is the Image Correct as expected since TextBo
如何将“外部模板”与由同一类中的模板化成员使用的嵌套类一起使用？

首先一些背景信息我尝试以 Herb Sutter 在他的解决方案中介绍的方式使用 Pimpl 习语得到了 101 http herbsutter com gotw 101 这在头文件中看起来像这样 include pimpl h h
Qt 创建布局并动态添加小部件到布局

我正在尝试在 MainWindow 类中动态创建布局我有四个框架它们是用网格布局对象放置的每个框架都包含一个自定义的 ClockWidget 我希望 ClockWidget 对象在调整主窗口大小时相应地调整大小因此我需要将它们添加到
Azure 事件中心 - 按顺序接收事件

我使用下面的代码从 Azure Event Hub 接收事件 https learn microsoft com en us azure event hubs event hubs dotnet framework getstarted s
通过 NHibernate 进行查询，无需 N+1 - 包含示例

我有一个 N 1 问题我不知道如何解决它可以在这个问题的底部找到完全可重复的样本因此如果您愿意请创建数据库设置 NUnit 测试和所有附带的类并尝试在本地消除 N 1 这是我遇到的真实问题的匿名版本众所周知这段代码对于帮助
如何挤出平面 2D 网格并赋予其深度

我有一组共面连接的三角形即二维网格现在我需要将其在 z 轴上挤出几个单位网格由一组顶点定义渲染器通过与三角形数组匹配来理解这些顶点网格示例顶点 0 0 0 10 0 0 10 10 0 0 10 0 所以这里我们有一个二维正方
System.Runtime.InteropServices.COMException（0x80040154）：[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我在 C 项目中遇到异常 System Runtime InteropServices COMException 0x80040154 检
有没有一种简单的方法可以让 Visual Studio 2015 使用特定的 ToolsVersion？

使用特定版本构建项目或解决方案时msbuild我可以使用以下命令选择早期的 net 工具链 toolsversion or tv switch C Program Files x86 MSBuild 14 0 bin msbuild tv
剪贴板在 .NET 3.5 和 4 中的行为有所不同，但为什么呢？

我们最近将一个非常大的项目从 NET Framework 3 5 升级到 4 最初一切似乎都工作正常但现在复制粘贴操作开始出现错误我已经成功制作了一个小型的可复制应用程序它显示了 NET 3 5 和 4 中的不同行为我还找到了一种解
转到定义：“无法导航到插入符号下的符号。”

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动我今天突然开始在我的项目中遇到一个问题单击转到定义会出现一个奇怪的错误无法导航到
使用 C# 从 DateTime 获取日期

愚蠢的问题给定日期时间中的日期我知道它是星期二例如我如何知道它的 tue 2 和 mon 1 等 Thanks 您正在寻找星期几 http msdn microsoft com en us library system datetim
带重定向标准流的 C# + telnet 进程立即退出

我正在尝试用 C 做一个脚本化 telnet 项目有点类似于Tcl期望 http expect nist gov 我需要为其启动 telnet 进程并重定向和处理其 stdin stdout 流问题是生成的 telnet 进程在
Googletest：如何异步运行测试？

考虑到一个包含数千个测试的大型项目其中一些测试需要几分钟才能完成如果按顺序执行整套测试需要一个多小时才能完成通过并行执行测试可以减少测试时间据我所知没有办法直接从 googletest mock 做到这一点就像 async选项
使用 Crypto++ 获取 ECDSA 签名

我必须使用 Crypto 在变量中获取 ECDSA 签名我在启动 SignMessage 后尝试获取它但签名为空我怎样才能得到它你看过 Crypto wiki 吗上面有很多东西椭圆曲线数字签名算法 http www cryptop
是否可以在 C# 中强制接口实现为虚拟？

我今天遇到了一个问题试图重写尚未声明为虚拟的接口方法的实现在这种情况下我无法更改接口或基本实现而必须尝试其他方法但我想知道是否有一种方法可以强制类使用虚拟方法实现接口 Example interface IBuilder

随机推荐

在 android studio 上单击推送通知后重定向到特定活动

我正在努力开发一个 Android 应用程序以便在单击所有传入的推送通知时将应用程序重定向到特定的活动页面我是 Android 开发新手对我的编程感到抱歉下面是推送通知部分的 android manifest xml 如果对此主题有
Paradox 表 - Oledb 异常：外部表不是预期的格式

我正在使用 Oledb 从 Paradox 表中读取一些数据我遇到的问题是当我将代码复制到控制台应用程序时代码可以工作但在 WinForms 中却不行两者都以 x86 进行调试我实际上只是复制代码在 WinForms 应用程序
如何将 wsdl 内部架构设置为 Jaxb2Marshaller 以验证我所做的每篇文章？

我正在使用 SOAP Web 服务在调用它之前我必须验证每个 xml 帖子所以我正在使用 The CXF codegen 插件生成POJO树结构第三部分 wsdl xxxx soap service wsdl 一个类实现Web服务网关
KineticJS - 将舞台缩放到视口

我正在努力将默认分辨率设置为 1366x756 我会根据视口来放大和缩小它类似于此处显示的示例 http blogs msdn com b davrous archive 2012 04 06 modernizing your html5
在ansible中合并字典

我目前正在构建一个使用 ansible 安装 PHP 的角色并且在合并字典时遇到一些困难我尝试了多种方法来做到这一点但我无法让它像我想要的那样工作 A vars file my default values key value my
矩阵向量变换

我正在编写一个代码来制作软件蒙皮器骨骼皮肤动画并且我正处于优化阶段蒙皮器工作得很好并且在 Core 上 1 09 毫秒内对 4900 个三角形网格与 22 个骨骼进行蒙皮Duo 2 Ghz 笔记本我需要知道的是 1 有人可以
通过单击字段启用非活动字段

是否可以有一组非活动字段如果单击其中一个字段则某些字段将变为必填字段并运行某些代码段举例来说您显示了三个字段
Google 翻译 TTS API 被阻止

Google 实施了验证码来阻止人们访问 TTS 翻译 API 我在我的移动应用程序中使用它现在它没有返回任何东西如何绕过验证码将限定符 client tw ob 添加到查询末尾这个答案不再一致有效如果你滥用这个IP地址你的I
重命名（$project）数组中的字段 - MongoDB [重复]

这个问题在这里已经有答案了我有一个类似以下的文件 id 59ba903dacea50d0d7d47168 sections id 59d9dd7947ce651544c5d4c1 sectionName Section 1 id 59d9
ios7 绘图时出现延迟

我有一个应用程序在其中我正在视图上绘制一些草图到目前为止在我安装之前它运行良好ios7 我的应用程序使用触摸移动方法来识别运动的变化但是当我画一条线时触摸方法被调用但线不会更新直到我触摸结束ios7 所以画起来有一点点滞后它
如何在已实现特征的现有类型的枚举范围内实现特征？

如何在已实现特征的现有类型的枚举范围内实现特征我有这个 extern crate pnet use pnet packet ipv4 Ipv4Packet use pnet packet ipv6 Ipv6Packet enum Ethe
为什么要检查 Bower 组件？

鲍尔文档说注意如果您没有编写供其他人使用的包例如您正在构建 Web 应用程序则应始终将已安装的包签入源代码管理有谁能很好地回答为什么吗如果我正在制作一个网络应用程序我不希望我的存储库因库 X 版本的更新而混乱我只想更新 B
Keycloak 社交登录 REST API

我已经为我的 keycloak 实例启用了谷歌社交登录但我需要将其用作休息服务是否有可用于执行此操作的端点 Keycloak 中没有 Google 身份验证 API 但您可以使用以下方法解决它代币交换 https www keycloa
在 Java 5 及更高版本中迭代 java.util.Map 的所有键/值对的最简单方法是什么？

在 Java 5 及更高版本中迭代 java util Map 的所有键值对的最简单方法是什么假设K是您的密钥类型并且V是你的值类型 for Map Entry
在Powershell中，如何设置$？不将该值发送到管道？

PS gt gci C lt
ApplicationEventMulticaster 未初始化 - 在多播事件之前调用“刷新”

我正在尝试实施ehcache对于我的应用程序但是当尝试调用服务器时出现以下错误 java lang IllegalStateException ApplicationEventMulticaster not initialized ca
Xcode 7 Playground 执行 EXC_BAD_ACCESS

在 Xcode 7 Playgrounds 中运行最简单的默认代码得到以下错误 Playground execution failed Execution was interrupted reason EXC BAD ACCESS cod
为什么在快速合并两个视频或更改背景音乐后视频变成黑屏？

在我的 ios 应用程序中我想合并两个视频并更改背景音乐我尝试过对于普通视频来说效果很好但是当我选择任何延时视频然后尝试合并或更改背景音乐时视频变成全黑屏对于我的应用程序我使用 swift 4 2 和 xcode 10 我
在 Rails 上制作 ruby 占用更少的内存

我正在尝试运行 Ruby on Rails 项目 redmine http www redmine org 在 VPS 上它可以工作但需要相当多的内存与 VPS 的其余部分相比 rails 应用程序的使用量非常少我的服务器上也运行着
有没有办法使用 i387 fsqrt 指令获得正确的舍入？

有没有办法使用 i387 fsqrt 指令获得正确的舍入除了改变精确模式在 x87 控制字中我知道这是可能的但这不是一个合理的解决方案因为它存在令人讨厌的重入型问题如果 sqrt 操作中断精度模式将出错我正在处理的问题如下 x

有没有办法使用 i387 fsqrt 指令获得正确的舍入？

有没有办法使用 i387 fsqrt 指令获得正确的舍入？ 的相关文章

随机推荐

热门标签

有没有办法使用 i387 fsqrt 指令获得正确的舍入？的相关文章