GCC的sqrt()编译后如何工作？使用哪种root方法？牛顿-拉夫森？

2024-05-16

只是对标准感到好奇sqrt()来自 GCC 上的 math.h 。我自己编码的sqrt()使用牛顿拉夫森来做到这一点！

是的，我知道 fsqrt。但CPU是如何做到这一点的呢？我无法调试硬件

现代 CPU 中的典型 div/sqrt 硬件使用 2 基数的幂来一次计算多个结果位。例如http://www.imm.dtu.dk/~alna/pubs/ARITH20.pdf http://www.imm.dtu.dk/~alna/pubs/ARITH20.pdf介绍 Radix-16 div/sqrt ALU 的设计细节，并将其与 Penryn 中的设计进行比较。（他们声称延迟更低，功耗更低。）我查看了图片；看起来总体思路是做一些事情并通过乘法器和加法器迭代地反馈结果，基本上就像长除法一样。我认为类似于在软件中一次进行一点划分的方式。

Intel Broadwell 推出了 Radix-1024 div/sqrt 单位。询问 Penryn (Radix-16) 和 Broadwell 之间的变化。例如加宽了 SIMD 向量除法器，因此 256 位除法比 128 位除法速度更慢，并且增加了基数。

也许还看到

Intel x86处理器的整数除法算法 https://stackoverflow.com/questions/8401194/the-integer-division-algorithm-of-intels-x86-processors- Merom 的 Radix-2 和 Radix-4 分隔器被 Penryn 的 Radix-16 取代。（Core2 65nm 与 45nm）
https:// electronics.stackexchange.com/questions/280673/why-does-hardware-division-take-much-longer-than-multiplication https://electronics.stackexchange.com/questions/280673/why-does-hardware-division-take-much-longer-than-multiplication
https://scicomp.stackexchange.com/questions/187/why-is-division-so-much-more-complex-than-other-arithmetic-operations https://scicomp.stackexchange.com/questions/187/why-is-division-so-much-more-complex-than-other-arithmetic-operations

但无论硬件如何工作，IEEE 要求sqrt（以及 mul/div/add/sub）给出正确舍入 result，即误差你不需要知道它是如何工作的，只需要知道它的性能。这些操作比较特殊，其他功能如log and sin do not有这个要求，而真正的库实现通常不是那么准确。（和x87 fsin绝对不是那么准确 https://randomascii.wordpress.com/2014/10/09/intel-underestimates-error-bounds-by-1-3-quintillion/对于 Pi/2 附近的输入，范围缩小中的灾难性取消可能会导致huge相对误差。）

See https://agner.org/optimize/ https://agner.org/optimize/适用于 x86 指令表，包括标量和 SIMD 的吞吐量和延迟sqrtsd / sqrtss及其更广泛的版本。我收集了结果浮点除法与浮点乘法 https://stackoverflow.com/questions/4125033/floating-point-division-vs-floating-point-multiplication/45899202#45899202

对于非 x86 硬件 sqrt，您必须查看其他供应商发布的数据，或者测试过它的人的结果。

与大多数指令不同，sqrt性能通常取决于数据。（通常，更高的有效位或更大的结果量需要更长的时间）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

GCC的sqrt()编译后如何工作？使用哪种root方法？牛顿-拉夫森？的相关文章

如何在类文件中使用 Url.Action() ？

如何在 MVC 项目的类文件中使用 Url Action Like namespace 3harf public class myFunction public static void CheckUserAdminPanelPermissi
从复选框列表中选择循环生成的复选框中的一个复选框

抱歉我的英语不好在我的 ASP NET 网站上我从 SQL 表导入软件列表看起来像这样但实际上要长得多 Microsoft Application Error Reporting br br Microsoft Applicatio
当事件button.click发生时，如何获取按钮名称/标签？

我以编程方式制作按钮并将它们添加到堆栈面板中以便每次用户导航到页面时按钮都会发生变化我正在尝试做这样的事情当我单击创建的按钮时它将获取按钮的标签并转到正确的页面但是我无法使用 RoutedEventHandler 访问按钮元素
`list()` 被认为是一个函数吗？

list显然是内置类型 https docs python org 3 library stdtypes html list在Python中我看到底下有一条评论this https stackoverflow com a 53645813
有些有助于理解“产量”

在我不断追求少吸的过程中我试图理解产量的说法但我不断遇到同样的错误 someMethod 的主体不能是迭代器块因为 System Collections Generic List 不是迭代器接口类型这是我被卡住的代码 forea
获取没有显式特征的整数模板参数的有符号/无符号变体

我希望定义一个模板类其模板参数始终是整数类型该类将包含两个成员其中之一是类型T 另一个作为类型的无符号变体T 即如果T int then T Unsigned unsigned int 我的第一直觉是这样做 template
从网页运行 ClickOnce 应用程序，无需用户操作

我们有一个基于 Java 的 Web 应用程序以及用 C 编写的相同应用程序如果 java 检查器发现客户端计算机上没有安装 Java 则应该运行该应用程序这个想法是运行 C 单击一次 http en wikipedia org wik
如果输入被重定向则执行操作

我想知道如果我的输入被重定向我应该如何在 C 程序中执行操作例如假设我有已编译的程序 prog 并且我将输入 input txt 重定向到它我这样做 prog lt input txt 我如何在代码中检测到这一点一般来说您无法判
不可变类与结构

以下是类与 C 中的结构的唯一区别如果我错了请纠正我类变量是引用而结构变量是值因此在赋值和参数传递中复制结构的整个值类变量是存储在堆栈上的指针指向堆上的内存而结构变量作为值存储在堆上假设我有一个不可变的结构该结构的字段一
在 C# 中为父窗体中的子窗体控件添加事件处理程序

我有两种形式一种是带有按钮和文本框的父表单单击该按钮时将打开一个对话框该子窗体又包含一个文本框和一个按钮现在我想要的是每当子表单文本框中的文本更改时父表单文本框中的文本会自动更改为了获得这个我所做的是 Form3 f3 n
比较：接口方法、虚方法、抽象方法

它们各自的优点和缺点是什么接口方法虚拟方法抽象方法什么时候应该选择什么做出这一决定时应牢记哪些要点虚拟和抽象几乎是一样的虚方法在基类中有一个实现可以选择重写而抽象方法则没有并且must在子类中被覆盖否则它们是相同的在
Visual Studio 2015：v120 与 v140？

仅供参考 Win10 x64 我今天开始尝试 Visual Studio 2015 在弄清楚如何运行 C C 部分后我尝试加载一个大型个人项目该项目使用非官方的glsdk http glsdk sourceforge net docs
如何解压 msgpack 文件？

我正在将 msgpack 编码的数据写入文件在编写时我只是使用 C API 的 fbuffer 如我为示例删除了所有错误处理 FILE fp fopen filename ab msgpack packer pk msgpack pa
C++：为什么 numeric_limits 对它不知道的类型起作用？

我创建了自己的类型没有任何比较器也没有专门化std numeric limits 尽管如此由于某种原因 std numeric limits
代码中的.net Access Forms身份验证“超时”值

我正在向我的应用程序添加注销过期警报并希望从我的代码访问我的 web config 表单身份验证超时值我有什么办法可以做到这一点吗我认为您可以从 FormsAuthentication 静态类方法中读取它这比直接读取 web c
了解 Lambda 表达式和委托 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我已经尝试解决这个问题很长一段时间了阅读在线博客和文章但到目前为止还没有成功什么是代表什么是 Lambda 表达式两者的优点
在 Win32 控制台应用程序中设置光标位置

如何在 Win32 控制台应用程序中设置光标位置最好我想避免制作句柄并使用 Windows 控制台功能我花了整个早上沿着那条黑暗的小巷跑它产生的问题比它解决的问题还要多我似乎记得当我在大学时使用 stdio 做这件事相对简单但我
无法将字符串文字分配给装箱的 std::string 向量

这是我的类型系统的简化版本 include
MySqlConnectionStringBuilder - 使用证书连接

我正在尝试连接到 Google Cloud Sql 这是一个 MySql 解决方案我能够使用 MySql Workbench 进行连接我如何使用 C 连接MySqlConnectionStringBuilder 我找不到提供这三个证书的
当用户更改 Windows 中的语言键盘布局时如何通知？

I want to show a message to user when the user changes the language keyboard layout of Windows for example from EN to FR

随机推荐

如何在 Laravel 中 session_write_close() ？

Running session write close before sleep 在 Laravel 中似乎不起作用因为会话仍然被其他请求阻止直到当前连接完成我试图sleep 在 Laravel 中不会阻止其他请求发现 sessi
有没有办法在 JTS 中将自相交多边形转换为多重多边形？

取无效多边形POLYGON 0 100 100 100 0 0 100 0 0 100 一个带有未声明交点的煮蛋定时器形状许多说明说 JTS 可以使用以下命令创建此版本的有效版本 buffer method Geometry input
使用 utf-8 的 Java BufferedWriter 对象

我有以下代码我想让输出流使用 utf 8 基本上我有这样的角色显示为 233 所以看起来像是编码问题我见过很多使用的例子 OutputStreamWriter out new OutputStreamWriter new FileO
TFS 构建控制器：“无法加载文件或程序集“Microsoft.WindowsAzure.StorageClient，版本=1.7.0.0”

如您所知您的 TFS 预览版不支持 Azure SDK 1 8 因此我们使用本地 TFS 构建控制器来构建我们的项目在 Azure 持续集成部署构建期间我们收到此错误 Exception Message Could not load
只允许一种身份验证机制；只有 X-Amz-Algorithm 查询参数..？

我正在尝试将 PUT 请求发送到 amazonS3 预签名 URL 即使我只有一个 PUT 请求我的请求似乎也被调用了两次第一个请求返回200 OK 第二个返回400 Bad Request 这是我的代码 var req method
MS Access - 粘贴确认事件后

当用户将记录直接粘贴到数据表子报表中时是否可以在显示粘贴确认消息后捕获事件我需要它能够在审计表中创建新记录时进行记录通过捕获更新前更新后和插入事件我可以轻松创建已添加的记录集合准备将详细信息插入审核日志但是在所有这些事件触发后
对 Pandas DataFrame 进行类型检查

我想对 Pandas DataFrames 进行类型检查即我想指定 DataFrame 必须具有哪些列标签以及哪种数据类型 dtype 存储在其中一个粗略的实现受此启发question https stackoverflow com
第一次点击时的 event.preventDefault() 然后删除

如果它有一个类子导航我会禁用默认锚点如下所示这把小提琴 http jsfiddle net aaronk85 5Quee 我只希望在第一次单击时禁用此功能然后我希望恢复正常的锚点功能做这个的最好方式是什么我尝试了涉及以下代码的操作
在 docker 中将 pgadmin 连接到 postgres

我有一个docker compose与服务文件python nginx postgres and pgadmin services postgres image postgres 9 6 env file env volumes postg
使用 Promise 对 Google 表格进行多次查询

我是一名初学者编码器需要一些帮助来加快我的 Google 表格查询速度我环顾四周找不到解决方案我正在尝试快速对 Google 表格运行 25 个查询这就是我的尝试方式对 Google 工作表运行查询将结果推送到数组运行不同的
LinqToSql 声明和实例化 DataContext 最佳实践？

设置 DataContext 以便在扩展 LinqToSql 类中轻松访问方面的最佳实践是什么例如我的 dbml 中有一个 User 实体我想向该类添加方法如下所示 Partial Public Class User Public
从队列更新活动的最佳方法

我有一个LinkedBlockingQueue在我的生产者调解者消费者模型中的调解者中 Producer 首先更新将 Mediator 添加到 ActivityQueue 中接下来消费者活动在队列中等待侦听并获取下一个项目
尝试渲染 SDL_Texture 时 C++ SDL2 错误：无效纹理

我正在尝试制作一个简单的游戏当我尝试渲染我的SDL Texture 我收到一个莫名其妙的错误我已经将一切设置正确我能够成功地清除屏幕SDL RenderClear 并且我的纹理不为空因此它应该已正确创建但是当我尝试打电话给rend
检测桌面是否被锁定[重复]

这个问题在这里已经有答案了可能的重复如何以编程方式确定我的工作站是否被锁定 https stackoverflow com questions 44980 how can i programmatically determine if
错误请求 400：nginx/gunicorn

我已经遵循了这个教程 http blog wercker com 2013 11 25 django 16 part3 html http blog wercker com 2013 11 25 django 16 part3 html我现
删除缺失的数据值

我删除了原始帖子以便能够发布更大版本的数据集实际上总共有 418 行这是我正在进行的生存分析的数据第一列是 ID 号其他列标记为 V2 V20 有很多缺失的数据用表示我用coxph 函数来获取以下内容 Saves survi
如何使用 Compose 创建具有用户定义的 IP 和 MAC 地址的 Docker macvlan

我有一个使用 MAC 地址执行硬件许可证的 Docker 项目我无法更改此设置 ISV 使用包含 MAC 地址的硬件指纹我正在尝试创建一个 macvlan 网络它将使用物理适配器并从我的网络 DHCP 服务器获取 IP 地址或者我将
使用自动布局、IB 和字体大小时表头视图高度错误

我正在尝试为我的 uiTableView 创建一个标题视图不是节标题我已经有了我已经在界面生成器中设置了一个 XIB 所有的连接都已连接好并且运行良好除了桌子没有给它足够的空间我的问题是表格顶部与表格标题有一点重叠我的 XIB
为什么局部变量不设置为零？

既然全局变量和静态变量默认初始化为0 为什么局部变量不默认初始化为0呢因为这种零初始化需要执行时间它会使你的程序明显变慢每次调用函数时程序都必须执行无意义的开销代码这会将变量设置为零静态变量在程序的整个生命周期中持续存在因此您
GCC的sqrt()编译后如何工作？使用哪种root方法？牛顿-拉夫森？

只是对标准感到好奇sqrt 来自 GCC 上的 math h 我自己编码的sqrt 使用牛顿拉夫森来做到这一点是的我知道 fsqrt 但CPU是如何做到这一点的呢我无法调试硬件现代 CPU 中的典型 div sqrt 硬件使用 2

GCC的sqrt()编译后如何工作？使用哪种root方法？牛顿-拉夫森？

GCC的sqrt()编译后如何工作？使用哪种root方法？牛顿-拉夫森？ 的相关文章

随机推荐

热门标签

GCC的sqrt()编译后如何工作？使用哪种root方法？牛顿-拉夫森？的相关文章