16 位、32 位和 64 位 IEEE-754 系统可以表示什么范围的数字？

2024-06-19

我对浮点数的表示方式有所了解，但恐怕还不够。

一般问题是：

对于给定的精度（就我的目的而言，以 10 为基数的精确小数位数），16 位、32 位和 64 位 IEEE-754 系统可以表示什么范围的数字？

具体来说，我只对精确到 +/-0.5（个位）或 +/- 0.0005（千分位）的 16 位和 32 位数字范围感兴趣。

对于给定的IEEE-754 http://en.wikipedia.org/wiki/IEEE_754浮点数X, if

2^E <= abs(X) < 2^(E+1)

那么距离X到下一个最大的可表示浮点数（epsilon https://en.wikipedia.org/wiki/Machine_epsilon) is:

epsilon = 2^(E-52)    % For a 64-bit float (double precision)
epsilon = 2^(E-23)    % For a 32-bit float (single precision)
epsilon = 2^(E-10)    % For a 16-bit float (half precision)

上述方程允许我们计算以下内容：

For 半精度 http://en.wikipedia.org/wiki/Half_precision...

如果您想要 +/-0.5（或 2^-1）的精度，则数字的最大大小为 2^10。任何大于此限制的 X 都会导致浮点数之间的距离大于 0.5。

如果您想要 +/-0.0005（大约 2^-11）的精度，则数字的最大大小为 1。任何大于此最大限制的 X 都会导致浮点数之间的距离大于 0.0005。
For 单精度 http://en.wikipedia.org/wiki/Single_precision...

如果您想要 +/-0.5（或 2^-1）的精度，则数字的最大大小为 2^23。任何大于此限制的 X 都会导致浮点数之间的距离大于 0.5。

如果您想要 +/-0.0005（大约 2^-11）的精度，则数字的最大大小为 2^13。任何大于此限制的 X 都会导致浮点数之间的距离大于 0.0005。
For 双精度 http://en.wikipedia.org/wiki/Double_precision...

如果您想要 +/-0.5（或 2^-1）的精度，则数字的最大大小为 2^52。任何大于此限制的 X 都会导致浮点数之间的距离大于 0.5。

如果您想要 +/-0.0005（大约 2^-11）的精度，则数字的最大大小为 2^42。任何大于此限制的 X 都会导致浮点数之间的距离大于 0.0005。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

floatingpoint

precision

numerical

IEEE754

16 位、32 位和 64 位 IEEE-754 系统可以表示什么范围的数字？的相关文章

如何解决 boost::multi precision::cpp_dec_float 除法错误

除以boost multiprecision cpp dec float有某种舍入误差如下 include
在c#中打印0.1的增量

我目前正在阅读 Steve McConnell 的 Code Complete 特别是第 295 页有关浮点数的内容当我运行以下代码时 double nominal 1 0 double sum 0 0 for int i 0 i lt
JavaScript 中的 ParseFloat 函数

当我添加两个文本框值时1 001 and 0 001然后我做了一个parseFloat I get 1 0019999999 我要它1 002 你能帮助我吗 JavaScriptNumber http www w3schools com j
限制纬度和经度值的模数

我有代表纬度和经度的双精度数我可以轻松地将经度限制为 180 0 180 0 具有以下功能 double limitLon double lon return fmod lon 180 0 360 0 180 0 这是有效的因为一端是排
python中计算最小范数解或从伪逆得到的解最准确的方法是什么？

我的目标是解决 Kc y 与伪逆即最小范数解 c K y 这样模型希望是高次多项式模型f x sum i c i x i 我对不确定的情况特别感兴趣在这种情况下我们拥有比数据更多的多项式特征方程很少变量未知数太多 colum
空序列的算术平均值是多少？

免责声明不我没有找到任何明显的答案这与我的预期相反在寻找代码示例时算术平均值我可以通过谷歌找到的前几个例子似乎是这样定义的空序列生成的平均值为0 0 eg here https rosettacode org wiki Ave
基数排序浮动数据

基数如何对浮点数据进行排序例如 12 4 45 13 等它会先读取小数点右侧吗还是先读取小数点左侧然后如果它读取小数点右侧它将如何处理这些数字会它首先读取最右边的请参阅本页的讨论 http codercorner com R
如何从 cpp_dec_float_50 转换为 cpp_int？关于一般的浮点数？

我的基本目标是减去两个应该相等的浮点数考虑一下 float x 1 float a x 30 x 40 float b x 30 b x 40 std cout lt
对于 IEEE754 NaN 值，所有比较都返回 false 的基本原理是什么？

为什么 NaN 值的比较行为与所有其他值不同也就是说与运算符进行的所有比较其中一个或两个值为 NaN 都会返回 false 这与所有其他值的行为相反我想这在某种程度上简化了数值计算但我找不到明确说明的原因即使在关于 IEEE
将浮点值转换为灰度十六进制颜色值

这个问题又快又简单我有一个二维浮点数组 0 0000000 到 1 0000000 我想将这些数字转换为颜色值 000000 到 ffffff 请注意我所说的只是灰度值 0 黑色 0 5 中灰色 1 白色有谁知道如何用 javascr
如何在 x86 ASM 中将整数转换为浮点值？

我需要将一个整数二进制补码乘以一个浮点常数这是我所拥有的 data pi dd 3 14 int dd 0ah code fld pi fmul ST 1 ST 我怎样才能转换int乘以浮点值pi 你需要fild操作说明这是一个参考
如何从文件C++中读取带有科学记数法的浮点数？

我有一个具有以下格式的文件 0 0064785667 0 73900002 0 028505694 4 7858757e 39 315 218 0 0051828534 0 73900002 0 028505694 4 6936954e 3
.NET 中严格浮点数学的库

我有 Java 算法计算及其单元测试单元测试期望结果具有一定的精度增量现在我将算法移植到 NET 中并希望使用相同的单元测试我使用双数据类型问题在于 Java 使用 strictfp 64 位来执行 Math 类中的某些操作
为什么这些数字不相等？

下面的代码显然是错误的有什么问题 i lt 0 1 i lt i 0 05 i 1 0 15 if i 0 15 cat i equals 0 15 else cat i does not equal 0 15 i does not eq
-ffast-math 可以安全地用于典型项目吗？

在回答我建议的问题时 ffast math 有评论指出这是危险的我个人的感觉是在科学计算之外是可以的我还假设严肃的金融应用程序使用定点而不是浮点当然如果你想在你的项目中使用它最终的答案是在你的项目上测试它看看它有多大影响但
Go 算术中处理浮点数精度？

我对 Go 中精确减去 2 个浮点数的方法感兴趣我尝试过使用math big图书馆但我无法得到准确的结果我用过big js https github com MikeMcl big jsJavascript 库解决了这个问题 Go 算
Python 中浮点数到分数的转换

在对 Python 3 52 中的 float 类型到 Fraction 类型转换主题进行练习时我发现了两种不同转换方式之间的差异第一种方法是 gt gt gt from fractions import Fraction gt gt
两个浮点数相加

我想计算两个 IEEE 754 二进制 64 数字的四舍五入之和为此我编写了下面的 C99 程序 include
为什么我在 ECMAScript / ActionScript 3 中看到不精确的浮点结果？

大家好让我们直接跳到代码示例以展示 ECMAScript JavaScript AS3 如何无法正确执行简单的数学运算 AS3 对 Number 类使用 IEEE 754 双精度浮点数据说与JavaScript 中使用的 trace
Python 中的十进制到二进制半精度 IEEE 754

我只能使用以下命令将十进制转换为二进制单精度 IEEE754struct pack模块或者使用相反的方法 float16 或 float32 numpy frombuffer 是否可以使用 Numpy 将十进制转换为二进制半精度浮点数我

随机推荐

Java：使用 Java.util.concurrent 线程访问读取线程串行端口

我正在尝试编写一个 Java 串行设备驱动程序并想使用对我来说是新的 java util concurrent包裹我有一种发送数据包然后等待 ACK 的方法我打算有炭接收在不同的线程中运行如果接收线程收到 ACK 它应该使用发送数
返回 int& 的函数[重复]

这个问题在这里已经有答案了我在网上查了一下发现一篇试图解释的文章std move和右值 http thbecker net articles rvalue references section 01 html并发现了一些我实在无法掌握的东
Swift 3：如何访问48字节CFData中matrix_float3x3的值？

我正在尝试访问内在矩阵answer https stackoverflow com a 48159895 9296667 通过运行下面的命令我能够得到一个 48 字节的任意对象 https developer apple com docu
表单提交后 Angular2 更新视图

我正在使用 Angular2 创建一个简单的 CRUD 应用程序该应用程序由一个列出当前记录的表格和一个用于提交新记录的表格组成提交表单后更新表格以反映新记录的正确方法是什么这是我到目前为止所拥有的 export class Pers
Flymake的临时文件可以在系统临时目录下创建吗？

我目前正在使用以下代码在 emacs 中连接 Flymake 和 Pyflakes defun flymake create temp in system tempdir filename prefix make temp file or
在运行时设置 DataGridView 上的 DataFormatString？

是否可以在运行时设置 ASP NET DataGridView 中的列或单元格的 DataFormatString 属性这应该有效 BoundField priceField grid Columns 0 as BoundField pr
Reporting Services 在哪里存储其日志文件

最相关的谷歌结果似乎表明为了访问日志我们必须将您自己的日志表部署到数据库并制作报告服务写入它 http technet microsoft com en us library ms157403 aspx 简而言之 Reporting S
pandas groupby 操作缺少数据

在 pandas 数据框中我有一列如下所示 0 M 1 E 2 L 3 M 1 4 M 2 5 M 3 6 E 1 7 E 2 8 E 3 9 E 4 10 L 1 11 L 2 12 M 1 a 13 M 1 b 14 M 1 c 15
在 WooCommerce 管理订单项目上显示产品自定义字段（也适用于可变产品）

基于在 WooCommerce 的订单编辑页面上显示自定义字段 https stackoverflow com questions 56259910 show custom fields on the order editing page
关闭 XDOCUMENT 的实例

我收到这个错误该进程无法访问文件 C test Person xml 因为它是被另一个进程使用 IOException 未处理保存文件内容后如何关闭 xml 文件的实例 using System using System Collec
Bash：单行命令以与 grep 命令相反的状态退出？

如何减少以下 bash 脚本 grep P STATUS Perfect recess txt exit 1 exit 0 看起来我应该能够用一个命令来完成它但我这里总共有 3 个命令我的程序应该阅读课间休息 txt 如果它包含 ST
ChannelFactory重用策略

我一直在读到 ChannelFactory 的创建是昂贵的除非有技术原因不这样做否则应该在可能的情况下重用 ChannelFactory 或者通过某种方式缓存它们或者使用工厂的静态实例根据您的经验您发现哪些 ChannelFact
如何使用汇编获取BIOS时间？

我正在从头开始实现一个小型操作系统用于教育目的现在我想使用汇编来获取 BIOS 时间我对此进行了很多搜索但找不到任何代码示例来执行此操作如果有人可以提供任何参考或代码示例或与此相关的任何内容我将非常感激 See 时钟中断 1a
删除 Xcode 项目的源代码控制

我在 Xcode 项目上使用源代码控制已经有一段时间了但现在我不想使用源代码控制如何从 Xcode 中的项目中删除源代码控制有三种方法方法 1 将禁用所有项目的源代码管理方法 2 将删除所有项目的单个存储库的链接方法 3 将删除
Laravel 5 命名空间

我刚刚下载了 Laravel 5 并开始迁移到它但是我发现需要使用命名空间really恼人的除了让我的代码变得混乱之外我觉得我没有从中得到太多东西如何禁用命名空间要求我认为您不应该禁用或删除名称空间命名空间的主要原因是避免与同
使组合高度等于浏览器窗口的高度

http featuredfotografer com http featuredfotografer com Codemirror div 与 header div 结合占用的高度超过了浏览器的高度我怎样才能使它们的总高度达到浏览器窗口
Scala 交互式解释器 (REPL) - 如何将输出重定向到文本文件？

是否可能如果可能是如何做到的通常 gt and gt gt 在 Windows 或 Linux 命令行上工作的命令在这种情况下不起作用您可以从控制台以编程方式执行此操作 import java io FileOutputStream
CSS 选择器用于选择最后两个子项，而不知道列表中有多少项

我有一个无序列表它有时包含 4 5 6 或 7 个项目我想知道是否有一个 CSS 选择器来选择最后两项我意识到 last child会给我最后一件物品是否有倒数第二个孩子选择器或者孩子数量 2 选择器 HTML ul li
在 GCC 和 Clang 下，使用 lambda 的简单 RAII 包装器的复制初始化意外失败

我在创建一个简单的 RAII 包装器时遇到了一个意想不到的问题更不用说下面代码的逻辑不完整性了复制构造函数和赋值运算符未删除等这意味着是一个SSCCE 令我印象深刻的是复制初始化我的包装器与临时 lambda 的结果会导致编译错误而
16 位、32 位和 64 位 IEEE-754 系统可以表示什么范围的数字？

我对浮点数的表示方式有所了解但恐怕还不够一般问题是对于给定的精度就我的目的而言以 10 为基数的精确小数位数 16 位 32 位和 64 位 IEEE 754 系统可以表示什么范围的数字具体来说我只对精确到 0 5 个位或

16 位、32 位和 64 位 IEEE-754 系统可以表示什么范围的数字？

16 位、32 位和 64 位 IEEE-754 系统可以表示什么范围的数字？ 的相关文章

随机推荐

热门标签

16 位、32 位和 64 位 IEEE-754 系统可以表示什么范围的数字？的相关文章