Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
Florian 的 Grisu2 算法如何工作?
我遇到了一个关于将 double 转换为 ascii 的问题 经过搜索 我得到了 Florian 的论文 使用整数快速准确地打印浮点数 http www cs tufts edu nr cs257 archive florian loits
c
Algorithm
precision
IEEE754
floatingpointconversion
二进制浮点加法算法
我试图理解二进制级别的 IEEE 754 浮点加法 我遵循了一些在网上找到的示例算法 并且大量测试用例与经过验证的软件实现相匹配 我的算法目前只处理正数 但是 我没有得到与此测试用例的匹配 0000100011110011011001001
floatingpoint
Binary
IEEE754
了解 C# 和 Java 中的 IEEE-754 64 位定点表示
考虑以下 Java 代码 public class Program public static void main String args double number Double MAX VALUE String formattedNum
Java
c
double
IEEE754
IEEE-754 32 位(单精度)指数 -126 而不是 -127
我知道我是否有这样的号码 1 1001 0001 0011 0011 0000 0001 0101 000 1 sign bit 8 bit biased exponent 23 bit fraction mantissa 我可以通过从有偏
floatingpoint
IEEE754
当计算结果在 Linux 中产生非正规数时刷新为零
我的 C 代码中的计算正在产生逐渐下溢 当发生这种情况时 程序将以 SIGFPE 终止 当计算产生逐渐下溢 非正常 时 如何将结果刷新为零 而不终止执行 我正在一台 redhat linux 机器上工作 谢谢 您还没有指定架构 我猜测它是一
floatingpoint
IEEE754
underflow
float 和 double 精度相关的概念
为什么精度float小数点后最多 6 位 精度double小数点后最多15位 任何人都可以给一个数学解释 of it 说一下精度float or double是一些小数位数是草率的术语 float and double通常使用 IEEE 7
floatingpoint
double
precision
IEEE754
floatingaccuracy
C IEEE-Floats inf 等于 inf
在 C 中 在使用 IEEE 754 浮点数的实现中 当我比较两个 NaN 浮点数时 它返回 0 或 false 但是为什么两个都为 inf 的浮点数会被视为相等呢 该程序打印 equal 至少在带有 gcc 的 Linux AMD64 下
c
floatingpoint
IEEE754
在 C# 中以科学记数法显示 IEEE-754 四倍精度 (binary128) 浮点值
我正在尝试将原始二进制数据从线程上下文转换为人类可读的格式 并且在尝试转换时出现空的情况四精度浮点 http en wikipedia org wiki Quadruple precision floating point format I
c
Math
floatingpoint
IEEE754
`std::sin` 最后一点是错误的
为了提高效率 我正在将一些程序从 Matlab 移植到 C 两个程序的输出完全相同非常重要 我面临着此操作的不同结果 std sin 0 497418836818383950 0 477158760259608410 C sin 0 497
c
MATLAB
floatingpoint
IEEE754
融合乘加和默认舍入模式
使用 GCC 5 3 可以编译以下代码 O3 fma float mul add float a float b float c return a b c 产生以下程序集 vfmadd132ss xmm1 xmm2 xmm0 ret 我注意
c
gcc
Clang
IEEE754
fma
是否有 IEEE-754 操作的开源 c/c++ 实现? [关闭]
Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在寻找 IEEE 754 操作的参考实现 有这样的事吗 我相信 C 库软浮点 http www j
c
opensource
floatingpoint
IEEE754
如果任一参数为 NaN,什么会导致 C/C++ <、<= 和 == 运算符返回 true?
我对 IEEE 754 浮点比较规则的理解是 除了 如果其中一个或两个参数均为 NaN 则返回 false 而 运算符将返回 true 我可以通过简单的独立测试轻松重现此行为 for int ii 0 ii lt 4 ii float a
c
NaN
IEEE754
计算机如何进行浮点运算?
我看过很长的文章解释如何存储浮点数以及如何完成这些数字的算术运算 但请简要解释一下为什么当我写的时候 cout lt lt 1 0 3 0 lt
c
Math
floatingpoint
IEEE754
0除以无穷大一定是0吗?
根据这个问题 https stackoverflow com questions 1613988 dividing by infinity n inf预计为零n 0 什么时候呢n 0 根据 IEEE 754 0 inf 0总是正确的 从数学
c
IEEE754
C++ 中的舍入和往返数字
我有一个类 它在内部将某个定点数表示为 32 位整数 分母有些任意 它既不是 2 的幂也不是 10 的幂 为了与其他应用程序通信 数量在输出时转换为普通的旧双精度 并在输入时转换回来 作为类内的代码 它看起来像 int32 t quanti
c
rounding
IEEE754
C++ 标准是否对浮点数的表示指定了任何内容?
对于类型T为此std is floating point
c
C11
floatingpoint
standards
IEEE754
ULP(最后一位单位)和量子(IEEE 754)之间的区别
From ULP 维基百科页面 https en wikipedia org wiki Unit in the last place John Harrison 提出的另一个定义略有不同 ULP x 是两个最近的跨界浮点数 a 和 b 之间
floatingpoint
IEEE754
Java:将浮点二进制转换为浮点十进制
我想转换表示 IEEE754 双精度数尾数部分的字符串 找不到Java中是否有这样的转换方法 以避免手动添加1 1 2 1 4 1 8等 010000001100101000011111000000000000000000000000000
Java
Binary
Decimal
converters
IEEE754
将双精度常数定义为十六进制?
我希望将 1 0 以下最接近的数字作为浮点数 通过阅读维基百科的文章IEEE 754 http en wikipedia org wiki IEEE 754 1985 Double precision 64 bit我设法发现 1 0 的二进
c
floatingpoint
floatingaccuracy
IEEE754
Notation
IEEE 754:为什么谓词 == 和 != 没有发出信号?
注意 了解IEEE 754 请耐心等待 IEEE 754 2008 表 5 2 列出了五个无序信号谓词及其否定 当关系无序时 它们会导致无效操作异常 该无效操作异常可以防止使用以下代码编写的程序中出现意外的安静 NaN 标准谓词 gt 及其
IEEE754
1
2
3
4
5
»