为什么通过字符串进行的往返转换对于 double 来说不安全？

2024-01-05

最近，我不得不将双精度数序列化为文本，然后将其取回。该值似乎不相等：

double d1 = 0.84551240822557006;
string s = d1.ToString("R");
double d2 = double.Parse(s);
bool s1 = d1 == d2;
// -> s1 is False

但根据MSDN：标准数字格式字符串 https://msdn.microsoft.com/en-us/library/dwhawy9k(v=vs.110).aspx#Anchor_8，“R”选项应该保证往返安全。

往返（“R”）格式说明符用于确保转换为字符串的数值将被解析回相同的数值

为什么会发生这种情况？

我发现了这个错误。

.NET 在中执行以下操作clr\src\vm\comnumber.cpp https://github.com/dotnet/coreclr/blob/master/src/classlibnative/bcltype/number.cpp#L2483:

DoubleToNumber(value, DOUBLE_PRECISION, &number);

if (number.scale == (int) SCALE_NAN) {
    gc.refRetVal = gc.numfmt->sNaN;
    goto lExit;
}

if (number.scale == SCALE_INF) {
    gc.refRetVal = (number.sign? gc.numfmt->sNegativeInfinity: gc.numfmt->sPositiveInfinity);
    goto lExit;
}

NumberToDouble(&number, &dTest);

if (dTest == value) {
    gc.refRetVal = NumberToString(&number, 'G', DOUBLE_PRECISION, gc.numfmt);
    goto lExit;
}

DoubleToNumber(value, 17, &number);

DoubleToNumber https://github.com/dotnet/coreclr/blob/master/src/classlibnative/bcltype/number.cpp#L140非常简单——它只是调用_ecvt，它在 C 运行时中：

void DoubleToNumber(double value, int precision, NUMBER* number)
{
    WRAPPER_CONTRACT
    _ASSERTE(number != NULL);

    number->precision = precision;
    if (((FPDOUBLE*)&value)->exp == 0x7FF) {
        number->scale = (((FPDOUBLE*)&value)->mantLo || ((FPDOUBLE*)&value)->mantHi) ? SCALE_NAN: SCALE_INF;
        number->sign = ((FPDOUBLE*)&value)->sign;
        number->digits[0] = 0;
    }
    else {
        char* src = _ecvt(value, precision, &number->scale, &number->sign);
        wchar* dst = number->digits;
        if (*src != '0') {
            while (*src) *dst++ = *src++;
        }
        *dst = 0;
    }
}

事实证明_ecvt返回字符串845512408225570.

注意到后面的零了吗？事实证明，这一切都不同了！
当零存在时，结果实际上解析回0.84551240822557006，这是你的originalnumber——因此比较相等，因此只返回 15 位数字。

但是，如果我将零处的字符串截断为84551240822557，然后我回来0.84551240822556994，即not您的原始号码，因此它将返回 17 位数字。

证明：在调试器中运行以下 64 位代码（其中大部分是我从 Microsoft Shared Source CLI 2.0 中提取的）并检查v在......的最后main:

#include <stdlib.h>
#include <string.h>
#include <math.h>

#define min(a, b) (((a) < (b)) ? (a) : (b))

struct NUMBER {
    int precision;
    int scale;
    int sign;
    wchar_t digits[20 + 1];
    NUMBER() : precision(0), scale(0), sign(0) {}
};


#define I64(x) x##LL
static const unsigned long long rgval64Power10[] = {
    // powers of 10
    /*1*/ I64(0xa000000000000000),
    /*2*/ I64(0xc800000000000000),
    /*3*/ I64(0xfa00000000000000),
    /*4*/ I64(0x9c40000000000000),
    /*5*/ I64(0xc350000000000000),
    /*6*/ I64(0xf424000000000000),
    /*7*/ I64(0x9896800000000000),
    /*8*/ I64(0xbebc200000000000),
    /*9*/ I64(0xee6b280000000000),
    /*10*/ I64(0x9502f90000000000),
    /*11*/ I64(0xba43b74000000000),
    /*12*/ I64(0xe8d4a51000000000),
    /*13*/ I64(0x9184e72a00000000),
    /*14*/ I64(0xb5e620f480000000),
    /*15*/ I64(0xe35fa931a0000000),

    // powers of 0.1
    /*1*/ I64(0xcccccccccccccccd),
    /*2*/ I64(0xa3d70a3d70a3d70b),
    /*3*/ I64(0x83126e978d4fdf3c),
    /*4*/ I64(0xd1b71758e219652e),
    /*5*/ I64(0xa7c5ac471b478425),
    /*6*/ I64(0x8637bd05af6c69b7),
    /*7*/ I64(0xd6bf94d5e57a42be),
    /*8*/ I64(0xabcc77118461ceff),
    /*9*/ I64(0x89705f4136b4a599),
    /*10*/ I64(0xdbe6fecebdedd5c2),
    /*11*/ I64(0xafebff0bcb24ab02),
    /*12*/ I64(0x8cbccc096f5088cf),
    /*13*/ I64(0xe12e13424bb40e18),
    /*14*/ I64(0xb424dc35095cd813),
    /*15*/ I64(0x901d7cf73ab0acdc),
};

static const signed char rgexp64Power10[] = {
    // exponents for both powers of 10 and 0.1
    /*1*/ 4,
    /*2*/ 7,
    /*3*/ 10,
    /*4*/ 14,
    /*5*/ 17,
    /*6*/ 20,
    /*7*/ 24,
    /*8*/ 27,
    /*9*/ 30,
    /*10*/ 34,
    /*11*/ 37,
    /*12*/ 40,
    /*13*/ 44,
    /*14*/ 47,
    /*15*/ 50,
};

static const unsigned long long rgval64Power10By16[] = {
    // powers of 10^16
    /*1*/ I64(0x8e1bc9bf04000000),
    /*2*/ I64(0x9dc5ada82b70b59e),
    /*3*/ I64(0xaf298d050e4395d6),
    /*4*/ I64(0xc2781f49ffcfa6d4),
    /*5*/ I64(0xd7e77a8f87daf7fa),
    /*6*/ I64(0xefb3ab16c59b14a0),
    /*7*/ I64(0x850fadc09923329c),
    /*8*/ I64(0x93ba47c980e98cde),
    /*9*/ I64(0xa402b9c5a8d3a6e6),
    /*10*/ I64(0xb616a12b7fe617a8),
    /*11*/ I64(0xca28a291859bbf90),
    /*12*/ I64(0xe070f78d39275566),
    /*13*/ I64(0xf92e0c3537826140),
    /*14*/ I64(0x8a5296ffe33cc92c),
    /*15*/ I64(0x9991a6f3d6bf1762),
    /*16*/ I64(0xaa7eebfb9df9de8a),
    /*17*/ I64(0xbd49d14aa79dbc7e),
    /*18*/ I64(0xd226fc195c6a2f88),
    /*19*/ I64(0xe950df20247c83f8),
    /*20*/ I64(0x81842f29f2cce373),
    /*21*/ I64(0x8fcac257558ee4e2),

    // powers of 0.1^16
    /*1*/ I64(0xe69594bec44de160),
    /*2*/ I64(0xcfb11ead453994c3),
    /*3*/ I64(0xbb127c53b17ec165),
    /*4*/ I64(0xa87fea27a539e9b3),
    /*5*/ I64(0x97c560ba6b0919b5),
    /*6*/ I64(0x88b402f7fd7553ab),
    /*7*/ I64(0xf64335bcf065d3a0),
    /*8*/ I64(0xddd0467c64bce4c4),
    /*9*/ I64(0xc7caba6e7c5382ed),
    /*10*/ I64(0xb3f4e093db73a0b7),
    /*11*/ I64(0xa21727db38cb0053),
    /*12*/ I64(0x91ff83775423cc29),
    /*13*/ I64(0x8380dea93da4bc82),
    /*14*/ I64(0xece53cec4a314f00),
    /*15*/ I64(0xd5605fcdcf32e217),
    /*16*/ I64(0xc0314325637a1978),
    /*17*/ I64(0xad1c8eab5ee43ba2),
    /*18*/ I64(0x9becce62836ac5b0),
    /*19*/ I64(0x8c71dcd9ba0b495c),
    /*20*/ I64(0xfd00b89747823938),
    /*21*/ I64(0xe3e27a444d8d991a),
};

static const signed short rgexp64Power10By16[] = {
    // exponents for both powers of 10^16 and 0.1^16
    /*1*/ 54,
    /*2*/ 107,
    /*3*/ 160,
    /*4*/ 213,
    /*5*/ 266,
    /*6*/ 319,
    /*7*/ 373,
    /*8*/ 426,
    /*9*/ 479,
    /*10*/ 532,
    /*11*/ 585,
    /*12*/ 638,
    /*13*/ 691,
    /*14*/ 745,
    /*15*/ 798,
    /*16*/ 851,
    /*17*/ 904,
    /*18*/ 957,
    /*19*/ 1010,
    /*20*/ 1064,
    /*21*/ 1117,
};

static unsigned DigitsToInt(wchar_t* p, int count)
{
    wchar_t* end = p + count;
    unsigned res = *p - '0';
    for ( p = p + 1; p < end; p++) {
        res = 10 * res + *p - '0';
    }
    return res;
}
#define Mul32x32To64(a, b) ((unsigned long long)((unsigned long)(a)) * (unsigned long long)((unsigned long)(b)))

static unsigned long long Mul64Lossy(unsigned long long a, unsigned long long b, int* pexp)
{
    // it's ok to losse some precision here - Mul64 will be called
    // at most twice during the conversion, so the error won't propagate
    // to any of the 53 significant bits of the result
    unsigned long long val = Mul32x32To64(a >> 32, b >> 32) +
        (Mul32x32To64(a >> 32, b) >> 32) +
        (Mul32x32To64(a, b >> 32) >> 32);

    // normalize
    if ((val & I64(0x8000000000000000)) == 0) { val <<= 1; *pexp -= 1; }

    return val;
}

void NumberToDouble(NUMBER* number, double* value)
{
    unsigned long long val;
    int exp;
    wchar_t* src = number->digits;
    int remaining;
    int total;
    int count;
    int scale;
    int absscale;
    int index;

    total = (int)wcslen(src);
    remaining = total;

    // skip the leading zeros
    while (*src == '0') {
        remaining--;
        src++;
    }

    if (remaining == 0) {
        *value = 0;
        goto done;
    }

    count = min(remaining, 9);
    remaining -= count;
    val = DigitsToInt(src, count);

    if (remaining > 0) {
        count = min(remaining, 9);
        remaining -= count;

        // get the denormalized power of 10
        unsigned long mult = (unsigned long)(rgval64Power10[count-1] >> (64 - rgexp64Power10[count-1]));
        val = Mul32x32To64(val, mult) + DigitsToInt(src+9, count);
    }

    scale = number->scale - (total - remaining);
    absscale = abs(scale);
    if (absscale >= 22 * 16) {
        // overflow / underflow
        *(unsigned long long*)value = (scale > 0) ? I64(0x7FF0000000000000) : 0;
        goto done;
    }

    exp = 64;

    // normalize the mantisa
    if ((val & I64(0xFFFFFFFF00000000)) == 0) { val <<= 32; exp -= 32; }
    if ((val & I64(0xFFFF000000000000)) == 0) { val <<= 16; exp -= 16; }
    if ((val & I64(0xFF00000000000000)) == 0) { val <<= 8; exp -= 8; }
    if ((val & I64(0xF000000000000000)) == 0) { val <<= 4; exp -= 4; }
    if ((val & I64(0xC000000000000000)) == 0) { val <<= 2; exp -= 2; }
    if ((val & I64(0x8000000000000000)) == 0) { val <<= 1; exp -= 1; }

    index = absscale & 15;
    if (index) {
        int multexp = rgexp64Power10[index-1];
        // the exponents are shared between the inverted and regular table
        exp += (scale < 0) ? (-multexp + 1) : multexp;

        unsigned long long multval = rgval64Power10[index + ((scale < 0) ? 15 : 0) - 1];
        val = Mul64Lossy(val, multval, &exp);
    }

    index = absscale >> 4;
    if (index) {
        int multexp = rgexp64Power10By16[index-1];
        // the exponents are shared between the inverted and regular table
        exp += (scale < 0) ? (-multexp + 1) : multexp;

        unsigned long long multval = rgval64Power10By16[index + ((scale < 0) ? 21 : 0) - 1];
        val = Mul64Lossy(val, multval, &exp);
    }

    // round & scale down
    if ((unsigned long)val & (1 << 10))
    {
        // IEEE round to even
        unsigned long long tmp = val + ((1 << 10) - 1) + (((unsigned long)val >> 11) & 1);
        if (tmp < val) {
            // overflow
            tmp = (tmp >> 1) | I64(0x8000000000000000);
            exp += 1;
        }
        val = tmp;
    }
    val >>= 11;

    exp += 0x3FE;

    if (exp <= 0) {
        if (exp <= -52) {
            // underflow
            val = 0;
        }
        else {
            // denormalized
            val >>= (-exp+1);
        }
    }
    else
        if (exp >= 0x7FF) {
            // overflow
            val = I64(0x7FF0000000000000);
        }
        else {
            val = ((unsigned long long)exp << 52) + (val & I64(0x000FFFFFFFFFFFFF));
        }

        *(unsigned long long*)value = val;

done:
        if (number->sign) *(unsigned long long*)value |= I64(0x8000000000000000);
}

int main()
{
    NUMBER number;
    number.precision = 15;
    double v = 0.84551240822557006;
    char *src = _ecvt(v, number.precision, &number.scale, &number.sign);
    int truncate = 0;  // change to 1 if you want to truncate
    if (truncate)
    {
        while (*src && src[strlen(src) - 1] == '0')
        {
            src[strlen(src) - 1] = 0;
        }
    }
    wchar_t* dst = number.digits;
    if (*src != '0') {
        while (*src) *dst++ = *src++;
    }
    *dst++ = 0;
    NumberToDouble(&number, &v);
    return 0;
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么通过字符串进行的往返转换对于 double 来说不安全？的相关文章

将数组向左或向右旋转一定数量的位置，复杂度为 o(n)

我想编写一个程序根据用户的输入正 gt 负 include
UML类图：抽象方法和属性是这样写的吗？

当我第一次为一个小型 C 项目创建 uml 类图时我在属性方面遇到了一些麻烦最后我只是将属性添加为变量 lt
如何在列表框项目之间画一条线

我希望能够用水平线分隔列表框中的每个项目这只是我用于绘制项目的一些代码 private void symptomsList DrawItem object sender System Windows Forms DrawItemEvent
WPF 中的调度程序和异步等待

我正在尝试学习 WPF C 中的异步编程但我陷入了异步编程和使用调度程序的困境它们是不同的还是在相同的场景中使用我愿意简短地回答这个问题以免含糊不清因为我知道我混淆了 WPF 中的概念和函数但还不足以在功能上正确使用它我在这里
为什么#pragma optimize("", off)

我正在审查一个 C MFC 项目在某些文件的开头有这样一行 pragma optimize off 我知道这会关闭所有以下功能的优化但这样做的动机通常是什么我专门使用它来在一组特定代码中获得更好的调试信息并在优化的情况下编译应用程序
C 预处理器库

我的任务是开发源分析工具C程序并且我需要在分析本身之前预处理代码我想知道什么是最好的图书馆我需要一些重量轻便于携带的东西与其推出自己的为什么不使用cpp这是的一部分gcc suite http gcc gnu org onlin
Cython 和类的构造函数

我对 Cython 使用默认构造函数有疑问我的 C 类 Node 如下 Node h class Node public Node std cerr lt lt calling no arg constructor lt lt std e
WPF TabControl，用C#代码更改TabItem的背景颜色

嗨我认为这是一个初学者的问题我搜索了所有相关问题但所有这些都由 xaml 回答但是我需要的是后台代码我有一个 TabControl 我需要设置其项目的背景颜色我需要在选择取消选择和悬停时为项目设置不同的颜色非常感谢你的帮助
将自定义元数据添加到 jpeg 文件

我正在开发一个图像处理项目 C 我需要在处理完成后将自定义元数据写入 jpeg 文件我怎样才能做到这一点有没有可用的图书馆可以做到这一点如果您正在谈论 EXIF 元数据您可能需要查看exiv2 http www exiv2 org
如何将单个 char 转换为 int [重复]

这个问题在这里已经有答案了我有一串数字例如 123456789 我需要提取它们中的每一个以在计算中使用它们我当然可以通过索引访问每个字符但是如何将其转换为 int 我研究过 atoi 但它需要一个字符串作为参数因此我必须将每个字
clang 实例化后静态成员初始化

这样的代码可以用 GCC 编译但 clang 3 5 失败 include
从库中捕获主线程 SynchronizationContext 或 Dispatcher

我有一个 C 库希望能够将工作发送发布到主 ui 线程如果存在该库可供以下人员使用一个winforms应用程序本机应用程序带 UI 控制台应用程序没有 UI 在库中我想在初始化期间捕获一些东西 Synchronizati
Discord.net 无法在 Linux 上运行

我正在尝试让在 Linux VPS 上运行的 Discord net 中编码的不和谐机器人我通过单声道运行但我不断收到此错误 Unhandled Exception System Exception Connection lost at
实体框架 4 DB 优先依赖注入？

我更喜欢创建自己的数据库设置索引唯一约束等使用 edmx 实体框架设计器从数据库生成域模型是轻而易举的事现在我有兴趣使用依赖注入来设置一些存储库我查看了 StackOverflow 上的一些文章和帖子似乎重点关注代码优先方法
C++ fmt 库，仅使用格式说明符格式化单个参数

使用 C fmt 库并给定一个裸格式说明符有没有办法使用它来格式化单个参数 example std string str magic format 2f 1 23 current method template
需要哪个版本的 Visual C++ 运行时库？

microsoft 的最新 vcredist 2010 版是否包含以前的版本 2008 SP1 和 2005 SP1 还是我需要安装全部 3 个版本谢谢你需要所有这些
如何让Gtk+窗口背景透明？

我想让 Gtk 窗口的背景透明以便只有窗口中的小部件可见我找到了一些教程 http mikehearn wordpress com 2006 03 26 gtk windows with alpha channels https web
在 Dynamics CRM 插件中访问电子邮件发件人地址

我正在编写一个 Dynamics CRM 2011 插件该插件挂钩到电子邮件实体的更新后事件阶段 40 pipeline http msdn microsoft com en us library gg327941 aspx 并且在此阶
const、span 和迭代器的问题

我尝试编写一个按索引迭代容器的迭代器 AIt and a const It两者都允许更改容器的内容 AConst it and a const Const it两者都禁止更改容器的内容之后我尝试写一个span
x86 上未对齐的指针

有人可以提供一个示例将指针从一种类型转换为另一种类型由于未对齐而失败吗在评论中这个答案 https stackoverflow com questions 544928 reading integer size bytes from a

随机推荐

如何从函数内部的 for 循环退出（转义）函数？

这是一个理论问题旨在了解有多少转义返回或退出可以应用于嵌套循环或其他控件和函数我对此感到困惑因为我被困在代码中如何同时逃离 for 每个循环和方法 https stackoverflow com questions 1557412
将本地分支推送到远程分支

我在我的 Github 存储库中创建了新存储库使用 gitpython 库我可以获得这个存储库然后我创建新分支添加新文件提交并尝试推送到新分支请检查以下代码 import git import random import os r
jQuery 将复选框选择转换为数组

我有一个HTML像这样 div class pgggo list taxon li li div
GitHub 操作无法连接到 MongoDB 服务

我在使用 GitHub 操作运行自动化测试时遇到问题我不明白为什么我无法连接到运行集成测试的 MongoDB 服务我尝试了不同的主机 localhost 127 0 0 1 0 0 0 0 但它们都无法连接数据库它在我的 docker
像 PyCharm/Spyder 一样自动将项目添加到 VS Code 中的 sys.path 吗？

Problem 在带有子包的 Python 项目中绝对导入不适用于不在项目根目录中的任何文件 my project my package init py my module py my scripts some script py som
适用于 Windows Phone 8.1 的 PhotoChooserTask 内置裁剪选项

在 Windows Phone 8 中我使用 PhotoChooserTask 从手机图库获取图像当我固定像素宽度和高度时 Windows Phone 会自动启动一个页面来裁剪所选图像有人可以告诉我如何使用 FileOpenPicke
如何使用JavaScript读取post请求参数

我正在尝试从 HTML 中读取 post 请求参数我可以使用 JavaScript 中的以下代码读取获取请求参数 wnd location search 但它不适用于 post 请求谁能告诉我如何使用 JavaScript 读取 HTM
带有文件内容的.Net资源使docker构建失败

dotnet build 构建一个没有错误的项目同时 docker build 给出以下错误 src Audit Worker Example Resources resx error MSB3103 Invalid Resx file
Ntext 和 Image 数据类型不能在 WHERE、HAVING、GROUP BY、ON 或 IN 子句中使用

我收到错误 ntext 和 image 数据类型不能用于 WHERE HAVING GROUP BY ON 或 IN 子句除非这些数据类型与 LIKE 或 IS NULL 谓词同时尝试将更改保存到 SQLCE 表请注意这是一个更
jQuery DatePicker：获取选定的日期

我需要能够从日期选择器中获取选定的日期并使用选定的值填充另一个文本框我目前正在使用onClose像这样的函数 defaultDate datepicker onClose function theDate txtEntry1 text
Firefox 和 AJAX 文档元素后出现垃圾

我使用页面获取脚本将网页动态加载到 div 中这是代码顺便说一句我正在使用 Firefox 和 Kubuntu function fetch URL divId req window XMLHttpRequest new XMLHtt
如何在c#中获取图片框上的绘图图形

我在面板中创建了一个 PictureBox 我在 PictureBox 上画了一些图形我想通过单击按钮来获取这些图形我怎样才能做到这一点 Check this http www syncfusion com faq windowsfor
在 Delphi XE5 中生成一个包含数组的示例 JSON

来自 NET 我一直无法完成我认为简单的任务我想用TJSONObject TJSONArray TJSONPair等构建一个简单的 JSON 如下所示 APIKEY sadfsafsafdsa UserID 123123123 Trans
Moment JS 不包括节假日

我对 javascript 和 moment js 非常陌生我正在开发一个网站我们需要列出产品接下来 5 个可能的提货日期不包括周末和节假日我开始使用我在网上找到的一个函数它可以很好地跳过周末但我无法让假期工作任何帮助将不胜
将 df 与用户定义的函数聚合

我有一个关于将 pandas 数据帧与用户定义的函数聚合的问题如果我有一个数据帧并在有或没有 groupby 的情况下运行 agg 则在使用内置函数时会聚合结果另一方面如果我使用自定义函数则在使用 groupby 时它会按预期工作
增加浏览器中的堆栈大小

简短的问题我有一个在递归方面非常深入的JavaScript 如何增加堆栈大小以便可以执行它类似于 Unix 系统中的 ulimit s unlimited 长话短说我必须画一张图我使用 Cytoscape JS http js cy
Console.log 在 Chrome 中不起作用

我试图从我的 javascript 代码中记录一些数据来检查它是否正确但它似乎不起作用即使我在控制台中输入 console log hello 控制台只返回未定义这是正确的但它也不会记录 hello 如果重要的话我会使用 adbl
使用 kubeadm 为什么要手动生成证书？

我正在尝试遵循这个tutorial https blog inkubate io install and configure a multi master kubernetes cluster with kubeadm 自己生成证书而不是依
如何删除分配有新放置的对象

C 中的 new 运算符有很多面孔但我对放置 new 感兴趣假设您在特定的内存位置分配内存 int memoryPool poolSize sizeof int int p new mem int allocates memory in
为什么通过字符串进行的往返转换对于 double 来说不安全？

最近我不得不将双精度数序列化为文本然后将其取回该值似乎不相等 double d1 0 84551240822557006 string s d1 ToString R double d2 double Parse s bool s1

为什么通过字符串进行的往返转换对于 double 来说不安全？

为什么通过字符串进行的往返转换对于 double 来说不安全？ 的相关文章

随机推荐

热门标签

为什么通过字符串进行的往返转换对于 double 来说不安全？的相关文章