为什么 scipy.stats.nanmean 给出与 numpy.nansum 不同的结果？

2023-12-23

>>> import numpy as np
>>> from scipy import stats
>>> a = np.r_[1., 2., np.nan, 4., 5.]
>>> stats.nanmean(a)
2.9999999999999996
>>> np.nansum(a)/np.sum(~np.isnan(a))
3.0

我知道浮点表示的局限性。只是好奇为什么更笨拙的表达似乎给出了“更好”的结果。

首先，这是scipy.nanmean()这样我们就知道我们正在比较什么：

def nanmean(x, axis=0):
    x, axis = _chk_asarray(x,axis)
    x = x.copy()
    Norig = x.shape[axis]
    factor = 1.0-np.sum(np.isnan(x),axis)*1.0/Norig

    x[np.isnan(x)] = 0
    return np.mean(x,axis)/factor

从数学上讲，这两种方法是等效的。从数字上看，它们是不同的。

您的方法涉及单个除法，并且碰巧：

分子（1. + 2. + 4. + 5.) 可以精确地表示为float; and
分母 (4.) 是 2 的幂。

这意味着除法的结果是准确的，3..

stats.nanmean()涉及首先计算平均值[1., 2., 0., 4., 5.]，然后调整它以考虑NaNs。碰巧的是，这意味着 (2.4) 不能精确地表示为float，所以从这一点来看计算是不精确的。

我没有考虑太多，但也许可以构建一个角色互换的例子，并且stats.nanmean()会比其他方法给出更准确的结果。

让我惊讶的是stats.nanmean()不只是简单地做类似的事情：

In [6]: np.mean(np.ma.MaskedArray(a, np.isnan(a)))
Out[6]: 3.0

在我看来，这似乎是比目前所做的更好的方法。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

floatingpoint

scipy

floatingpointprecision

为什么 scipy.stats.nanmean 给出与 numpy.nansum 不同的结果？的相关文章

将 c++ 异常传播到 cython - python 异常

我的 Cython 0 17 1 有问题我的函数抛出一个std runtime error如果文件不存在我想以某种方式将此异常传播到我的 Cython 代码 void loadFile const string filename som
分类报告 - 精度和 F 分数定义不明确

我从 sklearn metrics 导入了classification report 当我输入我的np arrays作为参数我收到以下错误 usr local lib python3 6 dist packages sklearn met
反转 Python 整数的位

给定一个十进制整数例如 65 如何反转 Python 中的底层位即以下操作 65 01000001 10000010 130 看来这个任务可以分为三步将十进制整数转换为二进制表示形式反转位转换回十进制第 2 步和第 3 步看起来
扭曲的日志记录到屏幕（标准输出）不起作用

我有这个小程序取自这里 https twistedmatrix com documents 16 3 0 core howto logger html usage for emitting applications from twisted
在 opencv 中一次性将旋转和平移结合起来

我有一段用于旋转和平移图像的代码 Point2f pt 0 in rows double angle atan trans c trans b 180 M PI Mat r getRotationMatrix2D pt angle 1 0
将 Django 的 FileField 设置为现有文件

我在磁盘上有一个现有文件例如 folder file txt 在 Django 中有一个 FileField 模型字段当我做 instance field File file folder file txt instance save
张量流 - 向量中的前 k 个值到二进制向量

假设我有一个带有值的向量 0 4 1 2 8 7 0 2 如何获得前 k 个值的二进制向量 k 3 0 1 0 0 1 1 0 0 in 张量流 TensorFlow 的tf math top k https www tensorflow
获取每行最后 150 行中所有正值的计数 - pandas

我有以下数据集其中有列Date and Values对于每一行它两者都有 ve and ve价值观我必须计算最后 150 行的所有正值在每一行因此前 150 行将具有空值然后以下行将具有最后 150 行的计数 ve行类似地
尽管浮点数相同，但它们并不相等？ [复制]

这个问题在这里已经有答案了下面的程序输出This No is not same 当两个数字相同时为什么会这样做 void main float f 2 7 if f 2 7 printf This No is same else prin
在 Windows 上使用 pycrypto 时如何修复“ImportError：无法从 Crypto.Cipher 导入名称 _AES”？

我在 Crypto 的 Cipher 模块中有 AES Python27 Lib Crypto Cipher AES 当我尝试做的时候 from Crypto Cipher import AES 我收到以下错误 Traceback most
setUp() 中的 if 条件忽略测试

在unittest python库中存在函数setUp and tearDown用于设置变量和其他测试前后的事情如何运行或忽略 setUp 中条件的测试您可以致电if cond self skipTest reason in setU
获取SVG绘图的边界框

我想提取 SVG 绘图的边界框由于 Python 已经在系统上可用并且还用于执行其他任务因此我不想使用 JavaScript 或任何其他语言我的理解是是否可以计算单个元素的边界框但我不知道如何计算整个绘图的边界框只是所有元素的最小
如何重写一个列表列表，使值的“孤岛”彼此唯一？

假设我有一个列表列表或更概念上准确的二维数组 list 1 1 0 0 0 1 1 2 0 0 0 2 2 2 0 0 0 0 2 0 0 0 0 1 0 我想识别具有相同值的不同区域并重写列表以便每个区域都有唯一的值如下所示 lis
使用 python 将多个 JSON 文件插入 MongoDB

JSON文件如下a json b json z json 26个json文件每个文件的 json 格式如下 a cappella word a cappella wordset id 5feb6f679a meanings id 4920
布尔 pandas 之间的操作对称性破缺。具有不等索引的系列

隐式索引匹配pandas用于不同之间的操作DataFrame Series很棒而且大多数时候它都有效但是我偶然发现了一个无法按预期工作的示例 import pandas as pd 0 21 0 import numpy as np
DataFrame 对象没有属性“sort_values”

dataset pd read csv dataset csv fillna 100 dataset Id 0 dataset i 0 dataset j 0 entries dataset dataset Id 0 print type
在Python中设置Windows命令行终端标题

我在 Windows 计算机上运行某个 Python 脚本的多个实例每个实例都来自不同的目录并使用单独的 shell 窗口不幸的是 Windows 为每个 shell 窗口提供了相同的名称
对象对于所需数组来说太深 - scipy.integrate.odeint

我昨天刚开始使用Python 使用时遇到错误scipy integrate odeint 我定义了一个函数 def SIR x t beta gamma mu M 这需要numpy array物体x t and M 标量浮动beta gam
XGBoostError：[10：10：03] /workspace/src/tree/updater_gpu_hist.cu：1407：gpu_hist 中的异常：NCCL 失败

PROJECT Nvidia 开发者项目 https developer nvidia com blog gradient boosting decision trees xgboost cuda 在 Google Colab 环境中 MY
gis计算点和多边形/边界之间的距离

我想使用 python 计算一个点到一个国家边界之间的距离shapely 它应该工作得很好 point distance poly 例如在这里展示查找多边形形状上最近点的坐标 https stackoverflow com question

随机推荐

while 循环读取文件提前结束

最终目标是让我的 bash 脚本在多个服务器上执行命令我差不多已经设置好了我的 SSH 身份验证工作正常但是这个简单的 while 循环快要我的命了当我执行 while 循环读取文件中的主机名时当我运行 ssh HOST una
在 mac osx 中反汇编 g++ 创建的可执行文件

如何在 Mac OSx 上查看 C 程序的可执行文件例如 a out 的反汇编版本这不完全是你所要求的但是g S从源代码生成汇编预计比反汇编版本更具可读性如果你不能重新编译 S 例如没有源代码那么gdb让你可以拆卸就像objd
dart - 使用空安全时订阅的正确编码模式？

我已经启用了 dart 2 8 实验性空安全性我有以下退出代码 StreamSubscription
增强 python 链接

我正在为我的游戏添加 boost python 我为我的类编写包装器以在脚本中使用它们问题在于将该库链接到我的应用程序我在用着cmake构建系统现在我有一个简单的应用程序包含 1 个文件和 makefile PYTHON usr i
如何在AWS-Glue脚本中编写用户定义函数？

我们如何在动态框架或数据框架上使用 PySpark Python 在 AWS Glue 脚本中编写用户定义的函数 Dynamicframe 并不像 Dataframe API 支持 UDF 那样完全支持它您将获得的最好结果是 MAP ap
应用程序如何使用 Android 4+ 的 Google 离线地图？

Android 版本 4 引入了离线地图我可以在手机上选择要缓存的区域然后 Google 地图会将该地图数据下载到手机上正如我收到的评论我想使用我的设备上已有的数据如果用户之前已经下载了离线地图使用并且不要打开与 Google
如何知道Python中海龟图形上特定文本的像素大小？

如标题所示当我执行以下代码时 import turtle turtle write some text 我想知道字符串的整体大小包括高度和宽度 some text画布上的乌龟图形我怎样才能做到这一点字体大小只能告诉你half您需要知
将名字和姓氏标记为一个标记

是否可以对标记中的文本进行标记以便将名字和姓氏组合在一个标记中例如如果我的文本是 text Barack Obama is the President Then text split 结果是 Barack Obama is the P
未找到隧道错误 Pyngrok Streamlit 协作

我正在开发一个用户界面streamlit并使用pyngrok来自科拉布一切都工作正常直到几天前开始出现隧道未找到错误我正在使用下面的代码我也升级了pyngrok并尝试过但同样的问题仍然存在对于整个 UI 构建和 Colab 来说
在没有中间过程的情况下，如何在 Python 调试器中查看函数的返回值？

PDB 和其他 Python 调试器有一种简单的方法来查看任何当前变量的值只需输入它即可但是有时我使用的库不将其返回值存储在中间变量中这是一个示例函数 def do stuff args kwds return f args kw
使用ARAnchor插入节点和直接插入节点有什么区别？

在ARKit中我发现了两种在hitTest之后插入节点的方法插入 ARAnchor 然后在中创建节点renderer renderer SCNSceneRenderer nodeFor anchor ARAnchor gt SCNNod
Zend Framework：该行已标记为只读

这是我第一次遇到这个问题保存我的模型之一时我收到错误消息此行已标记为只读不知道为什么我会收到此错误以及如何解决它堆栈跟踪对我没有帮助如何解决此问题以便保存记录将行标记为只读可能是以下任一操作的结果 The Zend Db Se
Cocos2d中用手指旋转精灵

我需要帮助用手指计算精灵的旋转精灵旋转得很好但在我手指第一次触摸时它不知何故自行旋转了几度此外只有当手指围绕精灵中心旋转时旋转才起作用我正在尝试模拟自行车车轮并有一个齿轮精灵和一个踏板精灵作为齿轮精灵的子级我希望当我触摸踏
输入类型=复位和敲除

单击表单重置按钮时 Knockout 不会更新可观察值 http jsfiddle net nQXeM http jsfiddle net nQXeM HTML
为什么 ARC 在 popViewController 之后不释放内存

我在 UINavigationController 中推送和弹出 ViewController 我正在跟踪我的应用程序的内存消耗在推送新的 viewController 时内存消耗逐渐增加但是当我使用以下命令弹出相同的 ViewCon
C++ 库实现如何分配内存但在程序退出时不释放它？

代码相当简单 include
numpy：按列点积

给定一个 2Dnumpy数组我需要计算每一列与其自身的点积并将结果存储在一个一维数组中以下作品 In 45 A np array 1 2 3 4 5 6 7 8 In 46 np array np dot A i A i for i
将表单数据序列化为 JSON [重复]

这个问题在这里已经有答案了我想对表单进行一些服务器前验证骨干网 js https en wikipedia org wiki Backbone js模型为此我需要将用户输入从表单获取为可用数据我找到了三种方法来做到这一点 var i
JQuery：从“a”标签中删除“OnClick”事件

这是一个奇怪的问题我们的内网上有一些生产链接一些 rouge javascript 在我们的 Intranet 主页上的所有链接上返回 false 我们无权访问源代码来重新构建控件并修复此 JavaScript 因此作为临时创可贴我
为什么 scipy.stats.nanmean 给出与 numpy.nansum 不同的结果？

gt gt gt import numpy as np gt gt gt from scipy import stats gt gt gt a np r 1 2 np nan 4 5 gt gt gt stats nanmean a 2 9

为什么 scipy.stats.nanmean 给出与 numpy.nansum 不同的结果？

为什么 scipy.stats.nanmean 给出与 numpy.nansum 不同的结果？ 的相关文章

随机推荐

热门标签

为什么 scipy.stats.nanmean 给出与 numpy.nansum 不同的结果？的相关文章