将 pandas 的skipna 全局默认设置设置为 False

2024-01-23

对于某些 Pandas 函数，例如 sum()、cumsum() 和 cumprod()，有一个 Skipna 选项，默认设置为 True。这会给我带来问题，因为错误可能会默默地传播，所以我总是明确地将skipna设置为False。

sum_df = df.sum(skipna=False)

每次出现这些函数之一时都执行此操作会使代码看起来有点笨拙。有没有办法改变 Pandas 的默认行为？

选项还不是选项

似乎没有什么这样的option https://pandas.pydata.org/pandas-docs/stable/user_guide/options.html#available-options来控制这种行为。它是硬编码的：

import inspect
inspect.getfile(pd.DataFrame.sum)    # './pandas/core/generic.py'
inspect.getsource(pd.DataFrame.sum)

# @Substitution(outname=name, desc=desc, name1=name1, name2=name2,
#                  axis_descr=axis_descr, min_count=_min_count_stub,
#                  see_also=see_also, examples=examples)
# @Appender(_num_doc)
# def stat_func(self, axis=None, skipna=None, level=None, numeric_only=None,
# [...]

对于拉取请求来说，这可能是一个好主意。

一个简单的解决方案

可能不是最好的解决方案，它有点黑客，但它确实解决了您的问题。

我并不是说这总体上是一种好的做法。它可能有我没有解决的缺点（欢迎您在评论中列出）。无论如何，这个解决方案的优点是非侵入性.

另外，虽然这是一个非常简单的技术并且是纯粹的 PSL，但它可能违反了最小惊讶原则（参见此answer https://softwareengineering.stackexchange.com/a/305962/316969了解详情）。

MCVE

让我们构建一个覆盖现有默认参数或添加额外参数的包装器：

def set_default(func, **default):
    def inner(*args, **kwargs):
        kwargs.update(default)        # Update function kwargs w/ decorator defaults
        return func(*args, **kwargs)  # Call function w/ updated kwargs
    return inner                      # Return decorated function

然后，我们可以装饰任何函数。例如：

import pandas as pd
pd.DataFrame.sum = set_default(pd.DataFrame.sum, skipna=False)

然后，sum的方法DataFrame物体有它的skipna重写为False每次我们调用它。现在有以下代码：

import numpy as np
df = pd.DataFrame([1., 2., np.nan])
df.sum()

Returns:

0   NaN
dtype: float64

代替：

0    3.0
dtype: float64

自动化

我们可以立即将此修改应用于许多函数：

for key in ['sum', 'mean', 'std']:
    setattr(pd.DataFrame, key, set_default(getattr(pd.DataFrame, key), skipna=False))

如果我们将这些修改存储到 python 模块中（.py文件）它们将在导入时应用，无需修改 Pandas 代码本身。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Sum

cumsum

将 pandas 的skipna 全局默认设置设置为 False 的相关文章

将 numpy 数组合并为单个 int

numpy 数组怎么可以这样 10 22 37 45 转换为单个 int32 数字如下所示 10223745 这可以工作 gt gt gt int join map str 10 22 37 45 10223745 基本上你使用map s
按边距（“全部”）值列对 Pandas 数据透视表进行排序

我试图根据 pandas 数据透视表中的行总和对最后一列边距 aggrfunc 进行降序排序我知道我在这里错过了一些简单的东西但我无法弄清楚数据框数据透视表 WIDGETS DATE 2 1 16 2 2 16 2 3 16 Al
是否可以从 Julia 调用 Python 函数并返回其结果？

我正在使用 Python 从网络上抓取数据我想使用这些数据在 Julia 中运行计算是否可以在 Julia 中调用该函数并返回其结果或者我最好直接导出到 CSV 并以这种方式加载数据绝对地看PyCall jl https gith
使用 Boto3 以字符串形式打开 S3 对象

我知道使用 Boto 2 可以使用以下命令将 S3 对象作为字符串打开 get contents as string http boto readthedocs org en latest ref file html highlight c
Matplotlib：如何有效地将大量线段着色为独立渐变

Python 绘图库如何有效地将大量线段着色为独立渐变已经阅读this https stackoverflow com questions 8500700 how to plot a gradient color line in ma
Python将文本文件解析为嵌套字典

考虑以下数据结构 HEADER1 key value key value HEADER2 key value key value HEADER3 key value HEADER4 key value key value 原始数据中没有缩进
Spark 和 Python 使用自定义文件格式/生成器作为 RDD 的输入

我想问一下 Spark 中输入的可能性我可以看到从http spark apache org docs latest programming guide html http spark apache org docs latest pro
两个不同长度的数据帧的列之间的余弦相似度？

我在 df1 中有文本列在 df2 中有文本列 df2 的长度将与 df1 的长度不同我想计算 df1 text 中每个条目与 df2 text 中每个条目的余弦相似度并为每场比赛给出分数输入样本 df1 mahesh suresh
Plotly：如何检查基本图形结构（版本 4）

对于旧版本的plotly 例如在 Jupyterlab 中您可以简单地运行figure像这样检查你的图形的基础知识 Ouput data marker color red size 10 symbol 104 mode markers l
pandas 相当于 np.where

np where具有向量化 if else 的语义类似于 Apache Spark 的when otherwise数据帧方法我知道我可以使用np where on pandas Series but pandas通常定义自己的 API
是否需要关闭没有引用它们的文件？

作为一个完全的编程初学者我试图理解打开和关闭文件的基本概念我正在做的一项练习是创建一个脚本允许我将内容从一个文件复制到另一个文件 in file open from file indata in file read out file
在骨架图像中查找线 OpenCV python

我有以下图片我想找到一些线来进行一些计算平均长度等我尝试使用HoughLinesP 但它找不到线我能怎么做这是我的代码 sk skeleton mask rows cols sk shape imgOut np zeros row
在Raspberry pi上升级skimage版本

我已经使用 Raspberry Pi 2 上的 synaptic 包管理器安装了 python 包然而 skimage 模块版本 0 6 是 synaptic 中最新的可用版本有人可以指导我如何将其升级到0 11 因为旧版本中缺少某些功
XPath：通过当前节点属性选择当前和下一个节点的文本

首先这是从我之前的问题 https stackoverflow com questions 5202187 xpath select current and next nodes text by current node attribut
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
如何将带有参数的Python装饰器实现为类？

我正在尝试实现一个接受一些参数的装饰器通常带有参数的装饰器被实现为双重嵌套闭包如下所示 def mydecorator param1 param2 do something with params def wrapper fn def
Django 管理器链接

我想知道是否有可能如果可以的话如何将多个管理器链接在一起以生成受两个单独管理器影响的查询集我将解释我正在研究的具体示例我有多个抽象模型类用于为其他模型提供小型的特定功能其中两个模型是DeleteMixin 和GlobalMix
pandas 中数据帧中的随机/洗牌行

我目前正在尝试找到一种方法来按行随机化数据框中的项目我在 pandas 中按列洗牌排列找到了这个线程在 pandas 中对 DataFrame 进行改组排列 https stackoverflow com questions 157
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不
如何（安全）将 Python 对象发送到我的 Flask API？

我目前正在尝试构建一个 Flask Web API 它能够在 POST 请求中接收 python 对象我使用 Python 3 7 1 创建请求使用 Python 2 7 运行 API 该 API 设置为在我的本地计算机上运行我试图发

随机推荐

如何定位 CSS 网格布局中的特定列或行？

是否可以使用 CSS 选择特定的网格列或行例如假设我有一个 3 行 x 2 列的 CSS 网格布局 grid template rows 1fr 1fr 1fr grid template columns 1fr 1fr 我如何从第二列
Mysql UTF8 编码问题 - “字符串值不正确”

我正在使用 Mysql 5 5 27 和 Net 连接器 6 5 4 当我尝试插入一些数据时出现以下错误 Incorrect string value xF3 xB6 xA5 x89f for column STACK TRACE at
使用输入参数作为可选输入

使用 wso2 DSS 版本 3 01 我试图有一个可以是可选参数的输入参数用户可以说给我这个特定代码的所有信息或者如果用户没有指定任何代码我想提供所有数据行你能帮我吗您还可以执行以下操作而不是为每个可选参数创建查询
cli/C++ 如何使用非托管类型元素定义 cli::array？

我有一个本机 C C 结构 typedef struct AStruct 在 C CLI 代码中我定义了一个委托和一个 cli 数组如下所示 public delegate void UpdateDataDelegate AStruct
KnockoutJS + Polymer：绑定中断（Chrome 之外）

编辑这仅出现在 Chrome 之外我使用 KO 来使用 foreach 绑定填充元素另一方面我加载了 Polymer 以利用 Google 的 Material Design 样式问题是 platform js 文件 Polyme
有没有更好的方法来获取 Ruby 对象的公共“属性”？

有没有更好的方法来获取 Ruby 对象的公共属性 def props self public methods grep end 您的正则表达式不完整它匹配以任何字符开头的方法而不仅仅是单词字符获得所有作家的最佳方法是 metho
绘制因子变量的直方图

I m trying to replicate the graph similar to the following originally found HERE http 37signals com svn posts 3019 the r
后台在 uiwebview 中加载 url

你好我有一个应用程序我在 uiwebview 中加载网页所以每次加载都需要太多时间所以我需要以后台模式加载网页任何人都知道如何做到这一点任何帮助将不胜感激 void start Web View UIWebView wv UIW
onPageFinished() 从未调用过（webview）！

我想在网络视图完全加载时显示一个祝酒词但吐司从未出现我不知道为什么这是我的代码 public class WebViewSignUp extends Activity WebView mWebView Override public
如何将 AltGr 键全局映射到 Alt 键？

I want my AltGr key to behave exactly like left Alt Usually I do this kind of stuff with Autohotkey http www autohotkey
Julia+JuMP：函数参数数量可变

我正在尝试使用 JuMP 来解决非线性问题其中变量的数量由用户决定也就是说在编译时未知为了实现这一目标 NLobjective线路看起来像这样 eval JuMP NLobjective m Min Expr call myf Ex
如何使用 PyTest 捕获测试用例失败的屏幕截图

目前我正在使用以下解决方案在 PyTest 的每个测试函数结束时截取屏幕截图如何确保仅在测试失败时才截取屏幕截图这是一个关于 PyTest 机制的问题这个问题与 selenium 或 appium 无关我在 Stackoverfl
如何在 yii 中获取 json 格式（application/json）的响应？

如何在 yii 中获取 json 格式 application json 的响应对于 Yii 1 在您的基础控制器中创建此函数 Return data to browser as JSON and end application pa
在 Android 中单击按钮时触发后退按钮功能

我知道 Android 中有后退按钮可以让我们回到之前的表单但我的团队领导要求在按钮单击时添加后退按钮功能我怎样才能做到这一点你应该使用finish 当用户单击按钮以转到上一个活动时 Button backButton Button
使用 Spring 4 注解配置 404 错误页面

我有一个 Spring MVC 项目使用 Spring 4 我的服务器是 tomcat 7 我正在尝试制作一个404页面我尝试了很多方法但我做不到我缺少什么这是 WebAppContext Configuration Compon
将 PNG 图像保存到 WP7 的隔离存储

这里有很多关于图像到隔离存储的问题但我找不到适合我的情况的好的答案所以我们开始吧我正在取一个 png来自网络的图像并将其另存为BitmapImage 目的当它完成加载时在BitmapImage ImageOpened事件我想将
是否可以在运行时跳过 Cucumber-JVM 的场景

我想将标签 skiponchrome 添加到场景中这应该在使用 Chrome 浏览器运行 Selenium 测试时跳过该场景这样做的原因是因为某些场景在某些环境中有效而在其他环境中无效这甚至可能不是特定于浏览器测试的并且可以应用于
在 Python 中绘制多个图，但具有偏移范围

我想绘制 e 和 nu 的函数其中 e 是偏心率 nu 是真正的异常我只看椭圆轨道所以0
在C++中使用组合时如何决定类属性应该是指针还是值？

请参阅此示例大学的班级有一个主任和很多学生所以我的班级会是这样的 a class University Director d Student list 1000 or b class University Director d Stude
将 pandas 的skipna 全局默认设置设置为 False

对于某些 Pandas 函数例如 sum cumsum 和 cumprod 有一个 Skipna 选项默认设置为 True 这会给我带来问题因为错误可能会默默地传播所以我总是明确地将skipna设置为False sum df df

热门标签