用每列的组平均值填充 NaN [重复]

2024-04-04

我知道fillna()方法可用于在整个数据框中填充 NaN。

df.fillna(df.mean()) # fill with mean of column.

如何将平均值计算限制为 NaN 所在的组（和列）。

Exemple:

import pandas as pd 
import numpy as np 

df = pd.DataFrame({
    'a': pd.Series([1,1,1,2,2,2]),
    'b': pd.Series([1,2,np.NaN,1,np.NaN,4])
})

print df

Input

Output（在 groupby('a') 之后并用组的平均值替换 NaN）

IIUC 然后你可以打电话fillna http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.fillna.html结果是groupby http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.groupby.html在“a”和transform http://pandas.pydata.org/pandas-docs/stable/groupby.html#transformation on 'b':

In [44]:
df['b'] = df['b'].fillna(df.groupby('a')['b'].transform('mean'))
df

Out[44]:
   a    b
0  1  1.0
1  1  2.0
2  1  1.5
3  2  1.0
4  2  2.5
5  2  4.0

如果您有多个NaN那么我认为以下应该有效：

In [47]:
df.fillna(df.groupby('a').transform('mean'))

Out[47]:
   a    b
0  1  1.0
1  1  2.0
2  1  1.5
3  2  1.0
4  2  2.5
5  2  4.0

EDIT

In [49]:
df = pd.DataFrame({
    'a': pd.Series([1,1,1,2,2,2]),
    'b': pd.Series([1,2,np.NaN,1,np.NaN,4]),
    'c': pd.Series([1,np.NaN,np.NaN,1,np.NaN,4]),
    'd': pd.Series([np.NaN,np.NaN,np.NaN,1,np.NaN,4])
})
df

Out[49]:
   a   b   c   d
0  1   1   1 NaN
1  1   2 NaN NaN
2  1 NaN NaN NaN
3  2   1   1   1
4  2 NaN NaN NaN
5  2   4   4   4

In [50]:
df.fillna(df.groupby('a').transform('mean'))

Out[50]:
   a    b    c    d
0  1  1.0  1.0  NaN
1  1  2.0  1.0  NaN
2  1  1.5  1.0  NaN
3  2  1.0  1.0  1.0
4  2  2.5  2.5  2.5
5  2  4.0  4.0  4.0

你得到全部NaN对于“d”，因为所有值都是NaN对于团体1 for d

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

用每列的组平均值填充 NaN [重复] 的相关文章

如何测试该变量不等于多个事物？

这是我的一段代码 choice while choice 1 and choice 2 and choice 3 choice raw input pick 1 2 or 3 if choice 1 print 1 it is elif c
使用 keras 澄清 Yolo v3 模型输出

我将 yolo v3 模型与 keras 一起使用该网络为我提供了形状如下的输出容器 1 13 13 255 1 26 26 255 1 52 52 255 所以我找到了这个link https www cyberailab com ho
使用python编辑html，但是lxml将漂亮的html实体转换为奇怪的编码

我正在尝试使用 python 带有 pyquery 和 lxml 来更改和清理一些 html Eg html div p It 146 s a spicy meatball p div lxml html clean 函数 clean ht
Python：由于 OSError 无法安装软件包：[Errno 2] 没有这样的文件或目录

我尝试使用pip安装sklearn 并且我收到以下错误消息错误由于 OSError 无法安装软件包 Errno 2 没有这样的文件或目录 C Users 13434 AppData Local Packages PythonSoftwa
TemplateSyntaxError：“settings_tags”不是有效的标签库

当我尝试运行此测试用例时出现此错误这是在我的 django 应用程序的tests py 中编写的 def test accounts register self self url http royalflag com pk accoun
如何进行重定向并保留查询字符串？

我想进行重定向并保留查询字符串就像是self redirect加上发送的查询参数那可能吗 newurl my new route urllib urlencode self request params self redirect ne
将 numpy 数组及其大小写入二进制文件

我需要将 2D numpy 数组写入文件包括其尺寸以便我可以从 C 程序中读取它并创建相应的数组我编写了一些简单的代码来保存数组并且可以从 C 读取它但是如果我尝试先写入数组的大小它总是会给我一个错误这是我的简单 python
清理 MongoDB 的输入

我正在为 MongoDB 数据库程序编写 REST 接口并尝试实现搜索功能我想公开整个 MongoDB 接口我确实有两个问题但它们是相关的所以我将它们放在一篇文章中使用 Python json 模块解码不受信任的 JSON 是否
pandas DataFrame 中行的高效成对比较

我目前正在处理一个较小的数据集大约 900 万行不幸的是大多数条目都是字符串即使强制类别框架在内存中也只有几 GB 我想做的是将每一行与其他行进行比较并对内容进行直接比较例如给定 A B C D 0 cat blue old
关于具有自定义损失的 3 输出 ANN 的加权

我正在尝试定义一个自定义损失函数它在回归模型中接收 3 个输出变量 def custom loss y true y pred y true c K cast y true float32 Shape batch size 3 y pre
按升序对数字字符串列表进行排序

我创建了一个SQLite https en wikipedia org wiki SQLite数据库有一个存储温度值的表第一次将温度值按升序写入数据库然后我将数据库中的温度值读入列表中然后将该列表添加到组合框中以选择温度效果很好
熊猫系列到二维数组

所以我使用了来自的答案将二维数组放入 Pandas 系列中 https stackoverflow com questions 38840319 put a 2d array into a pandas series将 2D numpy
如何使用 Python 在表单中选择选项？

我想知道如何以格式如下的形式选择选项 td align left td
如何停止 PythonShell

如何终止停止 Node js 中 PythonShell 执行的 Python 脚本的执行我在交互模式下运行输出通过 socket io 发送到给定的房间如果没有更多的客户端连接到这个房间我想停止 python 脚本的执行这是我
在 Python 中引发异常的正确方法是什么？ [复制]

这个问题在这里已经有答案了这是简单的代码 import sys class EmptyArgs StandardError pass if name main The first way to raise an exception if
配置 Django 和 Google 云存储？

I am not使用应用引擎我有一个在虚拟机上运行的普通 Django 应用程序我想使用 Google Cloud Storage 来提供静态文件以及上传提供媒体文件我有一个水桶如何将 Django 应用程序链接到我的存储桶我
Python：如何“杀死”类实例/对象？

我希望 Roach 类在达到一定量的饥饿时死亡但我不知道如何删除该实例我的术语可能有误但我的意思是窗户上有大量蟑螂我希望特定的蟑螂完全消失我会向您展示代码但它很长我将蟑螂类添加到策划者类蟑螂种群列表中一般来说每个
将整数转换为特定格式的十六进制字符串

我是 python 新手有以下问题我需要将整数转换为 6 个字节的十六进制字符串例如 281473900746245 gt xFF xFF xBF xDE x16 x05 十六进制字符串的格式很重要 int 值的长度是可变的格式 0
如何通过 API Gateway 使用事件调用类型调用 Lambda 函数？

文件说默认情况下 Invoke API 采用 RequestResponse 调用类型您可以选择通过将 Event 指定为 InitationType 来请求异步执行因此我可以发送到我的函数 python 的就是到处都是 Inspi
python：日志记录：我们可以向记录器添加多个过滤器吗？考虑哪一个

我试图了解 Python 日志记录中的多个过滤器一个在配置中定义另一个在代码中定义如何工作我正在开发一个 Django 项目下面是我在 settings py 中的记录器配置我的目标是switch on and switch o

随机推荐

KTable 应该发出的事件

我正在尝试测试一个拓扑该拓扑作为最后一个节点具有 KTable 我的测试是使用成熟的 Kafka 集群通过 confluence 的 Docker 镜像所以我not使用TopologyTestDriver 我的拓扑有键值类型的输入S
自定义设计signed_up_but_unconfirmed消息

实际上我想自定义signed up but unconfirmed消息该消息是 A message with a confirmation link has been sent to your email address Please fo
如何检查SuperTab和jedi-vim是否激活？

正如标题所述如何检查插件是否已加载当我击中时tab 对于 SuperTab 我得到的只是插入到我的文件中的普通字符 tab 当我点击ctrl 空格键我只是被抛出插入模式与点击相同的行为ESC The scriptnames命令列出所有
办公文档设置

我目前正在存储一个键值对Office context documents settings使用以下函数 Office context document settings set name value 存储键值对后我将重新启动加载项并尝试使
无法将 SQL 查询的结果传递给 JAVA 中的方法

这是我第一次使用 Java 我很困惑我创建了这个方法 List
即使使用文档中的示例，也无法模拟打开

我直接从 Python 复制并粘贴了以下代码模拟文档 https docs python org 3 library unittest mock html mock open from unittest mock import patch
无法安装 MySQL-python

好的我最近从 Ubuntu 10 04 升级到 12 04 只会面临很多问题我是这方面的新手所以你可能需要更详细地或一步一步地告诉我我有一个 django 项目运行完美但现在它给了我这个错误 File usr local lib
在 Fabric.js 中控制 z-index

在fabricjs中我想创建一个场景其中鼠标下方的对象在z index中上升到场景的顶部然后一旦鼠标离开该对象它就会返回到它来自的z index 无法设置 object zindex 这很好相反我使用一个占位符对象将其放入旧位
控制加速度直到到达某个位置的算法

我有一个可以移动的点在一维并且我需要它平滑地移动所以我认为它的速度必须是一个连续函数我需要控制加速度然后计算它的速度和位置该算法对我来说似乎并不明显但我想这一定是一个常见问题我只是找不到解决方案 Notes 对象在移动时的最
Python - 将 set-cookies 响应转换为 cookie 字典

如何转换response set cookie 输出字符串来自httplib2回应像 cookie1 xxxyyyzzz Path Expires Wed 03 Feb 2015 08 03 12 GMT Secure HttpOnly c
GLUT 退出重新定义错误

在我的简单 OpenGL 程序中我收到以下有关退出重新定义的错误 1 gt c program files microsoft visual studio 8 vc include stdlib h 406 error C2381 exi
Android Studio 3 库模块和功能模块的区别

Android Studio 3 中至少有两种新的模块类型首先是Instant app module第二个是feature module With Instant App module这是很明显的但是feature module从我的角度
arrayWillChange 中“无法调用未定义的‘销毁’方法”

我有一个非常标准的数组模板关系设置但是当我将一个新项目推入数组时我得到了上面提到的内容Cannot call method destroy of undefined错误在arrayWillChangeEmber源码的方法 for id
将格式化日期转换回unix

我将使用哪个函数将自定义格式的日期转换回 Unix 纪元时间例如 Ymd gt U 我在看date U strtotime 20140525 但我不确定如何适应原始格式Ymd 该函数如何知道输入格式是 YYYYMMDD 因为它看起来有效
如何将 Haskell 转换为 F#？

我正在尝试通过翻译我很久以前编写的一些 Haskell 代码来学习 F 但我陷入了困境 percent Int gt Int gt Float percent a b fromInt a fromInt b 100 freqs String
跨多个线程的 Java 日志记录

我们有一个使用线程的系统以便它可以同时并行处理不同的功能我们希望找到一种方法将特定事务的所有日志条目绑定在一起通常人们可能会使用 threadName 将它们收集在一起但显然这在多线程情况下会失败如果没有通过每个方法调用传递
使用 C++ 登录到 Windows 上的事件查看器 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我想在我的 C 应用程序上使用日志但是我想使用 Windows 10 事件查看器而不是文本文件我
如何将“捐赠”按钮集成到印度的网站中？

我们正在为印度的慈善信托基金开发一个网站为此我们需要在网站上添加一个捐赠按钮供任何想要通过支付网关向慈善机构捐赠的人使用然而 Paypal 和 Google Wallet Google Checkout 都限制在印度使用捐赠
杰克逊：将对象视为原始对象

我有一门或多或少是围绕双精度型的包装类当我通过 Jackson 序列化我的类时我将收到类似以下内容的信息 value 123 0 我基本上希望发生的是杰克逊只给我 123 0 0 如果我可以扩展 Number 我的问题就会得到解决但
用每列的组平均值填充 NaN [重复]

这个问题在这里已经有答案了我知道fillna 方法可用于在整个数据框中填充 NaN df fillna df mean fill with mean of column 如何将平均值计算限制为 NaN 所在的组和列 Exemple im

用每列的组平均值填充 NaN [重复]

用每列的组平均值填充 NaN [重复] 的相关文章

随机推荐

热门标签