pandas：在（多索引）DataFrame上使用每个组中最常见的值执行 fillna() 的最佳方法是什么？

2024-02-28

有一个包含一些 NaN 值的 DataFrame：

df = pd.DataFrame({'A': [1, 1, 1, 1, 2, 2, 2, 2], 'B': [1, 1, np.NaN, 2, 3, np.NaN, 3, 4]})

   A    B
0  1  1.0
1  1  1.0
2  1  NaN <-
3  1  2.0
4  2  3.0
5  2  NaN <-
6  2  3.0
7  2  4.0

将标签“A”设置为索引：

df.set_index(['A'], inplace=True)

现在有两个组，索引分别为 1 和 2：

     B
A     
1  1.0
1  1.0
1  NaN <-
1  2.0
2  3.0
2  NaN <-
2  3.0
2  4.0

使用以下命令在 DataFrame 上执行 fillna() 的最佳方法是什么最频繁的每个组的价值？

所以，我想做这样的电话：

df.B.fillna(df.groupby('A').B...)

and get:

我希望有一种方法，它也适用于多索引。

按列分组A并申请fillna()每组内的B；
从系列中删除缺失值，然后执行value_counts, use idxmax()选取最频繁的值；

假设不存在缺少所有值的组：

df['B'] = df.groupby('A')['B'].transform(lambda x: x.fillna(x.dropna().value_counts().idxmax()))
df

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

Fill

missingdata

pandas：在（多索引）DataFrame上使用每个组中最常见的值执行 fillna() 的最佳方法是什么？的相关文章

Pandas：GroupBy 到 DataFrame

参考这个关于 groupby 到 dataframe 的非常流行的问题 https stackoverflow com questions 10373660 converting a pandas groupby object to dat
如何在Python中同时运行两只乌龟？

我试图让两只乌龟一起移动而不是一只接着另一只移动例如 a turtle Turtle b turtle Turtle a forward 100 b forward 100 但这只能让他们一前一后地移动有没有办法让它们同时移动有没有
Python3.0 - 标记化和取消标记化

我正在使用类似于以下简化脚本的内容来解析较大文件中的 python 片段 import io import tokenize src foo bar src bytes src encode src io BytesIO src src l
Pandas：如果单元格包含特定文本则删除行

pandas 中的这段代码不起作用如果该列包含提供的任何文本数字我希望它删除该行目前我只能在单元格与我的代码中传递的确切文本匹配时才能使其工作因为它只删除显示 Fin 的单元格不是金融或金融 df2 df df Team Fin
Keras：如何保存模型或权重？

如果这个问题看起来很简单我很抱歉但是阅读 Keras 保存和恢复帮助页面 https www tensorflow org beta tutorials keras save and restore models https www t
在 Django OAuth Toolkit 中安全创建新应用程序

如何将 IsAdminUser 权限添加到 Django OAuth Toolkit 中的 o applications 视图 REST FRAMEWORK DEFAULT PERMISSION CLASSES rest framework
如果在等待“read -s”时中断，在子进程中运行 bash 会破坏 tty 的标准输出吗？

正如 Bakuriu 在评论中指出的那样这基本上与BASH 输入期间按 Ctrl C 会中断当前终端 https stackoverflow com questions 31808863 bash ctrlc during input b
Django 的 request.FILES 出现 UnicodeDecodeError

我在视图调用中有以下代码 def view request body u for filename f in request FILES items body body Filename filename n f read n 在某些情况下
Tensorflow 与 Keras 的兼容性

我正在使用 Python 3 6 和 Tensorflow 2 0 并且有一些 Keras 代码 import keras from keras models import Sequential from keras layers impo
如何在 pandas 中使用 read_fwf 跳过空行？

I use pandas read fwf http pandas pydata org pandas docs stable generated pandas read fwf htmlPython pandas 0 19 2 中的函数读
使用 Pandas 计算 delta 列

我有一个数据框如下所示 Name Variable Field A 2 3 412 A 2 9 861 A 3 5 1703 B 3 5 1731 A 4 0 2609 B 4 0 2539 A 4 6 2821 B 4 6 2779 A
使用 Keras np_utils.to_categorical 的问题

我正在尝试将整数的 one hot 向量数组制作为 keras 将能够使用的 one hot 向量数组来拟合我的模型这是代码的相关部分 Y train np hstack np asarray dataframe output vecto
返回表示每组内最大值的索引的一系列数字位置

考虑一下这个系列 np random seed 3 1415 s pd Series np random rand 100 pd MultiIndex from product list ABDCE list abcde One Two T
在 keras 中保存和加载权重

我试图从我训练过的模型中保存和加载权重我用来保存模型的代码是 TensorBoard log dir output model fit generator image a b gen batch size steps per epoch
Anaconda 无法导入 ssl 但 Python 可以

Anaconda 3 Jupyter笔记本无法导入ssl 但使用Atom终端导入ssl没有问题我尝试在 Jupyter 笔记本中导入 ssl 但出现以下错误 C ProgramData Anaconda3 lib ssl py in
动态过滤 pandas 数据框

我正在尝试使用三列的阈值来过滤 pandas 数据框 import pandas as pd df pd DataFrame A 6 2 10 5 3 B 2 5 3 2 6 C 5 2 1 8 2 df df loc df A gt 0
Django Admin 中的反向内联

我有以下 2 个型号现在我需要将模型 A 内联到模型 B 的页面上模型 py class A models Model name models CharField max length 50 class B models Model n
混淆矩阵不支持多标签指示符

multilabel indicator is not supported是我在尝试运行时收到的错误消息 confusion matrix y test predictions y test is a DataFrame其形状为 Horse
Django 与谷歌图表

我试图让谷歌图表显示在我的页面上但我不知道如何将值从 django 视图传递到 javascript 以便我可以绘制图表姜戈代码 array Year Sales Expenses 2004 1000 400 2005 1170 460
使用ssl和socket的python客户端身份验证

我有一个 python 服务器需要客户端使用证书进行身份验证我如何制作一个客户端脚本使用客户端证书由 python 中的服务器使用 ssl 和套接字模块进行身份验证有没有仅使用套接字和 ssl 而不扭曲的示例 from OpenSS

随机推荐

keras的model.fit中tf.Print没有结果

我写了那个损失用于测试 keras 中的自定义损失 def loss y true y pred loss tf reduce sum y true tf log y pred loss tf Print loss loss loss r
如何在python中删除文件的部分内容？

我有一个名为 a txt 的文件如下所示我是第一线我是第二线这里可能还有更多行我在空行下方我是一条线更多线路在这里现在我想删除空行上方的内容包括空行本身我怎样才能以 Pythonic 的方式做到这一点基本上您无法从文件
嵌入式 Jetty - 启动 Jetty 服务器后添加上下文

在没有指定上下文和上下文处理程序的情况下启动jetty实例然后在服务器启动后继续向其添加上下文是否正确尽管我能够使用可变的 HandlerCollection 来执行此操作并且日志显示服务器和上下文已启动且可用但我无法使用 URL
在设计时隐藏私有子控件属性

我有一个带有一些私有子控件的容器控件如何在设计时隐藏属性浏览器以显示控件它还在设计时在每个控件上显示一个锁和一个方形图标我尝试为控件设置
PHP中HTTP请求完成后执行代码？

PHP提供了注册关闭函数的机制 register shutdown function shutdown func 问题是在最新版本的 PHP 中该函数仍然在请求期间执行我有一个平台如果重要的话在 Zend Framework 中整
Ehcache并发修改异常+Spring+Struts应用

在我的应用程序中 ehcache 配置如下应用程序数据区域 java import statements public class AppDataRegion Variable for region identifier private
Android RSA 加密与 OAEP 使用 SHA-256 进行主摘要和 MGF1 摘要

根据规范我需要对两个摘要主摘要和 MGF1 摘要使用带有 SHA 256 的 RSA ECB OAEPPadding 密码安卓密码学 https developer android com guide topics security
java try 块的范围应该尽可能严格吗？

有人告诉我使用 Java try catch 机制会产生一些开销因此虽然有必要将抛出已检查异常的方法放入 try 块中来处理可能的异常但从性能角度来看限制 try 块的大小以仅包含那些可能抛出异常的操作是一种很好的做法我不太确定
在数据库表中存储视图计数

每次访问数据库记录时存储视图计数的适当且最有效的方法是什么我有桌子ITEMS包含以下字段 id item name 每个项目都有自己的永久链接 http domain com item name http domain com item
CSS 动画属性在动画后保留

我试图让 CSS 动画属性在完成后保留这可能吗这就是我正在努力实现的目标当用户登陆页面时该元素应该隐藏 3秒后或其他时间它应该淡入一旦动画完成它应该停留在那里这是一个小提琴尝试 http jsfiddle net GZx6
SVN将服务器端的数据存储在哪里？

我已经在我的 Web 主机服务器上创建了一个 svn 存储库并成功向其中提交文件并更新了文件但我似乎实际上无法在服务器上找到这些文件我的 svn 仓库位于 svn my first repo 其中包含以下内容 README txt c
在 Python 中将图像中的颜色映射到颜色列表中最接近的成员

我有一个 19 种颜色的列表它是一个大小为 numpy 的数组 19 3 colors np array 0 0 0 0 0 255 255 0 0 150 30 150 255 65 255 150 80 0 170 120 65 12
如何使用 iTextSharp 获取 pdf 文件中的部分目标页码？

我有一个 pdf 文件其中包含索引页其中包含目标页面部分我可以获得章节名称第 1 1 节第 5 2 节但无法获取目标页码 For ex http www mikesdotnetting com Article 84 iTextS
使用 VB.NET 创建 ODBC DSN

我想为数据库创建 ODBC DSN 每当用户设置应用程序时该数据库将包含在我的应用程序文件夹中我想知道如何使用所有必需的参数创建 ODBC 以便运行安装程序时要做的第一件事是将数据库连接到应用程序我尝试过使用默认的 VB NET 安装
如何向某些 jQuery 对象添加函数，而不向其他对象添加函数？

假设我有一个 ul list ul class products ul 我想用 jQuery 选择它然后向该对象添加一些函数例如我想添加一个addProduct productData 函数和一个deleteProduct produ
降低 Bootstrap 3.0 导航栏的高度

我正在尝试降低与固定顶部行为一起使用的 Bootstrap 3 0 导航栏高度这里我使用的是代码 HTML div class tnav div class navbar navbar fixed top div class navbar
我应该使用 MySQL blob 字段类型吗？

我正在努力决定是否应该在即将进行的项目中使用 MySQL blob 字段类型我的基本要求是可以查看某些数据库记录并上传多个文件并将其附加到这些记录根据具体情况查看所述记录可能仅限于某些人任何类型的文件都可以上传几乎没有任何
使用本地密钥 MONGODB 启用数据加密时出错

我已成功加密 mongoDB 中的通信但是当我尝试启用数据加密时出现错误我使用的是 mongoDB 企业版版本为 3 2 4 我在控制台中收到以下消息 ERROR child process failed exited with er
有没有办法验证 jsonpath 的语法是否正确？

嗨我正在尝试找到一种方法验证 jsonpath由用户输入评估之前它我希望使用正则表达式之类的东西来做到这一点但到目前为止我找不到任何有关如何验证 jsonpath 语法的文档资源所有搜索到的返回资源都讨论了表达式的求值即使 ja
pandas：在（多索引）DataFrame上使用每个组中最常见的值执行 fillna() 的最佳方法是什么？

有一个包含一些 NaN 值的 DataFrame df pd DataFrame A 1 1 1 1 2 2 2 2 B 1 1 np NaN 2 3 np NaN 3 4 A B 0 1 1 0 1 1 1 0 2 1 NaN lt 3

pandas：在（多索引）DataFrame上使用每个组中最常见的值执行 fillna() 的最佳方法是什么？

pandas：在（多索引）DataFrame上使用每个组中最常见的值执行 fillna() 的最佳方法是什么？ 的相关文章

随机推荐

热门标签

pandas：在（多索引）DataFrame上使用每个组中最常见的值执行 fillna() 的最佳方法是什么？的相关文章