Python pandas - 根据集体 NaN 计数删除组

2024-07-01

我有一个基于不同气象站的多个变量（温度、压力等）的数据集，

stationID | Time | Temperature | Pressure |...
----------+------+-------------+----------+
123       |  1   |     30      |  1010.5  |
123       |  2   |     31      |  1009.0  |
202       |  1   |     24      |  NaN     |
202       |  2   |     24.3    |  NaN     |
202       |  3   |     NaN     |  1000.3  |
...

我想删除“stationID”组，这些组的 NaN 数量超过一定数量（考虑到计数中的所有变量）。

如果我尝试，

df.loc[df.groupby('station')['temperature'].filter(lambda x: len(x[pd.isnull(x)] ) < 30).index]

它有效，如下所示：Python pandas - 根据 NaN 计数阈值删除组 https://stackoverflow.com/questions/38572079/python-pandas-remove-groups-based-on-nan-count-threshold

但上面的例子只考虑了“温度”。所以，我如何考虑可用变量的 NaN 总和？即：我想删除一个组，其中 [variable1,variable2,variable3,...] 中 NaN 的总和小于阈值。

这应该有效：

df.groupby('stationID').filter(lambda g: g.isnull().sum().sum() < 4)

您可以更换4并设置一个您希望的阈值。

df.groupby('stationID').filter(lambda g: g.isnull().sum().sum() < 4)

   stationID    Time    Temperature Pressure
0        123       1           30.0   1010.5
1        123       2           31.0   1009.0
2        202       1           24.0      NaN
3        202       2           24.3      NaN
4        202       3            NaN   1000.3


df.groupby('stationID').filter(lambda g: g.isnull().sum().sum() < 3)

   stationID    Time    Temperature Pressure
0        123       1           30.0   1010.5
1        123       2           31.0   1009.0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Python pandas - 根据集体 NaN 计数删除组的相关文章

多处理冻结计算机

我通过使用多处理提高了执行时间但我不确定 PC 的行为是否正确它会冻结系统直到所有进程完成我使用的是 Windows 7 和 Python 2 7 也许我做错了这就是我所做的 def do big calculation sub
使用具有阿拉伯字符的 json.dumps 将字典转换为 json [重复]

这个问题在这里已经有答案了我有一本包含阿拉伯语单词的字典例如 data name name print json dumps data file open data json a encoding utf 8 Output name u
Python 内存使用情况

因此我有一些代码接收一组文件将其可以缝合在一起然后绘制它们我发布了大部分代码试图使其更具可读性如果需要可以添加更多代码 for paths dirs files in os walk start path for d in d
二维数组 matplotlib 的颜色图

所以我认为这会非常简单但我一直很难在一个易于理解的示例中找到我正在寻找的内容基本上我想制作相图所以假设我有一个二维数组我怎样才能让 matplotlib 将其转换为我可以附加标题轴和图例彩条的图我正在寻找一种极其简单的基本
在 Python 中获取连接的 VPN 名称

我正在尝试检索已连接的 VPN 的名称我运行的是 Fedora 23 因此连接在 etc NetworkManager system connections 中得到了很好的枚举其中一个文件列出了 VPN 配置的每个参数包括我要查找的
为什么追加会覆盖列表？

我正在尝试 hackerrank 的一些问题并遇到了这个问题https www hackerrank com challenges list com经理问题 https www hackerrank com challenges list
在窗口中定位画布 - Tkinter/python

有没有办法将画布放置在窗口中并在其周围放置一个框架我只找到了如何在画布内放置对象您可以创建一个框架然后将您的小部件放入其中 f tk Frame c1 tk Canvas f c2 tk Canvas f c1 pack side l
如何在python中查找文件的mime类型？

假设您想要将一堆文件保存在某个地方例如保存在 BLOB 中假设您想通过网页分发这些文件并让客户端自动打开正确的应用程序查看器假设浏览器通过 HTTP 响应中的 mime type 内容类型标头确定要使用哪个应用程序查看器基
在heroku上安装pdftotext库

pdftotext 库是requirements txt 中的要求在尝试推送到 heroku 时出现以下错误 remote Running setup py install for pdftotext started remote Ru
Python pandas 使用 read_hdf 和 HDFStore.select 从 HDF5 文件读取特定值

所以我使用一个简单的数据集创建了 hdf5 文件如下所示 gt gt gt pd read hdf STORAGE2 h5 table A B 0 0 0 1 1 1 2 2 2 3 3 3 4 4 4 使用这个脚本 import pan
Python 程序员资源 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
python中1+1可以等于3吗？ [复制]

这个问题在这里已经有答案了在继续之前我知道人们应该never做这个这个问题纯粹是出于教育目的我进行这个练习是为了更好地理解 python 的内部结构ctypes 以及它们如何工作我知道在 python 中更改整数的值相对容易其实
Django 和原始 Python 之间的性能

我想知道使用纯 python 文件制作网页和使用 Django 之间的性能差异是什么我只是想知道两者之间是否有显着差异谢谢 Django 是纯Python 因此每个类似语句或表达式的执行时间将是相同的需要理解的是在进行 Web 开发
抓取框架 NTSCtoUSB 加密狗、opencv2、python 包装器

Context 我一直在研究 opencv2 的 python 包装器我想尝试一些想法并使用类似于汽车后视摄像头的广角摄像头我从一辆报废的撞车上得到了一根它有 4 根电线我从电线的颜色编码中进行了有根据的猜测将其连接起来以便
相当于 C++ 中用于缓冲读取的 python 生成器

Guido Van Rossum 在此展示了 Python 的简单性article http neopythonic blogspot com 2008 10 sorting million 32 bit integers in 2mb h
XPath 错误：[contains(text()="something")]' 不是有效的 XPath 表达式

在观看了关于 XPath 的非常基本的教程之后我第一次使用 selenium 构建一个应用程序该应用程序包含卡的奖金计算器我写了这段代码 from selenium webdriver import Chrome from webdr
Pandas：获取重复索引

给定一个数据帧我想获取重复的索引这些索引在列中没有重复的值并查看哪些值不同具体来说我有这个数据框 import pandas as pd wget https www dropbox com s vmimze2g4lt4ud3 a
将函数应用于数据帧的每一行

下面有什么更优雅的实现方式我想应用一个函数 my function到数据帧其中数据帧的每一行都包含函数的参数然后我想将函数的输出写回数据帧行 results pd DataFrame for row in input panel it
将函数应用于数据帧的每一行

下面有什么更优雅的实现方式我想应用一个函数 my function到数据帧其中数据帧的每一行都包含函数的参数然后我想将函数的输出写回数据帧行 results pd DataFrame for row in input panel it
OpenCV中如何在点之间画线？

我有一个元组数组 a 375 193 364 113 277 20 271 16 52 106 133 266 289 296 372 282 OpenCV中如何在点之间画线这是我的代码不起作用 for index item in enu

随机推荐

缺乏 CUDA 5 动态并行示例

我一直在谷歌上搜索只找到了一个简单的例子 http developer nvidia com sites default files akamai cuda files CUDADownloads TechBrief Dynamic Pa
Scrapy在使用crawlerprocess运行时抛出错误

我用 python 编写了一个脚本使用 scrapy 来收集网站上不同帖子的名称及其链接当我从命令行执行脚本时它可以完美地工作现在我的意图是使用运行脚本CrawlerProcess 我在不同的地方寻找类似的问题但我找不到任何直接
未调用下拉列表的自定义验证器（显然）

为使用自动回发的下拉列表编写自定义验证器似乎完全忽略了验证为什么它被忽略并且有简单的修复方法吗注意我没有使用 ControlToValidate asp net
从 Iphone 本机客户端使用 Google App Engine 进行身份验证

我想创建一个 Iphone 游戏用户可以使用他们的 facebook 凭据登录并通过在 Google App Engine 上运行的我的服务器进行身份验证我已经在 iPhone 和 Google App Engine 上使用了 Face
如何使用 cmake 和 QRC 将 Qt4 qm 文件集成为二进制文件？

我有一个 Qt4 CMake 项目我想将 i18n 的 QM 文件集成到输出二进制文件中这些是我迄今为止生成 TS 和 QM 文件的规则 set myapp TRANSLATIONS i18n myapp de ts set FILES
同一项目的不同文件夹中的相同包名称

我正在开发一个大项目最终可能会包含数万行代码对于当前的结构我喜欢这样 main go controllers NAME go models NAME go 问题是控制器和模型目录包含很多文件全部使用package controller
如何在javascript中获取表中复选框的值

我需要获取表行中提供跨度的复选框的值下面的代码是我的项目的一部分 HTML 代码用于动态我的表格而 javascript 代码用于获取不适用于复选框的元素的值它适用于其他输入元素我的桌子 var html tr class rows
在 Azure AD B2C 中，首次从社交登录登录时，如何将用户的社交帐户与现有本地帐户关联？

据我从文档中了解到 Azure AD B2C 会在第一次登录时为来自 GMail Facebook 等社交登录的每个用户创建一个新的本地帐户如果我错了请纠正我但是我想拦截此行为并将用户链接到已经存在的用户自己的本地帐户而不通过
++ 已弃用，它将在 swift 3 中删除[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案将在 swift 3 中被弃用变量现在可以写成 variable 1 我怎样才能重写 variable 请回忆一下之间的区别 varia
PHP Serialize() ― 规范 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我正在寻找有关 PHP serial
使用 terraform 初始化 terraform 后端

我刚刚开始使用 terraform 我希望能够使用 AWS S3 作为后端来存储项目的状态 terraform backend s3 bucket tfstate key app state region us east 1 我觉得使用 t
如何使用判别函数绘制 3 个类别之间的决策边界

我有 3 个判别函数将 2D 空间划分为 3 个区域我想绘制这些区域之间的决策边界我不知道如何在 python 中使用 matplotlib meshgrid 来做到这一点对于2个判别函数过程很简单我计算值为 0 的函数和等高线
从 canActivate 方法返回 Observable 并在 false 时重定向

我一直在寻找解决方案但没有运气如果用户获得授权我需要调用服务器并且我需要 canActivate 方法来等待该调用的结果但我似乎无法将各个部分拼凑在一起下面是我的代码我的问题在代码的注释中 canActivate route A
从 Outlook 中提取电子邮件地址

我正在尝试提取 Outlook 收件箱中所有电子邮件的电子邮件地址我在互联网上找到了这段代码 Sub GetALLEmailAddresses Dim objFolder As MAPIFolder Dim strEmail As Str
NSCollectionView 自定义布局启用滚动

我无法垂直和水平滚动来使用自定义布局NSCollectionView 根据文档在我的子类中我返回collectionViewContentSize如果太大则会在集合视图的封闭滚动视图中自动启用滚动但是即使我将所有元素排列在水平行中
Select2 的行为与未为 Select2 定义的 Uncaught 查询函数非常不同

我按以下方式加载 select2 的值声明类型 var AdjustmentType Backbone Model extend url Hexgen getContextPath referencedata adjustmenttype
ListView 内的 TextBox 绑定到对象，双向绑定不起作用

Edit 好吧在尝试了无数次但没有成功之后我创建了一个非常小的 Wpf 应用程序您可以直接复制此代码请注意当您更改文本框中的值并按测试按钮时这些值永远不会更新我不明白为什么双向绑定不起作用请帮忙这是 xaml
使用 Symfony2 对实体进行级联验证

我想知道如何使用验证器服务对实体执行级联验证 Using validator this gt get validator errorList validator gt validate entity 不执行实体子实体的验证我很确定它可
在 Scala 宏中对来自 ValDef 的 TypeTree 值进行模式匹配的正确方法？

我需要读取案例类的字段并根据字段的类型执行不同的操作我想我会尝试使用宏读取每个 TypeTree 上的 ValDef 和模式匹配但这并没有揭示每个 TypeTree 代表什么例如整数和字符串都显示为 TypeTree 除了打电话还
Python pandas - 根据集体 NaN 计数删除组

我有一个基于不同气象站的多个变量温度压力等的数据集 stationID Time Temperature Pressure 123 1 30 1010 5 123 2 31 1009 0 202 1 24 NaN 202 2 24 3

Python pandas - 根据集体 NaN 计数删除组

Python pandas - 根据集体 NaN 计数删除组 的相关文章

随机推荐

Python pandas - 根据集体 NaN 计数删除组的相关文章