Python Pandas - 根据组中值的存在来过滤组

2024-04-18

我需要按一列对数据框进行分组，然后过滤掉另一列中不包含特定值的所有组。

例如，这是我的数据框：

A  B
1 False
1 True
2 False
2 False
3 True
3 False
4 False

我想按 A 列进行分组，然后删除 B 列中不包含 True 的所有组（因此仅在示例中保留 1 和 3 的组）。

我正在尝试的代码是：

df.groupby('A').filter(lambda x:True in x['B'])

然而，这返回的是空的。为什么这不起作用？提前致谢。

第一个想法是过滤所有A价值观与True in B列并传递到Series.isin http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.isin.html通过原件检查会员资格A列和过滤依据boolean indexing http://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#boolean-indexing:

df1 = df[df['A'].isin(df.loc[df.B, 'A'])]

或者你可以使用GroupBy.transform http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.core.groupby.GroupBy.transform.html测试是否至少有一个True每组由GroupBy.any http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.core.groupby.GroupBy.any.html:

df1 = df[df.groupby('A')['B'].transform('any')]
print (df1)
   A      B
0  1  False
1  1   True
4  3   True
5  3  False

您的解决方案可能会随着测试一而改变True每组由Series.any http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.any.html，但如果 DataFrame 较大或有很多组，则速度最慢：

df1 = df.groupby('A').filter(lambda x: x['B'].any())

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Python Pandas - 根据组中值的存在来过滤组的相关文章

在 Python 中静默打印 PDF

我正在尝试使用 Python 打印 PDF 而不打开 PDF 查看器应用程序 Adobe Foxit 等我还需要知道打印何时完成以删除文件 Here http permalink gmane org gmane comp python
有没有纯Python的表类？

我正在构建一个需要分析表格数据的应用程序我想执行一些列操作例如重命名列删除列以及根据现有列的值计算新列的能力我的第一选择是 Pandas 之类的东西但是一个限制是这个项目必须是跨平台的并且非常容易在 virtualenv 中部署
根据日期列过滤并创建列

我有一个样本数据如下 date Deadline 2018 08 01 2018 08 11 2018 09 18 2018 12 08 2018 12 18 我想用代码中描述的条件填写截止日期列如 1 DL 2 DL 3 DL 等基于
Python 中的密码子生成

我有这段代码用于将 DNA 字符串转换为密码子列表然后将此列表转换为具有各自氨基酸的字符串然而当我运行代码并且 DNA 字符串以一对核苷酸例如 CT 而不是三联体结尾时代码不会生成氨基酸序列正如您在输出中看到的 from co
为什么 takewhile() 会跳过第一行？

我有一个这样的文件 1 2 3 TAB 1 2 3 TAB 我想将 TAB 之间的行作为块读取 import itertools def block generator file with open file as lines for li
Flask-admin 内联建模传递表单参数会抛出 AttributeError

Flask 开发者们大家好在 Flask admin 中我目前尝试在模型视图中实现内联模型编辑在模型方面我有一个简单的树结构表示一组内容页面每个节点都有多个子节点以及与其关联的多个内容数据模型模型被命名为ContentNode
Jupyter Notebook 找不到 IQSharp

我一直在尝试为 Quantum Katas 运行 Q 但在找到 Q 内核方面遇到了一些困难唯一显示的内核是用于 Jupyter Notebook 的 Python 3 内核奇怪的是当我执行 jupyter kernalspec lis
lxml/python 使用 CDATA 部分读取 xml

在我的 xml 中我有一个CDATA部分我想保留 CDATA 部分然后剥离它有人可以帮忙解决以下问题吗默认不起作用 from io import StringIO from lxml import etree xml
使用 Numpy 与 einsum 和 tensordot 进行相同的操作

假设我有两个 3D 数组A and B形状的 3 4 N and 4 3 N 我可以计算沿第三轴的切片之间的点积 with einsum np eisum ikl kjl gt ijl A B 是否可以执行相同的操作numpy tensor
是否可以使用 csv.DictReader 保持列顺序？

例如我的 csv 有如下列 ID ID2 Date Job No Code 我需要以相同的顺序写回各列这dict立即打乱了顺序所以我相信这更多是读者的问题蟒蛇的dicts 在 3 6 之前不维持顺序但是无论如何在该版本中csv
解码来自 S60 设备的 WBXML SyncML 消息

我正在尝试解码来自诺基亚 N95 的 WBXML 编码的 SyncML 消息我的第一次尝试是使用 python pywbxml 模块它包装了对 libwbxml 的调用用此方法解码消息会得到许多标签以及标签内的一大块二进制文件我
Dataframe unstack 性能 - pandas

我正在尝试拆开数据框它工作正常但问题是我正在处理 CSV 文件中的巨大数据集约 10 亿这是示例数据集 236539 48512569874 Name Danny 236539 48512569874 Class 12 236539
Groupby Sum 忽略几列

在此数据框中我想按位置进行分组并获得分数的总和但我不希望纬度经度和年份在此过程中受到影响 sample pd DataFrame Location A B C A B C Year 2001 2002 2003 200
if(interactive()) 是否相当于 Python 中的“if __name__ == ”__main__“: main()”？

我希望 R 脚本有一个 main 函数可以在交互模式下执行但在获取文件时不应执行 main 函数已经有一个关于这个的问题了 https stackoverflow com questions 2968220 is there an r
为什么Python安装程序不断弹出？

每当我尝试运行 Python 文件时都会自动弹出此窗口虽然我可以关闭它但有时它会连续打开 7 10 个窗口这令人恼火谁能告诉我为什么会发生这种情况 None
Chrome 已关闭，并出现错误 ERROR:network_change_notifier_win.cc(141)] WSALookupServiceBegin 失败，原因为：0

我的笔记本电脑操作系统是 windows 10 我使用 selenium webdriver 和 Python 当我通过脚本打开chrome浏览器时加载网页后chrome就关闭了下面是我的python代码和错误 from seleniu
将 scipy 稀疏矩阵的几行采样到另一个中

如何对 scipy 稀疏矩阵的某些行进行采样并从这些采样的行中形成一个新的 scipy 稀疏矩阵例如如果我有一个 10 行的 scipy 稀疏矩阵 A 并且我想创建一个新的 scipy 稀疏矩阵 B 其中 A 的第 1 3 4 行该
从由空格分隔的单个输入整数列表创建二维数组

我正在解决一些问题geeksforgeeks我遇到了一个特定的问题其中在测试用例中提供了输入如下所示 2 2 denotes row column of the matrix 1 0 0 0 all the elements of th
pandas - 组合行的字符串

我有一个像这样的数据框 id text 1 DM HTN Enlarged prostate 2 hypertensive and on regular treatment 2 LBP 3 DM HTN Enlarged prostate
Python google云函数部署失败-Madmom pip包

我正在尝试使用 madmom python pip 包部署 Python3 7 Google Cloud Function 但是指定madmom 0 16 1requirements txt 中的内容导致部署失败当我从requiremen

随机推荐

Face API 超出速率限制

当我遇到人脸 API 超出速率限制除了使用之外时该怎么办Task Delay 1000 我有大约 50 条记录并在 2 秒内检测识别验证为了identifyasync 我将置信度阈值设置为 0 0f 返回的最大候选数为 50 我
如何在MySQL 8.0.11中重置root密码？

我实际上丢失了 root 密码我需要更改它我按照以下步骤操作步骤 1 停止 MySQL 服务器进程步骤 2 使用以下命令启动 MySQL mysqld 服务器守护进程 skip grant tables 选项这样就不会提示输入密
计算字符串列表中子字符串的出现次数

我知道计算列表项的简单出现次数很简单 gt gt gt 1 2 3 4 1 4 1 count 1 3 但我想知道如何做是每次列表条目的子字符串中出现字符串时进行计数例如我想看看有多少次foo出现在列表中data data the fo
Xcode 4 Interface Builder：如何设置文件所有者

我定义了 myController h 和 myController m 并继续使用向导创建 myController xib 但是我无法将 xib 文件中的控件连接到类接口通常当我将连接十字线放在文件所有者图标上时它会显示已声明为
为什么我的 MySQL 数据列中只保存了 64kB 数据？

我试图将一个很长的文本字符串插入到 MySQL Blob 列中但 MySQL 只保存了 64kB 的数据该字符串的长度为 75360 个字符我正在使用 PHP 连接mysql connect 有任何想法吗它是 Blob 还是 Tex
在 iOS 中使用触摸绘制水平或垂直线

我正在开发一个项目我希望如果用户触摸在水平方向移动则应绘制水平线如果用户触摸在垂直方向移动则应绘制垂直线请建议一些使用 Swift 的解决方案我在下面尝试过但这是自由的 override func touchesBegan t
PHP call_user_func 与仅调用函数

我确信对此有一个非常简单的解释这有什么区别 function barber type echo You wanted a type haircut no problem n call user func barber mushroom c
MVC ASP.NET 地图路由不适用于表单 GET 请求

In View using Html BeginForm PageName ControllerName FormMethod Get
如何在 C++ 中创建内存泄漏？

我只是想知道如何使用 C 创建系统内存泄漏我对此进行了一些谷歌搜索但没有得到太多结果我知道在 C 中执行此操作实际上不太可行因为它是托管代码但想知道是否有一种简单的方法可以用 C 执行此操作我只是觉得看看系统因代码编写不正确而受
Netbeans - 类没有 main 方法

我的程序只是一个简单的 System out println 但是netbeans找不到main方法 netbeans 6 7 1和WIN7有冲突吗有什么可能的错误吗当您手动移动主类位置时会发生这种情况因为 Netbeans 不会刷新
如何有条件地跳过 Cucumber 中的场景？

如何有条件地跳过场景例如我希望仅在满足某些条件时才继续某个场景但如果不存在我不希望将其注册为失败这是我遇到的一个问题我编写的测试是针对一个 UI 该 UI 具有不断变化的 BE 数据库我目前无法在其中包含静态数据这意味着有时
在 javascript 中查找经过的时间

我是 JavaScript 新手我正在尝试编写一段代码来计算从用户登录到当前时间所经过的时间这是我的代码 function markPresent window markDate new Date document ready func
/admin 处导入错误：没有名为 defaults 的模块

我正在将我的网站从 django 1 4 升级到 django 1 6 但它一直出现以下错误 admin 处的 ImportError 没有名为 defaults 的模块其他地方都说你应该这样做 from django conf urls
如何在IIS7.5上Response.Write？

我正在尝试写一个给客户的回复 response StatusCode int HttpStatusCode BadRequest response ClearContent response Write String Format CRLF
在delphi中的“自定义”浏览器中修改requestHeaders

我的 deplhi 应用程序 IE 中集成了一个浏览器我需要调用某个 Web 应用程序并且需要在标头中为来自应用程序浏览器的所有请求附加一个新变量例如 jquery 添加到 xhrobjHTTP X REQUESTED WITH范围
使用 jQuery 进行渐变填充？

我有一个 div 需要渐变背景然而 div 的大小是可变的这让我又回到了不能在 CSS 中做渐变的境地然而我很确定这在 jQuery 中是可能的我只是似乎找不到一个合适的例子有人可以指点我的方向吗 Thanks 如果有人需要
如何更新猫鼬嵌套数组文档[重复]

这个问题在这里已经有答案了我知道这个问题是重复的但我不知道为什么我被困住了 Question 我怎样才能编辑 requirement update 数组文档使用 find by id and requirement update id
带有条件 isset 的 If 语句和比较不能一起工作

我在制作时遇到问题if声明 code if detail variable exists and is equal to 1 code if detail variable doesn t exist or is not equal 1 由
如何向 dateadd sql 添加小时、分钟、秒？

我想要一个完整的约会所以今天是 7 7 2010 12 00 00 am 到 7 7 2010 11 59 59 pm 所以这应该是完整的 24 小时因为上午 12 00 00 就是 8 号所以我有这个 select DATEADD
Python Pandas - 根据组中值的存在来过滤组

我需要按一列对数据框进行分组然后过滤掉另一列中不包含特定值的所有组例如这是我的数据框 A B 1 False 1 True 2 False 2 False 3 True 3 False 4 False 我想按 A 列进行分组然后删除

Python Pandas - 根据组中值的存在来过滤组

Python Pandas - 根据组中值的存在来过滤组 的相关文章

随机推荐

热门标签

Python Pandas - 根据组中值的存在来过滤组的相关文章