Pandas：根据特定列的值计数选择行

2024-01-20

从 panda 数据框中选择所有行的最简单方法是什么，谁的 sym 在整个表中恰好出现两次？例如，在下表中，我想选择 ['b','e'] 中包含 sym 的所有行，因为这些符号的 value_counts 等于 2。

df=pd.DataFrame({'sym':['a', 'b', 'b', 'c', 'd','d','d','e','e'],'price':np.random.randn(9)})

                     price sym
    0              -0.0129   a
    1              -1.2940   b
    2               1.8423   b
    3              -0.7160   c
    4              -2.3216   d
    5              -0.0120   d
    6              -0.5914   d
    7               0.6280   e
    8               0.5361   e

df.sym.value_counts()
Out[237]: 
d    3
e    2
b    2
c    1
a    1

我想你可以使用groupby http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.groupby.html按列sym and filter http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.filter.html价值观与length == 2:

print df.groupby("sym").filter(lambda x: len(x) == 2)
      price sym
1  0.400157   b
2  0.978738   b
7 -0.151357   e
8 -0.103219   e

第二种溶液使用isin http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.isin.html with 布尔索引 http://pandas.pydata.org/pandas-docs/stable/indexing.html#boolean-indexing:

s = df.sym.value_counts()

print s[s == 2].index
Index([u'e', u'b'], dtype='object')

print df[df.sym.isin(s[s == 2].index)]
      price sym
1  0.400157   b
2  0.978738   b
7 -0.151357   e
8 -0.103219   e

最快的解决方案transform http://pandas.pydata.org/pandas-docs/stable/generated/pandas.core.groupby.GroupBy.transform.html and boolean indexing http://pandas.pydata.org/pandas-docs/stable/indexing.html#boolean-indexing:

print (df[df.groupby("sym")["sym"].transform('size') == 2])
    price sym
1 -1.2940   b
2  1.8423   b
7  0.6280   e
8  0.5361   e

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Pandas：根据特定列的值计数选择行的相关文章

Visual Studio Code：如何使用参数调试 Python 脚本

我正在使用 Visual Studio Code 来调试 Python 脚本下列的本指南 https code visualstudio com docs python debugging 我在中设置了参数launch json file
如何在python中确定过去的时区特定日期是否是夏令时？

有没有办法检查特定时区在我指定的日期是否处于夏令时 test dt datetime year 2015 month 2 day 1 pst pytz timezone America Los Angeles test dt pst loc
从 Python 将分层 JSON 数据写入 Excel xls？

我想将一些数据从 python 写入 xlsx 我目前将其存储为 JSON 但它从 Python 中输出什么并不重要单个文章的 JSON 如下所示 Word Count 50 Key Words Blah blah blah Foo Fr
将相同的 Patch 实例添加到 matplotlib 中的多个子图中

我正在尝试将补丁的相同实例添加到 matplotlib 中的多个轴这是最小的例子 import matplotlib pyplot as mpl plt import matplotlib patches as mpl patches f
监控培训课程如何运作？

我试图理解使用之间的区别tf Session and tf train MonitoredTrainingSession 以及我可能更喜欢其中之一似乎当我使用后者时我可以避免许多杂务例如初始化变量启动队列运行程序或设置文件编写器以
如何在python mechanize中设置cookie

向服务器发送请求后 br open http xxxx br select form nr 0 br form MESSAGE 1 2 3 4 5 br submit 我得到了响应标题其中包含 set cookie Set Cookie
检查列表是否已排序的 Pythonic 方法

有没有一种Python式的方法来检查列表是否已经排序ASC or DESC listtimestamps 1 2 3 5 6 7 就像是isttimestamps isSorted 返回True or False 我想输入一些消息的时间戳列
TypeError：“NoneType”对象不可下标[重复]

这个问题在这里已经有答案了错误 names curfetchone 0 TypeError NoneType object is not subscriptable 我尝试检查缩进但仍然有错误我读到如果数据库中没有文件名记录变量名
使用 Python 导入包含文本和数字数据的文件

I have a txt file which has text data and numerical data The first two rows of the file have essential information in te
如何在python中访问矩阵每个元素的相邻单元格？

这里如果两个单元共享边界则它们被认为是相邻的例如 A 5 6 4 2 1 3 7 9 8 这里索引 0 0 的相邻元素位于索引 0 1 和 1 0 处索引 1 1 的相邻元素位于索引 0 1 1 0 2 1 处和 1 2 假设你
在 Python 中将嵌套字典位置作为参数传递

如果我有一个嵌套字典我可以通过索引来获取键如下所示 gt gt gt d a b c gt gt gt d a b c 我可以将该索引作为函数参数传递吗 def get nested value d path a b return d
如何在自定义 django 命令中抽象出命令代码

我正在我的应用程序下编写自定义 django 命令management commands目录目前我在该目录中有 6 个不同的文件每个文件都有不同的命令来解决独特的需求然而有一些实用程序是它们所共有的抽象出这些公共代码的最佳方法是什
在 matplotlib 中将 3D 背景更改为黑色

我在将 3D 图表的背景更改为黑色时遇到问题这是我当前的代码当我将facecolor设置为黑色时它会将图表内部更改为灰色这不是我想要的 fig plt figure fig set size inches 10 10 ax plt
列表中的“u”是什么意思？

这是我第一次遇到这种情况刚刚打印了一个列表每个元素似乎都有一个u在它前面即 u hello u hi u hey 它是什么意思为什么列表的每个元素前面都会有这个由于我不知道这种情况有多常见如果您想了解我是如何遇到它的我会很乐意
python：xml.etree.ElementTree，删除“命名空间”

我喜欢 ElementTree 解析 xml 的方式特别是 Xpath 功能我有一个带有嵌套标签的应用程序的 xml 输出我想按名称访问此标签而不指定名称空间这可能吗例如 root findall molpro job 代替 ro
Matplotlib：检查空图

我有一个循环加载并绘制一些数据如下所示 import os import numpy as np import matplotlib pyplot as plt for filename in filenames plt figure i
具有行业级约束的 SciPy 投资组合优化

尝试在这里优化投资组合权重分配通过限制风险来最大化我的回报函数我可以毫无问题地通过简单的约束所有权重之和等于 1 找到产生我的回报函数的优化权重并做出另一个约束即我的总风险低于目标风险我的问题是如何为每个组添加行业权重界限我
如何通过 Selenium 内部的文本查找按钮（Python）？

我有以下三个按钮我不知道如何获取其中的文本例如异常值我试过browser find element by link text Outliers click 但出现无法找到元素错误我该怎么做 See find element by
如何从Python枚举类中获取所有值？

我正在使用 Enum4 库创建一个枚举类如下所示 class Color Enum RED 1 BLUE 2 我要打印 1 2 作为某处的列表我怎样才能实现这个目标您可以执行以下操作 e value for e in Color
使用 python/scipy 进行 voronoi 和 lloyd 松弛

如何使用 Qhull 确定哪些 voronoi 单元按索引是正确的由现有顶点组成我正在尝试使用 LLoyds 算法和 scipy spatial Voronoi 它是 Qhull 的包装器生成的输入来执行约束松弛就代码而言

随机推荐

用字符串填充表格视图

我已阅读 API 和示例但无法理解如何填充表格视图假设我有一个两列字符串数组 String 其中包含名称值对我现在只想创建一个表格视图它在两列中显示数据在第一列中显示原始数组中所有行的名称在第二列中显示值我尝试了什么什
MySQL远程连接【不正常】

我无法从外部访问 mysql 我认为这是 mysql 或防火墙的东西或 mysql 中的某些特权我已经尝试执行互联网上的步骤我将逐步介绍该过程以举例说明我正在做的事情并为其他遇到同样问题的人提供教程我在用着 ubuntu serv
pyinstaller可执行文件的差异更新（修改嵌入的PYZ-00.pyz）

我计划创建一个巨大的可执行目录并将其安装在某些设备上想象一下后来我发现我的 python 模块中有一个错误有没有办法只传输复制修改后的字节码并用新的字节码替换原始字节码我想这样做的原因是在我的上下文中带宽非常昂贵我想远程修
大型项目没有 PHP？为什么不？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我读过一些帖子人们指出没有建议没有讨论没有提供 PHP 不应该用于大型项目作为一名主要的 PHP 开发人员我问两个问题大型项目的
带有 pod 标签的 Prometheus kubelet 指标 [关闭]

Closed 这个问题是与编程或软件开发无关 help closed questions 目前不接受答案我想弄清楚如何使用 prometheus stack 将 pod 标签从 kubelet 指标获取到指标标签在我们的环境中我们需要
在 C 中调用函数时的序列点和未定义/未指定的行为

我试图确定我对 C 中序列点的理解只是想检查一些东西目前我认为 1 是未定义的而 2 只是未指定的因为在 2 中在评估参数后存在序列点g and h 所以我们不修改i序列点之间两次但是参数的求值顺序f仍然未指定我的理解正确吗
为什么我的 Azure 存储帐户上的队列域丢失？

我已使用以下设置在 Azure 上成功创建存储帐户部署资源管理器类型通用标准复制 ZRS 在 Azure 门户上我可以看到 Blob 服务如果单击它我可以在 blob 域下创建 blob 容器 https 帐户名称 blo
Javascript字典性能问题

现在我有以下 javascript 字典 var a a SVG343 1942 a UAL534 2153 右边的数字代表时间键是唯一的 ID 我想让 id 成为键因为它们是唯一的我的问题是给出一个时间找到对应的id 我要如何做到这
将外部域名连接到AWS S3网站

我想在 Amazon S3 上托管一个静态网站创建了相关的存储桶测试它们正常现在我已经在 EuroDNS 注册了一个域名 www gopropel io 我找不到如何将其连接到我的 AWS S3 存储桶我需要创建路由 53 托管区域
Flutter Firebase Messaging 无法创建服务 io.flutter.plugins.firebasemessaging.FlutterFirebaseMessagingService

我正在尝试在 Flutter 应用程序中使用 Firebase Messaging 我遵循包装上的所有说明在我的 pubspec yaml 中我有这些包 dependencies flutter sdk flutter firebase
当元素的父元素溢出时，使元素宽度拉伸以适合其子元素：auto;

在这个简化的示例中我有一个书柜书架上放着书籍书架是具有定义宽度的最外面的元素书架上的书应该从左到右排列没有包装书架应该拉伸其宽度以显示书架上的所有书籍所有书架的宽度必须相同即最宽书架的宽度 My HTML div class
保护 Raven 数据库的安全

我正在尝试将 RavenDB 的访问权限限制为只有一名用户更改设置以保护数据库后我仍然可以访问 RavenDB 管理工作室但我不确定为什么我将 RavenDB 作为 Windows 服务运行并且使用构建 573 这是我的 Rave
如何向 Skype 聊天室发出 Jenkins 构建状态警报？

我们公司使用 Skype 进行通信我希望能够在 Jenkins 构建失败以及恢复时时向 Skype 聊天室发送警报我怎样才能做到这一点我已经使用了Skype 公共 API http developer skype com acce
C++ 和 Java 之间的低延迟 IPC

对于以下情况实现 C Java IPC 的最佳方法是什么最近有人问类似的问题 https stackoverflow com questions 5900887 ipc between java and c applications 但
将非数组变量的地址传递给声明为“Type ptr[static 1]”的函数参数是否有效？

如上所述here https stackoverflow com questions 3430315 what is the purpose of static keyword in array parameter of function
ESLint 显示括号中的错误

我的 javascript 代码工作正常除了 ESLint 显示我有错误例如错误 myFunction 已定义但从未使用 no unused vars and 错误文档未定义 no undef 这只是一个问题因为我使用的是外部
如何设置单个单元格而不是事件的背景颜色？

我不想为圣诞节和复活节等创建事件而是希望能够为受影响的日期单元格着色甚至可能为每个事件提供灰色半透明文本在 FullCalendar 中有什么简单的方法可以做到这一点吗 EDIT 有人向我指出 fc state highlight 用
Mysql从管道导入

我试图弄清楚如何将输出通过管道传输到 mysqlimport 中但没有任何运气我有一个巨大的文件 250 GB 我想在处理它后通过管道传输到 mysqlimport 我不想创建中间文件表我正在想象这样的事情猫基因组 mpileup
C# 和 Visual Studio 2005 中的程序集之间的循环引用

我正在努力标准化所有应用程序的分层多层设计的单一方式我正在尝试将我的所有应用程序设为 5 层 Code 用户界面业务对象或映射器数据访问关系型数据库管理系统假设我正在开发一个具有用户登录注销功能的应用程序我正在 VS200
Pandas：根据特定列的值计数选择行

从 panda 数据框中选择所有行的最简单方法是什么谁的 sym 在整个表中恰好出现两次例如在下表中我想选择 b e 中包含 sym 的所有行因为这些符号的 value counts 等于 2 df pd DataFrame sy

Pandas：根据特定列的值计数选择行

Pandas：根据特定列的值计数选择行 的相关文章

随机推荐

热门标签

Pandas：根据特定列的值计数选择行的相关文章