可以根据 nunique 值删除数据框中的行吗?

2023-12-08

我想忽略该职业的唯一名称少于 2 个的行:

name        value      occupation
   a           23      mechanic
   a           24      mechanic
   b           30      mechanic
   c           40      mechanic
   c           41      mechanic
   d           30      doctor
   d           20      doctor
   e           70      plumber
   e           71      plumber
   f           30      plumber
   g           50      tailor

I did:

df.groupby('ocuupation')['name'].nunique()
>>>>>>
occupation
mechanic   3
doctor     1
plumber    2
tailor     1
Name: name, dtype: int64

是否可以使用类似的东西df = df.drop(df[<some boolean condition>].index)?

期望的输出:

name        value      occupation
   a           23      mechanic
   a           24      mechanic
   b           30      mechanic
   c           40      mechanic
   c           41      mechanic
   e           70      plumber
   e           71      plumber
   f           30      plumber

Use GroupBy.transform with Series.ge获得等于或大于的值2:

df = df[df.groupby('occupation')['name'].transform('nunique').ge(2)]
print (df)
  name  value occupation
0    a     23   mechanic
1    a     24   mechanic
2    b     30   mechanic
3    c     40   mechanic
4    c     41   mechanic
7    e     70    plumber
8    e     71    plumber
9    f     30    plumber

您的解决方案是系列中索引的过滤值与Series.isin:

s = df.groupby('occupation')['name'].nunique()

df = df[df['occupation'].isin(s[s.ge(2)].index)]
print (df)
  name  value occupation
0    a     23   mechanic
1    a     24   mechanic
2    b     30   mechanic
3    c     40   mechanic
4    c     41   mechanic
7    e     70    plumber
8    e     71    plumber
9    f     30    plumber
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

可以根据 nunique 值删除数据框中的行吗? 的相关文章

随机推荐

  • 如何将python变量传递给html变量?

    我需要从 python 中的文本文件读取 url 链接作为变量 并在 html 中使用它 文本文件 file txt 仅包含一行 http 188 xxx xxx xx 8878 这一行应该保存在变量 link 中 然后我应该在html中使
  • 解决 Azure YAML Pipeline 多个变量组中变量名称重叠的问题

    我们正在努力将经典 Azure Pipelines 转换为 YAML Pipelines 不清楚的一件事是如何确保两个具有相同名称但不同含义的变量的不同变量组不会互相踩踏 例如 如果我有变量组vg1 and vg2 每个变量都有名为secr
  • 从 EF Core 加载时计算 NotMapped 属性

    我们确实有一个实体类定义如下 Table Users Schema Mstr Audited public class User public virtual string FamilyName get set public virtual
  • 最大宽度与最小宽度

    我正在阅读的大多数关于使用媒体查询的教程都演示了如何使用min width 但我很少看到人们使用max width 这是人们使用的某种设计趋势或模式吗 min width over max width 例如 我正在设计一个从移动设备开始一直
  • 使用 boost 几何体调整几何对象模型的其他问题

    我想将 boost geometry 算法应用于以下不可变的 2D 模型 分别由点 多边形 开放或封闭 和多边形域类 具有任意数量的孔 类组成 如下所示 include
  • 如何给客户一个matlab项目?

    如果一家公司从事 matlab 项目 那么他们如何向客户提供该项目 我的意思是他们将哪个文件发送给客户 因为他们无法向客户移交整个代码和数据 这取决于很多事情 例如您为客户构建的产品的性质 您与他们的关系和合同协议 以及他们将来是否需要修改
  • PySpark java.io.IOException:方案没有文件系统:https

    我正在使用本地窗口并尝试加载XML在 python 上使用以下代码的文件 我遇到了这个错误 有谁知道如何解决它 这是代码 df1 sqlContext read format xml options rowTag IRS990EZ load
  • 如何避免警告“使用集合获取指定的firstResult/maxResults;在内存中应用!”当使用休眠时?

    我在服务器日志中收到警告 通过集合获取指定的firstResult maxResults 在内存中应用 然而一切工作正常 但我不想要这个警告 我的代码是 public employee find int id return employee
  • 扩展记录何时引入?

    在 Delphi 7 中 记录只不过是分组到一个位置的数据集合 在过去的几个版本中 您已经能够向它们添加公共和私有成员 方法 属性和构造函数 将它们更像对象一样对待 这个扩展语法是在哪个版本中引入的 编辑 如果有人想知道我为什么问 我正在尝
  • 在ggplot2中循环数据帧

    我想使用来自多个不同数据帧的 ggplot 绘制一系列绘图 我计划使用一个列表并迭代该列表 如下所示 libraries lt objects make a list of the dataframes we want to graph f
  • Laravel 应用程序未在 xampp 或实时服务器上运行,但在 php artisan 服务上运行良好

    我的 laravel 应用程序无法在 xampp 或实时服务器上运行 但在 PHP artisanserve 提供的链接上运行良好 每当我在 xampp 上运行这个应用程序时 它都会返回 404 错误 我还有其他 Laravel 应用程序也
  • 如何连接sql server表

    我在连接两张桌子时遇到一些麻烦 这是我的两张桌子的样子 Table 1 Customer ID CustomerName Add 1000 John Smith 1001 Mike Coles 1002 Sam Carter Table 2
  • 获取 MySQL 中特定值的 Json 键

    我刚刚安装了 MySQL 5 7 27 我想使用一些 Json 字段 所以我创建了一些记录 例如字段中的这个值 Intitule name Intitule de la formation stats false is array fals
  • 如何从视图调用codeigniter控制器函数

    如何从视图调用codeigniter控制器函数 当我在控制器中调用该函数时 得到一个 404 页面 您可以通过以下方式从视图调用控制器函数 控制器 public function read object controller this th
  • div 内包含很长的文本

    好的 我在 div 内包含文本时遇到问题 当它被空格分解时 它会移动到下一行 但如果有 1 行很长的文本 它不会移动到下一行 有人可以帮我解决这个问题吗 你可以尝试这个CSS word wrap break word 或包含元素上的 thi
  • 在 HTML 视频上加载字幕时出现安全错误

    所以我在 HTML5 视频的字幕上遇到了一些意外的行为 我将我的视频 字幕文件存储在 Google Cloud Storage 上 并且我有一个网络界面来观看电影 我的服务器为电影和字幕文件生成签名 URL 电影播放正常 并且我可以使用 U
  • 从字母数字字符串中检索字母字符

    我怎样才能分开AB2468123 with Excel VBA 我尝试了以下一些方法 myStr AB2468123 split myStr 1 OR 2 OR 3 9 我只想得到字母 字母 Thanks 只从输入字符串中检索字母怎么样 F
  • 将字符日期和时间(以毫秒为单位)转换为 R 中的数字

    我有以下时间戳向量 Timestamp lt c 30 09 2016 11 45 00 000 01 10 2016 06 19 57 860 01 10 2016 06 20 46 393 时间戳是包含其他度数和权重列的表的一部分 不幸
  • 创建半透明面板/控件。有没有万无一失的方法呢?

    我正在尝试创建一个源自的半透明控件System Windows Forms Panel 编辑 基本上我想要实现的是这样的 我浏览了大量的网络文章以及SO问题 并提出了这个 class SeeThroughPanel Panel public
  • 可以根据 nunique 值删除数据框中的行吗?

    我想忽略该职业的唯一名称少于 2 个的行 name value occupation a 23 mechanic a 24 mechanic b 30 mechanic c 40 mechanic c 41 mechanic d 30 do