Pandas GroupBy - 仅显示具有多个唯一特征值的组

2024-02-09

我有一个数据框df_things看起来像这样，我想在训练之前预测分类的质量

A    B     C      CLASS
-----------------------
al1  bal1  cal1   Ship
al1  bal1  cal1   Ship
al1  bal2  cal2   Ship
al2  bal2  cal2   Cow
al3  bal3  cal3   Car
al1  bal2  cal3   Car
al3  bal3  cal3   Car

我想按类对行进行分组，以便了解特征的分布。我这样做（例如，在“B”栏），

df_B = df_things.groupby('CLASS').B.value_counts()

这给了我结果

CLASS  B 
-------------
ship   bal1  2 
       bal2  1
cow    bal2  2
car    bal2  1
       bal3  2

我想要的是仅可视化具有多个值的组，使其看起来像这样：

CLASS  B 
-------------
ship   bal1  2 
       bal2  1
car    bal2  1
       bal3  2

我有点卡住了，有什么想法吗？

您可以使用groupby过滤具有nunique数超过1。

v = df_things.groupby('CLASS').B.value_counts()
v[v.groupby(level=0).transform('nunique').gt(1)]

CLASS  B   
Car    bal3    2
       bal2    1
Ship   bal1    2
       bal2    1
Name: B, dtype: int64

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Compare

unique

pandasgroupby

Pandas GroupBy - 仅显示具有多个唯一特征值的组的相关文章

API网关+Lambda+Python：处理异常

我正在非代理模式下从 API Gateway 调用基于 Python 的 AWS Lambda 方法我应该如何正确处理异常以便使用部分异常设置适当的 HTTP 状态代码以及 JSON 正文作为示例我有以下处理程序 def my ha
如何创建毫秒粒度的 Python 时间戳？

我需要一个自纪元以来的毫秒 ms 时间戳这应该不难我确信我只是缺少一些方法datetime或类似的东西实际上微秒 s 粒度也很好我只需要亚 1 10 秒的计时例子我有一个每 750 毫秒发生一次的事件假设它检查灯是否打开或关闭
使用DockerOperator时如何同时使用xcom_push=True和auto_remove=True？

Problem 跑步时DockerOperator with xcom push True xcom all True and auto remove True 任务会引发错误就好像容器在读取其内容之前被删除一样STDOUT Exampl
在 python 中查找价格动量的有效方法：对列的最后 n 个条目求平均值

我正在定义价格动量是给定股票过去动量的平均值n days 反过来动量是一种分类如果当天的收盘价高于前一天则每天标记为 1 如果当天的收盘价低于前一天则标记为 1 我的库存变化百分比如下 df close in percent np
导入 scipy.stats 时，出现“ImportError: DLL load failed: 找不到指定的过程”

我无法导入 scipy stats 并收到以下错误但不知何故 import scipy as sp 仍然可以正常工作其他库如numpy pandas都可以毫无问题地导入我尝试在 Anaconda 中重新安装 scipy 1 2 1 降
Python 排列（包括子字符串）

我遇到过这个帖子如何在Python中生成列表的所有排列 https stackoverflow com questions 104420 how to generate all permutations of a list in pyth
Tkinter：通过多处理启动进程会创建不需要的新窗口

我计划围绕数值模拟编写一个小型 GUI 这就是我现在使用 Tkinter 的原因模拟应在单独的进程中从 GUI 启动为了玩一下我定义了一个函数 random process 来生成成对的 randn 数字这应该是一个真正的模拟过程
如何避免在matplotlib中调用latex（输出到pgf）

我使用 matplotlib 及其 pgf 后端来生成包含在 LaTeX 投影仪文档中的绘图当我使用未定义的乳胶命令时我遇到了麻烦但对于我的应用程序我不需要 matplotlib 来使用 Latex 生成标签或注释我只想要正确的
如何在Python中获取套接字的外部IP？

当我打电话时socket getsockname 在套接字对象上它返回我的机器的内部 IP 和端口的元组但是我想找回我的外部IP 最便宜最有效的方式是什么如果没有外部服务器的配合这是不可能的因为您和另一台计算机之间可能存在任意
如何在 PyTorch 中对子集使用不同的数据增强

如何针对不同的情况使用不同的数据增强转换 Subset在 PyTorch 中吗例如 train test torch utils data random split dataset 80000 2000 train and test将具
Pandas 使用什么规则来生成视图和副本？

我对 Pandas 在决定数据帧中的选择是原始数据帧的副本或原始数据帧的视图时使用的规则感到困惑例如如果我有 df pd DataFrame np random randn 8 8 columns list ABCDEFGH index
Django admin.py 未知命令：'collectstatic'

我已经从 django 1 2 7 升级到 django 1 5 1我正在使用 python 2 6 6当我尝试跑步时python manage py collectstatic i get 未知命令 collectstatic 从我的设置
Python：如何对数组 X 进行排序，但对 Y 进行相同的相对排序？

例如 X 5 6 2 3 1 Y 7 2 3 4 6 我对X进行排序 X 1 2 3 5 6 但我希望对 Y 应用相同的相对排序以便数字保持与以前相同的相对位置 Y 6 3 4 7 2 我希望这是有道理的通常你会做一个zip sort
出于安全目的，您是否有理由不执行自己的算法来打乱 ID？

我计划实现我自己的非常简单的哈希公式为具有多个用户的应用程序添加一层安全性我目前的计划如下用户创建一个帐户此时后端会生成一个 ID ID 通过公式运行假设 ID 57 8926 36 7 或同样随机的东西然后我将新的用户
在Python中通过sys.stdout写入unicode字符串

暂时假设一个人无法使用print 从而享受自动编码检测的好处所以这给我们留下了sys stdout 然而 sys stdout太蠢了不做任何合理的编码 http bugs python org issue4947 现在人们阅读 Pytho
Spark (Python) 中的 Kolmogorov Smirnov 测试不起作用？

我正在 Python Spark ml 中进行正态性测试看到了我的结果think是一个错误这是设置我有一个标准化的数据集范围 1 到 1 当我做直方图时我可以清楚地看到数据不正常 gt gt gt prices norm hist
通过过滤对 Pyspark Dataframe 进行分组

我有一个数据框如下 cust id req req met 1 r1 1 1 r2 0 1 r2 1 2 r1 1 3 r1 1 3 r2 1 4 r1 0 5 r1 1 5 r2 0 5 r1 1 我必须观察客户看看他们有多少要求看看
如何在Python中显示坐标网格线的变换？

假设我有常规的笛卡尔坐标系 x y 并且我考虑一个矩形网格区域 D 分成小方块我想看看域 D 如何在 Python 中的坐标变换 T x y gt u x y v x y 下映射我正在寻找这样的东西 See here https mat
Pandas：合并多个数据框并控制列名称？

我想将九个 Pandas 数据帧合并到一个数据帧中对两列进行联接控制列名称这可能吗我有九个数据集它们都有以下列 org name items spend 我想将它们加入到具有以下列的单个数据框中 org name items df
捕获 SQLAlchemy 异常

我可以使用什么捕获 SQLAlechmy 异常的上层异常 gt gt gt from sqlalchemy import exc gt gt gt dir exc ArgumentError CircularDependencyError

随机推荐

在 ASP.NET 中启用分块传输编码

我有一个位于 IIS7 上的 ASP NET 3 5 网站我正在使用动态压缩想看看是否可以启用分块编码 IIS 或 Web 配置上是否有某些设置可以启用它根据我的经验调用 Response Flush 会将 Transfer Enc
我对 kotlin 中的泛型有疑问

我收到一个错误像这样 Error 1 平台声明冲突以下声明具有相同的 JVM 签名 getData Ljava lang Object fun 我在typeErasure2中定义 fun getData 我在 typeErasure2
Linux，为什么我有组权限却不能写？

我想在我所属的员工组拥有的目录中创建一个文件为什么我不能这样做 bmccann bmccann htpc ls l usr local lib R total 4 drwxrwsr x 2 root staff 4096 2010 07
RuntimeError：不允许数据库访问，请使用“django_db”标记或“db”或“transactional_db”固定装置来启用它

我正在尝试运行 pytest 并收到此错误 RuntimeError Database access not allowed use the django db mark or the db or transactional db fixt
如何覆盖 django 管理站点中的删除确认页面？

在我的 django 1 4 项目中我需要覆盖管理站点中的删除确认页面并执行一些额外的任务模型我找到了通用的DeleteView 但没有找到有关如何使用它的任何好的帮助要覆盖管理员默认确认页面请定义您自己的admin delete
YouTube API V3 中的 YouTube.Channels.List 在 Android 中仅返回一个频道

我正在使用 YouTube API 创建一个应用程序在这里我想列出与电子邮件 ID 相关的所有频道因此我编写了以下代码这段代码的问题是它只返回一个通道默认通道但我想要所有通道的列表这是代码 YouTube youTube ne
谓词“contracting/1”是否会恢复已删除的不一致值？

这个问题是在另一个问题之后提出的我之前发过帖子 https stackoverflow com q 36260440 2936460关于 Prolog 中的自定义标签是否contracting 1谓词当在自定义标签谓词中对变量进行赋值之
在 omnetpp 中找不到类“simpleModule”

我正在 omnet 中编写自己的简单模块在 omnet IDE 中我创建了三个简单的模块之后我使用这些模块创建了一个网络它正在成功构建但是每当我尝试模拟它时它都会显示网络期间模块 cModule NetworkTopology
CLR 集成中的套接字通信

套接字通信在 CLR 集成中表现良好吗例如我在 CLR Integration 中创建了一个 PROC 它从表中获取所有数据并且只想将数据发送到 TCP 服务器命令 CREATE ASSEMBLY TcpClr FROM G Tcp
如何向打字稿函数添加可选回调？

我可以进行 javascript ajax 调用如下所示 getJSON http localhost 62178 document filename c test dave docx function data console log
IE 不清除后续浮动

我试图让两个 div 浮动到页面的两侧文本在它们之间流动第二个左对齐 div 的顶部应与第一个右对齐 div 的底部齐平下面的代码在 FF Chrome Opera 等中运行良好但在 IE 中无法正确清除两个 div 都出现在
使用 jasmine.createSpyObj 实用程序构建 SpyObj 时声明 getter 属性？

假设我有一堂课 class MyRealClass get propOne return stuffFromTheServer 测试的时候我想实现这个功能 const mockClass get propOne return someStu
按后退按钮时出现“找不到类 android.transition.Transition”异常

我有一项活动一次托管一个片段并在两个片段之间交换片段 A 使用按钮启动片段 B 片段 B 使用按钮或后退按钮启动片段 A 使用自定义按钮从片段 A 到 B 以及从 B 到 A 时一切正常问题是当我使用后退按钮从片段 B 转到 A 时
SQL 过滤掉不太具体的行

我的表数据看起来像 Col1 Col2 Col3 1 2 NULL 1 2 3 1 NULL NULL 1 5 NULL 2 NULL NULL 我想编写一个查询以便只获得最具体的条目 IE 在上面的示例中 row1 比 row3 更具体
针对不同线条的多个 HoverTools（散景）

我在散景图中有多条线并且我希望 HoverTool 显示每条线的值但使用之前的 stackoverflow 答案中的方法不起作用 https stackoverflow com a 27549243 3087409 https stac
工作组之间的 OpenCL 同步

是否可以同步 OpenCL 工作组例如我有 100 个工作组每个工作组只有一个项目不要问我为什么这是一个例子我需要对每个工作项设置障碍以确保所有工作组都会在这 100 个工作组中的每个工作项达到此障碍点后继续不你不能您可
postgres - 具有递归

我期望以下内容返回所有元组将层次结构中的每个父级解析到顶部但它只返回最低级别其 ID 在查询中指定如何返回给定 level id 的整个树 create table level level id int level name tex
编辑 jQuery 数据表信息

我在用Jquery数据表 https datatables net 展示我的桌子我有一列记录为活动或非活动现在我想在显示显示 72 个条目中的 1 到 10 之后立即显示具有活动和非活动值的列数 My table like li
更多 Passport.js 问题 - 表单提交挂起

我正在设置我认为可能最简单的身份验证站点在登录屏幕上加载用户在表单中输入凭据提交时我使用 Passport JS 和 Sequelize 来检查凭据大多数内容都是从各种教程或 Passport 网站本身复制的无论我做什么更改或尝
Pandas GroupBy - 仅显示具有多个唯一特征值的组

我有一个数据框df things看起来像这样我想在训练之前预测分类的质量 A B C CLASS al1 bal1 cal1 Ship al1 bal1 cal1 Ship al1 bal2 cal2 Ship al2 bal2 cal2

Pandas GroupBy - 仅显示具有多个唯一特征值的组

Pandas GroupBy - 仅显示具有多个唯一特征值的组 的相关文章

随机推荐

热门标签

Pandas GroupBy - 仅显示具有多个唯一特征值的组的相关文章