Pandas：如何循环并删除列具有单个条目的行

2024-01-24

所以我有一个包含一定数量列的 pandas 数据框（下面是一个简单数据框的代码，但真正的数据框有超过 100 列）：

X = pd.DataFrame([["A","Z"],["A","Z"],["B","Z"]],columns=["COL1","COL2"])

我想要做的是遍历每一列并删除仅发生单个实例的行。例如，在第 1 列中，我们只有一个“B”实例，因此我想在此基础上删除该行。

但是，我想遍历数据帧的每一列，并继续删除有此类实例的行。

当我指定名称时，以下代码适用：

X = X[X.groupby('COL1').COL1.transform(len) > 1]

但是，我不确定如何循环使用此代码。显然我可以手动输入每个列名称，但我想更正确地执行此操作。显然下面的方法是行不通的：

for column in X:
    X[X.groupby(column).column.transform(len)>1]

    COL1    COL2
0   A   Z
1   A   Z
2   B   Y

抱歉，如果有人问这个问题。我发现了很多类似的问题，但没有找到我们不手动指定列的问题。

先感谢您！如果您需要更多信息，请告诉我

您可以像这样使用重复：

X = pd.DataFrame([["A","Z"],["A","Z"],["B","Z"], ["A","Y"]],columns=["COL1","COL2"])

for column in X:
    X = X[X[column].duplicated(keep=False)]

Output:

  COL1 COL2
0    A    Z
1    A    Z

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Pandas：如何循环并删除列具有单个条目的行的相关文章

如何在 Jupyter Notebook 中运行 Python 异步代码？

我有一些 asyncio 代码在 Python 解释器 CPython 3 6 2 中运行良好我现在想在具有 IPython 内核的 Jupyter 笔记本中运行它我可以运行它 import asyncio asyncio get ev
在Python中如何获取字典的部分视图？

是否有可能获得部分视图dict在Python中类似于pandasdf tail df head 说你有很长一段时间dict 而您只想检查某些元素开头结尾等 dict 就像是 dict head 3 To see the first 3
无故运行测试时 PyCharm 抛出“AttributeError: 'module' object has no attribute”

因此我有一个 Django REST Framework 项目有一天它无法在 PyCharm 中运行测试从命令行我可以使用它们来运行它们paver or the manage py直接地曾经有一段时间当我们没有在文件顶部导入类的超
“一旦获取切片就无法更新查询”。最佳实践？

由于我的项目的性质我发现自己不断地从查询集中取出切片如下所示 Thread objects filter board requested board id order by updatedate 10 但这给我带来了实际对我选择的元素进
PyTorch 给出 cuda 运行时错误

我对我的代码做了一些小小的修改以便它不使用 DataParallel and DistributedDataParallel 代码如下 import argparse import os import shutil import time
将二维数组放入 Pandas 系列中

我有一个 2D Numpy 数组我想将其放入 pandas 系列而不是 DataFrame 中 gt gt gt import pandas as pd gt gt gt import numpy as np gt gt gt a np
如何在Python中高效地添加稀疏矩阵

我想知道如何在Python中有效地添加稀疏矩阵我有一个程序可以将大任务分解为子任务并将它们分配到多个 CPU 上每个子任务都会产生一个结果一个 scipy 稀疏矩阵格式为 lil matrix 稀疏矩阵尺寸为 100000x50
Python中列表中两个连续元素的平均值

我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
如何使用正则表达式在 pandas 数据框中选择一行以及包含特定子字符串的行后面的固定行数

Problem 我有一个 pandas 数据框我试图从中提取特定行我感兴趣的行是包含日期的行以及紧随日期行之后的行重要的是我想将信息从日期后面的行移动到包含日期的行中的新列通过这样做我将在同一行上获得一个人的信息需要明确
ValueError：不支持连续[重复]

这个问题在这里已经有答案了我正在使用 GridSearchCV 进行线性回归的交叉验证不是分类器也不是逻辑回归我还使用 StandardScaler 对 X 进行标准化我的数据框有 17 个特征 X 和 5 个目标 y 观察约11
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
Python Pandas：如何对组中的所有项目进行分组并为其分配 id？

我有 df domain orgid csyunshu com 108299 dshu com 108299 bbbdshu com 108299 cwakwakmrg com 121303 ckonkatsunet com 121303
Pandas 堆积条形图中元素的排序

我正在尝试绘制有关某个地区 5 个地区的家庭在特定行业赚取的收入比例的信息我使用 groupby 按地区对数据框中的信息进行排序 df df orig groupby District Portion of income value co
Django - 提交具有同一字段多个输入的表单

预警我对 Django 以及一般的 Web 开发非常陌生我使用 Django 托管一个基于 Web 的 UI 该 UI 将从简短的调查中获取用户输入通过我用 Python 开发的一些分析来提供输入然后在 UI 中呈现这些分析的可视
Flask 应用程序的测试覆盖率不起作用

您好想在终端的 Flask 应用程序中测试删除路由我可以看到测试已经过去它说 test user delete test app LayoutTestCase ok 但是当我打开封面时它仍然是红色的这意味着没有覆盖它请有人向我
带有 RotatingFileHandler 的 Python 3 记录器超出 maxBytes 限制

我使用以下代码来限制日志文件的大小最小示例 import logging from logging handlers import RotatingFileHandler Set up logfile and message loggin
Python问题：打开和关闭文件返回语法错误

大家好我发现了这个有用的 python 脚本它允许我从网站获取一些天气数据我将创建一个文件和其中的数据集有些东西不起作用它返回此错误 File
bs4 `next_sibling` VS `find_next_sibling`

我在使用时遇到困难next sibling 并且类似地与next element 如果用作属性我不会得到任何返回但如果用作find next sibling or find next 然后就可以了来自doc https www cru
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4
python 日志记录会刷新每个日志吗？

当我使用标准模块将日志写入文件时logging 每个日志会分别刷新到磁盘吗例如下面的代码会将日志刷新 10 次吗 logging basicConfig level logging DEBUG filename debug log fo

随机推荐

通知号码和冰淇淋三明治？

http developer android com reference android app Notification html number http developer android com reference android a
我如何知道接口何时直接在忽略继承接口的类型中实现？

出现的问题是当我有一个实现接口的类并扩展一个实现接口的类时 class Some SomeBase ISome class SomeBase ISomeBase interface ISome interface ISomeBase 由于
VS Code 中的 Hugo 模板格式

VS Code 中的自动格式通过删除缩进使我的代码无法读取我不知道如何仅针对车把关闭此功能 Input range if if
是什么原因导致错误“java.security.InvalidKeyException：参数丢失”？ [复制]

这个问题在这里已经有答案了我正在尝试使用 AES 加密和解密字符串但出现错误我不知道如何解决这是代码 public class EncryptionTest public static void main String args S
Lawnchair .nuke() 在填满我的存储配额后无法工作

我在用着草坪椅 http westcoastlogic com lawnchair 使用我的 Web 客户端 Firefox 13 0 的 dom 适配器存储持久数据并已达到存储配额 Console log 说 Persistent st
用于图像哈希的 Flutter 计算函数

hii 我正在尝试实现计算功能我正在尝试使用 image picker 插件通过相机单击图像然后我试图获取图像文件的哈希摘要由于它是一个非常密集的操作我尝试使用计算功能但无法这样做这就是我到目前为止所做的 final File p
Htaccess缓存问题

这让我彻底疯了我一直在这个新安装的服务器上使用 URL 重写来自定义 URL 但似乎我在 htaccess 中编写的任何 URL 重写规则都将永远被考虑在内 Example RewriteRule dashboard calendar c
Node.js 应用程序在 Heroku 上不断崩溃，并给出错误 Boot timeout

我正在开发一个示例 node js 应用程序它在本地运行良好 node index js 但是当我将其推送到 Heroku 实例时它崩溃并出现以下错误 2017 10 23T06 08 07 000000 00 00 app api
sqlalchemy 中的点类型？

我在 Postgres 中发现了关于 Point 类型的信息 http www postgresql org docs current interactive datatype geometric html http www postgre
如何序列化邮件消息？

当尝试使用 los 格式化程序序列化 Gmail 消息时我收到以下信息错误 Sys WebForms PageRequestManagerServerErrorException 序列化 System Net Mail MailMess
如果有多个iis服务器，如何实现SignalR？

使用 SignalR 时是否支持 iis 节点集群或者我需要一些第三方消息总线吗还没有但他们正在努力计划发布 0 4 版本准备就绪后更多信息可能会在 wiki 中发布 SignalR 和 Webfarms http github
在 Tab 单击事件上禁用 TabView 动画？

我怎样才能禁用TabView动画时Tab in TabBar点击我添加了 physics NeverScrollableScrollPhysics 对于 TabView 但不适用于 TabBar 我在用着DefaultTabControl
toLocaleDateString Javascript日期格式问题[重复]

这个问题在这里已经有答案了我有一个脚本我想将日期格式化为短日期格式即 2013 年 7 月 3 日或 2013 年 7 月 3 日第一个日期格式的呈现方式与 Chrome 中的呈现方式类似但其他浏览器则不然它显示日期月份名称和
在多个程序集中定义的 System.Tuple

我刚刚在 Windows 8 中安装了 VS 11 当我获得使用 VS 2010 构建的最新解决方案然后构建它时我收到此错误在 VS 11 中预定义类型 System Tuple 在多个程序集中定义在全局别名中使用 c Prog
非全屏时保存 WebBrowser 控件截图

我得到了 WebBrowser 控件中包含的网页的屏幕截图正如所描述的那样here http www dreamincode net code snippet3389 htm and here https stackoverflow co
MySQL 错误：“列计数与第 1 行的值计数不匹配” - 初学者帮助

基本上使用的是 php 和 MySQL 我是初学者我想做的是将用户注册到我的数据库中因此将表单输入存储到我的 users tb 中当我尝试将值插入表单时出现此错误列计数与第 1 行的值计数不匹配我认为这是因为我没有插入 user
Java：是否可以通过 Object(In|Out)putStreams 在阻塞 SocketChannel 上进行并发读取和写入？

我创建了一个ObjectInputSteam and ObjectOutputStream在阻塞上SocketChannel我正在尝试同时读写我的代码是这样的 socketChannel SocketChannel open destNo
Android：无法从 json 检索数据

我从上一个活动到此活动获取某个事件的一个 id 并将该 id 传递到当前活动中的 url 以获取该 url 中存在的城市名称我的代码是 String s getIntent getStringExtra ar try HttpPost h
仅当“beforeunload”函数返回 true 时才运行 Javascript 代码

当用户离开页面时我使用 JQuery 捕获卸载事件这工作得很好但我只有在用户发生以下情况时才需要保存数据really想离开这是我的第二十二条军规如果我过早保存代码并且用户不想离开那么我就破坏了支持代码的 Web 服务的状态因此
Pandas：如何循环并删除列具有单个条目的行

所以我有一个包含一定数量列的 pandas 数据框下面是一个简单数据框的代码但真正的数据框有超过 100 列 X pd DataFrame A Z A Z B Z columns COL1 COL2 我想要做的是遍历每一列并删除仅发生单

Pandas：如何循环并删除列具有单个条目的行

Pandas：如何循环并删除列具有单个条目的行 的相关文章

随机推荐

热门标签

Pandas：如何循环并删除列具有单个条目的行的相关文章