如何删除重复项并保留 pandas 上的第一个值?

2024-02-12

我想删除重复项并保留第一个值。想要删除的重复项是 A = 'df' 。这是我的数据

A   B   C   D   E
qw  1   3   1   1
er  2   4   2   6
ew  4   8   44  4
df  34  34  34  34
df  2   5   2   2
df  3   3   7   3
df  4   4   7   4
we  2   5   5   2
we  4   4   4   4
df  34  9   34  34
df  3   3   9   3
we  4   7   4   4
qw  2   2   7   2

所以结果将是

A   B   C   D   E
qw  1   3   1   1
er  2   4   2   6
ew  4   8   44  4
**df**  34  34  34  34
we  2   5   5   2
we  4   4   4   4
**df**  34  9   34  34
we  4   7   4   4
qw  2   2   7   2

创建助手Series用于区分连续值A列,然后过滤boolean indexing http://pandas.pydata.org/pandas-docs/stable/indexing.html#boolean-indexing与倒立的(~)由以下创建的布尔掩码duplicated http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.duplicated.html与另一个掩码链接以获取比较值df:

s = df['A'].ne(df['A'].shift()).cumsum()
df = df[~((df['A'] == 'df') & (s.duplicated()))]
print (df)
     A   B   C   D   E
0   qw   1   3   1   1
1   er   2   4   2   6
2   ew   4   8  44   4
3   df  34  34  34  34
7   we   2   5   5   2
8   we   4   4   4   4
9   df  34   9  34  34
11  we   4   7   4   4
12  qw   2   2   7   2
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何删除重复项并保留 pandas 上的第一个值? 的相关文章

随机推荐

  • 快速将 Memset 设置为 UnsafeMutablePointer

    我遇到了类型变量的挑战UnsafeMutablePointer
  • ActiveAdmin:如何保持用户密码不变?

    我在 Rails 应用程序中使用 ActiveAdmin 作为管理后端 基本上 我有一个admin user and a user模型 当我从管理员帐户创建新用户时 我指定了电子邮件和密码 这是可以的 假设我想修改用户的电子邮件而不是密码
  • R:绘图未完全加载

    我正在使用 R 编程语言 我试图在这里遵循本教程 https plotly com r parallel coordinates plot https plotly com r parallel coordinates plot 我正在尝试
  • Ant + Vista 64:“无法找到tools.jar”(jre/jdk 冲突?)

    我正在尝试在 vista 64 环境中使用 ant 来构建一些 docbook xml 文件 但是 我无法解决此错误消息 有人有建议吗 C Users 罗伯特管理员 gt ant 无法找到tools jar 预计在 C Program Fi
  • 在 WPF 中自定义上下文菜单

    我这里有一个项目 需要在 WPF 应用程序中自定义上下文菜单 其中一个按钮将放置在所有菜单项的底部 但是 如果我通过 XAML 添加按钮 它将显示为上下文菜单中集合中的另一个项目 并且鼠标悬停突出显示将对其进行操作 我希望将上下文菜单调整为
  • Foreach 语句无法对“object”类型的变量进行操作,因为“object”不包含“GetEnumerator”的公共定义

    我试图弄清楚如何通过 API 访问对象中的值 但运气不佳 有一些文档 但不多 我可以访问一些信息 但我要查找的信息存在于该软件正在使用的数据库的关键字字段中 我可以打印出对象类型 但不能打印出实际对象中的值 这是我的代码 public cl
  • 如何向 JTextArea 添加拼写检查?

    我有一个小型 Java 应用程序 它有一个 JTextArea 用户可以在其中输入文本 我想向该组件添加拼写检查功能 类似于 Microsoft Word 的方式 即拼写错误的单词带有下划线 当用户右键单击带下划线的单词时 会显示带有更正的
  • 如何在 zip 文件中找到“中央目录”的开头?

    维基百科对 ZIP 文件格式有很好的描述 http en wikipedia org wiki ZIP file format 但 中央目录 结构让我感到困惑 具体来说是这样的 这种顺序允许一次创建 ZIP 文件 但通常通过首先在最后读取中
  • 如何在 Flutter 中发送或接收 xml 文件?

    我可以使用 Flutter 发送和接收 JSON 字符串数据 但我找不到任何如何使用 Flutter 发送和接收 xml 文件的信息 我正在寻找很好的文档和基本的实践示例 有什么帮助吗 感谢 G nterZ chbauer 我设法在 Flu
  • 从 QT5 中的 QPixmap 获取 HBITMAP (Windows)

    现在 QPixmap toWinHBITMAP 已被弃用 我找不到从 QPixmap 或 QImage 获取 HBITMAP 的方法 谷歌搜索 我发现有一个名为 qt pixmapToWinHBITMAP 的函数 它似乎可以满足我的需要 但
  • 是否无法检查案例陈述条件中的列表项目?

    我正在尝试检查 Oracle 10g 中 case 语句的条件部分中的项目列表是否包含特定数字 我明白了ORA 00936 missing expression虽然错误 我正在尝试做类似以下的事情 Select case some colu
  • Git包文件入口格式

    My understanding of the Git pack file format is something like 其中表是32位宽 前三个32位字是包文件头 最后一行 32 位是条目的前 4 个字节 据我了解 条目的大小由带有
  • 在堆表上,非聚集索引使用什么作为指向行的指针?

    选择您的 SQL Server 版本 如果版本之间发生了更改 请注明 如果您知道 建一个表 在 1 列或多列上添加非聚集索引 如果我可以转储叶块 我会找到什么作为指向表中包含数据的行的指针 它使用行 ID 它基本上是数据库中行的物理地址 位
  • 在 pytorch 中绘制训练和验证损失图

    我正在使用 pytorch 来训练我的 CNN 网络 我想绘制训练和验证损失曲线以可视化模型性能 如何绘制两条曲线 我有下面的代码 create a function this my favorite choice def RMSELoss
  • PHP 中最快的 XML 解析器是什么?

    对于某个项目 我需要某种方法来解析 XML 并从中获取数据 所以我想知道哪一个内置解析器是最快的 另外 如果解析器能够接受 XML 字符串作为输入 那就太好了 我有自己的线程安全处理文件的实现 我不希望一些讨厌的非线程安全库让我的努力变得毫
  • Keras 未在整个数据集上进行训练

    因此 我一直在关注 Google 的官方张量流指南 并尝试使用 Keras 构建一个简单的神经网络 但在训练模型时 它并没有使用整个数据集 包含 60000 个条目 而是仅使用 1875 个条目进行训练 有什么可能的解决办法吗 import
  • Django 找不到我的模板

    我在 Windows XP SP3 上运行 Python 2 6 1 和 Django 1 2 1 我正在使用 JetBrains PyCharm 1 0 创建和部署我的 Django 应用程序 我对 Python 相对缺乏经验 并且我开始
  • 非 JSF 组件的条件呈现(普通 HTML 和模板文本)

    我正在尝试有条件地渲染 tr 因此我不能使用 tr
  • 如何获得linq中最高价和最低价商品的数量总和

    我试图编写的实际查询比标题所示的要稍微棘手一些 我有一个这样的订单列表 List
  • 如何删除重复项并保留 pandas 上的第一个值?

    我想删除重复项并保留第一个值 想要删除的重复项是 A df 这是我的数据 A B C D E qw 1 3 1 1 er 2 4 2 6 ew 4 8 44 4 df 34 34 34 34 df 2 5 2 2 df 3 3 7 3 df