如何删除重复项并保留 pandas 上的第一个值？

2024-02-12

我想删除重复项并保留第一个值。想要删除的重复项是 A = 'df' 。这是我的数据

A   B   C   D   E
qw  1   3   1   1
er  2   4   2   6
ew  4   8   44  4
df  34  34  34  34
df  2   5   2   2
df  3   3   7   3
df  4   4   7   4
we  2   5   5   2
we  4   4   4   4
df  34  9   34  34
df  3   3   9   3
we  4   7   4   4
qw  2   2   7   2

所以结果将是

A   B   C   D   E
qw  1   3   1   1
er  2   4   2   6
ew  4   8   44  4
**df**  34  34  34  34
we  2   5   5   2
we  4   4   4   4
**df**  34  9   34  34
we  4   7   4   4
qw  2   2   7   2

创建助手Series用于区分连续值A列，然后过滤boolean indexing http://pandas.pydata.org/pandas-docs/stable/indexing.html#boolean-indexing与倒立的(~)由以下创建的布尔掩码duplicated http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.duplicated.html与另一个掩码链接以获取比较值df:

s = df['A'].ne(df['A'].shift()).cumsum()
df = df[~((df['A'] == 'df') & (s.duplicated()))]
print (df)
     A   B   C   D   E
0   qw   1   3   1   1
1   er   2   4   2   6
2   ew   4   8  44   4
3   df  34  34  34  34
7   we   2   5   5   2
8   we   4   4   4   4
9   df  34   9  34  34
11  we   4   7   4   4
12  qw   2   2   7   2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

如何删除重复项并保留 pandas 上的第一个值？的相关文章

如何使用显式引用转储 YAML？

递归引用非常适合ruamel yaml or pyyaml ruamel yaml dump ruamel yaml load A A id001 id001 然而它显然不适用于普通引用 ruamel yaml dump ruamel
Tweepy StreamListener 到 CSV

我是 python 新手我正在尝试开发一个应用程序使用 Tweepy 和 Streaming API 从 Twitter 检索数据并将数据转换为 CSV 文件问题是此代码不会创建输出 CSV 文件也许是因为我应该将代码设置为在实现例
如何在 PyCharm 4.5.2 中使用 PyPy 作为标准/默认解释器？

如何在 PyCharm 4 5 2 中使用 PyPy 作为标准默认解释器一切都在 Ubunutu 14 10 下运行并且 pypy 已经安装您可以在项目的设置下进行配置这个官方文档直接涵盖了 https www jetbrains
查找模块中显式定义的函数 (python)

好的我知道您可以使用 dir 方法列出模块中的所有内容但是有什么方法可以仅查看该模块中定义的函数吗例如假设我的模块如下所示 from datetime import date datetime def test return Thi
当我在 Pandas 中使用 df.corr 时，我的一些列丢失了

这是我的代码 import numpy as np import pandas as pd import seaborn as sns import matplotlib pyplot as plt data pd read csv dea
在 macOS 中通过 Python 访问进程的压缩 RAM（顶部的 CMPRS）的方法？

我试图弄清楚如何从 Python 访问任何给定进程占用的实际 RAM 量我发现 psutil Process PID memory info rss 工作得很好直到操作系统决定开始压缩某些进程的 RAM 然后所有的 memory in
根据开始列和结束列扩展数据框（速度）

我有一个pandas DataFrame含有start and end列加上几个附加列我想将此数据框扩展为一个时间序列从start值并结束于end值但复制我的其他专栏到目前为止我想出了以下内容 import pandas as
更改 Altair 中的构面标题位置？

如何将方面标题在本例中为年份移动到每个图的上方默认值似乎位于图表的一侧这可以轻易改变吗 import altair as alt from vega datasets import data df data seattle weat
WindowsError：[错误 126] 使用 ctypes 加载操作系统时

python代码无法在Windows 7平台上运行 def libSO lib ctypes cdll LoadLibrary ConsoleApplication2 so lib cfoo2 1 3 当我尝试运行它时得到来自python
Python Pandas 根据另一列的总计从另一个数据帧中选择值

我下面有一个 DataFrame 但我需要根据取消和订单列从每个代码中选择行假设代码 xxx 的阶数为 6 1 5 1 阶数为 11 我需要一种算法可以选择满足总共 11 行的行阶数为 6 5 如果没有行匹配则选择最接近的 id 并
使用 scipy curve_fit 拟合噪声指数的建议？

我正在尝试拟合通常按以下方式建模的数据 def fit eq x a b c d e return a 1 np exp x b c np exp x d e x np arange 0 100 0 001 y fit eq x 1 1 1
在Python中计算内存碎片

我有一个长时间运行的进程不断分配和释放对象尽管正在释放对象但 RSS 内存使用量会随着时间的推移而增加如何计算发生了多少碎片一种可能性是计算 RSS sum of allocations 并将其作为指标即便如此我该如何计算分母
Python多处理错误“ForkAwareLocal”对象没有属性“连接”

下面是我的代码我面临着多处理问题我看到这个问题之前已经被问过我已经尝试过这些解决方案但它似乎不起作用有人可以帮我吗 from multiprocessing import Pool Manager Class X def init
Pandas style.bar 颜色基于条件？

如何渲染其中一列的 Pandas dfstyle bar color属性是根据某些条件计算的 Example df style bar subset before after color ff781c vmin 0 0 vmax 1 0 而
由于 json 字符串化 dict 键导致数据丢失

考虑下面的例子 gt gt gt import json gt gt gt d 0 potato 0 spud gt gt gt json dumps d 0 potato 0 spud gt gt gt json loads json d
检测 IDLE 的存在/如何判断 __file__ 是否未设置

我有一个脚本需要使用 file 所以我了解到 IDLE 没有设置这个有没有办法从我的脚本中检测到 IDLE 的存在 if file not in globals file is not set 如果你想做一些特别的事情 file 未设置
对数据帧的每 2 小时数据进行 Groupby

我有一个数据框 Time T201FN1ST2010 T201FN1VT2010 1791 2017 12 26 00 00 00 854 69 0 87 1792 2017 12 26 00 20 00 855 76 0 87 1793
如何使用 matplotlib 为圆柱体的每个单独面添加颜色

我正在尝试为圆柱体的每个面着色但是我不确定如何进行我尝试了以下方法 for i in range 10 col append for i in range 10 for j in range 20 col i append plt cm
在 Django shell 会话期间获取 SQL 查询计数

有没有办法打印 Django ORM 在 Django shell 会话期间执行的原始 SQL 查询的数量 Django 调试工具栏已经提供了此类信息例如 5 QUERIES in 5 83MS但如何从 shell 中获取它并不明显您可
如何为所有用户安装 Anaconda python？

Anaconda python 发行版 https store continuum io cshop anaconda 非常方便地部署科学计算环境 SCE 并根据需要切换python版本默认情况下安装会将 python 定位到 anac

随机推荐

快速将 Memset 设置为 UnsafeMutablePointer

我遇到了类型变量的挑战UnsafeMutablePointer
ActiveAdmin：如何保持用户密码不变？

我在 Rails 应用程序中使用 ActiveAdmin 作为管理后端基本上我有一个admin user and a user模型当我从管理员帐户创建新用户时我指定了电子邮件和密码这是可以的假设我想修改用户的电子邮件而不是密码
R：绘图未完全加载

我正在使用 R 编程语言我试图在这里遵循本教程 https plotly com r parallel coordinates plot https plotly com r parallel coordinates plot 我正在尝试
Ant + Vista 64：“无法找到tools.jar”（jre/jdk 冲突？）

我正在尝试在 vista 64 环境中使用 ant 来构建一些 docbook xml 文件但是我无法解决此错误消息有人有建议吗 C Users 罗伯特管理员 gt ant 无法找到tools jar 预计在 C Program Fi
在 WPF 中自定义上下文菜单

我这里有一个项目需要在 WPF 应用程序中自定义上下文菜单其中一个按钮将放置在所有菜单项的底部但是如果我通过 XAML 添加按钮它将显示为上下文菜单中集合中的另一个项目并且鼠标悬停突出显示将对其进行操作我希望将上下文菜单调整为
Foreach 语句无法对“object”类型的变量进行操作，因为“object”不包含“GetEnumerator”的公共定义

我试图弄清楚如何通过 API 访问对象中的值但运气不佳有一些文档但不多我可以访问一些信息但我要查找的信息存在于该软件正在使用的数据库的关键字字段中我可以打印出对象类型但不能打印出实际对象中的值这是我的代码 public cl
如何向 JTextArea 添加拼写检查？

我有一个小型 Java 应用程序它有一个 JTextArea 用户可以在其中输入文本我想向该组件添加拼写检查功能类似于 Microsoft Word 的方式即拼写错误的单词带有下划线当用户右键单击带下划线的单词时会显示带有更正的
如何在 zip 文件中找到“中央目录”的开头？

维基百科对 ZIP 文件格式有很好的描述 http en wikipedia org wiki ZIP file format 但中央目录结构让我感到困惑具体来说是这样的这种顺序允许一次创建 ZIP 文件但通常通过首先在最后读取中
如何在 Flutter 中发送或接收 xml 文件？

我可以使用 Flutter 发送和接收 JSON 字符串数据但我找不到任何如何使用 Flutter 发送和接收 xml 文件的信息我正在寻找很好的文档和基本的实践示例有什么帮助吗感谢 G nterZ chbauer 我设法在 Flu
从 QT5 中的 QPixmap 获取 HBITMAP (Windows)

现在 QPixmap toWinHBITMAP 已被弃用我找不到从 QPixmap 或 QImage 获取 HBITMAP 的方法谷歌搜索我发现有一个名为 qt pixmapToWinHBITMAP 的函数它似乎可以满足我的需要但
是否无法检查案例陈述条件中的列表项目？

我正在尝试检查 Oracle 10g 中 case 语句的条件部分中的项目列表是否包含特定数字我明白了ORA 00936 missing expression虽然错误我正在尝试做类似以下的事情 Select case some colu
Git包文件入口格式

My understanding of the Git pack file format is something like 其中表是32位宽前三个32位字是包文件头最后一行 32 位是条目的前 4 个字节据我了解条目的大小由带有
在堆表上，非聚集索引使用什么作为指向行的指针？

选择您的 SQL Server 版本如果版本之间发生了更改请注明如果您知道建一个表在 1 列或多列上添加非聚集索引如果我可以转储叶块我会找到什么作为指向表中包含数据的行的指针它使用行 ID 它基本上是数据库中行的物理地址位
在 pytorch 中绘制训练和验证损失图

我正在使用 pytorch 来训练我的 CNN 网络我想绘制训练和验证损失曲线以可视化模型性能如何绘制两条曲线我有下面的代码 create a function this my favorite choice def RMSELoss
PHP 中最快的 XML 解析器是什么？

对于某个项目我需要某种方法来解析 XML 并从中获取数据所以我想知道哪一个内置解析器是最快的另外如果解析器能够接受 XML 字符串作为输入那就太好了我有自己的线程安全处理文件的实现我不希望一些讨厌的非线程安全库让我的努力变得毫
Keras 未在整个数据集上进行训练

因此我一直在关注 Google 的官方张量流指南并尝试使用 Keras 构建一个简单的神经网络但在训练模型时它并没有使用整个数据集包含 60000 个条目而是仅使用 1875 个条目进行训练有什么可能的解决办法吗 import
Django 找不到我的模板

我在 Windows XP SP3 上运行 Python 2 6 1 和 Django 1 2 1 我正在使用 JetBrains PyCharm 1 0 创建和部署我的 Django 应用程序我对 Python 相对缺乏经验并且我开始
非 JSF 组件的条件呈现（普通 HTML 和模板文本）

我正在尝试有条件地渲染 tr 因此我不能使用 tr
如何获得linq中最高价和最低价商品的数量总和

我试图编写的实际查询比标题所示的要稍微棘手一些我有一个这样的订单列表 List
如何删除重复项并保留 pandas 上的第一个值？

我想删除重复项并保留第一个值想要删除的重复项是 A df 这是我的数据 A B C D E qw 1 3 1 1 er 2 4 2 6 ew 4 8 44 4 df 34 34 34 34 df 2 5 2 2 df 3 3 7 3 df

如何删除重复项并保留 pandas 上的第一个值？

如何删除重复项并保留 pandas 上的第一个值？ 的相关文章

随机推荐

热门标签

如何删除重复项并保留 pandas 上的第一个值？的相关文章