从 Pandas 数据框中删除重复的行，其中只有某些列具有相同的值

2024-01-12

我有一个 pandas 数据框，如下所示：

我希望在特定列中共享相同值的行仅保留 1 行。在上面的例子中我指的是列A and B。换句话说，如果列的值A and B在数据框中出现多次，只应保留一行（哪一行并不重要）。

FWIW：所谓重复行的最大数量（即其中列A and B相同）是 2。

结果应该是这样的：

Use drop_duplicates http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.drop_duplicates.html带参数subset，仅保留最后重复的行添加keep='last':

df1 = df.drop_duplicates(subset=['A','B'])
#same as
#df1 = df.drop_duplicates(subset=['A','B'], keep='first')
print (df1)
   A  B  C
0  1  2  x
2  3  4  z
3  3  5  x

df2 = df.drop_duplicates(subset=['A','B'], keep='last')
print (df2)
   A  B  C
1  1  2  y
2  3  4  z
3  3  5  x

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

duplicates

从 Pandas 数据框中删除重复的行，其中只有某些列具有相同的值的相关文章

Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
如何迭代按值排序的 Python 字典？

我有一本字典比如 a 6 b 1 c 2 我想迭代一下by value 不是通过键换句话说 b 1 c 2 a 6 最直接的方法是什么 sorted dictionary items key lambda x x 1 对于那些讨厌 la
Python逻辑运算符优先级[重复]

这个问题在这里已经有答案了哪个运算符优先4 gt 5 or 3 lt 4 and 9 gt 8 这会被评估为真还是假我知道该声明3 gt 4 or 2 lt 3 and 9 gt 10 显然应该评估为 false 但我不太确定 pyth
如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
对图像块进行多重处理

我有一个函数必须循环遍历图像的各个像素并计算一些几何形状此函数需要很长时间才能运行在 24 兆像素图像上大约需要 5 小时但似乎应该很容易在多个内核上并行运行然而我一生都找不到一个有据可查解释充分的例子来使用 Multiproc
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
使用鼻子获取设置中当前测试的名称

我目前正在使用鼻子编写一些功能测试我正在测试的库操作目录结构为了获得可重现的结果我存储了一个测试目录结构的模板并在执行测试之前创建该模板的副本我在测试中执行此操作 setup功能这确保了我在测试开始时始终具有明确定义的状态现在
如何从Python中的字符串中提取变量名称和值

我有一根绳子 data var1 id 12345 name John White python中有没有办法将var1提取为python变量更具体地说我对字典变量感兴趣这样我就可以获得变量的值 id和name python 这是由提供
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
按元组分隔符拆分列表

我有清单 print L I WW am XX newbie YY ZZ You WW are XX cool YY ZZ 我想用分隔符将列表拆分为子列表 ZZ print new L I WW am XX newbie YY ZZ You
首先对列表中最长的项目进行排序

我正在使用 lambda 来修改排序的行为 sorted list key lambda item item lower len item 对包含元素的列表进行排序A1 A2 A3 A B1 B2 B3 B 结果是A A1 A2 A3 B
Seaborn Pairplot 图例不显示颜色

我一直在学习如何在Python中使用seaborn和pairplot 这里的一切似乎都工作正常但由于某种原因图例不会显示相关的颜色我无法找到解决方案因此如果有人有任何建议请告诉我 x sns pairplot stats2 hue
mac osx 10.8 上的初学者 python

我正在学习编程并且一直在使用 Ruby 和 ROR 但我觉得我更喜欢 Python 语言来学习编程虽然我看到了 Ruby 和 Rails 的优点但我觉得我需要一种更容易学习编程概念的语言因此是 Python 但是我似乎找不到适用于
使用yield 进行字典理解

作为一个人为的例子 myset set a b c d mydict item yield join item s for item in myset and list mydict gives as cs bs ds a None b N
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
您可以将操作直接应用于map/reduce/filter 中的参数吗？

map and filter通常可以与列表理解互换但是reduce并不那么容易被交换map and filter 此外在某些情况下我仍然更喜欢函数语法但是当您需要对参数本身进行操作时我发现自己正在经历语法体操最终必须编写整个函数

随机推荐

将本地流发送到多个远程对等点

如何将本地视频流发送到多个远程对等点我需要实例化一个吗PeerConnection每个远程对等点或者也可以一样PeerConnection同时用于所有远程对等点根据用户dom on irc w3 org 上的 webrtc http
我在 React Native 中使用什么本地数据库？

我是本地反应新手我需要一个本地数据库工具列表这些工具将满足要遵循的描述中的最低标准如果这是一个 PHP MySQL 应用程序我会构建 3 个数据库表 t food 500 rows food id primary key food
无法在 Fabric 中使用新组织创建通道，出现错误：尝试包含不在联盟中的成员

这是我需要按步骤执行的操作创建具有 2 个组织的交换矩阵网络 Org1 和 Org2 在它们之间创建一个通道 publicchannel 现在使用本教程中的步骤通过 Fabric 添加 Org3 https hyperledger fab
在 SwiftUI 中手动设置亮/暗模式并保存用户选择

我找到了一个解决方案可以在此处找到的另一个线程中的 swiftui 应用程序中手动设置亮暗模式https stackoverflow com a 58476468 11698443 https stackoverflow com a 5
在 UITableViewCell 中如何将删除确认模式恢复到正常编辑模式？

我在某些单元格的常规单元格删除确认之上有一个自定义确认警报对话框它有点对这些单元格进行双重确认这是在用户进入编辑模式之后而不是通过滑动因此如果用户在我的自定义确认对话框中单击确定进行确认它应该执行实际的删除操作效果很好因
Android Studio 和 PhoneGap，Android 模块不受 gradle 支持

不久前我使用过 Eclipse 和 Phonegap 并成功部署了一些 Android 应用程序所以现在我正在尝试在 Android Studio 中启动并运行新的 Phonegap Cordova 应用程序但到目前为止没有任何运气
如何删除Hive表中的重复记录？

我正在尝试了解如何从 Hive 表中删除重复记录我的 Hive 表 dynpart 其中包含以下列 Id 名称技术 Id Name Technology 1 Abcd Hadoop 2 Efgh Java 3 Ijkl MainFram
如何创建一个接收其他函数作为参数的函数（没有已知参数）

之前我问过如何创建一个接收函数作为参数的函数在C语言中我得到答案链接到问题 https stackoverflow com a 52788832 7757135但这个解决方案是基于参数函数的参数我是说 int functionToPas
Python-Pandas 按列值的升序减去列值

有一个数据框mortgage data 其中列名称为mortgage amount 和month 按升序排列 mortgage amount paid 1000 抵押数据 name mortgage amount month mark 40
Array.Count() 比 List.Count() 慢得多

当使用扩展方法时IEnumerable
如何删除 Visual Studio Marketplace 发布者？

如何删除 Visual Studio Marketplace 发布者查看我的帐户https marketplace visualstudio com manage publishers https marketplace visualst
与（闪亮的）服务器断开连接：导致 Plotly R 热图较大

我正在开发一个相当复杂的闪亮应用程序在私人闪亮服务器上运行只有包含大型绘图热图 50 70Mb 的页面无法在线运行但这些页面在我的本地计算机上运行良好我收到的是通常的消息 Disconnected from the server R
设置工具栏时出现 NullPointerException

我有以下 XML 布局
如何在不丢失当前页面的情况下重绘数据表

假设我在数据表的第三页删除一行数据表并重新绘制数据表它又回到第一页但我想进入第三页这是我的代码一旦我从数据表中删除该行它就会出现在第一页我正在使用 jQuery v1 11 2 var oTable alluserlist
TCL/Expect - exec - 如何使用参数执行程序

我正在尝试使用 TCL 命令exec in tclsh这是我的结果 set show me dir ls ls exec show me dir VboxSharedFolder set show me dir ls la ls la ex
ASP.NET 如何检查文件类型的类型而不考虑扩展名

如果有人将任何文件 excel 除外的扩展名重命名为 xls 和 xlsx 请不要问我为什么我需要检查其有效性如果这仍然是有效的 excel 文件我正在使用 mime类型和它不工作我错过了什么吗 const string exce
如何注销修复会话？

我正在使用quickfixj 我有一条自定义消息例如 EndTrade 当我收到该消息时我想结束修复会话吗我怎样才能做到这一点我还没有找到任何方法可以做到这一点它不允许我使用new Session logout 我得到了我的问题的
从 Pandas DataFrame 创建 Spark DataFrame

我正在尝试从简单的 Pandas DataFrame 构建 Spark DataFrame 这是我遵循的步骤 import pandas as pd pandas df pd DataFrame Letters X Y Z spark df
chrome 扩展在新选项卡中打开链接 - 没有错误，但单击时不执行任何操作

我正在尝试创建一个非常简单的 chrome 扩展以便在单击时在新选项卡中打开硬编码链接但我没有任何运气添加扩展程序后图标出现但当我单击它时没有任何反应有什么建议么清单 json name Drive Button versio
从 Pandas 数据框中删除重复的行，其中只有某些列具有相同的值

我有一个 pandas 数据框如下所示 A B C 1 2 x 1 2 y 3 4 z 3 5 x 我希望在特定列中共享相同值的行仅保留 1 行在上面的例子中我指的是列A and B 换句话说如果列的值A and B在数据框中出现多次

从 Pandas 数据框中删除重复的行，其中只有某些列具有相同的值

从 Pandas 数据框中删除重复的行，其中只有某些列具有相同的值 的相关文章

随机推荐

热门标签

从 Pandas 数据框中删除重复的行，其中只有某些列具有相同的值的相关文章