基于列合并数据框，仅保留第一个匹配项

2023-12-28

我有 2 个如下所示的数据框。

df_1    
Index   Fruit
1       Apple
2       Banana
3       Peach

df_2    
Fruit   Taste
Apple   Tasty
Banana  Tasty
Banana  Rotten
Peach   Rotten
Peach   Tasty
Peach   Tasty

我想基于合并两个数据框Fruit但只保留第一次出现的Apple, Banana, and Peach在第二个数据框中。最终结果应该是：

df_output       
Index   Fruit   Taste
1   Apple   Tasty
2   Banana  Tasty
3   Peach   Rotten

Where Fruit, Index, and Taste是列标题。我尝试过类似的东西df1.merge(df2,how='left',on='Fruit但它根据长度创建了额外的行df_2

Thanks.

Use drop_duplicates http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.drop_duplicates.html对于第一行：

df = df_1.merge(df_2.drop_duplicates('Fruit'),how='left',on='Fruit')
print (df)
   Index   Fruit   Taste
0      1   Apple   Tasty
1      2  Banana   Tasty
2      3   Peach  Rotten

如果只想更快地添加一列，请使用map http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.map.html:

s = df_2.drop_duplicates('Fruit').set_index('Fruit')['Taste']
df_1['Taste'] = df_1['Fruit'].map(s)
print (df_1)
   Index   Fruit   Taste
0      1   Apple   Tasty
1      2  Banana   Tasty
2      3   Peach  Rotten

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

基于列合并数据框，仅保留第一个匹配项的相关文章

Virtualenv 在 OS X Yosemite 上失败并出现 OSError

我最近更新到 OSX Yosemite 现在无法使用virtualenv pip 每当我执行 virtualenv env 它抛出一个 OSError Command Users administrator ux env bin pytho
多处理中的动态池大小？

有没有办法动态调整multiprocessing Pool尺寸我正在编写一个简单的服务器进程它会产生工作人员来处理新任务使用multiprocessing Process对于这种情况可能更适合因为工作人员的数量不应该是固定的但我需
如何返回 cost, grad 作为 scipy 的 fmin_cg 函数的元组

我怎样才能使 scipy 的fmin cg使用一个返回的函数cost and gradient作为元组问题是有f对于成本和fprime对于梯度我可能必须执行两次操作非常昂贵 grad and cost被计算此外在它们之间共享变量可
Mypy 无法从文字列表推断项目的类型

我有一个变量x和一个文字列表例如 0 1 2 我想转换x这些文字之一如果x在列表中我将其退回否则我返回一个后备值 from typing import Literal Set Foo Literal 0 1 2 foos Set F
在Python中从大文件中搜索单词列表

我是新蟒蛇我有一个单词列表和一个非常大的文件我想删除文件中包含单词列表中的单词的行单词列表按排序给出并且可以在初始化期间输入我正在努力寻找解决这个问题的最佳方法我现在正在进行线性搜索这花费了太多时间有什么建议么您可以使用i
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
Arcpy 模数在 Pycharm 中不显示

如何将 Arcpy 集成到 Pycharm 中我尝试通过导入模块但它没有显示我确实知道该模块仅适用于 2 x python arcpy 在 PyPi Python 包索引上不可用因此无法通过 pip 安装要使用 arcpy 您需要
Python Anaconda：如何测试更新的库是否与我现有的代码兼容？

我在 Windows 7 机器上使用 Python 2 7 Anaconda 安装进行数据分析和科学计算当新的库发布时例如新版本的 pandas patsy 等您建议我如何测试新版本与现有代码的兼容性是否可以在同一台机器上安装两个
运行 Python 单元测试，以便成功时不打印任何内容，失败时仅打印 AssertionError()

我有一个标准单元测试格式的测试模块 class my test unittest TestCase def test 1 self tests def test 2 self tests etc 我的公司有一个专有的测试工具它将作为命令行
根据其他单元格值更改多个单元格值

我想更改包含的单元格moving to movingToOpenor movingToClose基于下一个单元格中给出的状态有时循环会被中断并且不会从open to close or close to open 这是我当前的数据框 Dat
可以使用哪些技术来衡量 pandas/numpy 解决方案的性能

Question 如何简洁全面地衡量下面各个功能的性能 Example 考虑数据框df df pd DataFrame Group list QLCKPXNLNTIXAWYMWACA Value 29 52 71 51 45 76 68 6
如何指示 urwid 列表框的项目数多于当前显示的项目数？

有没有办法向用户显示 urwid 列表框在显示部分上方下方有其他项目我正在考虑类似滚动条的东西它可以显示条目的数量或者列表框顶部底部的单独栏如果这个行为无法实现有哪些方法可以实现这个通知在我的研究过程中我发现这个问题 ht
Python bug - 或者我的愚蠢 - 扫描字符串文字时 EOL

我看不出以下两行之间有显着差异然而第一个解析而后者则不解析 In 5 n Axis of Awesome In 6 n Axis of Awesome File
如何在亚马逊 EC2 上调试 python 网站？

我是网络开发新手这可能是一个愚蠢的问题但我找不到可以帮助我的确切答案或教程我工作的公司的网站用 python django 构建托管在亚马逊 EC2 上我想知道从哪里开始调试这个生产站点并检查存储在那里的日志和数据库我有帐户信
AWS Lambda 不读取环境变量

我正在编写一个 python 脚本来查询 Qualys API 中的漏洞元数据我在 AWS 中将其作为 lambda 函数执行我已经在控制台中设置了环境变量但是当我执行函数时出现以下错误 module initialization
如何将带有参数的Python装饰器实现为类？

我正在尝试实现一个接受一些参数的装饰器通常带有参数的装饰器被实现为双重嵌套闭包如下所示 def mydecorator param1 param2 do something with params def wrapper fn def
minizinc python 安装

我通过 anaconda 提示符在 python 上安装了 minizinc 就像其他软件包一样 pip install minizinc 该软件包表示已成功安装我可以导入该模块但是我正在遵循基本示例https minizinc py
rpy2 无法加载外部库

希望有人能帮忙解决这个问题 R版本 2 14 1rpy2版本 2 2 5蟒蛇版本 2 7 3 一直在尝试在 python 脚本中使用 rpy2 加载 R venneuler 包该包以 rJava 作为依赖项 venneuler 和 rJa
如何使用 python 定位和读取 Data Matrix 代码

我正在尝试读取微管底部的数据矩阵条形码我试过libdmtx http libdmtx sourceforge net 它有 python 绑定当矩阵的点是方形时工作得相当好但当矩阵的点是圆形时工作得更糟如下所示另一个复杂问题是在某
定义在文本小部件中双击时选择哪些字符

在 Windows 上双击文本小部件中的单词也将选择连接的标点符号有什么方法可以定义您想要选择的角色吗 tcl wordchars该变量的值是一个正则表达式可以设置它来控制什么被视为单词字符例如通过双击 Tk 中的文本来选择单

随机推荐

MathJax 方程换行

嘿如果包含的元素具有固定大小有谁知道让 MathJax 自动换行方程的好方法 MathJax v2 0 现在包括针对长显示方程的自动可选换行它是由linebreaks的部分HTML CSS您的配置块请参阅MathJax 文档 h
在 TypeScript 中解构对象时重命名剩余属性变量

EDIT 我在github上开了一个与此相关的问题 https github com Microsoft TypeScript issues 21265 https github com Microsoft TypeScript issue
PostgreSQL 从 9.1 升级到 9.4 后性能下降

将 Postgres 9 1 升级到 9 4 后我的性能变得非常慢下面是两个查询的示例它们的运行速度明显慢得多注意我意识到这些查询可能可以被重写以更有效地工作但是我主要担心的是升级到较新版本的 Postgres 后它们的运行速
差异化包装

升级应用程序时 Test ServiceFabricApplicationPackage命令会对版本号未更改的每个代码包抛出错误这表示内容已更改即使代码未更改我知道有一个功能可以创建部分包但我无法使用它我的问题是如何检查代码包内
如何在其他工作表的应用程序脚本中请求或获得谷歌电子表格访问权限？

我正在为我的自定义函数编写 A 电子表格的应用程序脚本并尝试使用从那里获取 B 电子表格中的值openUrl 然而我得到了ERROR当我使用自定义函数时在电子表格中在谷歌文档中它说如果您的自定义函数抛出错误消息 You do no
使用powershell在其他域上查找“网络用户”？

我想做的是 net user user1 DOMAIN 但是我想为计算机未加入但可以访问的域执行此操作用户分布在 DOMAIN1 和 DOMAIN2 中我运行它的计算机已加入 DOMAIN1 但会在 DOMAIN2 上查找用户这可以
在 mongodb 的嵌套数组中插入数据[重复]

这个问题在这里已经有答案了可能的重复 MongoDB 更新嵌套数组中的字段 https stackoverflow com questions 9611833 mongodb updating fields in nested array
Safari 中的垂直居中

我在 Safari 中使用 margin auto 0 时遇到垂直居中问题在嵌套在带有 display inline flex 的 div 内的 div 上它在 Firefox Chrome Opera 中工作得很好但在 Safari
Travis CI 失败，因为无法接受许可证约束布局

在我写这个问题之前我已经搜索过同样的问题他们确实有导出许可证因为仍然使用 alpha 版本的约束布局但现在android已经发布了约束布局的稳定版本我尝试了很多设置但仍然失败我最新的 travis yml language an
Django - 显示图像字段

我刚刚开始使用 Django 还没有找到很多关于如何显示的信息imageField 所以我做了这个模型 py class Car models Model name models CharField max length 255 pric
如何判断闭合路径是否包含给定点？

在 Android 中我有一个 Path 对象我碰巧知道它定义了一条闭合路径并且我需要弄清楚给定点是否包含在路径中我所希望的是类似的东西路径 contains int x int y 但这似乎不存在我寻找这个的具体原因是因为我在
如何使用 signalr 将 json 对象发送到 .net 服务器

我正在开发一个 Angular 应用程序我必须使用 netcore 服务器和 signalR 将数据从角度形式发送到外部服务器我可以使用信号集线器在 Angular 客户端和控制器之间建立连接但我很困惑如何将 json 对象从客户端发
在 bash 中选择不同的可执行文件

当我想跑步的时候make为了生成一些可执行文件它总是使用 Sunmake位于在 usr local bin make而不是 GNU make 可以在以下位置找到 usr sfw bin gmake 我如何告诉操作系统使用 GNU mak
TkInter：了解解除绑定功能

TkInter 是否unbind http effbot org tkinterbook widget htm Tkinter Widget unbind method函数阻止应用它的小部件将更多事件绑定到小部件澄清假设我在程序的早期将
Python 中以下代码有什么问题？

我试图对一个字段实施约束但它不会导致约束验证而是允许保存记录而不显示任何约束消息 def check contact number self cr uid ids context None for rec in self browse
在 AOSP Android 6.0 上更新 WebView

我正在开发基于 AOSP Android 6 0 Marshmallow 的设备我想将标准 Android webview 更新到最新版本以使用最新的 JavaScript 为此我更换了external chromium webview
使 JButton 在 JTable 内可单击

这是我想做的事情的屏幕截图发生的情况是 JButton 显示正确但当我单击它时没有任何反应经过一番搜索我发现Object由返回table getValueAt 是一个字符串而不是 JButton 这是代码 tblResult new
是否有“纯粹适用的任一”的标准名称或实现？

我经常发现我所谓的纯粹应用性的用处Either i e Either与Applicative只要我们不实现一个实例就可用Monad实例也是如此 newtype AEither e a AEither unAEither Either e
使用可变批量大小加载数据？

我目前正在研究基于补丁的超分辨率大多数论文将图像分割成更小的补丁然后使用这些补丁作为模型的输入我能够使用自定义数据加载器创建补丁代码如下 import torch utils data as data from torchvisio
基于列合并数据框，仅保留第一个匹配项

我有 2 个如下所示的数据框 df 1 Index Fruit 1 Apple 2 Banana 3 Peach df 2 Fruit Taste Apple Tasty Banana Tasty Banana Rotten Peach R

基于列合并数据框，仅保留第一个匹配项

基于列合并数据框，仅保留第一个匹配项 的相关文章

随机推荐

热门标签

基于列合并数据框，仅保留第一个匹配项的相关文章