使用 df.merge 填充 df 中的新列给出奇怪的匹配

2024-04-07

我刚刚发现导致此问题的 2 个问题，请参阅下面的解决方案

我想基于另一个数据帧在我的数据帧（df）中创建一个新列。基本上 df2 包含我想要插入 df 的更新信息。为了复制我的真实情况（> 1m 行），我将用简单的列填充两个随机 df 。

我使用 pandas.merge() 来执行此操作，但这给了我奇怪的结果。

这是一个典型的例子。让我们随机创建 df 并使用简单的关系创建 df2 ：“New Type”=“Type”+ 1。我创建这个简单的关系，以便我们可以轻松检查输出。当然，在我的实际应用中，我没有这么简单的关系。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(0,100,size=(100, 1)),columns = ["Type"])
df.head()

   Type
0    45
1     3
2    89
3     6
4    39

df1 = pd.DataFrame({"Type":range(1,100)})
df1["New Type"] = df1["Type"] + 1
print(df1.head())

 Type  New Type
0     1         2
1     2         3
2     3         4
3     4         5
4     5         6

现在假设我想根据 df1 上的“新类型”更新 df“类型”

df["Type2"] = df.merge(df1,on="Type")["New Type"]
print(df.head())

我得到这个奇怪的输出，我们清楚地看到它不起作用

  Type  Type2
0    45   46.0
1     3    4.0
2    89    4.0
3     6    4.0
4    39   90.0

我认为输出应该是这样的

  Type  Type2
0    45   46.0
1     3    4.0
2    89   90.0
3     6    7.0
4    39   40.0

只有第一行是正确匹配的。你知道我错过了什么吗？

Solution

1.我需要与 how="left" 进行合并，否则默认选择是“内部”，生成另一个维度与 df 不同的表。

另外，我需要使用 sort=false 作为合并函数的属性。否则，合并结果在应用于 df 之前先进行排序。

您可以使用的一种方法是map, set_index, and squeeze:

df['Type2'] = df['Type'].map(df1.set_index('Type').squeeze())

Output:

   Type  Type2
0    22   23.0
1    56   57.0
2    63   64.0
3    33   34.0
4    25   26.0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

MERGE

使用 df.merge 填充 df 中的新列给出奇怪的匹配的相关文章

Flask 失败并显示“错误：导入‘X’时，引发了 ImportError”，但不显示错误。如何找到错误的根源？

当使用以下命令启动 Flask 应用程序时 flask run 我收到错误 Error While importing wsgi an ImportError was raised Usage flask OPTIONS COMMAND A
使用pathlib获取主目录

翻看新的pathlib在 Python 3 4 中我注意到没有任何简单的方法来获取用户的主目录我能想到的获取用户主目录的唯一方法是使用旧的os path像这样的库 import pathlib from os import path p
为什么 re.findall 在查找字符串中的三元组项时不具体。 Python

所以我有四行代码 seq ATGGAAGTTGGATGAAAGTGGAGGTAAAGAGAAGACGTTTGA OR 0 re findall r ATG 9 TAA TAG TGA seq 首先让我解释一下我正在尝试做什么如果这令人困惑
设置高亮大括号的 vim 颜色主题

如何更改突出显示大括号的 vim 配色方案我希望实际编辑 vim 主题文件以使更改永久生效问候克雷格匹配括号的自动高亮颜色称为MatchParen 您可以通过执行以下操作来更改 vimrc 中的颜色 highlight MatchP
查找与另一列 Pandas 中的唯一值关联的列中的值的交集

如果我有一个像这样的数据框非常小的例子 col1 col2 0 a 1 1 a 2 2 b 1 3 b 2 4 b 4 5 c 1 6 c 2 7 c 3 我想要所有的交集col2当价值观与其独特性相关时col1值因此在这种情况下交集
类型错误：此 COM 对象无法自动执行 makepy 过程 - 请为此对象手动运行 makepy

这是什么错误回溯错误 C Users DELL PycharmProjects MyNew venv Scripts python exe C Users DELL PycharmProjects MyNew agaaaaain py T
如何用正则表达式替换多个匹配/组？

通常我们会编写以下内容来替换一场比赛 namesRegex re compile r is life re I replaced namesRegex sub r butter There is no life in the void pr
使用 Python 绘制 USGS 水文数据甘特图？

我编译了一个数据帧其中包含几个不同流计的 USGS 流数据现在我想创建一个类似的甘特图this https stackoverflow com questions 31820578 how to plot stacked event d
更改 Matplotlib 投影轴的背景颜色

我正在尝试使用 Cartopy 创建一个图形该图形需要在未投影的轴上绘制投影轴这是一个尽可能简单的代码版本它将轴上的内容替换为背景颜色 import matplotlib pyplot as plt import cartopy cr
Python 属性和 Swig

我正在尝试使用 swig 为一些 C 代码创建 python 绑定我似乎遇到了一个问题试图从我拥有的一些访问器函数创建 python 属性方法如下 class Player public void entity Entity enti
Python：在字典中查找具有唯一值的键？

我收到一个字典作为输入并且想要返回一个键列表其中字典值在该字典的范围内是唯一的我将用一个例子来澄清假设我的输入是字典 a 构造如下 a dict a cat 1 a fish 1 a dog 2 lt unique a bat 3
要在子集中显示的非数字条目的维恩图

我有以下数据框 SET1 SET2 SET3 par1 par2 par1 par2 par3 par2 par3 par4 par5 我想制作一个维恩图其中所有这些 parX 元素都显示在各自的子集中即作为标签而不仅仅是重叠元素的数
Seaborn 中没有线性拟合的散点图

我想知道是否有办法关闭seaborn中的线性拟合lmplot或者是否有一个等效函数可以生成散点图当然我也可以使用 matplotlib 但是我发现 seaborn 中的语法和美学非常吸引人例如我想绘制以下情节 import sea
为什么 Collections.counter 这么慢？

我正在尝试解决罗莎琳德的基本问题即计算给定序列中的核苷酸并在列表中返回结果对于那些不熟悉生物信息学的人来说它只是计算字符串中 4 个不同字符 A C G T 出现的次数我期望collections Counter是最快的方法首先
是否可以在Python中将日+月（不是年）与当前日+月进行比较？

我正在获取 5 月 10 日格式的数据我试图弄清楚它是今年还是明年该日期仅一年因此 5 月 10 日表示 2015 年 5 月 10 日而 5 月 20 日表示 2014 年 5 月 20 日为此我想将字符串转换为日期格式并进
无法导入QUERY_TERMS

我正在运行一个网站Python and Django Django filters 2 1 installed Django 2 1 installed 当我运行时我收到以下错误 importError Could not import
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
是否可以使用 Anaconda 包作为 Google Cloud Functions 的依赖项？

我正在使用 Python 运行时编写 Google Cloud Function 我需要包含一些无法使用的依赖项pip 如文档中所述here https cloud google com functions docs writing spe
Python：如何在不先创建整个列表的情况下计算列表的总和？

通常我们必须 1 声明一个列表 2 使用以下方法计算该列表的总和sum 但现在我希望指定一个以 1 开头间隔为 4 100 个元素的列表如下所示 1 5 9 13 17 21 25 29 33 37 我不想涉及数学公式所以 1 如何在
没有名为“turtle”的模块

我正在学习并尝试用Python3制作贪吃蛇游戏我正在进口海龟我正在使用 Linux mint 19 PyCharm python37 python3 tk Traceback most recent call last File hom

随机推荐

NSArray 越界检查

菜鸟问题检查 NSArray 或 NSMutableArray 的索引是否存在的最佳方法是什么我到处找都没有结果这是我尝试过的 if sections arr objectAtIndex 4 or sections arr objec
为什么 Firefox 会截断我的中的文本？

我有一个简单的
芹菜“重试”并更新参数

考虑一个任务将列表作为参数并处理列表中的每个元素这可能会成功也可能会失败在这种情况下如何仅对失败的元素进行重试 Example app task bind True def my test self my list list new
在 bash 脚本中模拟用户输入[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我正在创建自己的 bash 脚本但目前陷入困境基本上该脚本将用于在 CentOS 中自动设置服务器某些软件通常要求用户输入密码我希望脚本将我
将复选框添加到 ASP.NET 网格视图

我正在尝试在我的网络应用程序中启用批量删除我显示的数据位于GridView我想添加一列其中每一行包含一个复选框或任何替代选项用户可以标记要删除的行然后立即删除所有行当我添加一个CheckBoxField 它必须绑定到我自然在数据
删除元素时映射迭代器如何失效？ [复制]

这个问题在这里已经有答案了使用擦除方法时迭代器何时以及如何在映射中失效例如 std map lt int int gt aMap aMap 33 1 aMap 42 10000 aMap 69 100 aMap 666 1 std m
WordPress 到 Jekyll 脚本抛出错误

我已经为这个问题苦苦挣扎了一天左右但无法弄清楚发生了什么我正在尝试运行一个脚本将我的 Wordpress sql 导入 Jekyll 并将所有内容转换为 Markdown 但每次我运行脚本在 Mac 和 Ubuntu 上时都会收到错
Python定时器回调方法

from threading import Timer class test timer def init self self awesum hh self timer Timer 1 self say hello args WOW def
在 Grails 中使用 Groovy++ 的经验

有人尝试过在幕后实现一个包含 Groovy 的 Grails 解决方案吗 Groovy 使用 Groovy 1 7 5 并包含将 G 与 Grails 集成的插件
当键盘在 Flutter TextField 中可见时，键盘顶部有大量空白

这是我的代码 build BuildContext context return new Scaffold body new SafeArea child new ListView builder itemBuilder itemBuild
动态更改从数组创建的按钮的按钮标签和标题（快速）

我的环境下面的代码是在我公司 iPad 上的 swift Playgrounds 4 中编写的项目目标我正在努力改进学校的课堂管理工具它基本上是一个纸质交通灯每个学生都有一个衣夹我想要一个应用程序其中我的 28 个学生都由一个
pthread_mutex_t 可以在内存中移动吗？

我想构建一个动态分配的 pthread mutex 数组该数组将随着时间的推移而增长添加更多互斥体我的问题是如果数组通过 realloc 移动它们是否仍然有效我担心的是 pthread mutex init 可能会以某种方式设置
更新具有一个字段的当前最高（最大值）值的行[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我有这个 SQL 查询这是错误的
在Java中，如何从资源构造文件？

File 在其构造函数中采用 String 和 URI getClass getResource 返回 URL 和getResourceAsStream 返回输入流有没有办法从资源构造文件你不能至少在资源位于 Jar 内的标准情况下不
JPA/Hibernate - 与子实体一起分离实体

我使用 JPA 2 和 Hibernate 3 6 8 作为实现假设我们有一个实体Foo Entity public class Foo OneToOne private Bar bar 我需要将整个实体图从会话中分离出来当我这样做时e
使用 Java 将数据从 Cassandra 中的一个表复制到另一个表

我正在尝试将所有数据从一个列族表移动到另一个列族由于两个表都有不同的描述我必须从 table 1 中提取所有数据并为 table 2 创建一个新对象然后执行批量 aync 插入我的 table 1 有数百万条记录因此我无法直接
如何使用Lua脚本语言打开Web套接字？

作为初学者我想在基于 Linux 的服务器上使用 Lua 打开一个 Web 套接字该服务器应允许 Android 客户端连接到它你能给我一些用Lua打开网络套接字的示例代码吗您两周前已经问过同样的问题并得到了回答 LUA 脚本 We
在 html5 Canvas 上移动对象

我使用 fillText 选项在 html5 canvas 对象上放置了一个文本问题是我需要移动文本位置或更改已渲染文本的颜色很快我需要知道如何操作画布元素的特定子元素这将在画布上移动一个小圆圈 var can document ge
为什么 ng-bind-html 不显示任何内容？

我正在显示一个包含 HTML 代码的字符串 div style font size 14px div put 它显示 HTML 代码而不是解释元素当我使用ng bind and ng bind unsafe 它什么也没显示如何获取要解析
使用 df.merge 填充 df 中的新列给出奇怪的匹配

我刚刚发现导致此问题的 2 个问题请参阅下面的解决方案我想基于另一个数据帧在我的数据帧 df 中创建一个新列基本上 df2 包含我想要插入 df 的更新信息为了复制我的真实情况 gt 1m 行我将用简单的列填充两个随机 df 我使

热门标签