尝试合并 2 个数据帧但出现 ValueError

2023-12-13

这些是我保存在两个变量中的两个数据框：

> print(df.head())
>
          club_name  tr_jan  tr_dec  year
    0  ADO Den Haag    1368    1422  2010
    1  ADO Den Haag    1455    1477  2011
    2  ADO Den Haag    1461    1443  2012
    3  ADO Den Haag    1437    1383  2013
    4  ADO Den Haag    1386    1422  2014
> print(rankingdf.head())
>
           club_name  ranking  year
    0    ADO Den Haag    12    2010
    1    ADO Den Haag    13    2011
    2    ADO Den Haag    11    2012
    3    ADO Den Haag    14    2013
    4    ADO Den Haag    17    2014

我正在尝试使用以下代码合并这两个：

new_df = df.merge(ranking_df, on=['club_name', 'year'], how='left')

添加 how='left' 是因为我的 rating_df 中的数据点比标准 df 中的数据点少。

预期的行为是这样的：

> print(new_df.head()) 
> 

      club_name  tr_jan  tr_dec  year    ranking
0  ADO Den Haag    1368    1422  2010    12
1  ADO Den Haag    1455    1477  2011    13
2  ADO Den Haag    1461    1443  2012    11
3  ADO Den Haag    1437    1383  2013    14
4  ADO Den Haag    1386    1422  2014    17

但我收到这个错误：

ValueError：您正在尝试合并 object 和 int64 列。如果您希望继续，您应该使用 pd.concat

但我不想使用 concat，因为我想合并树而不仅仅是添加它们。

我认为奇怪的另一个行为是，如果我将第一个 df 保存到 .csv，然后将该 .csv 加载到数据框中，我的代码就可以工作。

其代码：

df = pd.DataFrame(data_points, columns=['club_name', 'tr_jan', 'tr_dec', 'year'])
df.to_csv('preliminary.csv')

df = pd.read_csv('preliminary.csv', index_col=0)

ranking_df = pd.DataFrame(rankings, columns=['club_name', 'ranking', 'year'])

new_df = df.merge(ranking_df, on=['club_name', 'year'], how='left')

我认为这与 index_col=0 参数有关。但我不知道在不保存它的情况下修复它，这并不重要，但我必须这样做有点烦恼。

在你的一个数据框中，年份是一个字符串，另一个是一个 int64 您可以先转换它，然后加入（例如df['year']=df['year'].astype(int)或如 RafaelC 建议的那样df.year.astype(int))

编辑：另请注意安德森·朱的评论：以防万一None或者您的数据帧之一缺少值，您需要使用Int64代替int。参见参考资料here.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

尝试合并 2 个数据帧但出现 ValueError 的相关文章

Python在postgresql表中查找带有单引号符号的字符串

我需要从 psql 表中查找包含多个单引号的字符串我当前的解决方案是将单引号替换为双单引号如下所示 sql query f SELECT exists SELECT 1 FROM table name WHERE my column m
为什么我的代码不能根据字典解码加密字符串？

我有一本字典其中包含代表字母的键和值例如一个简单的 DICT CODE b g n a p o x d t y 我收到了一个加密代码并将该字符串转换为一个列表其中每个项目都是一个单词我需要根据字典中的项目来解决它代码示例是 wo
如何在 PyCharm 4.5.2 中使用 PyPy 作为标准/默认解释器？

如何在 PyCharm 4 5 2 中使用 PyPy 作为标准默认解释器一切都在 Ubunutu 14 10 下运行并且 pypy 已经安装您可以在项目的设置下进行配置这个官方文档直接涵盖了 https www jetbrains
当单词以“|”分隔时如何读取文件（埃因霍温）？

在Python中我有一个文件其中的单词由例如 city state zipcode 我的文件阅读器无法区分单词另外我希望我的文件阅读器从第 2 行而不是第 1 行开始如何让我的文件阅读器分隔单词 import os import
如何在 Python 3 中循环遍历集合，同时从集合中删除项目

这是我的情况我有一个list set 哪个并不重要 movieplayer我想调用的对象 preload 功能开启该预加载函数可以立即返回但希望将来返回一点我想存储这个电影播放器集合表明它们尚未预加载然后循环它们调用prel
如何将 self 传递给装饰器？

我该如何通过self key下面进入装饰器 class CacheMix object def init self args kwargs super CacheMix self init args kwargs key func Cons
Apache Spark 中的高效字符串匹配

我使用 OCR 工具从屏幕截图中提取文本每个大约 1 5 句话然而当手动验证提取的文本时我注意到时不时会出现一些错误鉴于文本你好我真的很喜欢 Spark 我注意到 1 像 I 和 l 这样的字母被替换 2 表情符号未被正确提
Pandas 滚动窗口 Spearman 相关性

我想使用滚动窗口计算 DataFrame 两列之间的 Spearman 和或 Pearson 相关性我努力了df corr df col1 rolling P corr df col2 P为窗口尺寸但我似乎无法定义该方法添加meth
如何使用 paramiko 查看（日志）文件传输进度？

我正在使用 Paramiko 的 SFTPClient 在主机之间传输文件我希望我的脚本打印文件传输进度类似于使用 scp 看到的输出 scp my file user host user host password my file 1
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
使用 numpy 在 python 中执行最大方差旋转

我正在研究矩阵的主成分分析我已经找到了如下所示的组件矩阵 A np array 0 73465832 0 24819766 0 32045055 0 3728976 0 58628043 0 63433607 0 72617152 0 5
Pandas style.bar 颜色基于条件？

如何渲染其中一列的 Pandas dfstyle bar color属性是根据某些条件计算的 Example df style bar subset before after color ff781c vmin 0 0 vmax 1 0 而
由于 json 字符串化 dict 键导致数据丢失

考虑下面的例子 gt gt gt import json gt gt gt d 0 potato 0 spud gt gt gt json dumps d 0 potato 0 spud gt gt gt json loads json d
当在另一行中找到元素逗号分隔时合并行

您好我有一个数据框例如 species family Events groups 1 SP1 A 10 22 G1 2 SP1 B 7 G2 3 SP1 C D 4 5 6 1 3 G3 G4 G5 G6 4 SP2 A 22 10 G
如何使用 matplotlib 为圆柱体的每个单独面添加颜色

我正在尝试为圆柱体的每个面着色但是我不确定如何进行我尝试了以下方法 for i in range 10 col append for i in range 10 for j in range 20 col i append plt cm
在 virtualenvwrapper 中激活环境

我安装了virtualenv and virtualenvwrapper用这个命令我创建了一个环境 mkvirtualenv cv 它有效创建后我就处于新环境中现在我重新启动了我的电脑我想activate又是那个环境但是怎么样我使
更改 Python Cmd 模块处理自动完成的方式

我有一个 Cmd 控制台设置为自动完成 Magic the Gathering 收藏管理系统的卡牌名称它使用文本参数在数据库中查询卡片并使用结果自动完成建议卡片然而这些卡片名称有多个单词 Cmd 会从last到行尾的空间例如
Python：高精度time.sleep

你能告诉我如何在 Win32 和 Linux 上的 Python 2 6 中获得高精度睡眠函数吗您可以在中使用浮点数sleep http docs python org library time html time sleep 该参数可以
如何循环遍历字典列表并打印特定键的值？

我是 Python 新手有一个问题我知道这是一个非常简单的问题运行Python 3 4 我有一个需要迭代并提取特定信息的列表以下是列表称为部分的示例已截断数千个项目 state DEAD id phwl type name
使用 urllib 编码时保持 url 参数有序

我正在尝试用 python 模拟 get 请求我有一个参数字典并使用 urllib urlencode 对它们进行 urlencode 我注意到虽然字典的形式是 k1 v1 k2 v2 k3 v3 urlencoding 后参数的顺序切

随机推荐

手动更改线型顺序并偏移 ggplot 中的误差线

使用这些数据 Data lt structure list value c 180 528 180 147 468 151 194 568 210 SE c 21 7869586486209 21 0831764730322 21 2726
设置redirectMode =“ResponseRewrite”时，CustomErrors不起作用

在旧站点中我通过添加来更改 CustomErrors 的工作方式redirectMode ResponseRewrite 3 5 SP1 中的新增功能
注入 Jersey Resource 类

我确实尝试过以下链接如何将协作者连接到 Jersey 资源 and 访问 Jersey Resource 类中的外部对象但我仍然无法找到一个工作示例来演示如何注入资源类我没有使用 Spring 或 Web 容器我的资源是 package
无法加载文件或程序集“Windows，Version=255.255.255.255，Culture=neutral，PublicKeyToken=null，ContentType=WindowsRuntime”

安装 vs2012 并更新我的 vs2010 WPF 项目后我在 WPF 设计器中收到以下错误无法加载文件或程序集 Windows Version 255 255 255 255 Culture neutral PublicKeyTok
Javascript：如何延迟返回 img.complete 的值

我编写了一个脚本来测试 IMG 标签中的 SVG 支持 function SVGinIMG var SVGdata data image svg xml base64 PHN2ZyB4bWxucz0iaHR0cDovL3d3dy53My5v
VIPT Cache：TLB 和 Cache 之间的连接？

我只是想澄清这个概念并且可以找到足够详细的答案这些答案可以帮助我们了解硬件中的所有内容实际上是如何工作的请提供任何相关详细信息对于 VIPT 缓存内存请求会并行发送到 TLB 和缓存从 TLB 中我们可以获得转换后的物理地址从
隐藏单独的自定义功能区按钮

我有一个自定义 Excel 功能区和一个 Excel 加载项其中包含一个在打开工作簿时实例化一次的类根据该类的某些属性我需要隐藏自定义功能区中的某些按钮全部位于同一选项卡中我的定制丝带是
为跨平台开源 UI 无关的 C# 类库选择哪种 Visual Studio 2017 项目类型？为什么？

我有一个 C 类库的想法我想开发并发布为开源我想让它在尽可能多的可用 Net 平台上轻松可用必要时重新编译例如完整的 Net Mono Net Core Xamarin 只有经典的 Net 兼容性才是真正必须的然而该库不会依赖于
围绕单个语句的事务有什么作用？

我了解事务如何有助于协调一对更新我不明白的是在事务中包装单个语句这是我所见过的 90 事实上在现实生活中的代码中根据我的经验更常见的是发现一系列逻辑相关的事务每个事务都包装在自己的事务中但整体并未包装在事务中在 MS SQL
我的 ViewModel 中的 IEnumerable 未随 EditorForModel 显示

视图模型 Validator typeof ProdutoCategoriaValidator public class ProdutoCategoriaViewModel HiddenInput DisplayValue false pu
为什么PHP的explode错误？

这是 PHP 代码 var dump value string 103 0e0cU 0Z dddd is moar awesome A6A32C2074B787893DF506F6F466F5919516C44F3 var dump exp
Raspberry Pi 无法在 JavaFX 应用程序中隐藏鼠标光标

目前我为 Raspberry Pi 3 开发 JavaFX 应用程序为了在我的 PC 上进行开发我使用 Ubuntu 16 04 1 OpenJDK 1 8 0 111 和 OpenJFX 8 0 60 对于 Raspberri Pi
Oracle 存储过程 OUT 参数

我有一个存储过程其 IN OUT 参数声明如下 create or replace PROCEDURE RIFATT SEGN0 INS pIdRifattSegn0 in OUT NUMBER pNumDossier IN VARCHA
如何定义 Swagger 2.0 JSON 来填充 Swagger UI 中的默认主体参数对象？

我们当前的部署模式要求我手动编写 swagger json 输出该输出将由我公司使用的基于 Swagger 的 UI 使用我希望我正在编写的 json 能够提供默认值来填充所有输入字段包括 body 输入参数的 Swagger
无法通过angularjs在phonegap中显示联系人照片

我能够从简单的 html 和 javascript 获取并显示联系人照片但是当我使用 angularjs 模型显示联系人照片时出现错误以下是我的源代码列出我尝试显示联系人的位置 ul class list li class item
如何使用表单从数组动态创建复选框？

我想使用代码根据传递给函数的数组或对象动态创建复选框你能修改这个函数来获取数组吗我有一个脚本可以根据用户名查找可能的电脑名称并列出匹配项如果有这个表格让我能够选择列表中的结果之一作为正确的 PC 以移入正确的容器并安装软件那就太
MySQL 删除重复行

我有一个评论表其结构如下 id name email comment 我有很多重复的评论具有相同的姓名和电子邮件我需要删除它们任何人都可以建议我如何使用单个查询来实现此目的 Thanks DELETE FROM comments c
用于在正在运行的 JVM 中打开调试的 Java API [重复]

这个问题在这里已经有答案了是否有一种编程方式可以在正在运行的 JVM 实例中打开调试我正在寻找一个 API 它可以使运行中的 JVM 成为调试服务器该 API 的作用相当于 Xdebug Xrunjdwp transport dt s
暂停测试执行，直到应用程序空闲

是否可以实现一些 util 方法来暂停测试当前线程执行直到应用程序空闲空闲的意思是 1 一段时间内没有GUI事件添加到事件队列中2 在同一时间段内没有工作线程运行任何任务您能否提供实现代码片段来跟踪以前的空闲情况您可以更换Ev
尝试合并 2 个数据帧但出现 ValueError

这些是我保存在两个变量中的两个数据框 gt print df head gt club name tr jan tr dec year 0 ADO Den Haag 1368 1422 2010 1 ADO Den Haag 1455 14

尝试合并 2 个数据帧但出现 ValueError

尝试合并 2 个数据帧但出现 ValueError 的相关文章

随机推荐

热门标签