为什么使用 pandas apply 时会出现 KeyError？

2024-03-27

我正在参加 kaggle Outbrain 竞赛，我的代码中引用的所有数据集都可以在以下位置找到：https://www.kaggle.com/c/outbrain-click-prediction/data https://www.kaggle.com/c/outbrain-click-prediction/data.

关于问题：我有一个包含列的数据框['document_id', 'category_id', 'confidence_level']。我想添加第四列，'max_cat'，这会返回'category_id'对应最大的值'confidence_level'该行的值'document_id'.

import pandas as pd
main_folder = r'...filepath\data_location' + '\\'
test = pd.read_csv(main_folder + 'documents_categories.csv\documents_categories.csv',nrows=1000)

def find_max(row,the_df,groupby_col,value_col,target_col):
    return the_df[the_df[groupby_col]==row[groupby_col]].loc[the_df[value_col].idxmax()][target_col]

test['max_cat'] = test.apply(lambda x: find_max(x,test,'document_id','confidence_level','category_id'))

这给了我错误：

KeyError: ('document_id', 'occurred at index document_id')

任何人都可以帮助解释为什么会发生此错误，或者如何以更有效的方式实现我的目标？

正如 EdChum 在comments https://stackoverflow.com/questions/39960728/pandas-apply-key-error#comment67201157_39960728。问题是apply默认按列工作（请参阅docs http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.apply.html）。因此，无法访问列名。

要指定它应该应用于每一行，axis=1必须通过：

test.apply(lambda x: find_max(x,test,'document_id','confidence_level','category_id'), axis=1)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么使用 pandas apply 时会出现 KeyError？的相关文章

如何在算术表达式的结果上添加 SQLAlchemy 标签？

我如何将这样的东西翻译成 SQLAlchemy select x y as difference 我知道该怎么做 x label foo 但我不确定在哪里放置下面的 label 方法调用 select table c x table c y
对打开文件的脚本进行单元测试

我编写了一个脚本它打开一个文件读取内容并进行一些操作和计算并将它们存储在集合和字典中我该如何为这样的事情编写单元测试我的问题具体是我会测试文件是否打开文件很大这是unix字典文件我如何对计算进行单元测试我真的必须手动计算
将 Django 表单中的所有 CharField 表单字段输入转换为小写

我使用 Django 表单进行用户注册用户可以在其中输入优惠券代码我希望在优惠券代码字段中输入的所有字符都转换为小写我尝试过在保存方法自定义清理方法和自定义验证器中使用 lower 但这些方法没有运气下面是我的代码 class S
无法安装时间模块

我试过了pip install time and sudo H pip install time 但我不断收到错误找不到满足要求时间的版本从版本未找到时间匹配的发行版我正在 PyCharm 中工作但真正没有意义的是我可以在 Py
如何从网站中提取冠状病毒病例？

我正在尝试从网站中提取冠状病毒 https www trackcorona live https www trackcorona live 但我得到了一个错误这是我的代码 response requests get https www t
multiprocessing.freeze_support()

为什么多处理模块需要调用特定的function http docs python org dev library multiprocessing html multiprocessing freeze support在被冻结以生成 Wi
使用 Python 抓取维基百科数据

我正在尝试从以下内容中检索 3 列 NFL 球队球员姓名大学球队维基百科页面 http en wikipedia org wiki 2008 NFL draft 我是 python 新手一直在尝试使用 beautifulsoup 来
使用 Python 解析 XML，解析外部 ENTITY 引用

在我的 S1000D xml 中它指定了一个带有对公共 URL 的引用的 DOCTYPE 该 URL 包含对包含所有有效字符实体的许多其他文件的引用我使用 xml etree ElementTree 和 lxml 尝试解析它并得到解析错
使用reduce方法的斐波那契数列

于是我看到有人用reduce方法来计算斐波那契数列这是他的想法 1 0 1 1 2 1 3 2 5 3 对应于 1 1 2 3 5 8 13 21 代码如下所示 def fib reduce n initial 1 0 dummy ra
我有一个 Employee 类，我想返回“姓名”列表

我有一个 Employee 类我想返回姓名列表雇员 py class Employee object def init self id name members None self id id self name name self
在 Windows 上将 Word2vec 与 Tensorflow 结合使用

In 本教程文件 https github com tensorflow models blob master tutorials embedding word2vec py L45通过 Tensorflow 找到以下行第 45 行来加
如何使用注释和聚合在 Django 的 ORM 中执行此 GROUP BY 查询

我真的不知道如何翻译GROUP BY and HAVING到姜戈的QuerySet annotate and QuerySet aggregate 我正在尝试将这个 SQL 查询转换为 ORM 语言 SELECT EXTRACT year
别碰我的女人

我讨厌的一件事迪斯图尔斯 http docs python org distutils 我猜他是邪恶的人他这样做了 https github com python cpython blob 300dd552b15825abfe0e367a
从 python 中的缩进文本文件创建树/深度嵌套字典

基本上我想迭代一个文件并将每行的内容放入一个深层嵌套的字典中其结构由每行开头的空格数量定义本质上目标是采取这样的事情 a b c d e 并将其变成这样的东西 a b c d e Or this apple colours red
在 Python 中，如何获取特定文件中定义的类列表？

如果一个文件myfile py包含 class A object Some implementation class B object Some implementation 我如何定义一个方法以便在给定的情况下myfile py 它返回
使用Python重命名目录中的多个文件

我正在尝试使用以下 Python 脚本重命名目录中的多个文件 import os path Users myName Desktop directory files os listdir path i 1 for file in files
如何使用 FastAPI 在 HTMX 前端中使用 HX-Redirect？

我试图在登录后在前端重定向我像这样从我的 htmx 前端发出请求
bool() 和operator.truth() 有什么区别？

bool https docs python org 3 library functions html bool and operator truth https docs python org 3 library operator htm
如何将 Pandas Dataframe 中的字符串转换为字符列表或数组？

我有一个名为的数据框data 其中一列包含字符串我想从字符串中提取字符因为我的目标是对它们进行一次性编码并使之可用于分类包含字符串的列存储在预测因子如下 predictors pd DataFrame data columns Seq
如何抑制 Pandas Future 警告？

当我运行该程序时 Pandas 每次都会给出如下所示的未来警告 D Python lib site packages pandas core frame py 3581 FutureWarning rename with inplace

随机推荐

使 ruby gems 响应终端命令

我对红宝石和宝石制作非常陌生我制作了一个简单的 gem 它根据输入抓取一些信息但是要使用我的 gem 我需要进入解释器 irb 并需要我的 gem 然后使用一些参数调用该方法假设宝石被称为foo 假设该方法被调用print webs
错误 StatusLogger Log4j2 找不到日志记录实现

我正在尝试实施log4j 2但它不断抛出以下错误 gt ERROR StatusLogger Log4j2 could not find a logging implementation gt Please add log4j core t
浮动操作按钮导致错误和应用程序崩溃

使用浮动操作按钮时我的 Android 应用程序崩溃并抛出错误当我删除它时我的应用程序成功运行但如果可以的话我宁愿使用浮动操作按钮这是我完整的错误日志 java lang RuntimeException Unable to s
Python - 如何检查文件是否被另一个应用程序使用？

我想打开一个由另一个应用程序定期写入的文件该应用程序无法修改因此我只想在知道该文件未被其他应用程序写入时才打开该文件有没有Pythonic的方法来做到这一点否则我如何在 Unix 和 Windows 中实现这一点 edit 我会
从头开始为 JRE 创建 Docker 映像

我正在尝试使用 JRE 创建映像而不使用任何操作系统我尝试了这个 Dockerfile 但不起作用 FROM openjdk 11 0 1 jdk oraclelinux7 as JDK RUN jlink no header files
如何为动态搜索字符串创建索引

我有一点数据库仅用于学术目的我最多有对象表我在 Power Designer 中创建了一个实体关系模型 ERM 并且该程序默认为每个表的序列 ID 创建索引我想知道如何使用索引就像在查询中那样说我会想要通过 id 查找产品但
64 位环境中引用的大小

在浏览 SO 上另一个问题的答复时遇到了这个引用与变量获取 https stackoverflow com questions 3744635 c is it a good idea to always return references
iOS 10 中的 AVSpeechSynthesizer 错误

我目前正在使用创建一个文本转语音应用程序AVSpeechSynthesizer 在 iOS 9 中运行正常但在 iOS 10 中出现以下错误无法获取属性 LocalURL 错误域 MobileAssetError Code 1 无法复制
Escape(\) 字符背后的魔力是什么

C C 编译器如何操作源代码中的转义字符编译器语法是如何编写来处理该字符的编译器遇到该字符后会做什么大多数编译器分为几个部分编译器前端称为词法分析器 http en wikipedia org wiki Lexical analyz
在 jdk 11 中运行 Doclet 的 com.sun.tools.javadoc.Main.execute 的替代方案是什么？

我在 Apache netbeans 10 上使用 JDK 11 The main该方法自 java 9 起已被弃用并标记为删除如果没有选择 https docs oracle com en java javase 11 docs a
如何对 SQL 存储过程的 col 结果求和[重复]

这个问题在这里已经有答案了我有一个存储过程其结果如下 Governors AUTO 07313570121 1 3 69 2 01 2 01 1 68 83 58 Governors AUTO 07319354850 1 2 79 1
如何根据风格更改 Flutter 应用程序名称？

我有 Flutter 应用程序的开发和生产风格问题是开发和生产应用程序的标签和启动器是相同的因此看不到差异实际上不能同时在设备上安装两者根据风格更改 Flutter 应用程序名称的简单方法是什么我知道可以通过修改 AndroidM
需要使用油脂猴脚本点击出价按钮

我有点卡住了我正在尝试创建一个油脂猴脚本该脚本将自动单击拍卖网站上出现的弹出窗口我有 Xpat 但我对 GM 的经验太丰富无法让它发挥作用这是我从 fire finder for firebug 获得的元素检查线
Sublime Text 中的边界敏感 Cmd+D

我在 OSX 上使用 Sublime Text 3 Using cmd D I want to select the next instance of es but not if it s part of another word 鉴于此代
如何从 Google App Engine for Java 调用 Google App 脚本

我有一个谷歌应用程序脚本我想从 Google App Engine for Java 调用它有人可以指导如何调用这样的脚本吗我试着用谷歌搜索这个但只找到了很多关于如何进行相反操作的信息请指教 6个月前我也有同样的问题我可以使用脚
缩短本地 jekyll 服务器的页面生成时间

跑步时jekyll server 整个站点被重建在足够大的站点上这需要非常长的时间即使与 auto标志这应该会阻止整个站点重新生成但完成时间相当长对我来说 10 多秒据报道对某些人来说需要几分钟这在编辑和预览单个页面时很不方
NDK：libm 静态链接

我在尝试使用最新的 android 9 x86 平台编译源代码时遇到问题主要问题为什么是静态库libm a和动态的libm so是不同的问题是我尝试编译 path to android ndk r8 toolchains x86 4
数据类型不一致：预期的 NUMBER 变为 BINARY

我是 Hibernate 新手我正在尝试对我创建的 Oracle 数据库进行简单用户插入我使用 Netbeans Hibernate 向导创建了所有必需的文件 hibernate cfg xml hibernate reveng x
如何在c#中向图标添加文本？

我想在系统托盘中显示一个图标 ico 文件并在运行时添加一些文本有没有原生的 WPF 方法可以做到这一点或 GDI 的片段也将不胜感激谢谢这是对我有用的代码 public static Icon GetIcon string te
为什么使用 pandas apply 时会出现 KeyError？

我正在参加 kaggle Outbrain 竞赛我的代码中引用的所有数据集都可以在以下位置找到 https www kaggle com c outbrain click prediction data https www kaggle

为什么使用 pandas apply 时会出现 KeyError？

为什么使用 pandas apply 时会出现 KeyError？ 的相关文章

随机推荐

热门标签

为什么使用 pandas apply 时会出现 KeyError？的相关文章