为什么使用 pandas apply 时会出现 AttributeError 错误？

2023-11-26

我应该如何根据条件将 NaN 值转换为分类值。我在尝试转换 Nan 值时遇到错误。

category           gender     sub-category    title

health&beauty      NaN         makeup         lipbalm

health&beauty      women       makeup         lipstick

NaN                NaN         NaN            lipgloss

我的数据框看起来像这样。我将性别中的 NaN 值转换为分类值的函数如下所示

def impute_gender(cols):
    category=cols[0]
    sub_category=cols[2]
    gender=cols[1]
    title=cols[3]
    if title.str.contains('Lip') and gender.isnull==True:
        return 'women'
df[['category','gender','sub_category','title']].apply(impute_gender,axis=1)

如果我运行代码，我会收到错误

----> 7     if title.str.contains('Lip') and gender.isnull()==True:
      8         print(gender)
      9 

AttributeError: ("'str' object has no attribute 'str'", 'occurred at index category')

完整数据集 -https://github.com/lakshmipriya04/py-sample

这里需要注意一些事情 -

如果您只使用两列，请调用apply超过 4 列是浪费
Calling apply既浪费又低效，因为它很慢，使用大量内存，并且没有为您提供矢量化优势
在应用中，您正在处理标量，因此您不使用.str访问器就像你一样pd.Series目的。title.contains就足够了。或者更Python地讲，"lip" in title.
gender.isnull对口译员来说听起来完全错误，因为gender是一个标量，它没有isnull属性

Option 1
np.where

m = df.gender.isnull() & df.title.str.contains('lip')
df['gender'] = np.where(m, 'women', df.gender)

df
        category gender sub-category     title
0  health&beauty  women       makeup   lipbalm
1  health&beauty  women       makeup  lipstick
2            NaN  women          NaN  lipgloss

这不仅速度快，而且更简单。如果您担心区分大小写，您可以将contains检查不区分大小写 -

m = df.gender.isnull() & df.title.str.contains('lip', flags=re.IGNORECASE)

Option 2
另一种选择是使用pd.Series.mask/pd.Series.where -

df['gender'] = df.gender.mask(m, 'women')

Or,

df['gender'] = df.gender.where(~m, 'women')

df
        category gender sub-category     title
0  health&beauty  women       makeup   lipbalm
1  health&beauty  women       makeup  lipstick
2            NaN  women          NaN  lipgloss

The mask根据提供的掩码将新值隐式应用于列。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

apply

AttributeError

为什么使用 pandas apply 时会出现 AttributeError 错误？的相关文章

元组有什么用？

我现在正在学习 Python 课程我们刚刚介绍了元组作为数据类型之一我阅读了它的维基百科页面但是我无法弄清楚这种数据类型在实践中会有什么用处我可以提供一些需要一组不可变数字的示例吗也许是在 Python 中这与列表有何不同每
Python 中的哈希映射

我想用Python实现HashMap 我想请求用户输入根据他的输入我从 HashMap 中检索一些信息如果用户输入HashMap的某个键我想检索相应的值如何在 Python 中实现此功能 HashMap
处理 Python 行为测试框架中的异常

我一直在考虑从鼻子转向行为测试摩卡柴等已经宠坏了我到目前为止一切都很好但除了以下之外我似乎无法找出任何测试异常的方法 then It throws a KeyError exception def step impl contex
使用 kivy textinput 的 'input_type' 属性的问题

您好我在使用 kivy 的文本输入小部件的 input type 属性时遇到问题问题是我制作了两个自定义文本输入其中一个称为 StrText 其中设置了 input type text 然后是第二个文本输入名为 NumText 其
Python zmq SUB 套接字未接收 MQL5 Zmq PUB 套接字

我正在尝试在 MQL5 中设置一个 PUB 套接字并在 Python 中设置一个 SUB 套接字来接收消息我在 MQL5 中有这个 include
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co
如何在 Python 中解析和比较 ISO 8601 持续时间？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 Python v2 库它允许我解析和比较 ISO 8601 持续时间may处于不同单
从Python中的字典列表中查找特定值

我的字典列表中有以下数据 data I versicolor 0 Sepal Length 7 9 I setosa 0 I virginica 1 I versicolor 0 I setosa 1 I virginica 0 Sepal
如何在不丢失注释和格式的情况下更新 YAML 文件 / Python 中的 YAML 自动重构

我想在 Python 中更新 YAML 文件值而不丢失 Python 中的格式和注释例如我想改造 YAML 文件 value 456 nice value to value 6 nice value 界面类似于 y yaml load
如何使用 Mysql Python 连接器检索二进制数据？

如果我在 MySQL 中创建一个包含二进制数据的简单表 CREATE TABLE foo bar binary 4 INSERT INTO foo bar VALUES UNHEX de12 然后尝试使用 MySQL Connector P
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
Cython 和类的构造函数

我对 Cython 使用默认构造函数有疑问我的 C 类 Node 如下 Node h class Node public Node std cerr lt lt calling no arg constructor lt lt std e
加快网络抓取速度

我正在使用一个非常简单的网络抓取工具抓取 23770 个网页scrapy 我对 scrapy 甚至 python 都很陌生但设法编写了一个可以完成这项工作的蜘蛛然而它确实很慢爬行 23770 个页面大约需要 28 小时我看过scr
javascript 是否有等效的 __repr__ ？

我最接近Python的东西repr这是 function User name password this name name this password password User prototype toString function r
为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍，而速度却没有任何提升？

我正在测试 Python 3 4 我注意到 pickle 模块有一个新协议因此我对 2 个协议进行了基准测试 def test1 pickle3 open pickle3 wb for i in range 1000000 pickle
python import inside函数隐藏现有变量

我在我正在处理的多子模块项目中遇到了一个奇怪的 UnboundLocalError 分配之前引用的局部变量问题并将其精简为这个片段使用标准库中的日志记录模块 import logging def foo logging info fo
将 Python 中的日期与日期时间进行比较

所以我有一个日期列表 datetime date 2013 7 9 datetime date 2013 7 12 datetime date 2013 7 15 datetime date 2013 7 18 datetime date
cv2.VideoWriter：请求一个元组作为 Size 参数，然后拒绝它

我正在使用 OpenCV 4 0 和 Python 3 7 创建延时视频构造 VideoWriter 对象时文档表示 Size 参数应该是一个元组当我给它一个元组时它拒绝它当我尝试用其他东西替换它时它不会接受它因为它说参数不是
使用 z = f(x, y) 形式的 B 样条方法来拟合 z = f(x)

作为一个潜在的解决方案这个问题 https stackoverflow com questions 76476327 how to avoid creating many binary switching variables in gekk

随机推荐

Shell：在多个文件中查找匹配行

我正在尝试使用 shell 脚本以及 oneliner 来查找大约 50 个文件之间的任何公共行 Edit 注意我正在寻找出现在所有文件中的一行行到目前为止我已经尝试过 grepgrep v x f file1 sp 它只匹配所有其他
编译器强制我实现特征方法，但方法上绑定的“Self”特征永远不会满足我的类型

我有一个特质Foo 我想强迫实现者定义一个方法 if这些实现者实现了另一个特征 Clone在此示例中我的想法操场 trait Foo Note in my real application the trait has other met
导入 Access .mdb 时 SQL Server 导入向导“工作组信息文件”错误

是否可以导入 MS Access 如果我没有安装 MS Access 如何将 mdb 文件导入 SQLExpress 我问的原因是因为我在尝试使用 SQL Management Studio 中的导入向导执行此任务时收到以下错误由于初始化
PHP 8.2 动态属性已弃用：如何以兼容的方式使用它们

在 PHP 8 2 中动态属性已弃用并且从 PHP 9 开始将导致致命错误 Using 动态属性 on Classes运行 PHP 8 2 将导致PHP Deprecated Creation of dynamic property i
matplotlib 动画绘图不会使用 blit 更新轴上的标签

我正在使用 wxPython 在图中绘制数据其中 y 轴上的数据限制随着数据而变化我想动态更改轴而不重新绘制整个画布例如canvas draw 相反我想用blitting为此就像我为情节本身所做的那样我要做的是改变 y 轴并且我
方法里面可以有方法吗？

我有一个方法里面有一个方法内部方法取决于正在运行的变量循环这是一个坏主意吗更新由于这个答案最近似乎引起了一些兴趣我想指出的是关于 Ruby 问题跟踪器的讨论remove这里讨论的功能即forbid在方法体中包含方法定义不 Ru
Python Tkinter 网格几何粘性设置无效（？）

我正在使用 Python Tkinter 设计简单的输入对话框grid几何并得到一些意想不到的行为当我开始使用这段代码时 winAddNew tk Toplevel winAddNew title Add New Customer lb
获取局部变量的名称

在开发和调试时我有时希望能够编写一个单行代码来转储一堆变量的名称类型和值问题是我不知道如何访问变量的名称如果可以的话这是第一次尝试 foo 1 bar 42 baz Hash new foo bar baz each do v p
如何使用 VBScript 判断 Excel 2007 电子表格是否打开以及是谁打开的

如何判断 Excel 2007 电子表格是否已打开以及是谁使用 VBScript 打开的我试图弄清楚 Excel 工作簿当前是否由另一个用户打开并在我的脚本中返回该用户是谁我已经弄清楚由谁来确定工作簿当前是否打开这是一种解决方法但
计算两列中任意一列中字符串出现次数的向量化方法

我有一个问题是similar to 这个问题但只是足够不同无法用相同的解决方案来解决我有两个数据框 df1 and df2 像这样 import pandas as pd import numpy as np np random se
如何下载离线副本MSDN（微软帮助文档）？

我可以下载离线副本MSDN 微软帮助文档吗例如我整天无法访问互联网但我需要访问帮助信息又该如何做呢 Yes 如果要简短只需安装微软帮助查看器在其中您可以离线复制您需要的所有项目 Full instruction you can
编程中的“原子”是什么意思？

在 Effective Java 一书中它指出语言规范保证读或写变量是原子的除非变量是类型long or double JLS 17 4 7 在 Java 编程或一般编程中原子是什么意思这是一个例子假设foo是一个类型变量l
在 Android Studio 上通过 CMake 将 OpenCV 添加到 Native C 代码

我正在尝试通过 Cmake 将 Opencv 包含到 android studio 项目中的本机 C 代码中我在网上做了一些研究并从网上下载了FindOpenCV cmake文件并将其添加到我的android项目的app目录中这也是
实现后密封接口

我正在做一个小项目我遇到了这个问题项目输出是一个包含接口的库如果可能的话我想实现该接口并密封其中的功能 public interface ITest void SomeMethod class A ITest public seal
如何从扩展中退出 Chrome？

我正在开发 Chrome 扩展程序有时我需要退出浏览器进程我尝试使用以下代码关闭所有窗口 chrome windows getCurrent function window chrome windows remove window id
git-clone 和结帐后钩子

根据手册 post checkout钩子在 a 之后运行git checkout 正如预期的那样而且经过git clone 除非你通过 no checkout 很好现在考虑以下几点您之前没有本地存储库git clone 挂钩在遥控器之
Angular 6：如何根据滚动突出显示导航栏上的元素？

我正在 Angular 6 中制作一个页面这是一个简单的页面我想强调一下navbar取决于滚动这是我的代码 sticky position sticky top 0 i ul list style type none margin 0
extbase 存储库 findAll() 返回结果 null

我有几个这样的控制器 CategoryController 和 NewsController 以及类别和新闻的领域模型以及两者的存储库在 NewsController 中我执行如下的 dependencyInjection 与在cate
如何在 React 中访问 DOM 元素？ React 中的 document.getElementById() 相当于什么

如何在react js中选择某些栏这是我的代码 var Progressbar React createClass getInitialState function return completed this props complete
为什么使用 pandas apply 时会出现 AttributeError 错误？

我应该如何根据条件将 NaN 值转换为分类值我在尝试转换 Nan 值时遇到错误 category gender sub category title health beauty NaN makeup lipbalm health beau

为什么使用 pandas apply 时会出现 AttributeError 错误？

为什么使用 pandas apply 时会出现 AttributeError 错误？ 的相关文章

随机推荐

热门标签

为什么使用 pandas apply 时会出现 AttributeError 错误？的相关文章