dfply：改变字符串列：TypeError

2024-05-30

我的 pandas 数据框包含一个“文件”列，它是带有文件路径的字符串。我正在尝试使用 dfply 来改变此列，例如

resultstatsDF.reset_index() >> mutate(dirfile = os.path.join(os.path.basename(os.path.dirname(X.file)),os.path.basename(X.file)))

但我得到了错误

TypeError: __index__ returned non-int (type Call)

我做错了什么？我怎样做才正确？

由于我的问题得到了赞成，我想，有些人仍然对此感兴趣。到目前为止，我已经对 Python 有了相当多的了解，让我来回答一下，也许这会对其他用户有所帮助。

首先我们导入需要的包

import pandas as pd
from dfply import *
from os.path import basename, dirname, join

并制作所需的 pandas DataFrame

resultstatsDF = pd.DataFrame({'file': ['/home/user/this/file1.png', '/home/user/that/file2.png']})

which is

                        file
0  /home/user/this/file1.png
1  /home/user/that/file2.png

我们看到仍然出现错误（尽管由于 dfply 的不断开发而发生了变化）：

resultstatsDF.reset_index() >> \
mutate(dirfile = join(basename(dirname(X.file)), basename(X.file)))

类型错误：index返回非 int （意图类型）

原因是，因为 mutate 适用于系列，但我们需要一个适用于元素的函数。这里我们可以使用这个函数pandas.Series.apply https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.apply.html的 pandas，适用于系列。但是，我们还需要一个自定义函数，可以将其应用于该系列的每个元素file。所有的东西放在一起我们最终得到了代码

def extract_last_dir_plus_filename(series_element):
    return join(basename(dirname(series_element)), basename(series_element))

resultstatsDF.reset_index() >> \
mutate(dirfile = X.file.apply(extract_last_dir_plus_filename))

哪个输出

   index                       file         dirfile
0      0  /home/user/this/file1.png  this/file1.png
1      1  /home/user/that/file2.png  that/file2.png

在没有 dfply 的情况下执行此操作mutate，我们也可以写成

resultstatsDF['dirfile'] = resultstatsDF.file.apply(extract_last_dir_plus_filename)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

dfply

dfply：改变字符串列：TypeError 的相关文章

Selenium AttributeError：列表对象没有属性 find_element_by_xpath

我正在尝试从网站上抓取一些营养数据到目前为止一切似乎都进展顺利直到我遇到格式略有不同的页面使用 selenium 和这样的行返回一个空列表 values browser find elements by class name siz
pygame中物体的速度？

我正在编写一个简单的 pygame 程序仅包含在屏幕上移动一个框盒子移动得很快我想知道如何控制速度在我的代码中更新后的位置移动了 1 而不是更小因为如果数字不是整数就会使事情变得更加复杂 import os sys impor
如何使用 pywin32 在 Python 中获取特定应用程序窗口的句柄？

我正在尝试修改一些在 Windows 10 中截取特定应用程序窗口屏幕截图的 Python 代码我正在尝试使用win32ui win32guipywin32 包中的模块用于此目的这是损坏的代码 def getWindow name Wi
Python select() 行为很奇怪

我在理解 select select 的行为时遇到一些困难请考虑以下 Python 程序 def str to hex s def dig n if n gt 9 return chr 65 10 n else return chr 48
哪个 Python IDE 可以逐行运行我的脚本？

我不会称自己为程序员但我最近开始学习 Python 并且非常喜欢它到目前为止我主要将它用于小任务脚本编写文本处理 KML 生成和 ArcGIS 根据我使用 R 的经验使用出色的 Notepad 和NppToR http sour
将行转换为 pandas 中逗号分隔的字符串

我有一个熊猫数据框 from pandas import DataFrame import pandas as pd df2 DataFrame a one one two two three two one six b x y z y x
我可以使用 Python 访问 ImageMagick API 吗？

我需要使用图像魔术师 http www imagemagick org script index php因为 PIL 没有我正在寻找的可用图像功能量但是我想使用Python python 绑定 PythonMagick 自 2009 年
调用 close() 后大文件没有立即刷新到磁盘？

我正在使用 python 脚本创建大文件超过1GB 实际上有 8 个在创建它们之后我必须创建将使用这些文件的进程该脚本如下所示 This is more complex function but it basically does
在 Python 中使用带有 asyncio 的信号量

我试图限制使用信号量同时运行的异步函数的数量但我无法让它工作我的代码归结为 import asyncio async def send i print f starting i await asyncio sleep 4 print f
dulwich - 从远程仓库身份验证克隆

我找不到有关此主题的任何资源我需要通过提供用户名和密码从私有存储库进行克隆然而当它们作为关键字参数提供给 dulwich get client from path 时会出现错误提示未知参数用户名这似乎是一件简单的事情但我找
tf.reshape 与 tf.contrib.layers.flatten

所以我正在运行 CNN 来解决分类问题我有 3 个转换层和 3 个池化层 P3是最后一个池化层的输出其维度为 Batch size 4 12 48 我想将该矩阵展平为 Batch size 2304 尺寸矩阵为2304 4 12 48
限制并行工作的线程数量

我正在创建一个函数将文件从本地计算机复制到远程创建线程以并行执行 sftp def copyToServer does copy file given host name and credentials for i in hostsLis
AttributeError：模块“rest_framework.serializers”没有属性“NullBooleanField”

升级后djangorest框架 https pypi org project djangorestframework from djangorestframework 3 13 1 to djangorestframework 3 14 0
Pandas 中的 Vlookup 具有近似匹配

我需要对两个 pandas 数据框进行 vlookup 样式操作 Excel 中的 Vlookup 函数有一个额外的参数是否应查找近似匹配或精确匹配为了精确匹配我知道我可以使用 join 函数但是我该如何进行近似匹配以找到下一个更大
强制 shell 在 SunGrid 引擎中使用 conda 变量中的 python [重复]

这个问题在这里已经有答案了我正在尝试在 SunGrid 引擎中执行 python 文件并且从 anaconda3 环境变量中执行它我的代码很简单 from future import print function import url
与正在运行的进程通信

We have 基于Python的服务器 A 正在运行的命令行应用程序在同一台 Linux 机器上能够读取stdin 计算一些东西并将输出提供给stdout B 将输入从 A 发送到的最佳最优雅方式是什么 stdin B 的并等待
python pandas 将两行或多行文本合并为一行

我有包含文本数据的数据框如下所示 name address number 1 Bob bob No 56 2 gmail com 3 Carly email protected cdn cgi l email protection No
在 django 中运行普通 sql 查询时如何获取字段名称

在我的 django 视图之一中我使用纯 sql 不是 orm 查询数据库并返回结果 sql select from foo bar cursor connection cursor cursor execute sql rows cur
Python：装饰器可以确定函数是否在类中定义吗？

我正在编写一个装饰器出于各种烦人的原因 0 检查它所包装的函数是独立定义还是作为类的一部分定义以及新类是哪些类的子类是很方便的例如 def my decorator f defined in class print r s f de
创建将一把小提琴按色调分割的小提琴图的正确方法是什么？

创建将一把小提琴分开的小提琴图的正确方法是什么hue 我尝试了不同的方法似乎唯一的方法是创建一个为数据集中的每个条目共享相同值的功能并将该功能的名称传递为x fig plt figure figsize 20 8 fig add sub

随机推荐

在 PHP 中的请求之间存储对象而不进行序列化

我正在用 PHP 编写一个有状态的 Web 应用程序其中状态可能包含大量对象目前我将所有这些对象保存在 SESSION 中并在请求结束时将它们序列化这有点痛苦因为序列化整个会话需要几秒钟而反序列化则需要更多时间我想尝试 AP
Angularjs 循环遍历 $http.post

当我循环遍历 Angularjs 的 http post 服务时 for var i 0 i lt scope tagStyles length i scope profilTag tag scope tagStyles i id tag
如何在 git 交互式 rebase 中将提交与下一个提交合并？

git rebase i允许通过以下方式将提交与前一个提交合并squash or fixup 这两个选项都需要至少一次提交pick ed 当一个人想要使用第一个提交但丢弃其提交消息时情况怎么样换句话说如果我希望第一个提交与后续提交合并
Java - 文本字段上的占位符

我正在尝试使用 Swing 创建一个 GUI 我的问题是我有一个文本字段但我希望它有一个占位符就像在 html 中一样我在这里和那里读到它可以通过覆盖文本字段的paint 来完成由于我的代码已生成我发现我需要使用自定义创建代
Flask Restful API url

我正在使用 Flask RESTful http flask restful readthedocs org en latest index html http flask restful readthedocs org en latest
命令中的 Bash 变量扩展[重复]

这个问题在这里已经有答案了 DATE 1 week ago date date DATE 不起作用我怎样才能让它发挥作用我可以做 DATE CMD date date DATE eval DATE CMD 但我不想将整个命令存储在变量中
默认的 jvm 错误日志位置是什么？

如果执行时未指定错误日志位置java cp blah someplace somejar jarjvm错误日志会写入哪里 jvm错误是什么意思如果您引用堆栈跟踪这些将被写入System err这导致standard error str
postgres 数组字段上的 ActiveAdmin 过滤器

我在 ActiveAdmin 中添加了以下过滤器 filter roles as select collection Model ROLES multiple true 但是当我选择过滤器值来搜索角色时它给了我以下错误 PG Invali
ASP.NET Core - 在 Visual Studio 2015 中通过 Docker 调试时出现问题

我在 Visual Studio 中使用 Docker 运行基于 ASP NET Core 构建的应用程序时遇到问题我的应用程序仅使用dnxcore50框架我的project json 文件是 version 1 0 0 compila
Heroku 未使用指定的 Ruby 1.9.3

升级到 Mongoid 3 和 Ruby 1 9 3 尝试在 Heroku Cedar Stack 上使用 Ruby 1 9 3 我已将以下内容添加到 Gemfile 的顶部 source http rubygems org ruby 1
频繁出现“offset out of range”消息，分区被消费者抛弃

我们正在运行 3 节点 Kafka 0 10 0 1 集群我们有一个消费者应用程序它有一个连接到多个主题的消费者组我们在消费者日志中看到奇怪的行为有了这些线 Fetch offset 1109143 is out of range
找不到“ANDROID_HOME”环境变量

我正在尝试构建一个 ionic android 项目并且安装了 android sdk 我的项目名称是myApp 我已经成功将android平台添加到myApp中但是当我尝试构建项目时 myApp sudo ionic build an
需要存储表的属性值以用于空手道中的断言

我有一个情况定位器没有文本值但它的名为 title 的属性有一个我需要断言的文本值在为其编写自定义定位器时我只能获取文本值而不是特定的属性值例如 title abcdd Example div class table cell
如何向 div 添加“闪耀”叠加层？

如何添加如下图所示的漂亮叠加层考虑以下 HTML 我将如何添加这样的覆盖层我知道我可以在它上面使用渐变并对角应用它但我也可以弯曲它吗 div class photostrip div class overlay div img sr
.Equals 上的 C# 泛型方法中的意外行为

为什么 Equals 方法返回与泛型方法不同的结果我认为这里有一些我不明白的自动拳击下面是使用 net 3 5 或 4 0 重现该行为的示例 static void Main string args TimeZoneInfo tzOne
使用 JSTS 缓冲区识别自相交多边形

我希望能够通过 JSTS 无法构造自相交多边形或通过添加缓冲区并在缓冲后测试它们是否是多重多边形来测试自相交多边形但对于某种形状这是行不通的这远远超出了我的几何能力格罗克 a self intersecting shape var p
带条纹的自定义字体 src

以此作为参考https stripe com docs elements reference stripe elements https stripe com docs elements reference stripe elements
如何在 Hibernate 中使用 Oracle 查询提示

我试图在 Hibernate 中使用 Oracle 提示来调用强制索引但在 Hibernate 3 6 10 Final 中没有找到任何合适的 API 我以某种方式尝试了 Hibernate 标准中的预测 proList add Proj
Python 列表切片语法的使用没有明显的原因

我偶尔会看到 Python 代码中使用的列表切片语法如下 newList oldList 当然这与以下内容相同 newList oldList 或者我错过了什么浅拷贝 http en wikipedia org wiki Deep co
dfply：改变字符串列：TypeError

我的 pandas 数据框包含一个文件列它是带有文件路径的字符串我正在尝试使用 dfply 来改变此列例如 resultstatsDF reset index gt gt mutate dirfile os path join o

dfply：改变字符串列：TypeError

dfply：改变字符串列：TypeError 的相关文章

随机推荐

热门标签