数据框应用不接受轴参数

2024-06-26

我有两个数据框：data and rules .

>>>data                            >>>rules
   vendor                             rule
0  googel                           0 google
1  google                           1 dell
2  googly                           2 macbook

我正在尝试添加两个新列data计算每个供应商和规则之间的 Levenshtein 相似度后的数据帧。所以我的数据框理想情况下应该包含如下所示的列：

>>>data
  vendor   rule    similarity
0 googel   google    0.8

到目前为止我正在尝试执行apply函数将返回我这个结构，但数据框应用不接受axis争论。

>>> for index,r in rules.iterrows():
...     data[['rule','similarity']]=data['vendor'].apply(lambda row:[r[0],ratio(row[0],r[0])],axis=1)
...
Traceback (most recent call last):

File "<stdin>", line 2, in <module>

File "/home/mnnr/test/env/test-1.0/runtime/lib/python3.4/site-packages/pandas/core/series.py", line 2220, in apply
mapped = lib.map_infer(values, f, convert=convert_dtype)
File "pandas/src/inference.pyx", line 1088, in pandas.lib.map_infer (pandas/lib.c:62658)
File "/home/mnnr/test/env/test-1.0/runtime/lib/python3.4/site-packages/pandas/core/series.py", line 2209, in <lambda>
f = lambda x: func(x, *args, **kwds)

TypeError: <lambda>() got an unexpected keyword argument 'axis'

有人可以帮我弄清楚我做错了什么吗？我所做的任何更改都只会产生新的错误。谢谢

您正在呼叫Series的版本apply http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.apply.html对此没有意义axisarg 因此出现错误。

如果你这样做：

data[['rule','similarity']]=data[['vendor']].apply(lambda row:[r[0],ratio(row[0],r[0])],axis=1)

那么这将生成一个单列 df ，这将对其起作用

或者只是删除axis arg:

data[['rule','similarity']]=data['vendor'].apply(lambda row:[r[0],ratio(row[0],r[0])])

update

看看您正在做什么，您需要计算每个规则针对每个供应商的编辑率。

您可以通过以下方式执行此操作：

data['vendor'].apply(lambda row: rules['rule'].apply(lambda x: ratio(x, row))

我认为这应该根据每条规则计算每个供应商的比率。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

apply

数据框应用不接受轴参数的相关文章

如何在redis中使用python删除排序集中的项目

如何使用 python 删除排序集中大于某个值的项目 key foo pipe redis master conn pipeline pipe zadd key 1 a pipe zadd key 2 b pipe zadd key 3 c
从 java 代码运行 Python 脚本

这是我第一次在java中尝试python 我正在尝试从我的代码执行 python 脚本如下所示 Process process Runtime getRuntime exec python C Users username Desktop
如果每个元组中的第二项重复，如何从元组列表中删除元素？

如果每个元组中的第二项重复如何从元组列表中删除元素例如我有一个按第一个元素排序的列表如下所示 alist 0 7897897 this is a foo bar sentence 0 653234 this is a foo bar
在 Python 中解压存档时出现错误

我使用 Python 下载 bz2 文件然后我想使用以下方法解压存档 def unpack file dir file cwd os getcwd os chdir dir print Unpacking file s file cmd
Python 中没有名称属性的表单提交

背景在Python中使用urllib和urllib2 您可以进行表单提交您首先创建一个字典 formdictionary search stackoverflow 然后使用 urllib 的 urlencode 方法来转换这个字典 pa
将 postgres 连接到 django 时遇到问题

以下文档来自Django Postgres 文档 https docs djangoproject com en 4 1 ref databases postgresql notes我添加到我的settings py 在我设置的设置中 DA
python osmnx - 仅提取一个国家的大型高速公路

我知道可以通过 OSMNX python 包提取城市的道路网络详情请参阅https geoffboeing com 2016 11 osmnx python street networks https geoffboeing com 20
python 函数中的对象不可迭代错误

我有一个简单的功能如下 comdList range 0 27 for t in comdList print t 但是它返回一个 in object not iterable 错误在函数之外它工作正常这是怎么回事尝试这个 for t
dask分布式内存错误

在分布式作业上运行 Dask 时我在调度程序上遇到以下错误 distributed core ERROR Traceback most recent call last File usr local lib python3 4 dist
Python父类访问子私有变量

以下代码会生成错误 class A object def say something self print self foo print self bar class B A def init self self foo hello sel
基于 Pandas 中特殊字符分隔列中的每个项目进行聚合

我输入的数据如下 Date Investment Type Medium 1 1 2000 Mutual Fund Stocks Fixed Deposit Real Estate Own Online Through Agent 1 2
过滤给定范围内的坐标

我有数百个带有地理位置的 out 文件我将把它们批量导入到 SQLite 数据库中但是为了节省时间我只会导入地理坐标在某些间隔内的线文件是这样的 value value longitude latitude value value
如何为 R 中接下来的 2 个单元格复制相同的列值[重复]

这个问题在这里已经有答案了我正在尝试使用 R 为列中接下来的 2 个单元格复制相同的列值我有以下形式的数据框 Time World Cate Data 1994 Africa A 12 1994 B 17 1994 C 22 1994
折叠 numpy 数组除前两个维度之外的所有维度

我有一个可变维度的 numpy 数组例如它可以具有以下形状 64 64 64 64 2 5 64 64 40 64 64 10 20 4 我想要做的是如果维数大于 3 我想将其他所有内容折叠堆叠到第三维中同时保留顺序因此在我上面
numpy.polyval() 的反函数

我想知道 np polyval 是否有一个方便的反函数我在其中给出 y 值并求解 x 我知道我可以做到这一点的一种方法是 import numpy as np Set up the question p np array 1 1 10 y
Python - 从一定范围内随机采样，同时避免某些值

我一直在阅读有关random sample 函数在random模块但没有看到任何可以解决我的问题的东西我知道使用random sample range 1 100 5 会给我来自人群的 5 个独特样本我想得到一个随机数range
Spacy-nightly (spacy 2.0) 问题“thinc.extra.MaxViolation 大小错误”

显然成功安装了 spacy nightly spacy nightly 2 0 0a14 和英语模型 en core web sm 后我在尝试运行它时仍然收到错误消息 import spacy nlp spacy load en core
Maya python 连接选择的属性

我一直在尝试制作一个简单的脚本它将采用两个视口选择然后基本上将第二个视口的旋转连接到第一个我不确定如何正确地从视口选择中为对象创建变量这是我的尝试但不起作用 import maya cmds as cmds sel cmds ls
Python - 将列表作为参数传递给 SQL，以及更多变量

我试图在 python 3 6 中将未知数量的参数传递给 SQL Server 这是我使用 pypyodbc 的代码 cursor cnxn cursor theargs 1033286869 1053474957 1063654630 1
如何限制单元测试的最大运行时间？

我目前正在运行一些单元测试这些测试可能需要很长时间才能失败或无限期地运行在成功的测试运行中它们总是会在一定的时间内完成是否可以创建一个 pytest 单元测试如果在一定时间内未完成该测试就会失败您可以安装 pytest tim

随机推荐

Flask-SQLAlchemy 构造函数

在 Flask SQLAlchemy 教程中定义了 User 模型的构造函数 from flask import Flask from flask ext sqlalchemy import SQLAlchemy app Flask na
Android 使用键盘上的“完成”按钮来单击按钮

好的在我的应用程序中我有一个供用户输入数字的字段我已将该字段设置为仅接受数字当用户单击该字段时它会弹出键盘键盘 ICS 上上有一个完成按钮我希望键盘上的完成按钮能够触发我的应用程序中的提交按钮我的代码如下 package
Entity Framework 5 Code First - 如何“重新开始”？

我一直在我的应用程序中成功使用 EF 5 Code First 我大约有40张桌子但是我遇到了一个问题我似乎可以正确处理迁移所以我想做的就是以某种方式告诉 EF 将数据库的当前模式视为一个新的起点并从这个点开始管理它这样我可
检查输出是否重定向

我有一个用 C 编写的控制台应用程序它处理一些数据然后打印结果在结果可用之前会有一个小动画和不断更新的进度百分比 xx 显然如果用户重定向我的应用程序的输出这将被打印到输出重定向到的文本文件中如果可能的话我想避免这种情况那么
C++ 17 编译器 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有可以运行 C 17 代码的在线地方因为我想学习新功能 https github com Anth
R 中具有 NA 值的聚合栅格

我在 R 中有一个分辨率为 1 公里的栅格其 NA 值分布广泛但位置不规则即包含数据的单元格不连续并且 NA 值分散我正在尝试使用用户定义的平均圆角函数包括在下面以 5 公里分辨率因子 5 聚合此栅格使用 raster
“代理人没有身份”是什么意思？

我成功关注了这些说明 https help github com articles generating ssh keys 来自 GitHub 关于如何生成 SSH 密钥的信息我与 GitHub 的连接成功但是当我稍后想检查我的 SSH
将互操作颜色转换为 System.Drawing.Color

我正在寻找如何在 C 中将 Microsoft Office Interop Word Excel PowerPoint Color 转换为 System Drawing Color 我在这个论坛发现了相反的情况here https sta
椭圆形留下痕迹

我正在尝试制作一个简单的球动画从面板的一个角开始到另一个角我为此编写了一个程序当我运行程序时oval or ball留下踪迹我的意思是说当程序运行时它会留下颜色痕迹在我的程序中timer每 100 毫秒触发一个事件以下是负
“伊甸园空间”的名字起源于垃圾收集

在垃圾收集术语中为什么它被称为伊甸园空间就这样我还在熟悉这个术语我不明白为什么它有这样的名字伊甸园空间是创建对象的地方他们的生活都很幸福但最终他们被小天使赶到了年轻一代和老一代的荒野中他们永远不会被允许回到伊甸园空间他们
Python中Shift和Caps Lock的状态

我正在使用 Python 2 5 编写 TkInter 应用程序我需要找出大写锁定和 Shift 键的状态 true 或 false 我在整个网络上进行了搜索但找不到解决方案 Tkinter 中的键盘事件可能很棘手我建议您按顺序查看以
在 python 中更改函数的 __qualname__ 时会发生什么？

为了能够pickle嵌套函数用于多重处理我用装饰器装饰了嵌套函数 def globalize one func def wrapper one args kwargs return func args kwargs setattr mo
Window Defender 想要重置您的设置”-ChromeDriver 2.29 问题：Chrome 浏览器以新选项卡打开

Chrome Browser open up with a new Tab asking for Window defender wants to reset your setting 请帮我解决这个问题这发生在 chrome v 57
STL容器：构造函数的分配器参数和作用域分配器

STL 容器有一个模板参数来选择自定义分配器花了一段时间但我想我明白它是如何工作的不知怎的这并不是很好因为给定的分配器类型不直接使用而是反弹到另一种类型的分配器我终于可以使用它了读完后API http en cpprefer
有java中公钥加密的教程吗？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我已经能够找到有关对称加密和散列的信息但在查找有关 java 的任何类型的公钥加密的大量信息时遇到了
如何通过 SSH 连接到 Docker？

我想创建以下基础架构流程使用 Docker 如何实现这一点首先您需要在要通过 ssh 访问的映像中安装 SSH 服务器您可以为所有安装了 ssh 服务器的容器使用基础映像然后您只需运行每个容器将 ssh 端口默认 22 映射
使用 Electron 打开外部文件

我有一个正在运行的 Electron 应用程序到目前为止运行良好对于上下文我需要运行打开一个外部文件该文件是一个 Go lang 二进制文件它将执行一些后台任务基本上它将充当后端并公开 Electron 应用程序将使用的 AP
在时间序列线图上绘制点

我有这个数据框我想绘制它的线图正如我所绘制的 Graph is 生成的代码是 fig ax plt subplots figsize 15 5 date time pd to datetime df Date df df set ind
多对多关系中的 KVO 对象属性

我有一个核心数据对多关系由父 gt 子组成我想设置一个键值观察机制以便当任何子对象上的属性例如 firstName lastName 发生更改时它会触发通知使用标准 KVO 语法时 self parentObject addOb
数据框应用不接受轴参数

我有两个数据框 data and rules gt gt gt data gt gt gt rules vendor rule 0 googel 0 google 1 google 1 dell 2 googly 2 macbook 我正在

数据框应用不接受轴参数

数据框应用不接受轴参数 的相关文章

随机推荐

热门标签

数据框应用不接受轴参数的相关文章