为什么 pandas apply 会计算两次

2023-11-27

我正在 panda 的 DataFrame 对象上使用 apply 方法。当我的 DataFrame 有一个列时，应用的函数似乎被调用了两次。问题是为什么？而且，我可以阻止这种行为吗？

Code:

import pandas as pd

def mul2(x):
    print ('hello')
    return 2*x

df = pd.DataFrame({'a': [1,2,0.67,1.34]})
df.apply(mul2)

Output:

hello
hello

0  2.00
1  4.00
2  1.34
3  2.68

我正在从正在应用的函数中打印“hello”。我知道它被应用了两次，因为“hello”打印了两次。更重要的是，如果我有两列，“hello”会打印 3 次。更糟糕的是，当我调用“hello”列时，它打印了 4 次。

Code:

df.a.apply(mul2)

Output:

hello
hello
hello
hello
0    2.00
1    4.00
2    1.34
3    2.68
Name: a, dtype: float64

此行为旨在作为一种优化。

See the docs:

在当前的实现中，apply 在第一次调用 func 两次列/行来决定是否可以采用快速或慢速代码路径。如果 func 有副作用，这可能会导致意外的行为，因为它们对第一列/第一行生效两次。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

apply

为什么 pandas apply 会计算两次的相关文章

如何在 Jupyter Notebook 中运行 Python 异步代码？

我有一些 asyncio 代码在 Python 解释器 CPython 3 6 2 中运行良好我现在想在具有 IPython 内核的 Jupyter 笔记本中运行它我可以运行它 import asyncio asyncio get ev
在 python 3 中使用子进程

我使用 subprocess 模块在 python 3 中运行 shell 命令这是我的代码 import subprocess filename somename py in practical i m using a real fil
PyTorch 给出 cuda 运行时错误

我对我的代码做了一些小小的修改以便它不使用 DataParallel and DistributedDataParallel 代码如下 import argparse import os import shutil import time
ImportError：运行 jupyter Notebook 时没有名为 IPython.paths 的模块？

我通过以下方式安装了 jupyter usr local opt python bin python2 7 m pip install jupyter 这将安装 ipython 版本 4 1 2 但是当我运行 jupyter Notebo
Python tkinter.filedialog Askfolder 干扰 clr

我主要在 Spyder 中工作构建需要弹出文件夹或文件浏览窗口的脚本下面的代码在spyder中完美运行在 Pycharm 中 askopenfilename工作良好同时askdirectory什么都不做卡住了但是如果在调试模式
如何在Python中高效地添加稀疏矩阵

我想知道如何在Python中有效地添加稀疏矩阵我有一个程序可以将大任务分解为子任务并将它们分配到多个 CPU 上每个子任务都会产生一个结果一个 scipy 稀疏矩阵格式为 lil matrix 稀疏矩阵尺寸为 100000x50
Python中列表中两个连续元素的平均值

我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
根据 Pandas 中的列表对多列进行排序

感谢有关如何根据 pandas 中的倍数列表对给定多列进行排序的任何提示如下所示 import pandas as pd sort a a d e sort b s1 s3 s6 sort c t1 t2 t3 df pd DataFra
编辑 Jupyter Notebook 时 VS Code 中缺少“在选择中查找”

使用 Jupyter Notebook 时 VSCode 中缺少在选择中查找按钮它会减慢开发速度所以我想请问有人知道如何激活它吗第一张图显示了在 python 文件中的搜索替换第二张图显示了笔记本电脑中缺少的按钮 Python
使用 Python 计算 Spark 中成对 (K,V) RDD 中每个 KEY 的平均值

我想与 Python 共享这个特定的 Apache Spark 解决方案因为它的文档非常贫乏我想通过 KEY 计算 K V 对存储在 Pairwise RDD 中的平均值示例数据如下所示 gt gt gt rdd1 take 10
如何使用 javascript/jquery/AJAX 调用 Django REST API？

我想使用 Javascript jQuery AJAX 在前端调用 Django Rest API 请求方法是 POST 但当我看到 API 调用它的调用 OPTIONS 方法时所以我开始了解access control allow o
如何从 JSON 响应重定向？

所以我尝试使用 Flask 和 Javascript 上传器 Dropzone 上传文件并在上传完成后重定向文件上传正常但在烧瓶中使用传统的重定向 return redirect http somesite com 不执行任何操作页面
如何在 Azure 数据工厂 - Databricks 中使用 continuation_token 获取 ADF Pipeline 运行详细信息的下一页？

我在用 adf client pipeline runs query by factory resourceGroupName 工厂名称过滤器参数的方法azure mgmt datafactory DataFactoryManageme
Django - 提交具有同一字段多个输入的表单

预警我对 Django 以及一般的 Web 开发非常陌生我使用 Django 托管一个基于 Web 的 UI 该 UI 将从简短的调查中获取用户输入通过我用 Python 开发的一些分析来提供输入然后在 UI 中呈现这些分析的可视
falcon，AttributeError：“API”对象没有属性“create”

我正在尝试测试我的猎鹰路线但测试总是失败而且看起来我把所有事情都做对了 my app py import falcon from resources static import StaticResource api falcon API
带有 RotatingFileHandler 的 Python 3 记录器超出 maxBytes 限制

我使用以下代码来限制日志文件的大小最小示例 import logging from logging handlers import RotatingFileHandler Set up logfile and message loggin
Python问题：打开和关闭文件返回语法错误

大家好我发现了这个有用的 python 脚本它允许我从网站获取一些天气数据我将创建一个文件和其中的数据集有些东西不起作用它返回此错误 File
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4
tkinter：打开一个带有按钮提示的新窗口[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案用户如何按下 tkinter GUI 中的按钮来打开新窗口我只需要非常简单的解决方案如果代码也能被解释那就太好了这

随机推荐

如何更改 Webdriver Firefox 连接到本地主机的端口？

我有一个 selenium webdriver 测试已转换为 Maven 项目我想通过 Jenkins 上的 xvfb 运行它显示选择有问题但我想尝试其他方法例如更改端口这是我得到的错误 org openqa selenium
测量 Windows C++ 的时间、毫秒或微秒 [重复]

这个问题在这里已经有答案了如何在 Windows C 中测量以毫秒或微秒为单位的执行时间我发现许多方法一调用 time NULL 但它仅以秒为单位测量时间而秒时钟 clock t 测量 CPU 时间而不是实际时间我找到了本文提到的
我需要在析构函数中使成员变量无效吗？

为什么人们想要显式清除 dtor 中的 a 向量成员变量请参阅下面的代码清除向量有什么好处即使它会在 dtor 代码的最后一行之后被销毁被处决 class A A values clear private std vector lt
使用 python 从语料库中提取最常用的单词

也许这是一个愚蠢的问题但我在使用 Python 从语料库中提取 10 个最常见的单词时遇到了问题这就是我到目前为止所得到的顺便说一句我使用 NLTK 来读取包含两个子类别的语料库每个子类别有 10 个 txt 文件 import
如何查看Oracle表列字符集？

在Oracle中我们可以使用desc返回每列的列宽是否有任何命令可以检索每列的字符集例如 AL32UTF8 WE8MSWIN1252 非常感谢 Oracle 中的列没有字符集数据库有字符集和国家字符集全部char varchar2
SQL 除以 2 计数()

我有以下查询它试图计算出某种产品占产品总数的百分比 IE 产品数量产品总数百分比 WITH totalCount AS SELECT CAST COUNT id as Integer as totalCount FROM TABLE
使用字段扩展的 Facebook Graph API 调用对于速率限制的计数与批量调用是否不同

我正在寻求优化我的 Facebook 应用程序今天我使用四个图形 API 调用进行批量调用 me me friends me likes me feed 如果我使用字段扩展将其更改为单个图形 API 调用如下所示 me fields
在 Jetpack Compose 中通过字体的上升而不是基线对齐两个文本

我知道如何将 Jetpack Compose 中的文本与基线对齐但现在我需要对齐两个不同大小的文本它们在一个Row by the ascent这两种字体中较大的一个如果有意义的话我想将此视为按顶部基线对齐两个文本 Modifie
偶数和奇数级别子级的选择器

选择偶数和奇数级别子级的正确选择器是什么我想简化当前的 CSS 同时允许无限级别而无需手动为它们编写 CSS box max width 100 margin 25px 0px padding 15px border d1ddbd so
如何为 python 3.0 的仅关键字参数导入 __future__ ？

python2 6中的以下代码抛出语法错误 gt gt gt def f a args c File
AngularJS $promise then() 数据未定义

我正在尝试将数据分配给 scope 变量在我的 promise then 函数内部它显示正确但在函数外部它显示为未定义以下是我的控制器代码 angular module testSiteApp controller TestCon
Max-age和304未修改处理

我一直在研究标准但并不完全确定以下内容如果我们有一个变体资源图像页面等其缓存设置为 max age 259200 3 天并且服务器也在处理 ETag 和上次修改日期那么当 max age 时会发生什么已达到年龄但资源尚未
无法将“Widget”类型的值分配给“PreferredSizeWidget”类型的变量

该程序中有 2 个错误如上图所示 Main dart 文件 void main runApp MyApp class MyApp extends StatelessWidget override Widget build BuildCon
在python中排序并获取文件的uniq行

我总是使用这个命令行来排序并仅获取唯一的行即使对于大文件超过 500 000 行它也很有魅力 sort filename txt uniq sponge filename txt 最短的等效Python代码是 f open filen
在 PHP 中，有没有一种简单的方法可以将变量与多个值进行比较？

基本上我想知道是否有一种方法可以缩短这样的时间 if variable one variable two variable three 这样就可以对变量进行测试或与多个值进行比较而无需每次都重复变量和运算符例如类似的内容可能会有所帮助
::shadowDOM 插槽中嵌套子级的插槽 CSS 选择器[重复]

这个问题在这里已经有答案了 The CSS slotted选择器选择的子项
R ggplot geom_jitter 重复异常值

Q1 我正在使用 ggplot 的 geom boxplot 绘制数据集但是当我尝试使用 geom jitter 绘制所有数据点时数据中的异常值是重复的所有其他数据点都很好哪里有问题示例代码 PeakPeriod 24h lt
如何在剔除映射中使用没有计算属性的 ko.toJs 方法？

我想将 viewModel 转换为 Json 对象但我不想映射计算属性如果您要将其转换为 JSON 这里有一些选项如果您正在为对象使用构造函数那么您可以覆盖 toJSON函数来控制要输出的属性这是一篇关于它的文章 http www
svg stroke-dashoffset 的百分比值的基础是什么

https developer mozilla org en US docs Web SVG Attribute Stroke dashoffset 根据上面的链接 lines dashoffset css 属性接受百分比百分比是多少的值
为什么 pandas apply 会计算两次

我正在 panda 的 DataFrame 对象上使用 apply 方法当我的 DataFrame 有一个列时应用的函数似乎被调用了两次问题是为什么而且我可以阻止这种行为吗 Code import pandas as pd def

为什么 pandas apply 会计算两次

为什么 pandas apply 会计算两次 的相关文章

随机推荐

热门标签

为什么 pandas apply 会计算两次的相关文章