python 字典理解如何与内部的 lambda 函数一起工作

2024-01-31

我的目标是使用以下方法聚合 pandas DataFrameGroupBy 对象agg https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.core.groupby.DataFrameGroupBy.aggregate.html功能。

为了做到这一点，我正在生成一个字典，我将使用 dict 解包将其解包为 kwargs**dict。该字典需要包含新列名作为键和元组作为值。元组的第一个值是列名，该列名被压缩为一个系列，并作为第二个值的输入lambda series: ....

agg_dict = {
   f"{cat_name}_count": ('movement_state', lambda series: series.value_counts()[cat_name]) 
   for cat_name in ml_data['category_column'].cat.categories
}

# Aggregating
agg_ml_data = ml_data.groupby(['col1', 'col2']).agg(**agg_dict)

现在实际发生的事情对我来说有点奇怪。

假设：

ml_data['category_column'].cat.categories

Index(['cat1', 'cat2', 'cat3'], dtype='object')

一组的正确值计数是

one_group['category_column'].value_counts()

     | category_column
cat1 | 2
cat2 | 9
cat3 | 6

一组的预期输出：

cat1_count	cat2_count	cat3_count
2	9	6

一组的实际输出

cat1_count	cat2_count	cat3_count
6	6	6

不知何故，python 执行 lambda 函数的 dict 理解并不像预期的那样，并且仅使用最后一个类别值cat3索引时series.value_counts()[cat_name]。我希望 lambda 函数是像字典本身一样创建的。关于如何解决这个问题有什么想法吗？

这是一个经典的Python陷阱。

当您使用自由变量时（cat_name，在本例中）在 lambda 表达式中，lambda 捕获名称指的是哪个变量，而不是该变量的值。所以在这种情况下，lambda“记住”cat_name是“该字典理解的循环变量”。当调用 lambda 时，它会查找“该字典理解的循环变量”的值，现在，由于字典理解已经完成，该值仍保留在列表的最后一个值。

解决此问题的通常方法是使用默认参数来“冻结”该值，例如

lambda series, cat=cat_name: series.blah[cat]

有效地使用一个陷阱（Python 在函数定义时计算默认参数）来爬出另一个陷阱。 :-)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Lambda

dictionarycomprehension

python 字典理解如何与内部的 lambda 函数一起工作的相关文章

加快 pandas groupby 中的滚动总和计算

我想按组计算大量组的滚动总和但我很难快速地完成它 Pandas 内置了滚动和展开计算器的方法这是一个例子 import pandas as pd import numpy as np obs per g 20 g 10000 obs g
将 Python 脚本导入另一个脚本？

我正在阅读 Zed Shaw 的艰难学习 Python 正在学习第 26 课在本课中我们必须修复一些代码这些代码从另一个脚本调用函数他说我们不必导入它们来通过测试但我很好奇我们将如何做到这一点课程链接 http learnpy
使用 lxml 和 xpath 解析 xml 文件时如何保留 &

我试图从输入 xml 文件中提取一些信息并使用 lxml 和 xpath 指令将其打印到输出文件中我在读取如下所示的 xml 标签时遇到问题
Pycharm 出现 Kivy 错误 [严重] [应用程序] 无法获取窗口，中止

我正在尝试让示例 Kivy 代码之一在我的机器上运行我使用的是 Pycharm 社区版 2017 1 安装了 anaconda python 2 7 和 Kivy 1 9 我已使用项目设置将 Kivy 模块和 Pygame 模块安装到项目
AWS AppSync 授权

我计划使用 AWS Appsync 迁移 lambda 函数中的 graphQL 终端节点该函数由 API 网关的 POST 触发我研究 AppSync 主要是因为订阅我无法使用 Lambda 函数创建订阅我的身份验证机制基于 Au
为什么del是Python中的指令而不是方法？ [复制]

这个问题在这里已经有答案了为什么Python的创建者更喜欢这种语法指令 del list index 超过这个方法 list del index 在我看来这del属于同一类别 append remove find ETC 因此应该
我怎样才能用Python中的语音识别来检测一个单词

我知道如何用 Python 检测语音但这个问题更具体如何让 Python 只监听一个单词然后如果 Python 可以识别该单词则返回 True 我知道我可以让 Python 一直监听然后做出类似的东西伪代码 while True
如何缩放图像的一部分并插入到 matplotlib 中的同一图中

我想缩放数据图像的一部分并将其绘制在同一个图中看起来有点像这个图是否可以在同一图中插入缩放图像的一部分我认为可以用子图绘制另一个图形但它绘制了两个不同的图形我还阅读了添加补丁以插入矩形圆形但不确定将图像的一部分插入到图中是否
将 *.appspot.com 重定向到自定义域：Google 应用引擎 (Django)

我直接将我的一些示例代码放在这里以获得更好的了解 url py r robots txt myapp views robots r myapp views home views py def home request my code ret
使用 Python 访问 MP3 音乐数据

我正在尝试编写一个 Python 脚本用于使用歌曲的数据作为比较的基础来搜索重复的 mp3 4 文件我的情况涉及许多文件名相似但 ID3 标签不同的 mp3 4 文件起初我尝试循环并使用 md5 来查找重复文件忽略文件名当然当
在 python 中以半小时为增量创建选择列表

我正在尝试创建一个
如何将字符串转换为二进制？

我需要一种方法来获取 python 中字符串的二进制表示形式例如 st hello world toBinary st 是否有一个模块可以以某种巧妙的方式执行此操作像这样的东西吗 gt gt gt st hello world gt g
使用 Keras 时，验证集中未见的类别会出现错误

我有由数值变量和分类变量组成的数据分类变量有很多类别因此我使用嵌入来表示这些类别我的模型是一个简单的神经网络我知道当你定义嵌入层时你需要通过input dim number of categories 1为了解释训练中看不见的类别
从 Python 调试 C 库 (ctypes)

我有一个使用 ctypes 和 C 共享库 dll 文件的 Python 程序作为 IDE 我使用 Eclipse 其中将开发两个项目 C 共享库和使用它的 python 程序我的想法是当我在调试模式下启动Python程序时我可以
在 C++ 中运行 python [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个用 C 编写的应用程序和一个测试系统也是用 C 编写的测试系统非常复杂并且很难改变我只想做一些小的改变我的班级是这样的
无法使用 pandas 获取平均日期

我有一个时间序列数据集我想从中获取平均日期这是一个人为的示例显示 pandas datetime64 对象的溢出错误 import pandas as pd import numpy as np rng pd date range 2
异常：AttributeError：使用 Azure Function 和 Python 的“DefaultAzureCredential”对象没有属性“signed_session”

我编写了一个运行 Python3 的 Azure 函数来简单地打开 Azure VM 该函数应用程序具有系统分配的托管标识我已为其授予 VM 贡献者角色为了让该函数使用托管标识我使用了 DefaultAzureCredential 类
在 Django 1.7 中使用 html 发送电子邮件

In 发送邮件我们有一个新参数 html message Docs https docs djangoproject com en dev topics email send mail I have 电子邮件 html文件我想发送我的消
Discord-py Rewrite - Cog 中的基本 aiohttp Web 服务器

我正在尝试将基本的 aiohttp 网络服务器集成到 Cog 中使用 discord py 重写我对齿轮使用以下代码 from aiohttp import web import discord from discord ext imp
python函数中的Return语句不返回任何内容[重复]

这个问题在这里已经有答案了我不明白退货和打印之间的区别有人告诉我应该在函数语句中使用 return 但它不会返回任何内容所以我一直在函数中使用 print 但我想了解为什么我的函数中的 return 语句不起作用 def triang

随机推荐

如何以非交互方式为 PostgreSQL 的 createb 提供密码？

我在 phing 中有一个任务在测试之前我会删除数据库如果存在并创建它这是在詹金斯上运行的我想用 createdb 来做到这一点如下所示
如何将张量流对象包装为 Keras 层？

我想将分层多尺度 LSTM 实现为 Keras 层已发表here https arxiv org pdf 1609 01704 pdf并在张量流中实现here https github com n s f hierarchical rnn
Googlebot 什么时候执行 JavaScript？

我在多个域上有一些单页 Web 应用程序它们严重依赖 javascript ajax 来获取和显示内容根据日志和搜索结果我可以看出 googlebot 在某些域上运行 javascript 但在其他域上则不运行在某些平台上它索引了
带有智能客户端 Winform 应用程序的 IoC/DI 框架：我应该如何处理这个问题？

我正在启动一个新的 Winforms 应用程序并且打算使用 IoC DI 框架可能是 Ninject 但我也在考虑 StructureMap 和 LinFu 似乎几乎每个使用 IoC DI 的人都是在基于 Web 的环境中这样做并且几
Django Admin 媒体文件在 Google App Engine 上的位置

我正在使用 Python 2 7 和 Django 1 3 运行 GoogleAppEngine GAE 1 6 3 方法是 libraries name django version 1 3 in my app yaml 以下内容应在 u
将复合 java 对象转换为 CSV

我有一个对象例如 Response java 如下所示 class Response private User user has firstName lastName age etc private Address address has
警告（不合时宜）：将 void(*)(int) 分配给 extern "C" void(*)(int)

我在使用 Sun 的 C 编译器时遇到问题我读过甲骨文的使用函数指针来自 C http www oracle com technetwork articles servers storage dev mixingcandcplusplu
TFS - 从本地工作副本创建分支

我正在尝试从已签出项目的本地工作区创建一个分支基本背景我从项目的主干中签出并进行了很多更改我现在想将这些更改签入新分支我从源代码管理中创建了一个新分支但我的工作区仍然映射到主干我按照我在这里找到的一篇文章中的步骤进行操作从
如何根据给定的视频 url 从 Youtube API 获取 Youtube 视频 ID？

我有一个页面用户可以在其中粘贴 Youtube 视频网址然后我需要提取视频的 ID 才能获取视频的缩略图困难的部分是找到一种从视频 URL 中提取视频 ID 的可靠方法这里有很多正则表达式解决方案但对我来说这些都不是 100 可
如何正确声明 Font 变量？ [复制]

这个问题在这里已经有答案了我有一个简单的问题谁能告诉我这行有什么问题 Font printFont gcnew System Drawing Font Arial 10 我的编译器说标识符 printFont 无法识别我还包含命名空
在 Windows 上获取鼠标光标位置和按钮状态

在 Windows Windows 7 及更高版本上获取鼠标光标位置或按钮状态的最合适方法是什么我以前使用过 DirectInput 但我不再使用它并且不想使用它我看到有 GetCursorPos 但是我没有看到任何用于获取鼠标按钮
NetworkX 中的图排列和旋转

l 与 Networkx 合作生成某种类型的图表现在我想排列节点并旋转图形 80 90 120 度我怎样才能申请排列 and rotation在带有 NetworkX 的图表上 Edit 1 给定图的邻接矩阵我希望以保留边和顶点链接的
如何从模型中获取 Zend\Db\Adapter 实例？ (ZF2)

我正在创建用于管理数据库实体的抽象模型我已经有了EntityAbstract EntitySetAbstract and a ManagerAbstract楷模在我的 ManagerAbstract 模型中我需要一个Zend Db A
显示键盘后离开应用程序时出现快照错误（需要 afterScreenUpdates:YES）

我目前正在启动一个新的测试项目用于通过单独的模式视图导入客户端证书该应用程序始终以主视图视图开始主视图 https i stack imgur com xtFsC png 我有一些虚拟元素来测试连接是否有效一旦用户将文件添加
如何正确授权对 Google Cloud Storage API 的请求？

我正在尝试使用 Google Cloud Storage JSON API 通过 http 调用从存储桶中检索文件我从与存储桶相同的项目中的 GCE 容器中进行卷曲并且服务帐户具有对该存储桶的读取访问权限以下是请求的模式 https
java.lang.NoSuchMethodError：没有为 HttpClientResponse 执行虚拟方法

当我在启动后尝试运行该应用程序时它在 logcat 中显示异常如下所示 java lang NoSuchMethodError No virtual method execute Lorg apache http client meth
显示和隐藏 Windows 10 屏幕键盘 (osk.exe) 时遇到问题

我一直在尝试获取屏幕键盘 osk exe 在 Windows 10 上从我的应用程序中出现和消失我的应用程序在 Windows 7 中运行良好 ShellExecute on osk exe会在那里显示键盘但尝试在 Windows 1
确定字符串是否是有效的地理位置

我有一堆位置有些是准确的哈博罗内博茨瓦纳有些是地理编码 40 75 73 997 有些是完全无用的 siliconcape 我需要找到一种方法来运行列表并确定每个字符串和地理编码的城市和国家地区并为无效位置返回空值是否有某种
RequireJS：多个 main.js？

我一直在使用 requireJS 构建一个单页应用程序到目前为止我很喜欢它我已经到了在主应用程序之外开发网站其他部分的阶段但我不太确定如何或是否为此使用 requireJS 在我的主应用程序中一切都是由这个脚本标签触发的
python 字典理解如何与内部的 lambda 函数一起工作

我的目标是使用以下方法聚合 pandas DataFrameGroupBy 对象agg https pandas pydata org pandas docs stable reference api pandas core groupby

热门标签