Pandas groupby 然后应用 to_dict('records')

2023-12-10

假设我有以下数据框：

df = pd.DataFrame({'a': [1,1,1,2], 'b': ['a', 'a', 'b', 'c'], 'd': [1, 2, 3, 4]})

我想以下面的句子结束：

{1: [{'b':'a', 'd': 1}, {'b': 'a', 'd': 2}, {'b': 'b', 'd': 3}], 2: [{'b': 'c', 'd': 4}]}

基本上，我想分组a对于我想应用的每个数据框to_dict('records').

我尝试的是以下内容：

# dict ok but not a list 
df.groupby('a').agg(list).to_dict('index')
{1: {'b': ['a', 'a', 'b'], 'd': [1, 2, 3]}, 2: {'b': ['c'], 'd': [4]}}

# the index disappears
df.groupby('a').agg(list).to_dict('records')
[{'b': ['a', 'a', 'b'], 'd': [1, 2, 3]}, {'b': ['c'], 'd': [4]}]

df.set_index('a').to_dict('index')
ValueError: DataFrame index must be unique for orient='index'

我想我可以使用 for 循环来做到这一点，但我几乎确定有一种 pythonic 方法可以做到这一点。

这是一种使用方法groupby() and apply()

df.groupby('a').apply(lambda x: x[['b','d']].to_dict('records')).to_dict()

Output:

{1: [{'b': 'a', 'd': 1}, {'b': 'a', 'd': 2}, {'b': 'b', 'd': 3}],
 2: [{'b': 'c', 'd': 4}]}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Pandas groupby 然后应用 to_dict('records') 的相关文章

Django：NoReverseMatch at /'myapp'不是注册的命名空间

我在模板渲染期间遇到此错误我想做的是允许用户上传 csv 然后将数据处理到模型中第 109 行出错 myapp 不是已注册的命名空间这是我的第 109 行代码
使用 selenium 和 python 在网页网格中抓取 javascript 数据

我的问题是我需要包含网站子域的网格中的所有数据https applipedia paloaltonetworks com https applipedia paloaltonetworks com 包含名称类别子类别风险技术的数据
Django表单中的隐藏字段不在cleaned_data中

我有这个表格 class CollaboratorForm forms Form user forms CharField label Username max length 100 canvas forms IntegerField wi
为什么Flask后台线程获取错误的数据库信息？

为了将实时数据库信息推送到客户端我在服务器端使用flask socketio 通过使用websocket将所有实时数据库信息推送到客户端我的视图文件有一个片段 from models import Host from flask soc
使用 Python 访问内存映射文件

我希望利用激战 2 中的内存映射文件该文件旨在链接到 Mumble 以获得位置音频该文件包含有关字符坐标的信息和其他有用的信息我已经能够使用此脚本访问坐标信息 import mmap import struct last while
并行执行按位运算的代码

我有这段代码通过将该 AU 矩阵的每个字节 8 个元素打包到 A 中来减少内存消耗从而使 100k 200k 矩阵占用更少的空间正如您所期望的这段代码需要永远运行我也计划将行数增加到 200k 我正在一个非常强大的实例 CPU 和
为什么 scikit-learn SVM.SVC() 非常慢？

我尝试使用SVM分类器来训练大约10万个样本的数据但我发现它非常慢甚至两个小时后也没有任何反应当数据集有大约 1k 个样本时我可以立即得到结果我还尝试了 SGDClassifier 和朴素贝叶斯速度相当快几分钟内就得到了结果
为什么我的字符串中出现不需要的换行符？

这应该很简单这很愚蠢但我无法让它发挥作用我有一个在读取文件时定义的标头 if gene env in line or gene HIV2gp7 in line header line 现在这个标题看起来像 gt lcl NC 0018
Python 中没有名称属性的表单提交

背景在Python中使用urllib和urllib2 您可以进行表单提交您首先创建一个字典 formdictionary search stackoverflow 然后使用 urllib 的 urlencode 方法来转换这个字典 pa
如何在 Google App Engine (Python) 中定义配置变量/常量？

我是 python GAE 的新手想知道如何快速定义和使用全局设置变量所以说你 git 克隆我的 GAE 应用程序然后打开config yaml 添加更改设置应用程序就全部连接起来如下所示 config yaml or whate
如何向 Jupyter (ipython) 笔记本自动添加扩展？

我已经安装了扩展 calico document tools 我可以使用以下命令从 Jupyter 笔记本中加载它 javascript IPython load extensions calico document tools 如何为每个
将列表列表替换为“压缩”列表列表，同时保持顺序

我有一个列表列表如我所附的代码所示如果有任何共同值我想链接每个子列表然后我想用列表的精简列表替换列表的列表例子如果我有一个清单 1 2 3 3 4 I want 1 2 3 4 如果我有 4 3 1 2 3 I want 4 3
构建wheel失败/“错误：INCLUDE环境变量为空”

我正在使用 Python 2 7 11 并尝试 pip install 模块但是其中一些模块失败了我收到的消息是无法为 X 构建轮子和错误包含环境变量为空我尝试安装 Scrapy LXML 和 Twisted 但都失败了我尝
python请求ssl握手失败

每次我尝试这样做 requests get https url 我收到这条消息 import requests gt gt gt requests get https reviews gethuman com companies Trace
pip 升级到 pip 10.x.x 后解析需求文件的正确方法？

所以今天我确实发现随着发布pip 10 x x the req软件包更改了其目录现在可以在下面找到pip internal req 由于通常的做法是使用parse requirements功能在你的setup py从需求文件中安装所有依赖
Python httplib 和 POST

我目前正在使用别人编写的一段代码它用httplib向服务器发出请求它以正确的格式提供所有数据例如消息正文标头值等问题是每次尝试发送 POST 请求时数据都在那里我可以在客户端看到它但没有任何内容到达服务器我已经阅读了库规
Spacy-nightly (spacy 2.0) 问题“thinc.extra.MaxViolation 大小错误”

显然成功安装了 spacy nightly spacy nightly 2 0 0a14 和英语模型 en core web sm 后我在尝试运行它时仍然收到错误消息 import spacy nlp spacy load en core
如何使用 opencv python 根据检测到的物体的位置生成其热图

我需要根据对象的位置生成其热图示例视频帧中检测到的绿色球如果它长时间停留在某个位置那么该位置应该是红色的并且球在短时间内经过的帧中的位置必须是蓝色的这样我就需要生成热图提前致谢那么你在这里可以做的是 1 首先定义一个热图作为
如何让 Python 生成器返回 None 而不是 StopIteration？

我使用生成器在列表中执行搜索如下简单示例 gt gt gt a 1 2 3 4 gt gt gt i for i v in enumerate a if v 4 next 3 只是为了稍微说明一下示例与上面的列表相比我使用的列表要长得
定义Python类时，如何在其中设置随机变量？

假设我有一个名为Person 其中只有该人的姓名和性别性别应从男性和女性中随机选择为此我导入random randint 功能根据随机int确定随机性别 import random class Person alias random

随机推荐

XSLT 转换为 xml，按键分组

我在编写 xsl 将 xml 转换为 raport 版本时遇到问题看起来像这样
使用反射将属性动态转换为其实际类型（其中实际类型是通用的）

这是一个略有不同的问题here 我将相同的代码修改为我的需要如下所示 using System using System Collections Generic using System Linq using System Reflect
由于类型转换而未使用索引？

由于对特定表进行全表扫描我有一个进程表现不佳我计算了统计数据重建了现有索引并尝试为此表添加新索引但这并没有解决问题隐式类型转换可以停止使用索引吗其他原因又如何呢全表扫描的成本比索引查找的成本大约高 1000 EDIT SQL语
从 parse.com 检索图像

我不知道这是否可能但我认为这是可能的但我不知道该怎么做我只是想从 parse com 加载图像就像从 parse com 检索对象一样我应该像从 parse com 获取字符串一样进行操作吗我刚刚找到了如何在解析时保存图像但没
如何制作输出目录选择面板？

您好我正在尝试制作一个窗格在我的计算机中显示类似 Windows 资源管理器的内容当用户完成操作后当他想要将编辑后的图像保存在磁盘上的特定位置时他可以轻松地从该窗格中选择目录我想设计这样的东西可以做类似的事情吗我的图片编辑器
pandas pytables 附加：性能和文件大小的增加

我有500多个PyTables每个存储大约包含 300Mb 的数据我想使用 pandas 将这些文件合并到一个大商店中append如下面的代码所示 def merge hdfs file list merged store for fil
如何将 rubygem 条件要求添加到 gem 规范中？

仅当用户使用特定版本的 ruby 时才可以添加 gem 依赖项吗背景我正在研究一个项目的分支使用 Test Unit Autorunner 等它们是 ruby 1 8 中标准库的一部分但不是 1 9 1 中标准库的一部分而是位于
python 列表，向列表添加一些内容会改变整个内容？

所以我试图在Python中实现选择排序并且我将每次迭代的结果附加到一个列表中以在最后打印我的代码正确地对数字列表进行排序但是当我将它附加到最后的同一个列表中时更改所有其他列表 def s sort numbers alist do a
计算出勤时间差

我有一个包含以下示例输出的表格 UserID Checktime CheckStatus 3175 2013 12 22 07 02 10 000 I 3175 2013 12 22 13 01 01 000 O 3175 2013 12
针对特定图像的 CSS

我正在寻找一种使用 CSS 定位特定图像的方法如果可能的话我正在运行一个 CMS 用户可以在其中上传图像并将其放在他们的页面上我想要一种定位具有特定尺寸的图像的方法所以问题是你可以让 css 行针对具有特定尺寸规格的图像或对象吗
使用 LocalStorage 保存和加载购物车

我有以下代码 inames iqtyp iprice function bestel inames push document getElementById artikel innerHTML iqtyp push parseInt doc
C - strtok(...) 上出现意外的分段错误

我正在使用库的 strtok 它似乎工作正常直到结束条件它导致分段错误和程序崩溃 API 声称当找不到更多标记时 strtok 将输出 NULL 这意味着我认为您必须捕获此 NULL 才能终止使用 strtok 运行的任何循环我
Android 来电事件

我想创建一个 onCall 事件我已经知道没有这样的方法但基本上我想做的是当接到来电时弹出 Toast 或其他任何内容任何类型的教程或示例代码都会有帮助多谢 Use PhoneStateListener它已经重写了方法onCal
如何确定 ARM 处理器是运行在通常的锁定“世界”中还是运行在 Secore“世界”中？

例如 virt what显示您是否在硬件虚拟化沙箱内运行如何检测您是否在 ARM TrustZone 沙箱中运行信任区也许与你想象的不同有一系列模式从可信功能的简单 API 到在每个世界中运行的双操作系统如果该问题有更多背
Objective-C：正确保留 3 位小数

我正在尝试将浮点值降低到小数点后第三位例如值 2 56976 应为 2 569 而不是 2 570 我搜索并找到了这样的答案向下取小数点后两位数这样的答案并不准确例如代码 double value double unsigned
序列化静态类？

如果我们序列化静态类会发生什么如果我们序列化静态类是否可以创建多个静态类实例 Serializable public static class MyClass public static MyClass public static bo
PHP 用 vars 替换字符串中的通配符（%s、%d）

我有翻译功能t var function t word return this gt words word where this gt words是数组 this gt words array word1 gt word word2 gt
如何打印一年中的所有星期（或一年中的第一个星期一）

如何打印从星期一开始到星期日结束的所有周如下所示使用 Zend date 1 04 Jan 2010 10 Jan 2010 2 11 Jan 2010 17 Jan 2010 3 18 Jan 2010 24 Jan 2010 首先找
MYSQL 选择往复数据？

我有一张桌子叫Follow 具有三个字段 Id 自动增量整数用户ID 整数关注整数如果我有这样的数据 ID UserId Following 1 2 3 2 3 2 3 2 5 4 2 6 5 3 5 我如何找到用户 2 的朋友即
Pandas groupby 然后应用 to_dict('records')

假设我有以下数据框 df pd DataFrame a 1 1 1 2 b a a b c d 1 2 3 4 我想以下面的句子结束 1 b a d 1 b a d 2 b b d 3 2 b c d 4 基本上我想分组a对于我想应用的每

Pandas groupby 然后应用 to_dict('records')

Pandas groupby 然后应用 to_dict('records') 的相关文章

随机推荐

热门标签