将包含字典列表的列转换为 pandas 数据框中的多列

2023-11-23

我有一个 Pandas 数据框，如下所示：

pd.DataFrame({'a':[1,2], 'b':[[{'c':1,'d':5},{'c':3, 'd':7}],[{'c':10,'d':50}]]})
Out[2]: 
   a                                         b
0  1  [{u'c': 1, u'd': 5}, {u'c': 3, u'd': 7}]
1  2                    [{u'c': 10, u'd': 50}]

如果“b”中有多个元素，我想扩展“b”列并重复“a”列，如下所示：

Out[2]: 
   a   c   d
0  1   1   5
1  1   3   7
2  2  10  50

我尝试在每一行上使用 apply 函数，但没有成功，显然是 apply 将一行转换为一行。

您可以使用concat with list comprehension:

df = pd.concat([pd.DataFrame(x) for x in df['b']], keys=df['a'])
       .reset_index(level=1, drop=True).reset_index()

print (df)
   a   c   d
0  1   1   5
1  1   3   7
2  2  10  50

EDIT:

如果索引是唯一的，则可以使用join对于所有列：

df1 = pd.concat([pd.DataFrame(x) for x in df['b']], keys=df.index)
        .reset_index(level=1,drop=True)
df = df.drop('b', axis=1).join(df1).reset_index(drop=True)
print (df)
   a   c   d
0  1   1   5
1  1   3   7
2  2  10  50

我尝试简化解决方案：

l = df['b'].str.len()
df1 = pd.DataFrame(np.concatenate(df['b']).tolist(), index=np.repeat(df.index, l))
df = df.drop('b', axis=1).join(df1).reset_index(drop=True)
print (df)
   a   c   d
0  1   1   5
1  1   3   7
2  2  10  50

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

将包含字典列表的列转换为 pandas 数据框中的多列的相关文章

for 循环如何评估其参数

我的问题很简单 Does a for循环评估它每次使用的参数 Such as for i in range 300 python 是否会为此循环的每次迭代创建一个包含 300 个项目的列表如果是的话这是避免这种情况的方法吗 lst ra
Python从int到string的快速转换

我正在用 python 求解大量阶乘并发现当我完成计算阶乘时需要相同的时间才能转换为字符串以保存到文件中我试图找到一种将 int 转换为字符串的快速方法我将举一个计算和 int 转换时间的例子我正在使用通用的 a str a 但感
Jupyter Notebooks 不显示进度条

我正在尝试在 Jupyter 笔记本中显示进度条这是一台新电脑我通常做的事情似乎不起作用 from tqdm import tqdm notebook example iter 1 2 3 4 5 for rec in tqdm not
如何使用显式引用转储 YAML？

递归引用非常适合ruamel yaml or pyyaml ruamel yaml dump ruamel yaml load A A id001 id001 然而它显然不适用于普通引用 ruamel yaml dump ruamel
使用 Django Rest 保存 Base64ImageField 类型会将其保存为原始图像。如何将其转换为普通图像

我的模型中有 5 个图像字段 imageS imageS imageS imageS 和 imageE 我正在尝试按以下方式保存图像图像的类型Base64ImageField images imageA imageB imageC ima
当单词以“|”分隔时如何读取文件（埃因霍温）？

在Python中我有一个文件其中的单词由例如 city state zipcode 我的文件阅读器无法区分单词另外我希望我的文件阅读器从第 2 行而不是第 1 行开始如何让我的文件阅读器分隔单词 import os import
Python Fabric - 未找到主机。请指定用于连接的（单个）主机字符串：

如何获取找不到主机请指定用于连接的单个主机字符串面料如何解决 def bootstrap host ec2 54 xxx xxx xxx compute 1 amazonaws com env hosts host env use
Python Pandas 根据另一列的总计从另一个数据帧中选择值

我下面有一个 DataFrame 但我需要根据取消和订单列从每个代码中选择行假设代码 xxx 的阶数为 6 1 5 1 阶数为 11 我需要一种算法可以选择满足总共 11 行的行阶数为 6 5 如果没有行匹配则选择最接近的 id 并
python是带有字符串的运算符行为[重复]

这个问题在这里已经有答案了我无法理解以下行为我正在创建 2 个字符串并使用 is 运算符来比较它对于第一种情况它的工作方式有所不同对于第二种情况它按预期工作当我使用逗号或空格时它显示是什么原因False与比较is当没有使用
使用 scipy curve_fit 拟合噪声指数的建议？

我正在尝试拟合通常按以下方式建模的数据 def fit eq x a b c d e return a 1 np exp x b c np exp x d e x np arange 0 100 0 001 y fit eq x 1 1 1
Apache Spark 中的高效字符串匹配

我使用 OCR 工具从屏幕截图中提取文本每个大约 1 5 句话然而当手动验证提取的文本时我注意到时不时会出现一些错误鉴于文本你好我真的很喜欢 Spark 我注意到 1 像 I 和 l 这样的字母被替换 2 表情符号未被正确提
`list()` 被认为是一个函数吗？

list显然是内置类型 https docs python org 3 library stdtypes html list在Python中我看到底下有一条评论this https stackoverflow com a 53645813
在 Sphinx 中，有没有办法在声明参数的同时记录参数？

我更喜欢在声明参数的同一行记录每个参数根据需要以便应用D R Y http en wikipedia org wiki Don t repeat yourself 如果我有这样的代码 def foo flab nickers a ser
解析根元素内元素之间的 XML 文本

我正在尝试用 Python 解析 XML 以下是 XML 结构的示例 a aaaa1 b bbbb b aaaa2 a
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
如何使用 Keras ImageDataGenerator 预测单个图像？

我已经训练 CNN 对图像进行 3 类分类在训练模型时我使用 keras 的 ImageDataGenerator 类对图像应用预处理功能并重新缩放它现在我的网络在测试集上训练得非常准确但我不知道如何在单图像预测上应用预处理功能如
是否可以将 pd.Series 分配给无序 pd.DataFrame 中的列而不映射到索引（即不重新排序值）？

在 Pandas 中创建或分配新列时我发现了一些意外的行为当我对 pd DataFrame 进行过滤或排序从而混合索引然后从 pd Series 创建新列时 Pandas 会重新排序该系列以映射到 DataFrame 索引例如 d
如何在 robobrowser-python 中发出 POST 请求

http robobrowser readthedocs org en latest api html http robobrowser readthedocs org en latest api html 我正在尝试使用 APIbrows
如何在单元测试中使用 JSON 发送请求

我的 Flask 应用程序中有在请求中使用 JSON 的代码我可以像这样获取 JSON 对象 Request request get json 这一直工作得很好但是我正在尝试使用 Python 的 unittest 模块创建单元测试但
如何获取所有mysql元组结果并转换为json

我能够从表中获取单个数据但是当我试图获取表上的所有数据时我只得到一行 cnn execute sql rows cnn fetchall column t 0 for t in cnn description for row in ro

随机推荐

如何将gradle添加到子项目根项目作为依赖项？

我有以下项目结构settings gradle include B include C rootProject name A 如何将gradle添加到子项目根项目作为依赖项就project就方法而言根项目没有名称这是项目 B 的 bu
计算总和为零的所有连续子数组

给定长度为 n 的随机数正数和负数数组我想要数字连续的子数组其总和等于零 Example 鉴于我有数组a 1 1 2 2 6 6 输出将是6因为子数组如下 1 1 2 2 6 6 1 1 2 2 2 2 6 6 1 1 2 2 6
使用 JPA 注释映射 java.util.Map 时键和值列名称会覆盖

我正在研究使用 Hibernate 4 1 9 和 JPA 注释来注释地图的不同方法如果我想存储一个 Map 其中键是实体值的属性则标记如下所示 OneToMany mappedBy deptById targetEntity com
C# 属性集合[重复]

这个问题在这里已经有答案了我有一个特定的内置属性集合例如 System Runtime Serialization SerializedAttribute 我想将其应用于特定的类集合是否有可能将这些属性合而为一我不想将它们全部显式应
在一张图上绘制两张图。功能线不起作用

我想在一张图上绘制两张图我读这个帖子但函数lines不起作用什么也没有发生我不知道会出现什么问题有任何想法吗编辑可重现的例子 gt tr error 1 0 2314984 0 2314990 0 2314981 0 2314
MIME 类型（'text/html'）不是受支持的样式表

我正在将 css 文件链接到我的express handlebars 文件但收到此错误拒绝应用来自的样式http localhost 4000 cs366 style draft css 因为它的 MIME 类型 text html
退出当前浏览器（返回一级）

有时你会抛出多个browser进入一个函数进行调试我知道你可以退出整个shebangQ但是如果您想退出第二个浏览器参见下面的代码并返回到第一级浏览器怎么办我听说过类型c但这并没有退出第二层browser FUN lt functio
将变量从一个 HTML 页面传递到另一个 HTML 页面的最佳实践是什么？

我对网络应用程序编程比较陌生所以我希望这个问题对每个人来说都不是太基础我创建了一个 HTML 页面其中包含一个包含 dojox 数据网格 v1 2 的 FORM 其中填充了不同杂货项目的描述行用户选择他感兴趣的项目后他将单击提交
UIImagePickerController 的cameraViewTransform 忽略了 iOS 10 beta 上的“缩放”和“平移”

我一直在使用下面的代码来缩放 UIImagePickerController 的实时预览以填充整个屏幕到目前为止这一切都很完美几天前我在 iPhone 5 上安装了 iOS 10 beta 7 但它不再扩展了我可以在 UIImag
PCL .NET 4.5 定时器

我正在使用 Xamarin 和 MvvmCross 构建跨平台应用程序我需要每分钟调用服务器更新一次稍后我将转向推送通知但我无法在我的核心项目中设置计时器我见过 MvvmCross N 42 但我相信目标项目比较旧允许计时器下面
Translation.E004) 您为 LANGUAGE_CODE 设置提供了一个不在 LANGUAGES 设置中的值

我刚刚重新映像了我的计算机因此为我的 django 项目设置了所有内容然后在运行服务器时出现此错误我不知道它指的是什么因为我的原始网站是开箱即用的而且我会说英语并且该网站是一个内部工作网站因此没有理由做任何基于语言的事情有谁
Angular 2 中的错误处理程序和拦截器有什么区别？

另外对于实时 Web 应用程序 ng2 中前端错误处理的最佳解决方案是什么使用 Http拦截器进行前端错误处理可以吗请解释一下这些事情 Angular 2 中的错误处理程序和拦截器有什么区别根据 Angular 文档它们是这样定
在 Ubuntu 上更新 TimescaleDB 后 Postgres 出现错误：找不到文件

如指定官方文档我将 Timescale PPA 存储库添加到apt 然后我通过安装它sudo apt install timescaledb postgresql 9 6 一切都工作正常随着最近的运行sudo apt upgrade时间刻
更改当前正在运行的进程的所有者

我有一个当前正在运行的进程pid PID 并由user foo这是not root 我想将此进程的所有权转移给另一个进程user bar这也是not root 是否有一个 shell 命令可以更改进程的所有者我正在考虑一个chown但对于
Stripe：为订阅添加免费天数

是否可以为 Stripe 上的有效订阅添加免费天数我想这样做是为了创建一个推荐计划当用户推荐某人时他将获得 10 天的免费时间我认为一个好方法是更新current period endvar 但我在文档中找不到如何执行此操作例如
Array.Sum() 导致溢出

我有一个像这样的 int 数组 int arr 256741038 623958417 467905213 714532089 938071625 然后我创建了一个 int64 var Int64 sum arr Sum 但这导致了溢出运
Delphi XE - RawByteString 与 AnsiString

我在这里有一个类似的问题 Delphi XE 我应该使用 String 还是 AnsiString 在决定在我的大型库中使用 ANSI 字符串是正确的之后我意识到我实际上可以使用 RawByteString 而不是 ANSI 因为我将
创建可下载的自定义主题并在运行时应用它

我正在制作一个 Android 应用程序需要允许客户端维护来自服务器的资源其中包括字符串可绘制对象等我已经创建了一种机制来下载包含所有这些文件的 zip 文件并且它们能够非常轻松地更改字符串我还创建了一种允许客户端更改 UI 控
Java抽象类和接口[重复]

这个问题在这里已经有答案了在面试中我被问到以下问题我试图回答这个问题但我想要问题的确切答案如果我可以将抽象类模拟为接口为什么java还要提供接口呢这意味着如果在抽象类中我可以将所有方法标记为抽象然后抽象类将充当接口那么为什么
将包含字典列表的列转换为 pandas 数据框中的多列

我有一个 Pandas 数据框如下所示 pd DataFrame a 1 2 b c 1 d 5 c 3 d 7 c 10 d 50 Out 2 a b 0 1 u c 1 u d 5 u c 3 u d 7 1 2 u c 10 u d

将包含字典列表的列转换为 pandas 数据框中的多列

将包含字典列表的列转换为 pandas 数据框中的多列 的相关文章

随机推荐

热门标签

将包含字典列表的列转换为 pandas 数据框中的多列的相关文章