如何将嵌套的 json 结构转换为 dataframe

2024-01-25

我将 JSON 转换为DataFrame并最终得到一列“Structure_value”，其中包含以下值作为字典/字典列表：

                   Structure_value
[{'Room': 6, 'Length': 7}, {'Room': 6, 'Length': 7}]
[{'Room': 6, 'Length': 22}]
[{'Room': 6, 'Length': 8}, {'Room': 6, 'Length': 9}]

因为它是一个对象，所以我猜它最终以这种格式结束。

我需要将其分为以下四列：

Structure_value_room_1
Structure_value_length_1
Structure_value_room_2
Structure_value_length_2

StackOverflow 上的所有其他解决方案仅处理将简单 JSON 转换为 DataFrame，而不处理嵌套结构。

P.S.:我知道我可以通过显式命名字段来执行某些操作，但我需要一个通用的解决方案，以便将来可以处理这种格式的任何 JSON

[编辑]：输出应如下所示：

   Structure_value_room_1  Structure_value_length_1  Structure_value_room_2  \
0                       6                         7                     6.0   
1                       6                        22                     NaN   
2                       6                         8                     6.0   

   Structure_value_length_2  
0                       7.0  
1                       NaN  
2                       9.0

使用列表理解与嵌套字典理解和枚举来删除字典的重复键，最后传递字典列表DataFrame构造函数：

L = [ {f"{k}_{i}": v for i, y in enumerate(x, 1) 
                     for k, v in y.items()}
                     for x in df["Structure_value"] ]
df = pd.DataFrame(L)
print(df)

   Room_1  Length_1  Room_2  Length_2
0       6         7     6.0       7.0
1       6        22     NaN       NaN
2       6         8     6.0       9.0

对于问题中的列名称，请使用：

def json_to_df(df, column):

    L = [ {f"{column}_{k.lower()}_{i}": v for i, y in enumerate(x, 1) 
                         for k, v in y.items()}
                         for x in df[column] ]
    return pd.DataFrame(L)


df1 = json_to_df(df, 'Structure_value')
print(df1)
   Structure_value_room_1  Structure_value_length_1  Structure_value_room_2  \
0                       6                         7                     6.0   
1                       6                        22                     NaN   
2                       6                         8                     6.0   

   Structure_value_length_2  
0                       7.0  
1                       NaN  
2                       9.0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

json

python3x

pandas

DataFrame

如何将嵌套的 json 结构转换为 dataframe 的相关文章

小数缓存是Python规范中定义的还是一个实现细节？

Python 似乎有一个所谓的小数字缓存用于存储 5 到 256 范围内的数字我们可以使用以下程序来演示这一点 for i in range 7 258 if id i id i 0 print i is cached else pr
Django 未在 404 页面上应用应用程序中的 CSS 文件

姜戈3 0 8 Python 3 7 x 我有一个包含一些应用程序的 Django 项目我正在尝试为 400 403 404 500 错误制作一些默认错误页面我已经这样做了并显示了适当的模板但没有任何样式或 JS 在 404 错
python 脚本中 os.system 的 256 和 512 响应代码是什么

当我在 python 中使用 os system ping 服务器时我得到多个响应代码使用的命令 os system ping q c 30 s SERVERANME 0 在线 256 离线 512 512 是什么意思 Per the
JSON 语法：传输数组

A validJSON 语法是这样的 username admin password 123 但是如果我想传输一组用户给出的例子而不是单个用户根据规范下面的代码是有效的 JSON 吗 username admin passwor
如何为 C 分配的 numpy 数组注册析构函数？

我想在 C C 中为 numpy 数组分配数字并将它们作为 numpy 数组传递给 python 我可以做的PyArray SimpleNewFromData http docs scipy org doc numpy reference
使用 boto3 从 s3 下载时使用 filename 作为文件名

我正在使用 boto3 上传文件如下所示 client boto3 client s3 aws access key id id aws secret access key key client upload file tmp test
类型错误：需要 Future 或协程

我尝试在 asyncssh 上自动重新连接 ssh 客户端 SshConnectManager 必须留在后台并在需要时进行 ssh 会话 class SshConnectManager object def init self host u
如何在Python中求和

我想知道如何在 python 中表示总和而不需要像这样的循环here http docs scipy org doc scipy reference tutorial optimize html 我们有 def rosen x The Ro
读取文件特定行号的有效方法。（奖励：Python 手册印刷错误）

我有一个 100 GB 的文本文件它是来自数据库的 BCP 转储当我尝试导入它时BULK INSERT 我在第 219506324 行上收到一个神秘错误在解决此问题之前我想看看这一行但可惜的是我最喜欢的方法 import line
python：是否有用于对输入流进行分块的库函数？

我想对输入流进行分块以进行批处理给定一个输入列表或生成器 x in 1 2 3 4 5 6 我想要一个能够返回该输入块的函数说如果chunk size 4 then x chunked 1 2 3 4 5 6 这是我一遍又一遍地做的事
如何为 Python 中的应用程序设置专用屏幕区域？

MS OneNote 就是一个很好的例子它可以选择固定在屏幕的一侧并将所有其他窗口推到一侧当最大化或调整其他窗口大小时它们只能扩展到 OneNote 的边缘 Python 使用 Tkinter 或其他模块是否具有此功能感谢您的帮助
使 np.loadtxt 使用多个可能的分隔符

我有一个程序可以读取数据文件用户可以选择他们想要使用的列我希望它对于输入文件更加通用有时列可能如下所示 10 34 24 58 8 284 6 121 有时它们可能看起来像这样 10 34 24 58 8 284 6 121 我希
如何加速 pandas 字符串函数？

我正在使用 pandas 矢量化 str split 方法来提取从上的拆分返回的第一个元素我还尝试使用 df apply 与 lambda 和 str split 来产生等效的结果使用 timeit 时我发现 df apply 的
Qcut Pandas：ValueError：Bin 边缘必须是唯一的

我使用 Pandas 中的 Qcut 将数据离散化为大小相等的存储桶我想要有价格桶这是我的数据框 productId sell prix categ popularity 11997 16758760 0 28 75 50 524137
Python 中的十进制到二进制半精度 IEEE 754

我只能使用以下命令将十进制转换为二进制单精度 IEEE754struct pack模块或者使用相反的方法 float16 或 float32 numpy frombuffer 是否可以使用 Numpy 将十进制转换为二进制半精度浮点数我
如何限制scrapy请求对象？

所以我有一个蜘蛛我认为它正在泄漏内存结果当我检查 telnet 控制台 gt gt gt prefs 时它只是从链接丰富的页面中抓取了太多链接有时它会超过 100 000 个现在我已经一遍又一遍地浏览文档和谷歌但我找不到一种方法
如何将 fields 参数传递到 Google Drive Python API 调用中

I have results drive service files list body execute where body q query string maxResults 1 为了提高性能我想限制返回的字段如下所述 https
Flask 扩展未在 app.extensions 中注册

我想访问在我的 Flask 应用程序上注册的一些扩展我尝试使用app extensions 但我初始化的一些扩展不在字典中 from flask import current app current app extensions get
只返回 $.ajax 传递的 JSON 数据的前 20 个结果？

我有以下简单的 jquery 片段 document ready function ajax url myjson json dataType json success function json each json function al
Python matplotlib 在鼠标悬停时不显示完整日期

我有一个数据框日期索引 and 温度值 Date Temperature 2015 10 21 9 118 2015 10 22 9 099 2015 10 23 8 945 2015 10 26 8 848 2015 10 27 8 84

随机推荐

如何从 WCF 服务返回干净的 JSON？

我正在尝试从 WCF 服务返回一些 JSON 该服务只是从我的数据库返回一些内容我可以拿到数据但是我担心 JSON 的格式目前返回的 JSON 格式如下 d Age 35 FirstName Peyton LastName Man
估算 scikit-learn 中的分类缺失值

我有一些带有文本类型列的熊猫数据这些文本列中还有一些 NaN 值我想做的是将那些 NaN 归咎于sklearn preprocessing Imputer 用最常见的值替换 NaN 问题出在执行上假设有一个包含 30 列的 Panda
Django ImproperlyConfigured：无法加载 WSGI 应用程序“myproject.wsgi.application”；导入模块时出错

我几乎全新安装了 django 当我运行时python manage py runserver 它给了我这个错误配置不正确无法加载 WSGI 应用程序 myproject wsgi application 导入模块时出错设置 py W
如何转发带有可变参数的函数？

在 Swift 中如何将数组转换为元组出现这个问题是因为我试图在一个采用可变数量参数的函数内部调用一个采用可变数量参数的函数 Function 1 func sumOf numbers Int gt Int var sum 0 for
检查重复项时的最佳自连接技术

我正在尝试优化生产中的查询该查询需要很长时间目标是根据匹配字段值条件查找重复记录然后将其删除当前查询通过 t1 col1 t2 col1 上的内部联接使用自联接然后使用 where 子句来检查值 select from table
为什么异步端点的过滤器链被调用两次

我正在开发一个基于 Spring boot 的应用程序我注意到对于异步端点身份验证过滤器被调用两次对于常规端点它被调用一次没找到原因不过在网上发现了一个问题https jira spring io browse SPR 126
我要释放多少次已分配或保留的对象？

我正在制作一款 iPhone 游戏我想释放所有已分配或保留的对象在里面dealloc我正在释放所有此类对象但后来我意识到有时我最终会在对象尚未分配时释放它们所以我想我需要检查一下是否retainCount在我释放它之前是否大于零我
在Fragment中使用观察者

在片段中使用观察者时遇到问题我已经实现了自己的 TextViewObserver 并且我不想将其插入片段中 public class TextViewObserver extends TextView implements Observe
有什么方法可以处理和返回领域驱动设计实体和聚合根中的错误（非异常和异常）？

我正在尝试找到一篇好文章示例说明 DDD 实体如何处理错误以及什么会被视为异常错误什么不会以及它们如何将它们传递到调用应用程序层通常将操作包装在事务中则需要回滚目前我正在考虑将所有会破坏聚合事务例如验证的错误视为异常
PHP $_POST 不起作用？ [复制]

这个问题在这里已经有答案了我有最简单的形式我想做的就是回显文本框中写入的内容 HTML
默认初始化（带值初始化）参数包

我可以默认将参数包初始化为每种类型各自的值初始化吗为了更详细地说明一下以一个简单的函数模板为例 template
spring单元测试如何插入记录（无删除方法）

我有使用 Spring 的 DAOjdbcTemplate具有创建读取更新无删除操作 Create 方法有 ID 参数它是表中的唯一键除了模拟 DAO 之外我如何在不违反约束的情况下实际测试创建使用随机 ID 有时仍然会失败我
从 JavaScript 字符串中删除特定的 HTML 标签及其内容

我有以下字符串变量我想删除所有a标签及其字符串中的内容 var myString table tr td Some text a href label a td tr table myString table tr td Some tex
如何将 Google 电子表格中的数据检索为 Javascript 或 JSON？

这是使用 Google 云端硬盘创建的公共电子表格 https docs google com spreadsheets d 1hA4LKZn9yKoqnSzaI6 73GQSj ZVpB3O0kC93QM98Vs pubhtml http
使用 System.js 在 Angular 2 应用程序中导入 Visionmedia 调试以及如何记录消息？

我正在使用 Angular 2 前端开发 MEAN 堆栈应用程序我已经成功使用了debug在快递应用程序中但是我无法干净地导入调试app components ts or main module ts 关于如何继续的任何想法结果出错
Rails 4 资产管道图像子目录

我知道这可能是一个简单的问题但我在这里被难住了我正在开发的应用程序包含如下资产 app assets fonts images javascripts 我喜欢有效地组织资源以避免将来出现混乱因此我尝试像这样分解图像 app asset
使用 mongo 计算所有文档中数组的出现次数

我试图从一组文档中提取数据如下所示 name john sex male hobbies football tennis swimming name betty sex female hobbies football tennis nam
如何从 Java 客户端创建 BigQuery 数据集和表/架构（无 CSV 文件）

我认为该方法从200行开始here https code google com p google bigquery tools source browse samples java cmdline src main java com goo
在 Supervisorctl ERROR 上的监督上出现错误（没有这样的过程）[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我以前见过这个问题但没有一个解决方案对我有用我在 rpi b 上使用主管时遇到问题每次我尝试运行启动进程时都会收到一条错误消息 p
如何将嵌套的 json 结构转换为 dataframe

我将 JSON 转换为DataFrame并最终得到一列 Structure value 其中包含以下值作为字典字典列表 Structure value Room 6 Length 7 Room 6 Length 7 Room 6 Leng

如何将嵌套的 json 结构转换为 dataframe

如何将嵌套的 json 结构转换为 dataframe 的相关文章

随机推荐

热门标签