展平双重嵌套 JSON

2023-11-27

我正在尝试展平一个如下所示的 JSON 文件：

{
"teams": [
  {
    "teamname": "1",
    "members": [
      {
        "firstname": "John", 
        "lastname": "Doe",
        "orgname": "Anon",
        "phone": "916-555-1234",
        "mobile": "",
        "email": "[email protected]"
      },
      {
        "firstname": "Jane",
        "lastname": "Doe",
        "orgname": "Anon",
        "phone": "916-555-4321",
        "mobile": "916-555-7890",
        "email": "[email protected]"
      }
    ]
  },
  {
    "teamname": "2",
    "members": [
      {
        "firstname": "Mickey",
        "lastname": "Moose",
        "orgname": "Moosers",
        "phone": "916-555-0000",
        "mobile": "916-555-1111",
        "email": "[email protected]"
      },
      {
        "firstname": "Minny",
        "lastname": "Moose",
        "orgname": "Moosers",
        "phone": "916-555-2222",
        "mobile": "",
        "email": "[email protected]"
      }
    ]
  }       
]

}

我想将其导出到 Excel 表格。我当前的代码是这样的：

from pandas.io.json import json_normalize
import json
import pandas as pd

inputFile = 'E:\\teams.json'
outputFile = 'E:\\teams.xlsx'

f = open(inputFile)
data = json.load(f)
f.close()

df = pd.DataFrame(data)

result1 = json_normalize(data, 'teams' )
print result1

结果是这样的输出：

members                                              teamname
0  [{u'firstname': u'John', u'phone': u'916-555-...        1
1  [{u'firstname': u'Mickey', u'phone': u'916-555-...      2

每行内嵌套有 2 个成员数据。我想要一个输出表来显示所有 4 名成员的数据以及他们关联的团队名称。

Use pandas.io.json.json_normalize

json_normalize(data,record_path=['teams','members'],meta=[['teams','teamname']])

output:
         email                firstname lastname mobile      orgname    phone       teams.teamname
0   [email protected]       John    Doe                   Anon      916-555-1234    1
1   [email protected]       Jane    Doe     916-555-7890  Anon      916-555-4321    1
2   [email protected]   Mickey  Moose   916-555-1111  Moosers   916-555-0000    2
3   [email protected]    Minny   Moose                 Moosers   916-555-2222    2

解释

from pandas.io.json import json_normalize
import pandas as pd

我最近才学会如何使用 json_normalize 函数，所以我的解释可能不正确。

从我所说的“第 0 层”开始

json_normalize(data)

output:
     teams
0   [{'teamname': '1', 'members': [{'firstname': '...

有 1 列和 1 行。一切都在“团队”栏中。

使用 record_path= 查看我所说的“第 1 层”

json_normalize(data,record_path='teams')

output:
     members                                          teamname
0   [{'firstname': 'John', 'lastname': 'Doe', 'org...    1
1   [{'firstname': 'Mickey', 'lastname': 'Moose', ...    2

在第 1 层中，我们已扁平化“团队名称”，但内部有更多“成员”。

使用 record_path= 查看第 2 层。这个符号一开始并不直观。我现在通过 ['layer','deeperlayer'] 记住它，结果是layer.deeperlayer。

json_normalize(data,record_path=['teams','members'])

output:
           email              firstname lastname   mobile     orgname   phone
0   [email protected]      John        Doe                  Anon    916-555-1234
1   [email protected]       Jane        Doe   916-555-7890  Anon    916-555-4321
2   [email protected]   Mickey     Moose   916-555-1111 Moosers 916-555-0000
3   [email protected]    Minny       Moose               Moosers 916-555-2222

请原谅我的输出，我不知道如何在响应中制作表格。

最后我们使用 meta= 添加第 1 层列

json_normalize(data,record_path=['teams','members'],meta=[['teams','teamname']])

output:
         email                firstname lastname mobile      orgname    phone       teams.teamname
0   [email protected]       John    Doe                   Anon      916-555-1234    1
1   [email protected]       Jane    Doe     916-555-7890  Anon      916-555-4321    1
2   [email protected]   Mickey  Moose   916-555-1111  Moosers   916-555-0000    2
3   [email protected]    Minny   Moose                 Moosers   916-555-2222    2

请注意，我们如何需要 meta=[[]] 的列表列表来引用第 1 层。如果我们想要第 0 层和第 1 层中的一列，我们可以这样做：

json_normalize(data,record_path=['layer1','layer2'],meta=['layer0',['layer0','layer1']])

json_normalize 的结果是 pandas 数据帧。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

json

Excel

pandas

Dictionary

展平双重嵌套 JSON 的相关文章

当单词以“|”分隔时如何读取文件（埃因霍温）？

在Python中我有一个文件其中的单词由例如 city state zipcode 我的文件阅读器无法区分单词另外我希望我的文件阅读器从第 2 行而不是第 1 行开始如何让我的文件阅读器分隔单词 import os import
参考上一个问题：为什么 VBA 没有加载所有发票详细信息

除了上一个问题之外我们在销售发票上仍然存在相同的加载失败问题下面的 VBA Json 仍然仅加载一行或第一个产品详细信息行而不是与表中该销售发票合作的所有产品行详细信息我们希望下面的 VBA 能够根据参数加载发票详细信息例如如果
根据开始列和结束列扩展数据框（速度）

我有一个pandas DataFrame含有start and end列加上几个附加列我想将此数据框扩展为一个时间序列从start值并结束于end值但复制我的其他专栏到目前为止我想出了以下内容 import pandas as
登录网站并使用 python 请求下载文件

我有一个带有 HTML 表单的网站登录后它会将我带到 start php 站点然后将我重定向到overview php 我想从该服务器下载文件当我单击 ZIP 文件的下载链接时链接后面的地址是 getimage php path
使用 Rails 中的 postgres json 字段更新嵌套键

我一直在尝试更新以下内容 boxes book 2 moving 2 goods to boxes book new 2 moving 2 goods 无需使用正则表达式或在 ruby 中执行此操作但似乎有点棘手我想添加新密钥然后删除
Python Pandas 根据另一列的总计从另一个数据帧中选择值

我下面有一个 DataFrame 但我需要根据取消和订单列从每个代码中选择行假设代码 xxx 的阶数为 6 1 5 1 阶数为 11 我需要一种算法可以选择满足总共 11 行的行阶数为 6 5 如果没有行匹配则选择最接近的 id 并
Apache Spark 中的高效字符串匹配

我使用 OCR 工具从屏幕截图中提取文本每个大约 1 5 句话然而当手动验证提取的文本时我注意到时不时会出现一些错误鉴于文本你好我真的很喜欢 Spark 我注意到 1 像 I 和 l 这样的字母被替换 2 表情符号未被正确提
Apache Camel 的 JsonMappingException

我在骆驼路线上遇到以下异常 Caused by com fasterxml jackson databind JsonMappingException No serializer found for class org apache cam
Pandas 滚动窗口 Spearman 相关性

我想使用滚动窗口计算 DataFrame 两列之间的 Spearman 和或 Pearson 相关性我努力了df corr df col1 rolling P corr df col2 P为窗口尺寸但我似乎无法定义该方法添加meth
`list()` 被认为是一个函数吗？

list显然是内置类型 https docs python org 3 library stdtypes html list在Python中我看到底下有一条评论this https stackoverflow com a 53645813
乘以行并按单元格值附加到数据框

考虑以下数据框 df pd DataFrame X a b c d Y a b d e Z a b c d 1 2 1 3 df 我想在列中附加数字大于 1 的行并在该行中的数字减 1 df 最好应该然后看起来像这样或者它可能看起来
返回视图作为 JSON 对象的一部分

我有一个应用程序只加载一次完整视图我这样做的原因并不重要重要的是其余内容只会以部分视图的形式返回除了一些内容之外我还有一些 JSON 对象我想通过每个 AJAX 请求在服务器之间来回传递有没有办法返回一个 JSON 对象并将
使用 numpy 在 python 中执行最大方差旋转

我正在研究矩阵的主成分分析我已经找到了如下所示的组件矩阵 A np array 0 73465832 0 24819766 0 32045055 0 3728976 0 58628043 0 63433607 0 72617152 0 5
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
对数据帧的每 2 小时数据进行 Groupby

我有一个数据框 Time T201FN1ST2010 T201FN1VT2010 1791 2017 12 26 00 00 00 854 69 0 87 1792 2017 12 26 00 20 00 855 76 0 87 1793
处理大文件的最快方法？

我有多个 3 GB 制表符分隔文件每个文件中有 2000 万行所有行都必须独立处理任何两行之间没有关系我的问题是什么会更快逐行阅读 with open as infile for line in infile 将文件分块读入内存
在 virtualenvwrapper 中激活环境

我安装了virtualenv and virtualenvwrapper用这个命令我创建了一个环境 mkvirtualenv cv 它有效创建后我就处于新环境中现在我重新启动了我的电脑我想activate又是那个环境但是怎么样我使
在 Django shell 会话期间获取 SQL 查询计数

有没有办法打印 Django ORM 在 Django shell 会话期间执行的原始 SQL 查询的数量 Django 调试工具栏已经提供了此类信息例如 5 QUERIES in 5 83MS但如何从 shell 中获取它并不明显您可
如何为所有用户安装 Anaconda python？

Anaconda python 发行版 https store continuum io cshop anaconda 非常方便地部署科学计算环境 SCE 并根据需要切换python版本默认情况下安装会将 python 定位到 anac
VBA全局类变量

我的障碍是试图让多个子程序识别类变量当我尝试全局声明它们时出现编译错误无效的外部过程然后当我运行公共函数或子函数来声明变量时它们在其他子函数中保持未定义状态我希望多个子程序能够识别变量因为它们的值应该通过用户窗体进行更改然

随机推荐

查看助手：如果布尔值为 false，则为 classBinding

如果布尔值为 FALSE 如何使用 view 帮助器将类绑定到视图 this is working view App MyView controllerBinding this classBinding controller content
多个具有 c3p0 配置的应用程序发出警告

Hi我在一个tomcat下有两个Web应用程序两者都使用 hibernate 3 2 1 和 c3p0 0 9 1 2 当部署第二个应用程序时我总是收到以下警告消息雄猫阿帕奇 tomcat 6 0 28 警告 2010 11 06
如何同步表单身份验证 cookie 和 Asp.Net 会话的生命周期？

我正在构建一个 ASP NET 网站该网站使用FormsAuthentication以及一个标准会话机制其配置如下
将大文本文件读入 Textview

我想将大文件从 SD 卡读取到文本视图中我有想法但不知道如何申请我认为这个东西需要使用处理程序和线但我不知道如何申请任何人都可以给出一些例子或教程 Updated Thread test new Thread public v
@Document indexName 中使用 Spring Data Elasticsearch 和 Spring Boot 的 SpEL 未被解析

寻求使用内部 SpEL 的帮助 Document注释参考 spring data elasticsearch 3 2 3 RELEASE和弹簧靴2 2 1 RELEASE 我在谷歌搜索上遇到了这个问题的帮助因为关键字出现了不相关的问题我
使用 Reporting Services (SSRS) 作为 ASP.NET Core 站点中的参考

我花了几天时间努力寻找解决方案所以我想分享我的情况我正在将现有的 ASP NET MVC 应用程序转换为 ASP NET Core MVC 然而使用 ASP NET Core 的最大变化是System Web命名空间是不行的然而通
如何提高室内定位精度？

我应该为某个地方开发一个室内定位系统所以我开始收集有关如何开发这样一个系统的信息我现在的问题是什么控制着定位的准确性以及如何提高它我发现了不同精度的API和项目例如 ericsson室内定位API提供了10米以内的精度而Qubu
为 Windows 编写控制台样式应用程序的好资源吗？

对于某些程序来说没有什么比命令行更好的了不幸的是我从未见过关于如何编写超越 Hello World 的控制台应用程序的良好文档或示例我有兴趣制作控制台应用程序例如Vim or Emacs 嗯与 Vim 或 Emacs 不完全一样
将 0 int 文字发送到 const 字符串参数时发生访问冲突

在 VS2015 和 VS2017 上编译时不会发出警告并生成无法捕获的访问冲突并使应用程序崩溃显然 int 0 会默默地转换为空指针然后假定该指针指向字符串从而崩溃 include
ASP.NET 5 (vNext) Web 项目：从 beta4 升级到 beta6 的库冲突

我升级了 DNVMdnvm upgrade Unstable 跑步dnvm list显示此版本处于活动状态 1 0 0 beta6 12120 我使用 ASP NET 5 网站预览模板创建了一个新项目并验证了它是否可以构建我更改了pro
参考 - 这个正则表达式是什么意思？

这个问题的答案是社区努力编辑现有答案以改进这篇文章目前不接受新的答案或互动这是什么这是常见问答集这也是一个社区Wiki 所以邀请大家参与维护为什么是这样 regex正在遭受给我 ze 代码问题类型和没有解释的糟糕答案此参考旨在
iOS 模拟器不适用于 https，所有 https 均被评估为不可信

模拟器版本 10 0 SimulatorApp 835 2 1 Xcode版本是9 1 似乎所有的https连接被评估为不被信任 Xcode和模拟器升级后受影响我确信 https 连接也具有有效的证书因为同样https support
为什么不允许 nameof(object) ？

在 C 6 0 中你可以这样写 var instance default object var type typeof object 他们有相同的结果 var instance default System Object var type
从Unity到iOS，如何完美自动化框架、设置和plist？

在 Unity3D 中构建 iOS Xcode 项目时如何完美自动化这三个构架设置 plist 项目解决方案必须仅具有最现代的 2019 语法和变体因为多年来 Unity 中的语法和变体略有变化重要的非常不幸的是你可以not正
CodeIgniter 的 HMVC 模块化扩展出现问题

我一直在使用 PHP 5 3 CodeIgniter 2 0 和 HMVC 模块化扩展在 MacOS X Snow Leopard 上进行本地开发一切都进展顺利突然我无法查明原因在尝试打开页面时偶尔会遇到此错误无法选择指定的数据
我无法在我的 Google Drive 中使用 php 查看通过 api 创建的文件和文件夹

我正在尝试使用 google Drive api 创建文件夹我能够在最后获取文件 ID 但我无法访问谷歌驱动器中的文件夹似乎有一些权限问题 scopes array https www googleapis com auth drive
如何在 R 绘图上的文本中包含上标？

我需要它看起来像这样 R 2 一些值我尝试了下面的代码但它不起作用它显示为 R 表达式 2 一些值 text 25 200 paste R expression 2 round rsquarelm2 2 你不需要一个字符向量而是一个
使用旧版本的节点创建 React App

我正在尝试使用创建反应应用程序但出现了它需要的错误Node 10或更高我的节点版本是节点8 10 0而且我无法更新 Node 版本因为它是一台工作机器有没有办法运行旧版本的 Create React App 来与我的旧 Node 版本
JPA - @PreRemove 方法行为

我有 2 个具有多对多关系的实体 Movie 实体是此关系的所有者因此当我想要删除 Actor 实体时我使用注释为 PreRemove 的方法来删除 Movie 演员表中出现的任何 Actor ID 以避免外键违规异常电影课 Ent
展平双重嵌套 JSON

我正在尝试展平一个如下所示的 JSON 文件 teams teamname 1 members firstname John lastname Doe orgname Anon phone 916 555 1234 mobile email

展平双重嵌套 JSON

Use pandas.io.json.json_normalize

展平双重嵌套 JSON 的相关文章

随机推荐

热门标签