Pandas MultiIndex（超过 2 级）DataFrame 到嵌套 Dict/JSON

2023-12-28

这个问题类似于this one https://stackoverflow.com/questions/47920624/convert-pandas-multiindex-dataframe-to-nested-dictionary，但我想更进一步。是否可以扩展该解决方案以适应更多级别？多级数据框'.to_dict()方法有一些有前途的选项，但大多数都会返回由元组索引的条目（即(A, 0, 0): 274.0）而不是将它们嵌套在字典中。

作为我想要完成的示例，请考虑这个多索引数据框：

data = {0: {
        ('A', 0, 0): 274.0, 
        ('A', 0, 1): 19.0, 
        ('A', 1, 0): 67.0, 
        ('A', 1, 1): 12.0, 
        ('B', 0, 0): 83.0, 
        ('B', 0, 1): 45.0
    },
    1: {
        ('A', 0, 0): 254.0, 
        ('A', 0, 1): 11.0, 
        ('A', 1, 0): 58.0, 
        ('A', 1, 1): 11.0, 
        ('B', 0, 0): 76.0, 
        ('B', 0, 1): 56.0
    }   
}
df = pd.DataFrame(data).T
df.index = ['entry1', 'entry2']
df
# output:

         A                              B
         0              1               0
         0      1       0       1       0       1
entry1   274.0  19.0    67.0    12.0    83.0    45.0
entry2   254.0  11.0    58.0    11.0    76.0    56.0

您可以想象我们这里有很多记录，而不仅仅是两条，并且索引名称可能是更长的字符串。如何将其转换为如下所示的嵌套字典（或直接转换为 JSON）：

[
 {'entry1': {'A': {0: {0: 274.0, 1: 19.0}, 1: {0: 67.0, 1: 12.0}},
  'B': {0: {0: 83.0, 1: 45.0}}},
 'entry2': {'A': {0: {0: 254.0, 1: 11.0}, 1: {0: 58.0, 1: 11.0}},
  'B': {0: {0: 76.0, 1: 56.0}}}}
]

我认为一定量的递归可能会有所帮助，也许像this https://stackoverflow.com/questions/19798112/convert-pandas-dataframe-to-a-nested-dict/19900276#19900276，但迄今为止尚未成功。

所以，你真的需要在这里做两件事：

df.to_dict()
将其转换为嵌套字典。

df.to_dict(orient='index')给你一个以索引为键的字典；它看起来像这样：

>>> df.to_dict(orient='index')
{'entry1': {('A', 0, 0): 274.0,
  ('A', 0, 1): 19.0,
  ('A', 1, 0): 67.0,
  ('A', 1, 1): 12.0,
  ('B', 0, 0): 83.0,
  ('B', 0, 1): 45.0},
 'entry2': {('A', 0, 0): 254.0,
  ('A', 0, 1): 11.0,
  ('A', 1, 0): 58.0,
  ('A', 1, 1): 11.0,
  ('B', 0, 0): 76.0,
  ('B', 0, 1): 56.0}}

现在你需要嵌套它。这是一个技巧来自马丁·彼得斯 https://stackoverflow.com/a/50932879/7954504要做到这一点：

def nest(d: dict) -> dict:
    result = {}
    for key, value in d.items():
        target = result
        for k in key[:-1]:  # traverse all keys but the last
            target = target.setdefault(k, {})
        target[key[-1]] = value
    return result

把这一切放在一起：

def df_to_nested_dict(df: pd.DataFrame) -> dict:
    d = df.to_dict(orient='index')
    return {k: nest(v) for k, v in d.items()}

Output:

>>> df_to_nested_dict(df)
{'entry1': {'A': {0: {0: 274.0, 1: 19.0}, 1: {0: 67.0, 1: 12.0}},
  'B': {0: {0: 83.0, 1: 45.0}}},
 'entry2': {'A': {0: {0: 254.0, 1: 11.0}, 1: {0: 58.0, 1: 11.0}},
  'B': {0: {0: 76.0, 1: 56.0}}}}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas MultiIndex（超过 2 级）DataFrame 到嵌套 Dict/JSON 的相关文章

创建 xyz 海拔数据的曲面图

我正在尝试用 python 创建一座山的表面图其中我有一些 xyz 数据最终结果应该类似于that https i stack imgur com rKQV0 png 该文件的格式如下 616000 0 90500 0 3096 712
删除 tkinter 文本默认绑定

我正在制作一个简单的 tkinter 文本编辑器但我想要所有默认绑定文本小部件如果可能的话删除例如当我按Ctrl i它默认插入一个制表符我制作了一个事件绑定来打印文本框中有多少行我将事件绑定设置为Ctrl i以及当我运行它时它会
如何在plotly（python）中的刻度标签和图形之间添加空格？

如果我使用绘图创建水平条形图则每个条形的标签都与图表相对应我想在标签和图表之间添加一些空间填充边距我怎样才能做到这一点 Example import plotly offline as py import plotly graph
DataFrame.loc 的“索引器太多”

我读了关于切片器的文档 http pandas pydata org pandas docs stable advanced html using slicers一百万次但我从来没有理解过它所以我仍在试图弄清楚如何使用loc切片Data
在多核上运行 python 线程

我知道Python 2 7不允许在不同的内核上运行多个线程你需要使用multiprocessing模块以实现某种程度的并发性我正在看concurrent futuresPython 3 4 中的模块是否使用ThreadPoolExec
无法使用Python请求会话模块登录网站

我刚刚开始进行网络抓取对于我的第一个项目我尝试使用 requests Session 登录 artofproblemsolving com 并访问另一个用户的帐户这是我的代码 import requests LOGIN URL htt
Python Apache Beam 端输入断言错误

我对 Apache Beam Cloud Dataflow 还很陌生所以如果我的理解不正确我深表歉意我正在尝试通过管道读取大约 30 000 行长的数据文件我的简单管道首先从 GCS 打开 csv 从数据中提取标题通过 ParDo
将括号子集映射到字符

我正在尝试创建一个 Scala 方法该方法将采用一个父括号组表示为字符串然后将每个括号子组映射到不同的字母然后它应该将它们放入它返回的映射中所以基本上我调用以下方法如下所示 val s 2 x 3 6 val map mapPa
将列表值转换为 pandas 中的行

我有数据帧其中一列具有相同长度的 numpy ndarray 值 df list 0 Out 92 array 0 0 0 0 29273096 0 30691767 0 27531403 我想将这些列表值转换为数据框并从 df iloc
matplotlib：渲染到缓冲区/访问像素数据

我想使用 matplotlib 生成的图作为 OpenGL 中的纹理到目前为止我遇到的 matplotlib 的 OpenGL 后端要么不成熟要么已经停止使用所以我想避免使用它们我当前的方法是将图形保存到临时 png 文件中并从
使用 python 从 CSV 创建字典

我有一个 CSV 格式的文件其中 A B 和 C 是标题我如何以Python方式将此CSV转换为以下形式的字典 A 1 B 4 C 7 A 2 B 5 C 8 A 3 B 6 C 9 到目前为止我正在尝试以下代码 import csv
当元组列表中相同项目的值是字符串时，对它们的值求和

如果我有这样的元组列表 my list books 5 books 10 ink 20 paper 15 paper 20 paper 15 我怎样才能把列表变成这样 books 15 ink 20 paper 50 即添加同一项目的费用
如何在 python 中使用交叉验证执行 GridSearchCV

我正在执行超参数调整RandomForest如下使用GridSearchCV X np array df features all features y np array df gold standard labels x train x
提高光线追踪命中功能的性能

我有一个简单的 python 光线追踪器渲染 200x200 的图像需要 4 分钟这对于我的口味来说绝对是太多了我想改善这种情况几点我为每个像素发射多条光线以提供抗锯齿功能每个像素总共发射 16 条光线 200x200x16
将 str.contains 映射到 pandas DataFrame

python 初学者我正在寻找创建字符串的字典映射以及关联的值我有一个数据框想要创建一个新列如果字符串匹配则会将该列标记为 x df pd DataFrame comp dell notebook dell notebook S3
在字符串内打印单引号

我想输出 XYZ s ABC 我在Python IDLE中尝试了以下3条语句第一条和第二条语句输出 a before 带打印功能的第三条语句不输出 before 作为 Python 新手我想了解为什么之前输出在第 1 条和第 2 条
如何在类型提示中定义元组或列表的大小

有没有办法在参数的类型提示中定义元组或列表的大小目前我正在使用这样的东西 from typing import List Optional Tuple def function name self list1 List Class1 if
本地主机上的 Google App Engine GQL 查询

我正在 Google App Engine Windows 上的 SDK 版本 1 7 0 上开发一个应用程序我需要经常测试该应用程序并且此测试涉及数据存储上的大量 GQL 查询您可以在 App Engine 管理界面的浏览器中在线运
JSONDecodeError：额外数据：Python [重复]

这个问题在这里已经有答案了我使用以下代码从文件加载 json file file name obj list with open file as f for json obj in f obj list append loads json
美丽的汤刮 - 登录凭据不起作用

尝试使用登录凭据抓取页面 payload email gmail com password urls login url https www spotrac com signin url https www spotrac com nba

随机推荐

在一场战争中使用多个 CDI 配置文件（开发、测试版、质量保证、生产）？

拥有使用 Spring DI applicationContext xml 声明依赖注入的方式的经验后我现在尝试弄清楚如何使用 Java EE6 CDI 执行相同的操作使用 Spring 我可以将我的 jar 与多个配置文件一起发送例
当 DEBUG 为 False 时错误处理程序不会触发

我在用着错误处理程序 http flask pocoo org docs 0 10 patterns errorpages error handlers捕获并处理某些类型的异常 app errorhandler CustomExceptio
Android 两个具有相同值的整数不正确相等

我不是java人所以我不确定这是否只是一个语言问题我正在编写一个 Android 应用程序在应用程序中的某一时刻我会与整数版本号进行比较以查看它们正在使用的应用程序版本如果它们不是最新的则执行某些操作我注意到我的操作代码
隐藏 Invoke-WebRequest 的进度

如何隐藏进度显示Invoke WebRequest 我连续提出了很多请求并有自己的请求Write Progress我使用的显示器所以我不需要每次都在它下面弹出内置的显示器我使用从结果创建的 mshtml 结果 IE COM 对象 In
将 CSS 应用于嵌入 img 标签的 SVG 图像

在我的页面上我使用 img 标签来嵌入 SVG 图像现在我想在它们上应用一些CSS 只要将 SVG 源代码直接复制粘贴到页面中这种方法就很有效但是如果我使用 img src 属性嵌入它们则不会有办法让它发挥作用吗 img sr
如何在PowerShell中转义特殊字符？

当我的 PowerShell 脚本运行时它会提示用户输入密码参数该密码可以包含任意数量的特殊字符例如然后将该密码用作 exe 命令的参数但由于某些特殊字符未正确转义该密码通常不正确过去的密码示例是我需要转义的唯一字符是我将
Swift 包管理器 - Swift 4 语法

我正在尝试使用更新后的 Swift4 SPM 如下所示Package swift file 包描述 API 版本 4 https github com apple swift package manager blob swift 4 0 b
AngularJS 中的 $$phase 是什么？

我发现这个代码片段是某人为引导模式编写的角度指令的一部分 Update the visible value when the dialog is closed through UI actions Ok cancel etc
jQuery：选择具有唯一 ID 的所有输入（正则表达式/通配符选择器）

我的网络表单上有一些文本框它们的 id 如下 txtFinalDeadline 1 txtFinalDeadline 2 txtFinalDeadline 3 txtFinalDeadline 4 在我的 jQuery 中我如何找到所有
如何消除 SQL Server 2005 和 C# 应用程序中的死锁？

我有一个用于 Windows 服务的 C 代码主要负责更新数据库表中的记录但我的日志中总是出现很多错误所有错误都与资源死锁有关这是错误 System Data SqlClient SqlException 0x80131904 事务
如何将动态创建的单选按钮设置到RadioGroup中？

我有动态创建的单选按钮 LinearLayout linLayRoot LinearLayout dialogView findViewById R id dialog layout root RadioGroup radGp new Ra
强制 Bootstrap 下拉菜单始终显示在底部并允许其离开屏幕

当视口底部没有空间容纳下拉菜单时它会显示在下拉按钮的顶部是否可以改变这种行为并使下拉菜单始终出现在底部 div class dropdown div
Groovy Eclipse 插件组织导入

我一直在使用最新版本的 groovy eclipse 插件适用于 eclipse 3 4 我注意到当我在文件上运行组织导入时它实际上删除了我需要的一些导入它似乎删除了我的项目中的那些而不是 java 导入有什么想法吗谢谢杰夫
Android 倒计时器的小时/分钟选择器

我正在尝试实现类似倒计时器的东西在 0 时播放警报我希望能够设置计时器响起之前等待的时间我想知道是否有一个 UI 小部件或元素可以提供这种选择功能基本上 android有类似iPhone选择旋转轮的东西吗或者是否有某种类型的时间选
如何将 -L 链接器标志传递给 rustc 以进行基于货物的项目？

如何办理货物通行证 Lrustc 调用的链接器标志现在可以使用 cargo config See https github com rust lang cargo issues 1109 https github com rust lan
CodeIgniter 延迟加载库/模型/等

在编写 CodeIgniter 应用程序时我的控制器操作往往以如下几行开头 this gt load gt model abc model this gt load gt library ijk 然后只是为了完整性它们的使用如下 th
无法从 Github 容器注册表 (GHCR) 提取公共映像

我已将映像推送到 Github 容器注册表 GHCR 并将其公开当我尝试拉它时出现错误我已经完成了docker login docker pull ghcr io username reponame master 我收到的错误 Err
调试启动时在 Flash 构建器中清理项目

使用 Flash builder 4 构建 AIR 应用程序当我使用调试器启动项目时我的代码更改始终没有生效可能大约每小时发生一次那么有谁知道如何让 FlashBuilder 在每次启动之前自动清理项目 Thanks 我在使用 Fl
线程引用需要静态生命周期吗？

虽然直观上讲传递给生成线程的引用需要具有静态生命周期但我不清楚到底是什么导致以下代码无法编译 use std sync Arc use std sync Mutex struct M fn do something m Arc
Pandas MultiIndex（超过 2 级）DataFrame 到嵌套 Dict/JSON

这个问题类似于this one https stackoverflow com questions 47920624 convert pandas multiindex dataframe to nested dictionary 但我想更

Pandas MultiIndex（超过 2 级）DataFrame 到嵌套 Dict/JSON

Pandas MultiIndex（超过 2 级）DataFrame 到嵌套 Dict/JSON 的相关文章

随机推荐

热门标签