使用 2 级嵌套数组将数据帧转换为 JSON

2023-12-04

我对 Python 编程有点陌生。我有一个小要求，我需要以 JSON 格式列出给定两周内的所有客户及其金额。

目前，我有一个这样的数据框：

  FortNight      Amount     Customer    Parameter
  Apr-2FN-2018   339632.00    10992     CustomerSales
  Apr-2FN-2018   27282.00     10994     CustomerSales 
  Apr-2FN-2018   26353.00     10995     CustomerSales 
  Apr-2FN-2018   24797.00     11000     CustomerSales
  Apr-2FN-2018   21093.00     10990     CustomerSales

预期的 JSON：

"CustomerSales" : [                                                                
    {"FortNight" : "Apr-2FN-2018",                                                                                      
         "Details" :[
             {"Customer":  "10992","Amount" : 339632.00},                                                                                                                                
             {"Customer":  "10994","Amount" : 27282.00},
             {"Customer":  "10995","Amount" : 26353.00},  
             {"Customer":  "11000","Amount" : 24797.00},
             {"Customer":  "10990","Amount" : 21093.00}
           ]
    }
]

I tried:

dict(df.set_index('Parameter').groupby(level=0).apply(lambda  x : ast.literal_eval(x.to_json(orient = 'records', date_format = "iso"))))

它检索这个：

 [{'CustomerSales': 
[{'Customer': '10992', 'Amount': 339632.00, 'FortNight': 'Apr-2FN-2018'}, {'Customer': '10994', 'Amount': 27282.00, 'FortNight': 'Apr-2FN-2018'},{'Customer': '10995', 'Amount': 26353.00, 'FortNight': 'Apr-2FN-2018'},
{'Customer': '11000', 'Amount': 24797.00, 'FortNight': 'Apr-2FN-2018'},
{'Customer': '10990', 'Amount': 21093.00, 'FortNight': 'Apr-2FN-2018'}]}]

我也尝试过其他方法但没有成功。欢迎任何帮助。提前致谢！

首先对两个参数进行分组andFortNight 列，并使用.to_dict()在结果分组行上生成最里面的字典：

details = df.groupby(['Parameter', 'FortNight']).apply(
    lambda r: r[['Customer', 'Amount']].to_dict(orient='records'))

这为您提供了一个具有多索引的系列Parameter and FortNight，并且值是正确格式的所有列表，每个条目都是一个字典Customer and Amount列。如果需要转换值类型，请在r[['Customer', 'Amount']]调用前的数据帧结果to_dict() on it.

那么你可以unstack将系列放入数据帧中，为您提供嵌套的参数 -> FortNight -> 详细信息结构；参数值成为列，每个客户/金额字典列表均由 FortNight 索引：

nested = details.unstack('Parameter')

如果你把它变成一本字典，你会得到一本基本上正确的字典：

>>> pprint(grouped.unstack('Parameter').to_dict())
{'CustomerSales': {'Apr-2FN-2018': [{'Amount': 339632.0, 'Customer': '10992'},
                                    {'Amount': 27282.0, 'Customer': '10994'},
                                    {'Amount': 26353.0, 'Customer': '10995'},
                                    {'Amount': 24797.0, 'Customer': '11000'},
                                    {'Amount': 21093.0, 'Customer': '10990'}]}}

但对于您的格式，您可以将每列中的值转换为列表{'FortNight': indexvalue, 'Details': value}映射，then将整个结构转换为字典：

output = nested.apply(lambda s: [
    {s.index.name: idx, 'Details': value}
    for idx, value in s.items()
]).to_dict('records')

这将为您提供最终输出：

>>> pprint(output)
[{'CustomerSales': {'Details': [{'Amount': 339632.0, 'Customer': '10992'},
                                {'Amount': 27282.0, 'Customer': '10994'},
                                {'Amount': 26353.0, 'Customer': '10995'},
                                {'Amount': 24797.0, 'Customer': '11000'},
                                {'Amount': 21093.0, 'Customer': '10990'}],
                    'FortNight': 'Apr-2FN-2018'}}]

如果您需要 JSON 文档，请使用.to_json(orient='records')而不是.to_dict('records').

放在一起作为一个表达式：

df.groupby(['Parameter', 'FortNight']).apply(
        lambda r: r[['Customer', 'Amount']].to_dict(orient='records')
    ).unstack('Parameter').apply(lambda s: [
        {s.index.name: idx, 'Details': value}
        for idx, value in s.items()]
    ).to_json(orient='records')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

json

pandas

Dictionary

使用 2 级嵌套数组将数据帧转换为 JSON 的相关文章

从字符串到类型的词法转换

最近我尝试用Python存储和读取文件中的信息遇到了一个小问题我想从文本文件中读取类型信息从 string 到 int 或 float 的类型转换非常有效但从 string 到 type 的类型转换似乎是另一个问题当然我尝试了
在python中将文本文件解析为列表

我对 Python 完全陌生我正在尝试读取包含单词和数字组合的 txt 文件我可以很好地读取 txt 文件但我正在努力将字符串转换为我可以使用的格式 import matplotlib pyplot as plt import num
如何从 PyCharm 项目中获取我的“exe”[重复]

这个问题在这里已经有答案了通过 PyCharm 在 Python 上编写一些项目我想从中获取一个exe文件我尝试过另存为 gt XXX exe 但是当我尝试执行它时出现错误此类操作系统不支持该文件附注我有win7 x64 它
可以在 TensorFlow 中使用排名相关作为成本函数吗？

我正在处理偶尔充满异常值的极其嘈杂的数据因此我主要依靠相关性来衡量我的神经网络的准确性是否可以明确使用诸如等级相关性斯皮尔曼相关系数之类的东西作为我的成本函数到目前为止我主要依赖 MSE 作为相关性的代理我现在面临三个主要障碍
Paramiko - 使用私钥连接 - 不是有效的 OPENSSH 私钥/公钥文件

我正在尝试找到解决方案但无法理解我做错了什么在我的 Linux 服务器上我运行了以下命令 ssh keygen t rsa 这产生了一个id rsa and id rsa pub file 然后我将它们复制到本地并尝试运行以下代码 s
Pandas重置索引未生效[重复]

这个问题在这里已经有答案了我不确定我在哪里误入歧途但我似乎无法重置数据帧上的索引当我跑步时test head 我得到以下输出正如您所看到的数据帧是一个切片因此索引超出范围我想做的是重置该数据帧的索引所以我跑test rese
json、rails、javascript 中的解析错误

我需要将 ruby 数组放入 javascript 数组中但出现解析错误 var characters 这就是我将 ruby 嵌入到内联 javascript 中的方式但它出现了解析错误我应该如何将此 ruby 数组放入 javasc
如果字段值在外部列表中，Django 会注释布尔值

想象一下我有这个 Django 模型 class Letter models Model name models CharField max length 1 unique True 还有这个列表 vowels a e i o u 我想查询
更改 pandas 中多个日期时间列的时区信息

有没有一种简单的方法可以将数据帧中的所有时间戳列转换为本地任何时区不是逐列进行吗您可以有选择地将转换应用于所有日期时间列首先选择它们select dtypes https pandas pydata org pandas docs
获取列表中倒数第二个元素[重复]

这个问题在这里已经有答案了我可以通过以下方式获取列表的倒数第二个元素 gt gt gt lst a b c d e f gt gt gt print lst len lst 2 e 有没有比使用更好的方法print lst len lst
Python：计算数据帧列中所有行中特定字符的实例数

我有一个包含列 toaddress ccaddress body 的数据框 df 我想迭代数据帧的索引以获取 toaddress 和 ccaddress 字段中电子邮件地址的最小最大和平均数量这是通过计算这两列中每个字段中的和的实
为什么我用 beautifulSoup 刮的时候有桌子，但没有 pandas

尝试抓取条目页面转换为制表符分隔格式主要拉出序列和 UniProt 登录号当我跑步时 url www signalpeptide de index php sess m listspdb bacteria s details id 10
Django 在选择列表更改时创建毫无意义的迁移

我正在尝试使用可调用创建一个带有选择字段的模型以便 Django 在选择列表更改时不会创建迁移如中所述this https stackoverflow com questions 31788450 stop django from cr
conda-env list / conda info --envs 如何查找环境？

我一直在尝试 anaconda miniconda 因为我的用户使用随 miniconda 安装的结构生物学程序并且作者都没有 A 考虑到可能存在其他 miniconda 应用程序 B 他们的程序将在多用户环境中使用因此使用 Arch
select() 可以在 Windows 下使用 Python 中的文件吗？

我正在尝试在 Windows 下运行以下 python 服务器 An echo server that uses select to handle multiple clients at a time Entering any line o
Matplotlib Scatter - ValueError：RGBA 序列的长度应为 3 或 4

我正在尝试为我的功能绘制图表但不断收到此错误 ValueError RGBA sequence should have length 3 or 4 每当我只有 6 种形状时代码就可以完美运行但现在我将其增加到 10 种它就不起作用了
Pandas Dataframe：将包含列表的行扩展到多行，并为所有列提供所需的索引

我在 pandas 数据框中有时间序列数据索引为测量开始时的时间列中包含以固定采样率记录的值列表连续索引列表中元素数量的差异这是它的样子 Time A B Z 0 1 2 3 4 1 2 3 4 2 5 6 7 8 5 6 7 8
Python组合目录中的所有csv文件并按日期时间排序

我有 2 年的每日数据分成每月文件我想将所有这些数据合并到一个按日期和时间排序的文件中我正在使用的代码组合了所有文件但不按顺序我正在使用的代码 import pandas as pd import glob os import cs
如何禁止 celery 中的 pickle 序列化

Celery 默认使用 pickle 作为任务的序列化方法如中所述FAQ http ask github com celery faq html isn t using pickle a security concern 这代表一个安全漏
使用 Python 生成类似于 Messenger 或 kik 代码的圆形二维码

我可以使用 Python 生成圆形 QR 码就像 Facebook Messenger 或 kik 使用的那样吗我访问了很多网站但找不到这种类型的二维码默认情况下 Python 生成方形 QR 码但在我的项目中我想要圆形 QR 码

随机推荐

Git 强制推送到 github 的大文件已被删除且不再跟踪而被拒绝

所以我对 git 还很陌生并且遇到了一些麻烦我的本地副本有许多与我的 github 存储库冲突的新更改但是我的本地副本是正确的我只想覆盖远程存储库本地和远程副本有 2 次和 3 次提交的差异我还意外地将一些非常大的 csv 文件
DataGridView 加载速度非常慢。如何优化DataGridView中行的添加？

datagridview 加载速度非常慢我该如何优化它 datagridview 有 4 5 千行我必须根据几个参数动态生成 datagridview 来自数据库的数据列数我必须从数据库中的表 id name contact 垂直生
我可以将 JRadioButton 添加到 JTable 中吗

我尝试添加JRadioButton into JTable通过使用CellEditor and CellRenderer 但我无法添加JRadioButton into JTable 我正在使用 NetBeans 和后端 MySQL 请帮我
如何通过分隔符将数组对象分成两个（或二维数组）

我想分割一个数组如下所示 let arrayToSplit Europe France Paris Europe Italy Rome America USA Washington America Canada Ottawa Into l
Hive 中的减速器选择

我有以下记录集来处理 1000 1001 1002 to 1999 2000 2001 2002 to 2999 3000 3001 3002 to 3999 我想使用HIVE处理以下记录集以便reducer 1将处理数据1000到199
不能从静态上下文中引用非静态方法（方法名()）。为什么？

我对此真的很困惑我有2节课 Club and 会员资格在会员资格中我有方法获取月份在俱乐部我有加入月份它采用参数月份因此用户输入月份然后我希望它返回在该特定月份加入的会员资格我试图从类 Club 中调用 getMonth
方法“getElementsByClassName”无法识别

我想启动 Windows 资源管理器并登录网站登录后我想单击注销文本链接但我收到此错误 Method invocation failed because mshtml HTMLDocumentClass doesn t contain
两个相同的文件根据 C# 的编写方式具有不同的文件大小

我正在尝试将对象数组序列化为 JSON 格式写入文件我正在尝试以两种不同的方式编写它如下所示 ToSerialise Obj new ToSerialise 10 for int i 0 i lt 10 i Obj i new ToSe
Django 在文件末尾添加一些奇怪的字符

当我将文件提交到 django 服务器并且文件名存在于目录中时我遇到了问题 Django 不会覆盖该文件但会在名称末尾添加一些字符我怎样才能添加字符而不是 Django 我的 model py 看起来像这样 class UpLoadF
使用 ggplot2 绘制不同长度的向量

我有 8 个不同长度的数据向量 MAP 分数评级的文档数量不同从 80 到 500 如何将它们读入 R 并在 ggplot2 中将它们绘制为相同的长度将它们视为从 0 到 1 范围内的不同数量的数据点它们应该按比例缩小放大以便它
OCaml 中函数以相反顺序返回列表

我想从文件中读取一些数字将它们放入列表中最后将它们显示在屏幕上 Numbers txt 目前有2 3 5 7 11但是作为输出我得到11 7 5 3 2 unit 为什么会发生这种情况 let rec int list from sb
Google App Engine 上的并发请求处理

我正在几个平台上尝试并发请求处理该实验的目的是有一个broad衡量某些选定技术的能力界限我在我的机器上设置了一个 Linux 虚拟机其中包含一个基本的 Go http 服务器 vanillahttp HandleFunc of the
如何在Linux下不使用QProcess执行shell命令？

我正在尝试从 Qt 应用程序中读取屏幕分辨率但不使用 GUI 模块所以我尝试使用 xrandr grep awk print 1 命令通过QProcess 但它显示警告并且不给出任何输出 unknown escape sequence
suds.TypeNotFound：未找到类型：“MerchantCode”

我正在使用 django 开发一个网络它处理 wsdl 我有一个处理它的示例代码但它是用 PHP 编写的我想将它转换为 python 以用于我的 django 这是 PHP 文件
Android 使新的异步任务在后台或 Dropbox Core API 问题中优先于其他任务

我正在使用 Android 中的核心 API 从 Dropbox 加载多张照片并在发出请求时对它们进行序列化我正在将缩略图显示在网格视图中当用户单击其中一个缩略图时它会转到另一个活动它会从服务器获取完整的分辨率版本它做得很好但
如何在 Foundry 中解析大型压缩 csv 文件？

我有一个大型 gzip 压缩 csv 文件 csv gz 上传到一个数据集该数据集大小约为 14GB 未压缩时为 40GB 有没有一种方法可以使用 Python Transforms 解压缩读取并将其写入数据集而不会导致执行器 OOM
Pandas：使用 groupby 和函数进行数据帧过滤

使用Python 3 3和Pandas 0 10 我有一个通过连接多个 CSV 文件构建的 DataFrame 首先我过滤掉名称列中包含特定字符串的所有值结果看起来像这样为了简洁起见缩短了实际上还有更多列 Name ID A 1
批处理菜单轮廓和设计[重复]

这个问题在这里已经有答案了不久前我在谷歌上搜索如何制作具有更专业外观的批处理菜单而不是使用以下符号批量制作菜单周围的轮廓但我没有运气今天无意间发现了这篇文章 https web archive org web 2015120
尝试设置 Spring Servlet 时出现“WARN org.springframework.web.servlet.PageNotFound - 未找到带有 URI 的 HTTP 请求的映射...”

我正在尝试设置一个 Spring MVC 项目我添加了一个调度程序 servlet 一个 jsp 并设置了 web xml 文件但我不断得到警告 org springframework web servlet PageNotFound
使用 2 级嵌套数组将数据帧转换为 JSON

我对 Python 编程有点陌生我有一个小要求我需要以 JSON 格式列出给定两周内的所有客户及其金额目前我有一个这样的数据框 FortNight Amount Customer Parameter Apr 2FN 2018 339

使用 2 级嵌套数组将数据帧转换为 JSON

使用 2 级嵌套数组将数据帧转换为 JSON 的相关文章

随机推荐

热门标签