如何 json_normalize() df 中的特定字段并保留其他列？ [复制]

2024-05-10

这是我的简单示例（我的实际数据集中的 json 字段非常嵌套，因此我一次解压一层）。我需要在 json_normalize() 之后保留数据集上的某些列。

https://pandas.pydata.org/docs/reference/api/pandas.json_normalize.html https://pandas.pydata.org/docs/reference/api/pandas.json_normalize.html

Start:

Expected (Excel mockup):

Actual:

import json

d = {'report_id': [100, 101, 102], 'start_date': ["2021-03-12", "2021-04-22", "2021-05-02"], 
     'report_json': ['{"name":"John", "age":30, "disease":"A-Pox"}', '{"name":"Mary", "age":22, "disease":"B-Pox"}', '{"name":"Karen", "age":42, "disease":"C-Pox"}']}

df = pd.DataFrame(data=d)
display(df)

df = pd.json_normalize(df['report_json'].apply(json.loads), max_level=0, meta=['report_id', 'start_date'])
display(df)

查看有关 json_normalize() 的文档，我认为元参数是我需要保留 report_id 和 start_date 的参数，但它似乎不起作用，因为要保留的预期字段没有出现在最终数据集上。

有人有建议吗？谢谢。

当您沿着结构化索引处理一个非常简单的 json 时，您可以规范化您的框架，然后使用.join沿着你的轴线加入。

from ast import literal_eval


df.join(
      pd.json_normalize(df['report_json'].map(literal_eval))
 ).drop('report_json',axis=1)


   report_id  start_date   name  age disease
0        100  2021-03-12   John   30   A-Pox
1        101  2021-04-22   Mary   22   B-Pox
2        102  2021-05-02  Karen   42   C-Pox

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

json

pandas

DataFrame

jsonnormalize

如何 json_normalize() df 中的特定字段并保留其他列？ [复制] 的相关文章

从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
Pandas 中允许重复列

我将一个大的 CSV 包含股票财务数据文件分割成更小的块 CSV 文件的格式不同像 Excel 数据透视表之类的东西第一列的前几行包含一些标题公司名称 ID 等在以下列中重复因为一家公司有多个属性而不是一家公司只有一栏在前几行
如何创建一个语句来打印以特定单词开头的单词？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何在 python 中打印从特定字母开始的单词而不使用函数而是使用方法或循环 1 我有一个字符串想要打印以 m 开头的单词 S
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
为什么Python的curses中escape键有延迟？

In the Python curses module I have observed that there is a roughly 1 second delay between pressing the esc key and getc
使用 Python pandas 计算调整后的成本基础（股票买入/卖出的投资组合分析）

我正在尝试对我的交易进行投资组合分析并尝试计算调整后的成本基础价格我几乎尝试了一切但似乎没有任何效果我能够计算调整后的数量但无法获得调整后的购买价格有人可以帮忙吗这是示例交易日志原始数据 import pandas as pd
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
shell-out 值到 md5（加密）函数

我正在寻找一种解决方案我正在构建 JSON 记录并需要在 JQ 中生成一些文本但将此文本通过管道传输到 MD5 求和函数并将其用作键的值 echo first John last Big jq id first last md5 通过
如何在 python 中没有 csv.reader 迭代器的情况下解析单行 csv 字符串？

我有一个 CSV 文件需要重新排列和重新编码我想跑 line line decode windows 1250 encode utf 8 在由 CSV 读取器解析和分割之前的每一行或者我想自己迭代行运行重新编码并仅使用单行解析表单
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
R 中的数据框操作 - 将单元格向左移动并删除 NA

我有一个数据框其列由随机分布的值和 NA 组成如下所示 a lt c S E NA S NA b lt c A NA M G K c lt c I NA NA NA L meh lt dataframe a b c 1 2 3 4 5
您可以将操作直接应用于map/reduce/filter 中的参数吗？

map and filter通常可以与列表理解互换但是reduce并不那么容易被交换map and filter 此外在某些情况下我仍然更喜欢函数语法但是当您需要对参数本身进行操作时我发现自己正在经历语法体操最终必须编写整个函数
检查字典键是否有空值

我有以下字典 dict1 city name yass region zipcode phone address tehsil planet mars 我正在尝试创建一个基于 dict1 的新字典但是它不会包含带有空字符串的键它不会包
迭代 pandas 数据框的最快方法？

如何运行数据框并仅返回满足特定条件的行必须在之前的行和列上测试此条件例如 1 2 3 4 1 1 1999 4 2 4 5 1 2 1999 5 2 3 3 1 3 1999 5 2 3 8 1 4 1999 6 4 2 6 1 5 1
您可以使用关键字参数而不提供默认值吗？

我习惯于在 Python 中使用这样的函数方法定义 def my function arg1 None arg2 default do stuff here 如果我不供应arg1 or arg2 那么默认值None or default

随机推荐

如何在 HTML5/CSS3 中将视口锁定为纵向方向

是否可以在移动设备上将视图端口的方向锁定为纵向我用谷歌搜索了它但无法找到确切的操作方法这个技巧应该有效 media screen and orientation landscape html Rotate the content co
我想使用 Sequelize 将 MySQL 中的对象数组存储在单个列中

之前我正在寻找如何使用 Sequelize 在 MySQL 中插入对象数组然后我找到了一种直接插入数组的解决方案例如 1 2 在单列中 insert into TABLE NAME id marks VALUES 21 1 2 但我正在
客户端可以看到服务器端源代码吗？ ASP.NET

我想知道使用任何浏览器的任何客户端是否可以看到我的服务器端代码如果是这样我怎样才能防止这种情况发生实际上客户在访问我的网站时能够看到什么 asp net 我以前从未使用过 asp net 但我认为它与 PHP 或 Perl 相同客
如何嘲笑一切？

我了解如何模拟接口或虚拟方法调用但是像 TypeMock 这样的框架可以模拟框架中的所有内容使用哪些 NET机制来提供此类功能例如 Typemock Isolator 使用 CLR分析器API http msdn microsoft
如何使用交换函数使字符串数组交换其组件？

问题是这段代码不会交换这两个字符串我是编程新手但我可以看出问题出在交换函数上但我不知道如何修复它我尝试在交换中添加 strcpy 而不是但这没有用 include
为什么 foo.hasOwnProperty('__proto__') 等于 false？

var foo bar 5 Why is foo hasOwnProperty proto 等于false 它不能来自原型链中更高层的任何对象因为它是特定于这个对象的 EDIT 有些答案说它已开启Object prototype 但我不明
在气球内显示带有照片的多个地标的最佳做法是什么？

我有一个项目如下从手机上拍摄几张照片将照片保存在网络系统中然后将照片显示在其中的谷歌地球上我读过很多文章但它们都使用 fetchKml 我读过的一篇好文章是使用 php 但使用 fetchKml 我不知道是否可以使用 parseK
Oracle中如何转义单引号？ [复制]

这个问题在这里已经有答案了我有一列包含某些存储为文本字符串的表达式其中包括单个引号例如错过的交易包括引号发生这种情况时如何使用 where 子句 select from table where reason missed tra
使用Spring Cloud Stream Kafka动态更改instanceindex

如同在运行时更改 spring cloud stream 实例索引计数 https stackoverflow com questions 37579939 changing spring cloud stream instance i
删除 servlet 中的 cookie 时出现问题

我尝试使用以下代码删除 servlet 中的 cookie Cookie minIdCookie null for Cookie c req getCookies if c getName equals iPlanetDirectoryPr
Video.js - 阻止点击播放功能

我正在使用 video js 将视频嵌入到 HTML 页面中它将用作仅适用于 ipad 的 Web 应用程序因此我相信它使用的是本机 HTML5 播放器我正在尝试禁用点击播放功能以便用户必须使用控件但我在这样做时遇到了麻烦我尝试
如何在phonegap上使用GCM处理android中的多个推送通知

当推送通知到达时如果用户无法查看该通知他收到另一条通知之前的通知正在更新为新的但它不应该更新为最新的我们需要单独显示每个通知这可以使用 GCM 吗我已经使用Phonegap来开发应用程序 PushPlugin 支持在有效负载中
从 Perl 中的字符串中删除标点符号

如何从 Perl 中的字符串中删除除空格之外的所有标点符号 s punct g
Android 上的 Chrome 强制隐藏地址栏

我最近开发了一个获取混合 http https 内容的网站因此我总是将地址栏显示在顶部它不会像其他网站那样自动隐藏这就是我要说的 This https planetkde org 是网站的链接内容是从各种来源获取的因此无法过滤非
如何在HQL中模拟NVL

我试过这个 from Table where par1 is null or col1 par1 但碰巧的是 from Table where par1 is null 始终返回表的所有行即使 par1 不为 null while sel
Firefox（仅限）动态表单操作不起作用

控制台为操作属性返回空白我已经移动了 file upload attr action io cfm action updateitemfile item id agenda modal attr data defaultitemid 周围
如何在 OpenAPI 3.0 中定义字节数组

我正在将 API 从 Swagger 2 0 迁移到 OpenAPI 3 0 在 DTO 中我有一个指定为字节数组的字段 Swagger 对 DTO 的定义 Job type object properties body type str
$.ajax(); 之间的区别和 $.ajaxSetup();

有什么区别 ajax and ajaxSetup 在 jQuery 中如下 ajax cache false and ajaxSetup cache true 另外哪一个是最好的选择以下将阻止all无论您使用哪种 jQuery 方法 g
Swift 3 的 NSLog 问题

迁移到 Swift 3 后当我尝试执行以下操作时出现错误 self publicDB save listRecord completionHandler record error gt Void in if let saveError e
如何 json_normalize() df 中的特定字段并保留其他列？ [复制]

这个问题在这里已经有答案了这是我的简单示例我的实际数据集中的 json 字段非常嵌套因此我一次解压一层我需要在 json normalize 之后保留数据集上的某些列 https pandas pydata org docs ref

如何 json_normalize() df 中的特定字段并保留其他列？ [复制]

如何 json_normalize() df 中的特定字段并保留其他列？ [复制] 的相关文章

随机推荐

热门标签