将一列 json 字符串转换为一列数据

2023-12-06

我有一个大约 30000 行的大数据框和一个包含 json 字符串的列。每个 json 字符串都包含许多变量及其值我想将此 json 字符串分解为数据列

两行看起来像

0 {"a":"1","b":"2","c":"3"}
1 {"a" ;"4","b":"5","c":"6"}

我想将其转换为数据框，例如

a   b   c
1   2   3
4   5   6

请帮忙

您的列值似乎在实际 json 字符串之前有一个额外的数字。所以你可能想先把它去掉（跳到Method如果情况并非如此）

一种方法是将函数应用于列

# constructing the df
df = pd.DataFrame([['0 {"a":"1","b":"2","c":"3"}'],['1 {"a" :"4","b":"5","c":"6"}']], columns=['json'])

# print(df)
                         json
# 0  0 {"a":"1","b":"2","c":"3"}
# 1  1 {"a" :"4","b":"5","c":"6"}

# function to remove the number
import re

def split_num(val):
    p = re.compile("({.*)")
    return p.search(val).group(1)

# applying the function
df['json'] = df['json'].map(lambda x: split_num(x))
print(df)

#                          json
# 0   {"a":"1","b":"2","c":"3"}
# 1  {"a" :"4","b":"5","c":"6"}

Method:

一旦df是上面的格式，下面将把每个行条目转换为字典：

df['json'] = df['json'].map(lambda x: dict(eval(x)))

然后，申请pd.Series到专栏就可以了

d = df['json'].apply(pd.Series)
print(d)
#   a  b  c
# 0  1  2  3
# 1  4  5  6

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

json

pandas

DataFrame

将一列 json 字符串转换为一列数据的相关文章

删除 tkinter 文本默认绑定

我正在制作一个简单的 tkinter 文本编辑器但我想要所有默认绑定文本小部件如果可能的话删除例如当我按Ctrl i它默认插入一个制表符我制作了一个事件绑定来打印文本框中有多少行我将事件绑定设置为Ctrl i以及当我运行它时它会
我可以同时打开两个 Tkinter Windows 吗？

可以同时打开2个窗口吗 import tkinter as Tk import random import math root Tk Tk canvas Tk Canvas root background image Tk PhotoIma
Discord.py 斜线命令在 cogs 中不起作用

我正在构建一个不和谐的机器人并且想要在 cogs 内使用斜杠命令但这些命令不显示或工作这是代码 cog guild ids 858573429787066368 861507832934563851 class Slash comma
在多核上运行 python 线程

我知道Python 2 7不允许在不同的内核上运行多个线程你需要使用multiprocessing模块以实现某种程度的并发性我正在看concurrent futuresPython 3 4 中的模块是否使用ThreadPoolExec
lmfit模型拟合然后预测

我正在领养lmfit进行曲线拟合并使用拟合模型进行预测然而下面的代码并没有达到我想要的效果能否请你帮忙谢谢 import numpy as np from lmfit import Model def linearModel x a0
Asyncio：从未检索到任务异常的怪异

假设我有一个简单的代码 import asyncio async def exc print 1 0 loop asyncio get event loop loop create task exc try loop run forever
cxfreeze virtualenv 中缺少 distutils 模块

从 python3 2 项目运行 cxfreeze 二进制文件时我收到以下运行时错误 project dist project distutils init py 13 UserWarning The virtualenv distuti
matplotlib：渲染到缓冲区/访问像素数据

我想使用 matplotlib 生成的图作为 OpenGL 中的纹理到目前为止我遇到的 matplotlib 的 OpenGL 后端要么不成熟要么已经停止使用所以我想避免使用它们我当前的方法是将图形保存到临时 png 文件中并从
右键单击 QPushButton 上的 contextMenu

对于我的应用程序我在 Qt Designer 中创建了一个 GUI 并将其转换为 python 2 6 代码关于一些QPushButton 与设计器创建我想添加右键单击上下文菜单菜单选项取决于应用程序状态如何实现这样的上下文菜单
使用 python 从 CSV 创建字典

我有一个 CSV 格式的文件其中 A B 和 C 是标题我如何以Python方式将此CSV转换为以下形式的字典 A 1 B 4 C 7 A 2 B 5 C 8 A 3 B 6 C 9 到目前为止我正在尝试以下代码 import csv
ImproperlyConfigured at / 不允许空静态前缀 - Django

我正在使用 Django 上传显示图像该网站部署在 Heroku 上下列的this https coderwall com p bz0sng教程我能够成功上传图像但是图像并未显示在模板中然后我了解到我的 urls py 末尾应该
Kivy TextInput 水平和垂直对齐（文本居中）

如何在 Kivy 的 TextInput 中水平居中文本 I have the following screen But I want to centralize my text like this 这是我的 kv 语言的一部分 BoxLa
使用具有可变数量索引的 numpy mggrid

如何将 numpy mgrid 与可变数量的索引一起使用我在 github 上找不到任何人将其与硬编码值以外的任何内容一起使用的示例 import numpy as np np mgrid 1 10 1 10 this works fin
增强迪基-富勒测试中的 BIC 在 Python 中到底是如何工作的？

这个问题是关于 statsmodels tsa stattools python 库 adfuller 中的增强迪基富勒测试实现原则上 AIC 和 BIC 应该计算一组可用模型的信息标准并选择最好的模型信息损失最低的模型但它们在增
在字符串内打印单引号

我想输出 XYZ s ABC 我在Python IDLE中尝试了以下3条语句第一条和第二条语句输出 a before 带打印功能的第三条语句不输出 before 作为 Python 新手我想了解为什么之前输出在第 1 条和第 2 条
如何在类型提示中定义元组或列表的大小

有没有办法在参数的类型提示中定义元组或列表的大小目前我正在使用这样的东西 from typing import List Optional Tuple def function name self list1 List Class1 if
带 Qt 的菜单栏/系统托盘应用程序

我是 Qt PyQt 的新手我正在尝试制作一个应用程序其功能将从菜单栏系统托盘执行这里展示了一个完美的例子我找不到关于如何做到这一点的好资源有人可以建议吗 Thanks 我认为您正在寻找与QMenu and QMainWindo
如何在 JSONKit 中 JSON 序列化 NSDate 字典

我尝试使用 Jsonkit 和 Apple 的 JSON 序列化器但没有成功它不断破坏 geo 属性该属性是 NSNumbers 的 nsarray Post p Post alloc init p uname mike p like
JSONDecodeError：额外数据：Python [重复]

这个问题在这里已经有答案了我使用以下代码从文件加载 json file file name obj list with open file as f for json obj in f obj list append loads json
在Python中使用os.makedirs创建目录时出现权限问题

我只是想处理上传的文件并将其写入工作目录中该目录的名称是系统时间戳问题是我想以完全权限创建该目录 777 但我不能使用以下代码创建的目录755权限 def handle uploaded file upfile cTimeStamp

随机推荐

MVVM下WPF DataGridTemplateColumn可见性绑定

我的 ViewModel 中有一个绑定到 ICollectionView 的 DataGrid DataGrid 位于 UserControl 内该 UserControl 用于几种不同的数据场景其中一些需要某些 DataGrid 列
将背景图像居中对齐

这是 HTML div class gallerybox a href CustomContentRetrieve aspx ID 398791 img alt src Utilities image jpg width 400 heigh
Delphi：使用参数时如何获取传递到服务器的查询

我有一个带有 Devart TMSQuery SQL 内参数的查询就像是 select from customers where customer CustomerID 在我做的代码中 Delphi sqlcustomer ParamBy
MongoDB 中的 geoNear 可以返回文档中字段的子集吗？

当使用 geoNear 时它返回所有字段整个文档它找到的对象有什么方法可以将其限制为字段的子集吗目前不支持这一点唯一的解决方法是使用 near 并自己进行距离计算 dist sqrt dx dx dy dy
如何查找 SQL Server 中所有数据库中所有表的列名

我想找到所有表中的所有列名在所有数据库中有没有一个查询可以为我做到这一点尝试这个 select o name c name from sys columns c inner join sys objects o on c object
Microsoft Graph - 允许用户访问应用程序/服务主体

我们正在向员工推出一个主要应用程序它已设置为使用 Azure AD SSO 目前我们必须通过 Azure AD gt 应用程序 gt 用户手动设置每个用户才能访问该应用程序我们有一个小型 C Web 应用程序用于管理 AD 用户希望使
使用 PushState 为 Backbone SPA 配置 Node Express

我的 Express 应用程序有一个休息服务器和一个使用 Backbone 的 SPA 使用 history一切正常即 Backbone history start If I do Backbone history start pushS
使用 C# 写入 Excel

我有一个基本的 WinForms 应用程序并且希望能够将该应用程序中的数据写入 Excel 电子表格到目前为止我有以下代码 Microsoft Office Interop Excel Application excelapp new
自定义上传按钮

嗨我只是想知道如何创建自己的自定义文件上传按钮因为我能做的最好的就是我想要实现的是如果有的话我会非常感激请我提供解释如何使用代码执行此操作的答案而不是包含允许您下载按钮或类似内容的网站链接的答案谢谢尽管其中一些答案会创建一些
历史数据的非抽样报告自动化

我们有一个客户每天收到 2 400 万次访问因此我们只能获得未抽样的报告因为它超出了谷歌的限制对于尚未存储数据的特殊查询最多 500 000 个会话我们正在尝试收集 1 天期间的独立访客和访问次数事实证明当数据被采样时使用
给定 k 个已排序数组，从每个数组中选择一个元素，使得所选元素的最大元素和最小元素之差最小

给定 k 个已排序数组从每个数组中选择一个元素使得所选元素的最大元素和最小元素之差最小 k 3 的示例数组1 1 13 27 30 数组2 16 20 29 数组3 2 3 14 18 19 22 25 28 答 2 选定的元素 27
将指针/引用作为参数传递给变量

我知道这个问题已经被问过多次是的我做了一些研究但我找不到适合我需求的解决方案到目前为止我所做的我正在构建一个函数用于跟踪用户向下滚动页面的百分比并将其很好地显示在某个进度条中这工作得很好但是当我在 Chrome 上打开开发者
如何让 OpenMP 在 MSVC 2015 上运行 clang

我尝试让 clang 5 0 0 适用于 Visual Studio 2015 因为我需要 OpenMP 3 0 功能我安装了clang编译器不是没有任何openmp支持的vs2015版本并使用cmake cmake minimum
通过 javascript 更改页面比例

我希望根据分辨率缩放网站主体但代码似乎不起作用 document body style transform scale window screen availHeight 2 document body style o transform
对动态表行进行编号

我正在使用 jQuery 制作动态 HTML 表格在表中我的用户有两种交互追加一行删除特定行对行进行编号的问题是如果用户删除特定行则该行后面的所有行都需要重新编号我必须选择已删除行之后的所有行并将其行数减去 1 有更好的方法
如何在 SQL Server 上启用 MSDTC？

这甚至是一个有效的问题吗我有一个使用 MSTDC 的 NET Windows 应用程序它抛出异常 System Transactions TransactionManagerCommunicationException 分布式事务管理器
为什么 elementtree.ElementTree.iterparse 使用这么多内存？

我正在使用 elementtree ElementTree iterparse 来解析一个大的 371 MB xml 文件我的代码基本上是这样的 outf open out txt w context iterparse copyrigh
easeljs 将图像分割成几部分

我是 easeljs 的新手想知道如何将图像分割成给定数量的块根据我到目前为止收集到的信息我应该使用 SpriteSheets 来完成此任务然而我见过的唯一教程是在一张 SpriteSheet 中包含多个图像的教程而不是将一张图
服务器发送事件在 Google Chrome 中不起作用

这是我的服务器 JSP 代码 Server Date jsp 这是我的客户端 jsp 页面 Client Serverdate jsp
将一列 json 字符串转换为一列数据

我有一个大约 30000 行的大数据框和一个包含 json 字符串的列每个 json 字符串都包含许多变量及其值我想将此 json 字符串分解为数据列两行看起来像 0 a 1 b 2 c 3 1 a 4 b 5 c 6 我想将其转换为

将一列 json 字符串转换为一列数据

将一列 json 字符串转换为一列数据 的相关文章

随机推荐

热门标签

将一列 json 字符串转换为一列数据的相关文章