使用 pandas 将一列字典拆分/分解为单独的列

2024-04-22

我的数据保存在postgreSQL数据库。我正在使用 Python2.7 查询这些数据并将其转换为 Pandas DataFrame。但是，该数据帧的最后一列内部有一个值字典。数据框df看起来像这样：

Station ID     Pollutants
8809           {"a": "46", "b": "3", "c": "12"}
8810           {"a": "36", "b": "5", "c": "8"}
8811           {"b": "2", "c": "7"}
8812           {"c": "11"}
8813           {"a": "82", "c": "15"}

我需要将此列拆分为单独的列，以便 DataFrame `df2 看起来像这样：

Station ID     a      b       c
8809           46     3       12
8810           36     5       8
8811           NaN    2       7
8812           NaN    NaN     11
8813           82     NaN     15

我遇到的主要问题是列表的长度不一样。但所有列表最多仅包含相同的 3 个值：“a”、“b”和“c”。它们总是以相同的顺序出现（“a”第一，“b”第二，“c”第三）。

以下代码可以正常工作并返回我想要的内容（df2）。

objs = [df, pandas.DataFrame(df['Pollutant Levels'].tolist()).iloc[:, :3]]
df2 = pandas.concat(objs, axis=1).drop('Pollutant Levels', axis=1)
print(df2)

我上周刚刚运行了这段代码，并且运行良好。但现在我的代码被破坏了，我从第 [4] 行收到此错误：

IndexError: out-of-bounds on slice (end)

我没有对代码进行任何更改，但现在收到错误。我觉得这是因为我的方法不够稳健或不正确。

任何有关如何将这列列表拆分为单独列的建议或指导将非常感激！

编辑：我认为.tolist()和 .apply 方法不适用于我的代码，因为它是一个 Unicode 字符串，即：

#My data format 
u{'a': '1', 'b': '2', 'c': '3'}

#and not
{u'a': '1', u'b': '2', u'c': '3'}

数据是从导入的postgreSQL数据库采用这种格式。对这个问题有什么帮助或想法吗？有没有办法转换Unicode？

要将字符串转换为实际的字典，你可以这样做df['Pollutant Levels'].map(eval)。之后，可以使用下面的解决方案将字典转换为不同的列。

使用一个小例子，您可以使用.apply(pd.Series):

In [2]: df = pd.DataFrame({'a':[1,2,3], 'b':[{'c':1}, {'d':3}, {'c':5, 'd':6}]})

In [3]: df
Out[3]:
   a                   b
0  1           {u'c': 1}
1  2           {u'd': 3}
2  3  {u'c': 5, u'd': 6}

In [4]: df['b'].apply(pd.Series)
Out[4]:
     c    d
0  1.0  NaN
1  NaN  3.0
2  5.0  6.0

要将其与数据框的其余部分结合起来，您可以concat具有上述结果的其他列：

In [7]: pd.concat([df.drop(['b'], axis=1), df['b'].apply(pd.Series)], axis=1)
Out[7]:
   a    c    d
0  1  1.0  NaN
1  2  NaN  3.0
2  3  5.0  6.0

使用您的代码，如果我省略了，这也有效iloc part:

In [15]: pd.concat([df.drop('b', axis=1), pd.DataFrame(df['b'].tolist())], axis=1)
Out[15]:
   a    c    d
0  1  1.0  NaN
1  2  NaN  3.0
2  3  5.0  6.0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

json

pandas

Dictionary

jsonnormalize

使用 pandas 将一列字典拆分/分解为单独的列的相关文章

pyqt5调用url时处于无响应状态

我刚刚在 pyqt 中实现了登录但在调用 url 和获取响应之间 qt 窗口显示无响应状态谁能建议我如何避免不响应状态 code class Login QDialog def init self height width parent
TensorFlow 未编译为使用 SSE（等）指令，但这些指令是可用的

我第一次使用一些示例代码运行 TensorFlow 运行代码时我收到以下警告有谁知道为什么会发生这种情况以及如何解决它 2017 03 31 02 12 59 346109 W c tf jenkins home workspace re
Python pandas cumsum() 在达到最大值后重置

我有一个 pandas DataFrame 其中 timedeltas 作为这些增量的累积和在单独的列中以毫秒表示下面提供了一个示例 Transaction ID Time TimeDelta CumSum ms 1 00 00 04
在Python中修改大型文本文件最后一行的最有效方法

我需要更新几个超过 2GB 的文件的最后一行这些文件由无法读取的文本行组成readlines 目前它可以通过逐行循环来正常工作但是我想知道是否有任何编译库可以更有效地实现这一点谢谢目前的方法 myfile open large
使用 PyQt4 在 QWidget 上进行 eventFilter

我有一个 QMainWindow 其中包含DrawingPointsWidget 该小部件随机绘制红点我通过使用以下命令为 MouseHovering 事件安装事件过滤器在 QMainWindow 的状态栏中显示鼠标坐标self ins
用python计算网页大小

我将如何使用 Python 计算网页 url 的大小我尝试了 urllib2 并获取内容长度标头但它不存在 import urllib2 url http www google com r urllib2 urlopen url Not
在 JSON 转换为 CSV 期间保持 JSON 键的顺序

我正在使用此处提供的 JSON 库http www json org java index html http www json org java index html为了将 json 字符串转换为 CSV 但我遇到的问题是转换后键的顺序
相当于一个允许重复键的排序字典

我需要一个数据结构可以通过与对象关联的浮动键对对象进行排序从低到低的在前问题是键代表成本所以经常有重复我不关心这一点因为如果两个具有相同的成本我只会抓住第一个因为它没有区别问题是编译器抱怨是否有一种数据结构的行为方式相同
计算两个表中等效行的交集

我有两个 FITS 文件让我们考虑一下例如第一个文件有 100 行和 2 列第二个文件有 1000 行和 2 列 FITS FILE 1 FITS FILE 2 A B C D 1 2 1 2 1 3 1 2 2 4 1 2 我需要采取
如何在 python 中将 selenium webelement 转换为字符串变量

from selenium import webdriver from time import sleep from selenium common exceptions import NoSuchAttributeException fr
dataframe KeyError，尽管它存在

鉴于数据 rows x 1 y 2 z 3 x 2 y 2 z 3 如果我尝试构建这样的数据框 frame pd DataFrame from records rows index x 效果很好然而这 frame pd DataFram
如何在 Python 中小写字符串？

有没有办法将字符串转换为小写 Kilometers kilometers See How to change a string into uppercase https stackoverflow com questions 9257094
如何让 list_blobs 表现得像 gsutil

我只想获得 GCS 上假文件夹结构的第一级如果我运行例如 gsutil ls gs gcp public data sentinel 2 tiles 我得到一个这样的列表 gs gcp public data sentinel 2 til
如何解析代码（Python）？

我需要解析一些特殊的数据结构它们采用某种类似 C 的格式大致如下所示 Group GroupName C Style comment Group AnotherGroupName Entry some variables 0 3 141
Android - 减少位图绘制的内存使用量

我的应用程序中有一张地图显示了 Gowalla 的位置我使用带有简单默认标记的 ItemizedOverlay 但在绘制项目时我将默认标记替换为从 Gowalla 下载 9 并缓存在磁盘上的位置图标问题是如果屏幕上有很多位置例
Python：使用 FOR 循环插入字典

我已经在论坛中进行了搜索但不明白是否可以使用以下构造将新条目插入到我的 Python 字典中而不将其转换为列表 for x in range 3 pupils dictionary new key input Enter new key
将 2D 数组中的每一列与另一个 2D 数组中的每一列相乘

我有两个 Numpy 数组x有形状 m i and y有形状 m j 所以行数是相同的我想将每一列相乘x每一列y逐元素使结果具有形状 m i j Example import numpy as np np random seed 1 x
如何提取Python代码文件中使用的函数？

我想创建代码文件中使用的所有函数的列表例如如果我们在名为 add random py 的文件中有以下代码 import numpy as np from numpy import linalg def foo print np rand
Python 用 lambda 函数封闭作用域变量

我写了这个简单的代码 def makelist L for i in range 5 L append lambda x i x return L 好的现在我打电话 mylist makelist 因为稍后调用嵌套函数时会查找封闭范围变量
使用按钮从 Django 项目根下载文件

So this is the webpage I m creating atm with Django 1 8 希望用户能够将数据导出为 csv 当用户在框中写下 Reddit 子版块名称按下获取数据按钮会发生什么它创建了一个

随机推荐

不使用 Numpy 的矩阵求逆

我想在不使用的情况下反转矩阵numpy linalg inv 原因是我使用 Numba 来加速代码但不支持 numpy linalg inv 所以我想知道是否可以使用经典 Python 代码反转矩阵 With numpy linalg
Array.sort() 在 Firefox 和 Chrome/Edge 中的行为不同[重复]

这个问题在这里已经有答案了我有这段极其简化的代码它在 Firefox 中产生的结果与您在 Chrome 或 Edge 中获得和期望的结果相反尚未尝试过其他浏览器 1 2 3 4 5 sort a b gt 1 forEach a
错误：(26, 13) 无法解析：com.android.support:appcompat-v7:25.0.1

错误 26 13 无法解析 com android support appcompat v7 25 0 1错误 23 24 无法解析 com android support test espresso espresso core 2 0 这
grid.arrange 错误：输入必须是 grobs

我有以下 R 脚本 library ggplot2 library gridExtra Sys setenv LANG en c1 lt ggplot mtcars aes factor cyl geom bar c2 lt ggplot
SwiftUI：如何在没有 AppDelegate 的情况下强制横向

我正在制作带有视频播放器的应用程序除了这个视频播放器之外我的整个结构仅用于纵向视图我想仅为该视图启用横向旋转但我查过很多论坛每个答案都是向 App Delegate 添加一些代码但我没有那我能做什么呢这是给您的演示您可以通
复杂的 Linq 查询未按预期工作

我想合并 4 个表的结果并使用 LINQ 选择特定字段请耐心等待因为我没有做过复杂的 LINQ 查询表 1 订阅者表 2 订阅表 3 状态表 4 国家地区注意订阅者可以有 0 个 1 个或多个订阅这意味着外键 Subsc
如何使用 Apollo 后端在 TypeScript Angular 应用程序中输入部分类型？

编辑我正在寻找来自 Graphql Angular 社区的权威和来源答案以提供最佳实践示例例如我们在 TypeScript 中定义了一个 Person 类型 interface Person firstName string las
从 WordPress 主题创建 Octopress 主题

我已经使用 wordpress 一段时间了想尝试一些不同的东西进入我对静态网站生成世界的发现现在我关注的是 Octopress 我知道它是基于 jekyll 构建的在我开始接触 ruby 之前我想知道是否有可能翻译我的curren
并排启动两个资源管理器窗口

有没有办法使用批处理脚本并排垂直平铺启动两个资源管理器窗口如果没有我该如何使用 VBS 来做到这一点我已经修改了上面的VBS脚本Hackoo完全按照OP的要求去做脚本中的注释准确地解释了它将做什么如果两个窗口未设置到正确位置
动态文件下载，无需在服务器中保存文件

我正在使用 Apache POI 库对多个 excel 文件执行一些操作我正在尝试下载 Excel 报告而不将其存储在服务器中的某个位置我正在使用 Struts 2 它需要将文件输入到InputStream而 POI 工作簿需要Outp
Android“Hello World”教程程序。错误：[解析错误] 解析包时出现问题

今天我决定开始为 Android 操作系统进行开发我访问了他们的网站下载了所有必需的软件 Eclipse Android SDK Eclipse 的 ADT 插件等我按照提供的 Hello World 教程进行操作链接文本 http
使用媒体查询调整图像大小

好的我正在使用 bootstrap 3 和 Quicksand js 制作一个可过滤的投资组合我正在使用流沙来过滤投资组合现在当我的图像设置宽度和高度时我的工作正常但是当我将宽度和高度更改为 100 时排序很奇怪图像在排序时
如何在plotly中绘制饼图？

如何在 fig 中绘制 pie1 子图使其位于第一个位置我就是这样做的但没有成功 import pandas as pd import numpy as np import seaborn as sns import plotly
如何将命名管道字符串从非托管代码空间发送到托管代码空间？

我似乎遇到了命名管道 101 问题我有一个非常简单的设置来连接从 C 非托管应用程序传输到 C 托管应用程序的单工命名管道管道已连接但我无法通过管道发送消息除非我关闭似乎刷新缓冲区并传递消息的句柄就好像消息被屏蔽了一样我尝试颠
发生未处理的异常：开发服务器仅支持每个构建本地化单个区域设置

请告知如何修复此错误我正在尝试实现本地化但遇到了此问题我使用的指南 https angular io guide i18n merge translations into the app https angular io guide
Django 调试工具栏仅适用于管理部分

嘿我已经使用 Django 1 2 1 一段时间了前几天遇到了 Django 调试工具栏它看起来真的很有用我真的很想尝试一些东西我完全按照自述文件所说的安装了一步步我将中间件放在最后以防万一出现问题但我使用的是相当标准的中
使用递归对数字求和

我刚刚研究了递归的概念我想尝试一个简单的例子在下面的代码中我尝试获取数字 1 2 3 4 5 并使用递归将它们加在一起我预计结果是 15 但我的代码返回 16 我究竟做错了什么 Code static void Main strin
Terraform 13，根据另一个变量的值验证变量

有没有办法实现以下逻辑 variable environment description The environment this will be run in can only be set to preprod test prod ty
file_get_contents：无法设置本地证书链文件

我们使用 Composer 来升级 Satis 的依赖项最近的服务器升级后我们无法这样做缩小可能的原因后我们发现 file get contents php 函数在尝试建立 ssl 连接时失败我们使用以下脚本来测试我们的 ssl
使用 pandas 将一列字典拆分/分解为单独的列

我的数据保存在postgreSQL数据库我正在使用 Python2 7 查询这些数据并将其转换为 Pandas DataFrame 但是该数据帧的最后一列内部有一个值字典数据框df看起来像这样 Station ID Pollutant

使用 pandas 将一列字典拆分/分解为单独的列

使用 pandas 将一列字典拆分/分解为单独的列 的相关文章

随机推荐

热门标签

使用 pandas 将一列字典拆分/分解为单独的列的相关文章