pandas 字典列表以分隔列

2024-03-03

我有一个如下数据集:

name    status    number   message
matt    active    12345    [job:  , money: none, wife: none]
james   active    23456    [group: band, wife: yes, money: 10000]
adam    inactive  34567    [job: none, money: none, wife:  , kids: one, group: jail]

如何提取键值对,并将它们转换成一路展开的数据框?

预期输出:

name    status   number    job    money    wife    group   kids 
matt    active   12345     none   none     none    none    none
james   active   23456     none   10000    none    band    none
adam    inactive 34567     none   none     none    none    one

该消息包含多种不同的密钥类型。

任何帮助将不胜感激。


这不简单。

需要将值转换为list of dict by replace http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.replace.html (\s+是一个或多个空格)然后使用ast https://docs.python.org/2/library/ast.html.

那么就可以使用DataFrame构造函数与concat http://pandas.pydata.org/pandas-docs/stable/generated/pandas.concat.html, pop http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.pop.html从以下位置删除列df:

import ast
df.message = df.message.replace([':\s+,','\[', '\]', ':\s+', ',\s+'], 
                                ['":"none","', '{"', '"}', '":"', '","'], regex=True)
df.message = df.message.apply(ast.literal_eval)

df1 = pd.DataFrame(df.pop('message').values.tolist(), index=df.index)
print (df1)
   kids  money group   job  money  wife
0   NaN   none   NaN  none    NaN  none
1   NaN    NaN  band   NaN  10000   yes
2   one    NaN  jail  none   none  none

df = pd.concat([df, df1], axis=1)
print (df)
    name    status  number  kids  money group   job  money  wife
0   matt    active   12345   NaN   none   NaN  none    NaN  none
1  james    active   23456   NaN    NaN  band   NaN  10000   yes
2   adam  inactive   34567   one    NaN  jail  none   none  none

EDIT:

另一种解决方案是yaml:

import yaml

df.message = df.message.replace(['\[','\]'],['{','}'], regex=True).apply(yaml.load)

df1 = pd.DataFrame(df.pop('message').values.tolist(), index=df.index)
print (df1)
  group   job kids  money  wife
0   NaN  None  NaN   none  none
1  band   NaN  NaN  10000  True
2  jail  none  one   none  None

df = pd.concat([df, df1], axis=1)
print (df)
    name    status  number group   job kids  money  wife
0   matt    active   12345   NaN  None  NaN   none  none
1  james    active   23456  band   NaN  NaN  10000  True
2   adam  inactive   34567  jail  none  one   none  None
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

pandas 字典列表以分隔列 的相关文章

随机推荐

  • 获取python项目使用的所有模块/包

    我有一个 python GUI 应用程序 现在我需要知道应用程序链接到的所有库 这样我就可以检查所有库的许可证兼容性 我尝试过使用 strace 但 strace 似乎会报告所有包 即使应用程序未使用它们 而且 我尝试了 python Mo
  • 如何更改 mysql 表列默认值?

    我有一个带有 type 列的表timestamp默认值current timestamp并更新至current timestamp每次更新时 我想删除此列上的 更新时 功能 怎样写alter语句呢 我尝试了以下方法 ALTER TABLE
  • 模块在角度模块中没有导出成员错误

    我想创建一个功能模块来处理上传的前端 上传组件 html没有错误
  • 从 Eclipse 插件使用 Jython

    当从 Eclipse 插件运行时 我很难让 jython 正常工作 我有一个简单的对象工厂 它加载符合 Java 接口的 python 模块 所有这些在独立模式下都可以正常工作 然而 当我将其打包为 Eclipse 插件时 我根据一些变量收
  • gnu sort - 默认缓冲区大小

    我已阅读全文文档 http www gnu org software coreutils manual html node sort invocation html sort invocation对于 gnu sort 并在线搜索 但我找不
  • JS 将 blob url 转换为 Base64 文件

    有如下代码 console log blob var reader new window FileReader reader onloadend function console log reader result reader readA
  • 如何在 Flutter 中点击其他小部件时打开 DropdownButton?

    我需要有一个DropdownButton当点击其他一些小部件时 选项列表会以编程方式打开 显示 我知道这可能不是 UI 最佳实践 但我需要这种行为 举个例子 在像下面这样的结构中 我可能需要用胶带固定Text every 来打开邻近的Dro
  • 在 php 下拉列表中设置默认选项并在提交查询时保留

    我有下面的代码 它从 php ini 创建下拉菜单 我想在这里实现两件事 1 我想将其中一个选项设置为默认 它可以是硬编码的或从查询中选择的 2 当按下按钮时 应保留所选选项 我可以使用会话数据检索所选选项 echo print versi
  • PostgreSQL 10 => 11.1 关于 Brew 更新问题

    试图找到一条迁移路线PostgreSQL 10 6 to postgreSQL 11 1 Using pg upgrade 从两个版本 给我错误 从11 1我认为这将用于将过时的表格转换为货币 usr local Cellar postgr
  • 检查 ipython 中最后一个命令的退出状态

    有谁知道如何在 ipython 中检查最后执行的命令 退出代码 的状态 它应该存储为 exit code运行命令后 至少在即将发布的 v0 11 版本中
  • 实现基于查表的三角函数

    对于我在业余时间实现的视频游戏 我尝试使用查找表实现我自己的 sinf cosf 和 atan2f 版本 目的是使实现速度更快 但准确性较低 我的初步实现如下 这些函数可以工作 并返回良好的近似值 唯一的问题是他们是slower而不是调用标
  • python中获取shell命令的返回值

    我正在做os system追踪实时文件并grep对于一个字符串 grep 成功后如何执行某些操作 例如 cmd os system tail f file log grep i abc if cmd Do something and con
  • 检查表达式是否有效

    由于未捕获的异常而终止应用程序 NSInvalidArgumentException 原因 无法解析格式 字符串 12 6 1 我想验证表达式是否有效 我正在尝试使用以下代码 let equationString 12 6 do let e
  • 添加到别人对我不拥有的 GitHub 项目的拉取请求

    我可以添加提交吗别人的在我不是所有者的存储库上拉取请求 e g 用户 A 拥有项目 X 用户 B 分叉项目 X 创建功能分支 进行一些更改 然后提交拉取请求 用户 C 喜欢该拉取请求 但希望对其进行一些修改 FWIW 用户 C 已经拥有项目
  • jquery `append()` 是否删除重复的对象?

    我正在使用 jQuery 对表进行排序 大致遵循找到的代码here https stackoverflow com questions 10543618 jquery sort a table after adding a row to i
  • 如何使用 Prettier 在 vscode 上无法自动多行?

    我喜欢 Prettier 中的所有功能 但自动多行功能很烦人 是否可以将其关闭 就像添加多个 CSS 选择器和 HTML 属性时一样 我希望将它们保留在一行中 而不是将每个选择器 属性放在自己的行上 例如 在 CSS 上我希望它看起来像这样
  • 从单个文件反序列化多个对象[重复]

    这个问题在这里已经有答案了 我有许多对象 同一类 序列化到一个文件中 但是在反序列化它时 只有第一个序列化的对象被反序列化 序列化代码 public void save File f new File vehicule txt try if
  • voiceSynthesis.getVoices() 在 Windows 上返回空数组 [重复]

    这个问题在这里已经有答案了 我正在做一个Chrome 扩展程序 其中我正在使用语音合成 当我打字时speechSynthesis getVoices in the console我得到一个21种不同声音的阵列 伟大的 When I cons
  • 如何在 sbt 设置初始化期间打印到流

    我试图在配置 sbt 设置时打印一条警告消息 我最初的尝试看起来像这样 setting val log streams value log val condition check something if condition log war
  • pandas 字典列表以分隔列

    我有一个如下数据集 name status number message matt active 12345 job money none wife none james active 23456 group band wife yes m