Pandas 字典键到列[重复]

2024-06-19

我有一个像这样的数据框。

index          column1
e1             {u'c680': 5, u'c681': 1, u'c682': 2, u'c57...
e2             {u'c680': 6, u'c681': 2, u'c682': 1, u'c57...
e3             {u'c680': 2, u'c681': 4, u'c682': 2, u'c57...
e4             {u'c680': 4, u'c681': 2, u'c682': 3, u'c57...
e5             {u'c680': 3, u'c681': 5, u'c683': 3, u'c57...

现在我想将 column1 中的字典扩展到各个列，如下所示。

index          c680           c681        c682        c683
e1             5              1           2           0 
e2             6              2           1           0
e3             2              4           2           0
e4             4              2           3           0    
e5             3              5           0           3

有没有可以实现这一目标的 pandas 快捷方式？

这里最好的是不使用apply(pd.Series)因为很慢，但是DataFrame带转换的构造函数NaNs to 0然后到ints:

df = pd.DataFrame({'column1': [{'c681': 1, 'c682': 2, 'c57': 4, 'c680': 5}, 
                               {'c681': 2, 'c682': 1, 'c57': 7, 'c680': 6}, 
                               {'c681': 4, 'c682': 2, 'c57': 8, 'c680': 2}, 
                               {'c681': 2, 'c682': 3, 'c57': 1, 'c680': 4}, 
                               {'c683': 3, 'c681': 5, 'c57': 0, 'c680': 3}]},
                                 index=['e1','e2','e3','e4','e5'])


print (df)
                                        column1
e1  {'c680': 5, 'c682': 2, 'c57': 4, 'c681': 1}
e2  {'c680': 6, 'c682': 1, 'c57': 7, 'c681': 2}
e3  {'c680': 2, 'c682': 2, 'c57': 8, 'c681': 4}
e4  {'c680': 4, 'c682': 3, 'c57': 1, 'c681': 2}
e5  {'c683': 3, 'c680': 3, 'c57': 0, 'c681': 5}


df = pd.DataFrame(df['column1'].values.tolist(), index=df.index).fillna(0).astype(int)
print (df)
    c57  c680  c681  c682  c683
e1    4     5     1     2     0
e2    7     6     2     1     0
e3    8     2     4     2     0
e4    1     4     2     3     0
e5    0     3     5     0     3

df = pd.concat([df] * 1000, ignore_index=True)

In [108]: %timeit (pd.DataFrame(df['column1'].values.tolist(), index=df.index))
100 loops, best of 3: 10.1 ms per loop

In [109]: %timeit (df['column1'].apply(pd.Series))
1 loop, best of 3: 1.14 s per loop

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Pandas 字典键到列[重复] 的相关文章

如何使用 pywin32 在 Python 中获取特定应用程序窗口的句柄？

我正在尝试修改一些在 Windows 10 中截取特定应用程序窗口屏幕截图的 Python 代码我正在尝试使用win32ui win32guipywin32 包中的模块用于此目的这是损坏的代码 def getWindow name Wi
从 Windows 文件系统中的任何位置运行 python 脚本

我已经实现了一些实用程序来满足我的需要以使用 Python 简化开发需要多个 py文件和一些额外的 template文件重命名 txt file 我希望能够从文件系统中的任何位置使用此实用程序例如如果我当前位于某个文件夹中我想运
Python select() 行为很奇怪

我在理解 select select 的行为时遇到一些困难请考虑以下 Python 程序 def str to hex s def dig n if n gt 9 return chr 65 10 n else return chr 48
十六进制转储文件的Pythonic方式

我的问题很简单有什么方法可以用 bash 命令以 Python 方式进行编码吗 hexdump e 2 1 02x file dat 显然不使用 os popen 或任何快捷方式编辑虽然我没有明确指定但如果代码在 Python3
将行转换为 pandas 中逗号分隔的字符串

我有一个熊猫数据框 from pandas import DataFrame import pandas as pd df2 DataFrame a one one two two three two one six b x y z y x
在 Python 中使用带有 asyncio 的信号量

我试图限制使用信号量同时运行的异步函数的数量但我无法让它工作我的代码归结为 import asyncio async def send i print f starting i await asyncio sleep 4 print f
使用索引作为循环变量连接多个数据帧

我通过 for 循环创建多个数据帧并将它们连接起来效果很好但我需要包含循环变量作为索引我找不到将循环变量设置为索引的方法 maindf pd DataFrame for i in 20170724 20170725 20170726
安装/编译 pylzma（lzma python 绑定）

我已经向作者提出了这个问题website http www joachim bauch de projects pylzma comment page 1 comment 5211 但我想我也可以在这里问我一直在尝试使用以下设置安装 py
从 Python 执行 PowerShell 脚本的最佳方式是什么

之前关于该主题的所有帖子都涉及其用例的具体挑战我认为如果有一篇文章只讨论从 Python 运行 PowerShell 脚本的最简洁方法并询问是否有人有比我发现的更好的解决方案那将会很有用绕过 PowerShell 尝试以与预期不同
如何计算 pandas 系列中到前一个零的距离？

我有以下 pandas 系列以列表形式表示 7 2 0 3 4 2 5 0 3 4 我想定义一个新的系列返回到最后一个零的距离这意味着我想要以下输出 1 2 0 1 2 3 4 0 1 2 如何以最有效的方式在 pandas 中做到这
使用 spaCy 添加多个 EntityRuler（ValueError：'entity_ruler' 已存在于管道中）

下列link https stackoverflow com questions 57477852 spacy matcher with entities spanning more than a single token展示如何在实体跨越
zsh：当我尝试在 venv 中运行应用程序时，中止 python 错误

我使用以下命令设置 Python 3 6pyenv这样我将来就可以管理多个Python版本例如3 7和3 8 我没有使用 Homebrew 安装 Python 因为它改变了系统版本这是我第一次使用zshshell 因为它是 Catali
Pythonlibs3 CMake 和 macOS

更新2 将以下两行添加到我的 CMake 文件中时成功找到了 python 3 及其库这只在终端中工作的原因是因为 CLion 使用其捆绑版本的 CMake 3 6 3 而我的终端使用的更新版本 3 7 2 正确找到了 python F
聚类算法采用哪种编程结构

我正在尝试实现以下分裂聚类算法下面是该算法的简短形式完整的描述可用here https dl dropboxusercontent com u 540963 diana pdf 从样本 x i 1 n 开始将其视为由 n 个数据点
Python：如何即时生成代码？

我遇到了一个问题我必须动态生成程序然后执行它我们怎样才能做到这一点您可以使用 eval 函数从字符串执行代码一个例子是 import math test r dir math eval test Output doc name pa
Flask 从线程中删除会话变量

我尝试实施投票系统它的工作原理是这样的如果用户对帖子进行投票我会在会话变量中记录其临时状态已投票已加星标等如果当前用户在我将结果保存到临时表之前尚未投票用户可以在 5 分钟内更改投票 5 分钟后结果将使用线程永久写入数据库
numpy.genfromtxt 生成看起来像元组的数组，而不是二维数组 - 为什么？

我在跑genfromtxt像下面这样 date conv lambda x str x replace time conv lambda x str x a np genfromtxt input txt delimiter skip he
Pandas 如何删除包含所需字符串的行

我想删除包含所需字符串的所有行假设我有以下数据框 A B C 1 a x w g n 3 l p j p v 我想删除包含字符串的所有行p 我已经搜索过它但大多数答案都是基于列名称就我而言我不会知道它可以出现在任何列中输出数据帧应
编写适用于 ndarray 和 MaskedArray 的通用数值函数的最佳实践

有没有比以下更漂亮的方式 import numpy as np from numpy import ma def foo x pkg ma if isinstance x ma MaskedArray else np return pkg
Django 类视图未返回 HttpResponse 对象。它返回 None 相反

urls py from housepost views import ListingPost url r house post ListingPost as view name post house views py from djang

随机推荐

RSpec 2 中使用 OR 相等

下面这个例子的正确写法是什么玩家的分数应等于 5 或 8 it should equal 5 or 8 do player score should 5 or 8 end Thanks Tim 5 or 8将始终产生结果 5 并且不会执行
输入连接-如何删除选定的文本？

我为 Android 制作了一个自定义键盘当我按下键盘的退格按钮时我使用 getCurrentInputConnection deleteSurroundingText 1 0 从输入字段中删除一个字母但是当我选择一些文本然后按退格
SetWindowsHookEx 函数返回 NULL

我正在研究 DLL 注入但收到错误如下挂接进程失败 87 参数不正确目标进程和dll都是64位的注入代码为 BOOL HookInjection TCHAR target TCHAR dll name https msdn micr
C修改printf()输出到文件

有没有办法修改printf为了将字符串输出到文件而不是控制台我尝试在互联网上查找一些内容发现了类似的电话dup dup2 and fflush这可能与此有关 EDIT 也许我不清楚问题是这是C考试问题问题如下解释一个通常将字符串输
为什么opencv videowriter这么慢？

你好 stackoverflow 社区我有一个棘手的问题我需要你的帮助来了解这里发生了什么我的程序从视频采集卡 Blackmagic 捕获帧到目前为止它工作得很好同时我用 opencv cv imshow 显示捕获的图像它也工
黄瓜与 RSpec

我想开始深入研究 BDD 我以前从未使用过 TDD 现在不确定我是否应该从学习 RSpec 开始然后跳到 Cucumber 或者直接使用 Cucumber 我一直在互联网上阅读有关两者的内容在我看来 Cucumber 可能是 RSpe
iPhone - 创建自定义 UITableViewCell 顶部和底部边框

我一直在到处寻找但还没有找到我的答案我使用 JSON 中的动态单元格填充 UITableView 并尝试隐藏任何额外的单元格我关闭了IB中的分隔符当然所有的单元格分隔符都消失了如何在每个 tableviewcell 的底部和顶部添
了解 Python 2.7 中的缩进错误

在编写 python 代码时我往往会遇到很多缩进错误有时当我删除并重写该行时错误就会消失有人可以为菜鸟提供 python 中 IndentationErrors 的高级解释吗以下是我在玩 CheckIO 时收到的最近 inden
Django User 模型，添加功能

我想向 Django 的默认用户模型添加一个新函数用于检索模型类型的相关列表这样的 Foo 模型 class Foo models Model owner models ForeignKey User related name owne
没有 Unicode 字节顺序标记。无法切换到 Unicode

我正在使用 XSD 编写 XML 验证器下面是我所做的但是当验证器到达该线时while list Read 它给了我错误没有 Unicode 字节顺序标记无法切换到 Unicode 有人可以帮我解决吗 public class Va
Android repo 脚本创建的 .repo/projects/ 中的裸 git 存储库的用途是什么？

The 安卓源码 http android git kernel org 由以下人员管理repo http source android com source version control html 使用 repo 同步时一个名为 re
以编程方式设置 Logback Appender 路径

我正在尝试以编程方式设置 Logback 附加程序路径滚动文件附加器 http logback qos ch apidocs ch qos logback core rolling RollingFileAppender html准确地说
Kotlin Room 数据库单例模式

我正在尝试创建单人房间数据库我找到了两种解决方案但我不知道它们之间有什么区别根据这个文件 companion object Volatile private var INSTANCE AppDatabase null fun getI
对 HTTP 处理程序的同时请求不起作用

我的 ASP Net 应用程序中有一个通用 HTTP 处理程序 ashx 它执行一些基本但耗时的计算将进度语句打印到输出以便让用户了解情况执行这些计算涉及读取一些在使用处理程序时锁定的数据文件因此对处理程序的两次调用不要立即开始处理
无法通过 Android 应用程序访问我的笔记本电脑的本地主机

因此我在发布此内容之前做了一项研究我发现的解决方案不起作用更准确地说连接到我的笔记本电脑的 IPv4192 168 XXX XXX 没用连接到10 0 2 2 加上端口不起作用我需要测试使用 Django Rest 框架构建的
如何使用 LazyColumn animateItemPlacement() 而不自动滚动更改？

我正在使用一个LazyColumn以类似清单的方式该列表首先显示所有待完成的项目最后显示所有已完成的项目点击一个项目可以切换它是否完成这是我正在做的 MWE data class TodoItem val id Int val la
慢速自动增量重置

我有很多表由于某些原因我需要在应用程序启动时调整这些表的自动增量值我尝试这样做 mysql gt select max id from item max id 97972232 1 row in set 0 05 sec mysql
Django TastyPie 地理距离查找

我正在使用 TastyPie 进行地理距离查找这有点困难因为 TastyPie 官方不支持它在 Github https gist github com 1067176 上我找到了以下代码示例 def apply sorting se
如何从 python 脚本执行 7zip 命令

我试图了解如何使用 os system 模块来执行 7zip 命令现在我不想用 Popen 或 subprocess 让事情变得复杂我已经安装了 7zip 并将 7zip exe 复制到我的用户文件夹中我只想提取我的测试文件 inst
Pandas 字典键到列[重复]

这个问题在这里已经有答案了我有一个像这样的数据框 index column1 e1 u c680 5 u c681 1 u c682 2 u c57 e2 u c680 6 u c681 2 u c682 1 u c57 e3 u c68

Pandas 字典键到列[重复]

Pandas 字典键到列[重复] 的相关文章

随机推荐

热门标签