Pandas：如何将列中的多个列表拆分为多行？

2024-02-19

我有一只熊猫DataFrame看起来像下面这样：

     bus_uid   bus_type    type                      obj_uid  \
0     biomass: DEB31    biomass  output       Simple_139804698384200   
0     biomass: DEB31    biomass   other                        duals   
0     biomass: DEB31    biomass   other                       excess   

                                         datetime  \
0   DatetimeIndex(['2015-01-01 00:00:00',  '2015-01-01 01:00:00',  '2015-01-01 02:00:00', ...   
0   DatetimeIndex(['2015-01-01 00:00:00',  '2015-01-01 01:00:00',  '2015-01-01 02:00:00', ...   
0   DatetimeIndex(['2015-01-01 00:00:00',  '2015-01-01 01:00:00',  '2015-01-01 02:00:00', ...   

                                           values  
0   [1.0, 2.0, 3.0, ...  
0   [4.0, 5.0, 6.0, ...  
0   [7.0, 8.0, 9.0, ...

并想将其转换成如下格式：

     bus_uid   bus_type    type                          obj_uid  datetime             values
0     biomass: DEB31    biomass  output   Simple_139804698384200  2015-01-01 00:00:00  1.0
0     biomass: DEB31    biomass  output   Simple_139804698384200  2015-01-01 01:00:00  2.0
0     biomass: DEB31    biomass  output   Simple_139804698384200  2015-01-01 02:00:00  3.0
0     biomass: DEB31    biomass   other                    duals  2015-01-01 00:00:00  4.0
0     biomass: DEB31    biomass   other                    duals  2015-01-01 01:00:00  5.0
0     biomass: DEB31    biomass   other                    duals  2015-01-01 02:00:00  6.0
0     biomass: DEB31    biomass   other                   excess  2015-01-01 00:00:00  7.0
0     biomass: DEB31    biomass   other                   excess  2015-01-01 01:00:00  8.0
0     biomass: DEB31    biomass   other                   excess  2015-01-01 02:00:00  9.0

列datetime and values具有相同的维度。

我已经问过类似的问题here https://stackoverflow.com/questions/27744276/reshaping-a-pandas-dataframe-into-stacked-record-database-long-format但无法设法将解决方案应用于两列的问题。

转换的最佳方式是什么DataFrame转换成需要的格式？

您可以迭代行以提取Index and Series来自细胞的信息。我不这么认为reshaping当您需要同时提取信息时，这些方法效果很好：

样本数据：

rows = 3
df = pd.DataFrame(data={'bus_uid': list(repeat('biomass: DEB31', rows)), 'type': list(repeat('biomass', 3)), 'id': ['id1', 'id2', 'id3'], 'datetime': list(repeat(pd.DatetimeIndex(start=datetime(2016,1,1), periods=3, freq='D'), rows)), 'values': list(repeat([1,2,3], rows))})

          bus_uid                                           datetime   id  \
0  biomass: DEB31  DatetimeIndex(['2016-01-01', '2016-01-02', '20...  id1   
1  biomass: DEB31  DatetimeIndex(['2016-01-01', '2016-01-02', '20...  id2   
2  biomass: DEB31  DatetimeIndex(['2016-01-01', '2016-01-02', '20...  id3   

      type     values  
0  biomass  [1, 2, 3]  
1  biomass  [1, 2, 3]  
2  biomass  [1, 2, 3]

建造新的DataFrame当你迭代DataFrame rows:

new_df = pd.DataFrame()
for index, cols in df.iterrows():
    extract_df = pd.DataFrame.from_dict({'datetime': cols.ix['datetime'], 'values': cols.ix['values']})
    extract_df = pd.concat([extract_df, cols.drop(['datetime', 'values']).to_frame().T], axis=1).fillna(method='ffill').fillna(method='bfill')
    new_df = pd.concat([new_df, extract_df], ignore_index=True)

to get:

    datetime  values         bus_uid   id     type
0 2016-01-01       1  biomass: DEB31  id1  biomass
1 2016-01-02       2  biomass: DEB31  id1  biomass
2 2016-01-03       3  biomass: DEB31  id1  biomass
3 2016-01-01       1  biomass: DEB31  id2  biomass
4 2016-01-02       2  biomass: DEB31  id2  biomass
5 2016-01-03       3  biomass: DEB31  id2  biomass
6 2016-01-01       1  biomass: DEB31  id3  biomass
7 2016-01-02       2  biomass: DEB31  id3  biomass
8 2016-01-03       3  biomass: DEB31  id3  biomass

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

list

pandas

DataFrame

Pandas：如何将列中的多个列表拆分为多行？的相关文章

保留完整姓氏，在 pandas 列中获取名字的首字母（如果有的话，还有中间名）

我有一个 pandas 数据框其中有一列表示几位网球运动员的姓氏和姓名如下所示 Player 0 Roddick Andy 1 Federer Roger 2 Tsonga Jo Wilfred 我想保留完整的姓氏并获取姓名的首字母和中
Mac OS X 中文件系统的 Unicode 编码在 Python 中不正确？

在 OS X 和 Python 中处理 Unicode 文件名有点困难我试图在代码中稍后使用文件名作为正则表达式的输入但文件名中使用的编码似乎与 sys getfilesystemencoding 告诉我的不同采取以下代码 usr b
搜索多个字段

我想我没有正确理解 django haystack 我有一个包含多个字段的数据模型我希望搜索其中两个字段 class UserProfile models Model user models ForeignKey User unique
没有名为 StringIO 的模块

我有Python 3 6 我想从另一个名为 run py 的 python 文件执行名为 operation py 的 python 文件 In operation py I do from cStringIO import StringI
Emacs 24.x 上的 IPython 支持

我对 IPython 与 Emacs 的集成感到困惑从 Emacs 24 开始 Emacs 附带了自己的python el 该文件是否支持 IPython 还是仅支持 Python 另外维基百科 http emacswiki org e
结构差异 sudo() run('sudo 命令')

我想知道函数之间有什么区别sudo 和函数run sudo u user smth 文档上有 sudo 在所有运行方式上都是相同的除了它总是换行调用 sudo 程序中的给定命令以提供超级用户特权但有几次 sudo cmd 提示我输入
如果在等待“read -s”时中断，在子进程中运行 bash 会破坏 tty 的标准输出吗？

正如 Bakuriu 在评论中指出的那样这基本上与BASH 输入期间按 Ctrl C 会中断当前终端 https stackoverflow com questions 31808863 bash ctrlc during input b
从扫描文档中提取行表 opencv python

我想从扫描的表中提取信息并将其存储为 csv 现在我的表提取算法执行以下步骤应用倾斜校正应用高斯滤波器进行去噪使用 Otsu 阈值进行二值化进行形态学开局 Canny 边缘检测进行霍夫变换以获得表格行去除重复行 10像素范围内相
在 Windows 上使用 apache mod_wsgi 运行 Flask 应用程序时导入冲突

我允许您询问我在 Windows 上使用您的 mod wsgi portage 托管 Flask 应用程序时遇到的问题我有两个烧瓶应用程序由于导入冲突只有一个可以同时存在 IE 如果请求申请 1 我有回复然后如果我请求应用程序 2
Geodjango距离查询未检索到正确的结果

我正在尝试根据地理位置的接近程度来检索一些帖子正如您在代码中看到的我正在使用 GeoDjango 并且代码在视图中执行问题是距离过滤器似乎被完全忽略了当我检查查询集上的距离时我得到了预期距离 1m 和 18km 但 18km 的帖
通过索引访问Python字典的元素

考虑一个像这样的字典 mydict Apple American 16 Mexican 10 Chinese 5 Grapes Arabian 25 Indian 20 例如我如何访问该字典的特定元素例如我想在对 Apple 的第一个
聚合函数在数据框中创建不需要的向量

我在函数中创建数据帧时遇到了一个奇怪的问题但是在 data frame 之外使用相同的方法效果很好这是基本函数我用它来计算数据集的平均值标准差和标准误差 aggregateX lt function formula dataset
使用 Pandas 计算 delta 列

我有一个数据框如下所示 Name Variable Field A 2 3 412 A 2 9 861 A 3 5 1703 B 3 5 1731 A 4 0 2609 B 4 0 2539 A 4 6 2821 B 4 6 2779 A
Jython 和 SAX 解析器：允许的实体不超过 64000 个？

我做了一个简单的测试xml saxJython 中的解析器在处理大型 XML 文件 800 MB 时遇到以下错误 Traceback most recent call last File src project xmltools py li
Python：IndexError：修改代码后列表索引超出范围

我的代码应该提供以下格式的输出我尝试修改代码但我破坏了它 import pandas as pd from bs4 import BeautifulSoup as bs from selenium import webdriver im
使用“默认”环境变量启动新的子进程

我正在编写一个构建脚本来解析依赖的共享库及其共享库等这些共享库在正常情况下是不存在的PATH环境变量为了使构建过程正常工作让编译器找到这些库 PATH已更改为包含这些库的目录构建过程是这样的加载器脚本更改 PATH gt 基于
如何与其他用户一起使用 pyenv？

如何与其他用户一起使用 pyenv 例如如果我在用户 test 的环境中安装了 pyenv 则当我以 test 身份登录时可以使用 pyenv 但是当我以其他用户例如 root 身份登录时如何使用 pyenv 即使你这么做了我也会s
将上下文管理器的动态可迭代链接到单个 with 语句

我有一堆想要链接的上下文管理器第一眼看上去 contextlib nested看起来是一个合适的解决方案但是此方法在文档中被标记为已弃用该文档还指出最新的with声明直接允许这样做自 2 7 版起已弃用 with 语句现在支持此
使用ssl和socket的python客户端身份验证

我有一个 python 服务器需要客户端使用证书进行身份验证我如何制作一个客户端脚本使用客户端证书由 python 中的服务器使用 ssl 和套接字模块进行身份验证有没有仅使用套接字和 ssl 而不扭曲的示例 from OpenSS
查找总和为给定数字的值组合的函数

这个帖子查找提供的 Sum 值的组合 https stackoverflow com a 20194023 1561176呈现函数subsets with sum 它在数组中查找总和等于给定值的值的组合但由于这个帖子已经有6年多了我发这

随机推荐

在C++中查找进程中加载的DLL的内存地址

我有一个正在使用 Test dll 的正在运行的进程我想知道内存中 Test dll 开始的确切内存位置但似乎无法我的主要问题是我需要写入此 DLL 的偏移量但当我使用 Read WriteProcessMemory 时我无法准确
为什么 MassTransit 消息传递中不允许使用结构体？

消费者界面在MassTransit所有人都期望消息模型是类而不是结构由于它们都是内部接口我必须说那里的设计非常好这是显示约束的通用容器类直接获取从源代码来看 https github com MassTransit MassTran
C++ 打印当前函数输入参数类型、名称和值

我正在寻找一种允许记录函数输入参数的功能例如 void func std string input name const int n print current function s inputs type name and value
获取 i18next 以回退到“无翻译”

如果没有找到该键的翻译默认情况下 i18next 翻译库似乎会回退到翻译键例如 No translation defined for CANCEL yet i18next t CANCEL Returns CANCEL 如果没有找到该密
如何动态创建变量？ [复制]

这个问题在这里已经有答案了我想在Python中动态创建变量有没有人有任何创造性的方法来做到这一点除非非常需要创建一堆变量名称否则我只会使用字典您可以在其中动态创建键名称并将值与每个名称相关联 a k 0 while k lt 10
将一组 NumPy 数组传递到 C 函数中进行输入和输出

假设我们有一个 C 函数它接受一组一个或多个输入数组处理它们并将其输出写入一组输出数组签名如下所示 count表示要处理的数组元素的数量 void compute int count float input float output
使用 Webpack 和 ES6 的 Fine Uploader

我正在尝试将 Fine uploader 与通过 Webpack 捆绑的 React ES6 应用程序集成寻找有关如何将精细上传器包含在此堆栈中的指导 In my webpack config js我为 Fine Uploader 设置了
在javascript中使用单引号传递变量

我对链接进行了 onClick 调用 a this is working good 问题是 fomateName 内的变量将包含单引号而我的 fomateName 采用如下变量 var a Andrew D souza 需要格式化用单引号
定义指向 const 字符串的 const 指针

阅读了 Ulrich Drepper 的博文发现两个条目看起来相互矛盾 In the 第一 http udrepper livejournal com 13851 html 全局空间中的字符串 Ulrich 指出该字符串应定义为 cons
Linux下如何用C写文件？

我想重写Linux的 cp 命令所以这个程序会像这样工作 a out originalfile copiedfile 我可以打开文件创建新文件但无法写入新文件什么也没写可能是什么原因当前的C代码是 include
无法将类型“TEnum”转换为“int”

我正在尝试将枚举转换为列表如中所述this https stackoverflow com questions 3489453 how can i convert an enumeration into a listselectlisti
降低 jquery UI 中手风琴的速度

我对这段代码有两个问题首先我想降低效果的速度其次就像您对效果进行操作以关闭选项卡一样然后将出现以下新选项卡 if sidebar ul length sidebar ul accordion event mouseover acti
从 SQLite 中的 INSERT OR IGNORE 语句查找自动递增值

我有一个名为图像的表 CREATE TABLE images id INTEGER PRIMARY KEY AUTOINCREMENT url TEXT NOT NULL UNIQUE caption TEXT 插入行时我希望 URL
`npm install` 和 `npmaudit` 计数之间的区别？

最近添加后npm audit 用于审核依赖关系我注意到有多少个包之间存在巨大差异added 安装在node modules 以及有多少个audited by npm 这是一个例子这是我的问题我说得对吗281已安装的软件包总数是多少 W
Selenium 单击与文本对应的 JavaScript 按钮

我的网页中有很多按钮它们也是 javascript 按钮所有这些按钮都有相同的 TagName 但 id 不同但我不能使用 ID 因为我无法预测必须单击哪个按钮 Selenium 将搜索内容问题here https stackove
在网络上创建电子邮件表单时的安全注意事项

我知道我必须考虑邮件头注入还有更多的事情吗在发送表格邮件之前我需要知道吗我想要邮件我觉得我必须设置表单邮件在我的页面上但我听说邮件事情很危险如果我不考虑所有安全问题 1 避免垃圾邮件使用验证码或其他东西来防止垃圾邮件链接谈
返回位于本地堆栈上的块

clang 分析器可以检查返回的基于堆栈的内存 dispatch block t getPrintBlock const char msg return printf s msg 引发此错误 returning block that liv
无法在 iOS8 上设置交互式推送通知

我已经能够设置交互式本地通知但远程通知不起作用我正在使用 Parse com 发送 JSON 我的 AppDelegate Swift 看起来像这样 AppDelegate swift SwifferApp Created by Tra
knitr 中 python 块的根目录？

我希望这并不像我感觉的那么简单我已经设置了一个基本目录 root gt Paper gt Code 对于我正在写的一篇论文我想从 Paper 目录中的knitr 文档调用 Code 目录中的 Python 脚本类似于this http
Pandas：如何将列中的多个列表拆分为多行？

我有一只熊猫DataFrame看起来像下面这样 bus uid bus type type obj uid 0 biomass DEB31 biomass output Simple 139804698384200 0 biomass DE

Pandas：如何将列中的多个列表拆分为多行？

Pandas：如何将列中的多个列表拆分为多行？ 的相关文章

随机推荐

热门标签

Pandas：如何将列中的多个列表拆分为多行？的相关文章