在 Pandas DataFrame 中拆分列表

2024-04-28

我有一个包含多列的 csv 文件。使用 pandas，我将此 csv 文件读入数据帧，并有一个日期时间索引和五六个其他列。

其中一列是时间戳列表（下面带有索引的示例）

CreateDate     TimeStamps
4/1/11         [Timestamp('2012-02-29 00:00:00'), Timestamp('2012-03-31 00:00:00'), Timestamp('2012-04-25 00:00:00'), Timestamp('2012-06-30 00:00:00')]
4/2/11         [Timestamp('2014-01-31 00:00:00')]
6/8/11         [Timestamp('2012-08-31 00:00:00'), Timestamp('2012-09-30 00:00:00'), Timestamp('2012-11-07 00:00:00'), Timestamp('2013-01-10 00:00:00'), Timestamp('2013-07-25 00:00:00')]

我想要做的是将时间戳列转换为列出的每个时间戳的单独行。例如，对于第 1 行，它将转换为 4 行，第 2 行将转换为 1 行。我意识到我需要重置索引才能做到这一点，这很好。

我尝试过的所有内容最终都会进入左侧字段（获取值并在 pandas 之外创建一个列表等）

任何建议表示赞赏。

如果你想留在纯熊猫中，你可以添加一个棘手的groupby and apply如果您不计算列重命名，则最终会归结为单行。

In [1]: import pandas as pd

In [2]: d = {'date': ['4/1/11', '4/2/11'], 'ts': [[pd.Timestamp('2012-02-29 00:00:00'), pd.Timestamp('2012-03-31 00:00:00'), pd.Timestamp('2012-04-25 00:00:00'), pd.Timestamp('2012-06-30 00:00:00')], [pd.Timestamp('2014-01-31 00:00:00')]]}

In [3]: df = pd.DataFrame(d)

In [4]: df.head()
Out[4]: 
     date                                                 ts
0  4/1/11  [2012-02-29 00:00:00, 2012-03-31 00:00:00, 201...
1  4/2/11                              [2014-01-31 00:00:00]

In [5]: df_new = df.groupby('date').ts.apply(lambda x: pd.DataFrame(x.values[0])).reset_index().drop('level_1', axis = 1)

In [6]: df_new.columns = ['date','ts']

In [7]: df_new.head()
Out[7]: 
     date         ts
0  4/1/11 2012-02-29
1  4/1/11 2012-03-31
2  4/1/11 2012-04-25
3  4/1/11 2012-06-30
4  4/2/11 2014-01-31

由于目标是获取列的值（在本例中为日期）并对您打算从列表中创建的多行的所有值重复该值，因此考虑 pandas 索引很有用。

我们希望日期成为新行的单个索引，因此我们使用groupby它将所需的行值放入索引中。然后在该操作中我只想分割这个日期的列表，这就是apply会为我们做的。

我路过apply一只熊猫Series它由一个列表组成，但我可以通过.values[0]这推动了唯一的一行Series到具有单个条目的数组。

要将列表转换为一组将传递回索引日期的行，我可以将其设为DataFrame。这会带来额外索引的惩罚，但我们最终会放弃它。我们可以将其本身作为索引，但这会排除重复值。

一旦将其传回，我就有了一个多索引，但我可以通过以下方式将其强制转换为我们想要的行格式reset_index。然后我们只需删除不需要的索引即可。

听起来很复杂，但实际上我们只是利用 pandas 函数的自然行为来避免显式迭代或循环。

速度方面这往往相当不错，因为它依赖于apply任何适用的并行化技巧apply在这里工作。

或者，如果您希望它对多个日期具有鲁棒性，每个日期都有一个嵌套列表：

df_new = df.groupby('date').ts.apply(lambda x: pd.DataFrame([item for sublist in x.values for item in sublist]))

此时，单行代码会变得密集，您可能应该将其放入一个函数中。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

csv

pandas

在 Pandas DataFrame 中拆分列表的相关文章

读取多个 CSV 文件，并在文件开头跳过不同行数

我必须阅读大约 300 个单独的 CSV 我已经成功使用循环和结构化 CSV 名称来自动化该过程然而每个 CSV 在开头都有 14 17 行垃圾并且随机变化因此在 read table 命令中硬编码 skip 参数将不起作用每个
将字段重新格式化为列，其他字段（与先前结构中成为列的字段配对）成为新列中的字段

我的任务是清理慈善机构设计的移动应用程序中的数据在一个部分中用户问答应用程序使用会话由一行表示该部分由重复的问题答案字段对组成其中一个字段代表所提出的问题然后它旁边的字段代表相应的答案每个问题字段和答案列对一起代表一个独特的问
通过 rpy 将 SPSS 文件（.sav）导入 pandas 时如何保留标签？

我正在寻找使用 SPSS 文件 sav pandas 在没有 SPSS 程序的情况下典型文件转换为 csv 后的样子如下在调查前两行的含义时我不知道 SPSS 似乎第一行包含Labels 而第二行包含VarNames 当我将文件带入
用定点迭代求解该方程

我怎样才能解这个方程 x3 x 1 0 使用定点迭代有没有定点迭代我可以在网上找到代码尤其是Python 吗 Using scipy optimize fixed point http docs scipy org doc scipy
如果使用 unicode 字符，则从数据库中进行 SELECT 会出现问题

我在用着latest带DatabaseLibrary的python和机器人框架版本 https franz see github io Robotframework Database Library api 1 0 1 DatabaseLi
使用DockerOperator时如何同时使用xcom_push=True和auto_remove=True？

Problem 跑步时DockerOperator with xcom push True xcom all True and auto remove True 任务会引发错误就好像容器在读取其内容之前被删除一样STDOUT Exampl
pybind11：如何将 c++ 和 python 代码打包到一个包中？

我正在尝试使用 CMake 和 pybind 11 将现有的 Python 代码和新的 C 11 代码打包在一起我认为我缺少一些可以添加到 CMake 脚本中的简单内容但在任何地方都找不到它 pybind11 示例只有 C 代码和没有P
如何在 Python for 循环中获取 GAE ndb 中当前记录的密钥？

我目前有一个网页其中显示数据存储中的记录列表以及编辑链接我想从数据库转换它至新开发银行我是 Python 和 GAE 新手当前代码 tbody for listtype in listtypes tr td listtype Li
带有redirect_uri的social-auth-app-django Facebook后端状态

我知道我的问题听起来像是重复的但我到处寻找但没有找到任何解决方案我正在努力为我的 django web 应用程序实现社交登录到目前为止谷歌推特和雅虎登录均按预期工作但facebook总是给出以下错误 URL 被阻止此重定向失败
有效地写入 pandas 中的多个相邻列

使用 numpy ndarray 可以一次写入多个列而无需先进行复制只要它们相邻如果我想写入数组的前三列我会写 a 0 0 3 1 2 3 this is very fast a is a numpy ndarray 我希望在 pa
Tkinter 按钮鼠标右键和左键单击有不同的命令

我正在用 Python 制作扫雷游戏并使用 tkinter 库来创建 gui 有没有绑定到 tkinter 按钮两个命令的方法一个是右键单击按钮时的命令另一个是单击左键时的命令通常按钮仅设计用于单击但 tkinter 允许您为
在Python中将用户昵称转换为正式名字

我正在尝试根据 Python 中的用户名字和姓氏映射来自不同系统的用户一个问题是名字在很多情况下都是昵称例如对于用户来说他的名字在一个系统中是 Dave 而在另一个系统中是 David python 中有没有简单的方法可以将这些
将 Selenium 与 PyCharm CE 结合使用

我正在尝试将 Selenium 与 PyCharm CE 一起使用我已经使用 pip install Selenium 安装了 Selenium 并且可以通过终端使用它但是当我尝试将它与 PyCharm 一起使用时出现导入错误 Imp
django 南迁移，不设置默认值

我使用 South 来迁移我的 Django 模型然而南方有一个令人讨厌的错误它不会在 Postgres 数据库中设置默认值例子 created at models DateTimeField default datetime no
Python：如何对数组 X 进行排序，但对 Y 进行相同的相对排序？

例如 X 5 6 2 3 1 Y 7 2 3 4 6 我对X进行排序 X 1 2 3 5 6 但我希望对 Y 应用相同的相对排序以便数字保持与以前相同的相对位置 Y 6 3 4 7 2 我希望这是有道理的通常你会做一个zip sort
使用 OleDbCommand / OleDbDataAdapter 读取 CSV 文件

我不明白为什么但是当我使用 OleDbDataAdapter 或 OleDbCommand 读取 CSV 文件时在这两种情况下生成的数据结构良好它识别文件头中的列但行数据都是空字符串我之前已经成功进行过多次 CSV 处理因此我
在Python中通过sys.stdout写入unicode字符串

暂时假设一个人无法使用print 从而享受自动编码检测的好处所以这给我们留下了sys stdout 然而 sys stdout太蠢了不做任何合理的编码 http bugs python org issue4947 现在人们阅读 Pytho
在 python 中使用 re.sub 将字母变成大写？

在许多编程语言中以下内容 find foo a z bar并替换为GOO U 1GAR 将导致整个匹配项变为大写我似乎无法在 python 中找到等效项它存在吗您可以将函数传递给re sub http docs python org
捕获 SQLAlchemy 异常

我可以使用什么捕获 SQLAlechmy 异常的上层异常 gt gt gt from sqlalchemy import exc gt gt gt dir exc ArgumentError CircularDependencyError
Pandas：如何删除以 nan 作为列名的多个列？

根据标题这是一个可重现的示例 raw data x this that this that this np nan np nan np nan np nan np nan np nan y np nan np nan np nan np

随机推荐

Oracle：SQL查询查找属于表的所有触发器？

我怎样才能找到属于一个表的所有触发器以下内容将独立于您的数据库权限而工作 select from all triggers where table name YOUR TABLE 以下备用选项可能有效也可能无效具体取决于您分配的数据库权
Android Map API V2 设置自定义 InfoWindow 位置

我对地图上的所有标记使用 InfoWindowAdapter Api v2 所有标记都清晰可见问题是我的自定义信息窗口的大小约为 500px 300px 当我触摸地图上的任何点时它被设置为屏幕中心因此信息窗口将从顶部裁剪我的要求是根
Ruby RVM apt-get 更新错误

尝试使用 RVM 安装任何内容时出现以下错误 Searching for binary rubies this might take some time Found remote file https rvm io binaries ubu
如何在nodejs中获取同步readline，或者使用异步“模拟”它？

我想知道是否有一种简单的方法来获取同步 readline 或至少在 node js 中获取同步 I O 的外观我用这样的东西但它很尴尬 var readline require readline var rl readline cre
如何使元素水平居中？

如何水平居中 div 在另一个内 div 使用CSS div div Foo foo div div With flexbox水平和垂直居中的 div 样式非常容易 inner border 0 05em solid black outer
Android 从另一个未上传文件的应用程序启动 Google Drive 应用程序

我尝试通过手动启动 Google 驱动器安装在设备上从 Android 应用程序上传文件我尝试使用此发送Intent createChooser其上传文件附件工作正常但我需要出于特定目的上传文件例如 Dropbox 仅限 Goog
无法在层次结构中的指定点插入节点”代码：“3

嘿又是我问了一个关于 jquery 的问题网格布局 http phase change org jquery gridlayout 我用 switch 制作了一个 php 模板我插入的代码是这样的 div div div class b
在 Actionscript 3 中实现单例模式类的最佳方法是什么？

由于 AS3 不允许私有构造函数因此构造单例并保证构造函数不是通过 new 显式创建的唯一方法是传递单个参数并检查它我听说过两个建议一个是检查调用者并确保它是静态 getInstance 另一个是在同一包命名空间中拥有一个私有内部类
更改工具栏中的标题颜色？

我有一个使用的工具栏并设置标题 ActionBarActivity getActivity getSupportActionBar setTitle Home 有没有办法将颜色从黑色更改为白色我尝试制作自己的主题并将其设置在 xml 中
Java邮件，设置回复地址不起作用

我用java写了一个小的电子邮件发送程序它有from to and reply to地址当客户端尝试回复邮件时应该能够回复reply to地址目前它不起作用我的代码如下 File Name SendEmail java impor
在 stackblitz 中找不到包，即使它存在于 npm 网站中。那要怎么安装呢？

我正在 stackblitz 中安装聚合物应用程序的依赖项说找不到 3 个包但 npm 网站上有这些包我也尝试过cdn 即使这样也行不通截图我也安装了来自该网站的 CDN https www jsdelivr com packag
如何使用 Playwright 打开新选项卡（例如，单击按钮在新选项卡中打开新部分）

我正在寻找针对当前情况的更简单的解决方案例如您打开 google 任何其他网站并且希望通过单击按钮例如 Gmail 使用 Playwright 在新选项卡中打开此页面 let browser page context describ
如何将钱兑换成零钱

尝试将输入的数字转换为 25 美分 50 美分 10 美分和 10 分有几个问题 public class Coins public static void main String args private int quarters di
从 Android 通知中的 URL 加载图像

在我的 Android 应用程序中我想动态设置将从 URL 加载的通知图标为此我使用了setLargeIcon中的NotificationBuilder的属性receiver 我参考了很多链接并尝试了各种解决方案但无法获得所需的输出
Android 应用程序还需要包含扩展文件下载器吗？

我的问题是当应用程序大于 50MB 并且必须使用它们时应用程序是否需要能够下载扩展文件根据 Android 开发人员帮助应用程序可以依赖扩展文件在较新的设备上扩展文件会在 APK 之前之后自动下载而在较旧的设备上开发人员
PHP客户端验证https证书

我需要创建一个 php 来充当客户端并使用 https 下的一些 Web 服务我的问题是我还想验证服务器证书我需要知道我有正确的服务器并且中间没有人充当服务器有人能帮助我吗 Thanks 如果您有curl 扩展则可以将其配置为验证连
如何防止IntelliJ IDEA删除未使用的包？

我正在使用 intellij 我的问题是当我开始将一些临时未使用的包导入到我的类文件中时 intellij 会在一秒钟内删除这些行我怎样才能关闭这个不太好的功能 Disable File Settings Editor General A
Xcode：如何创建出现在另一个视图控制器中的弹出视图控制器

基本上我想做的是假设我有一个名为 V1 的视图控制器它内部有一个常规视图和一个按钮现在当您点击该按钮时我希望该按钮创建一个操作在同一视图控制器 V1 中弹出另一个名为 V2 的视图控制器 V2 的尺寸会缩小一些使其不会填满整个
WPF 中的 InvokeRequired [重复]

这个问题在这里已经有答案了我在一个中使用了这个函数Windows forms应用 delegate void ParametrizedMethodInvoker5 int arg private void log left accs in
在 Pandas DataFrame 中拆分列表

我有一个包含多列的 csv 文件使用 pandas 我将此 csv 文件读入数据帧并有一个日期时间索引和五六个其他列其中一列是时间戳列表下面带有索引的示例 CreateDate TimeStamps 4 1 11 Timestamp

在 Pandas DataFrame 中拆分列表

在 Pandas DataFrame 中拆分列表 的相关文章

随机推荐

热门标签

在 Pandas DataFrame 中拆分列表的相关文章