按时间合并 pandas 数据框和另一列

2024-04-19

我有两个熊猫数据框，我正在尝试将它们组合成一个数据框。我是这样设置它们的：

a = {'date':['1/1/2015 00:00','1/1/2015 00:15','1/1/2015 00:30'], 'num':[1,2,3]}
b = {'date':['1/1/2015 01:15','1/1/2015 01:30','1/1/2015 01:45'], 'num':[4,5,6]}

dfa = pd.DataFrame(a)
dfb = pd.DataFrame(b)

dfa['date'] = dfa['date'].apply(pd.to_datetime)
dfb['date'] = dfb['date'].apply(pd.to_datetime)

然后我找到earliest and latest每个数据帧的时间戳，并创建一个新的数据帧，该数据帧以date series:

earliest = min(dfa['date'].min(), dfb['date'].min())
latest = max(dfa['date'].max(), dfb['date'].max())

date_range = pd.date_range(earliest, latest, freq='15min')

dfd = pd.DataFrame({'date':date_range})

然后我想将它们全部合并到一个数据框中dfd作为基础，因为它将包含所有正确的时间戳。所以我合并dfd and dfa一切都很好：

dfd = pd.merge(dfd, dfa, how = 'outer', on = 'date')

但是，当我将它与dfb the date系列变得扭曲，我不明白为什么。

dfd = pd.merge(dfd, dfb, how = 'outer', on = ['date','num'])

...产量：

                  date  num
0  2015-01-01 00:00:00  1.0
1  2015-01-01 00:15:00  2.0
2  2015-01-01 00:30:00  3.0
3  2015-01-01 00:45:00  NaN
4  2015-01-01 01:00:00  NaN
5  2015-01-01 01:15:00  NaN
6  2015-01-01 01:30:00  NaN
7  2015-01-01 01:45:00  NaN
8  2015-01-01 01:15:00  4.0
9  2015-01-01 01:30:00  5.0
10 2015-01-01 01:45:00  6.0

我所期望的地方4.0填写2015-01-01 01:15:00时间段等，并且不创建新行。

或者如果我尝试：

dfd = pd.merge(dfd, dfb, how = 'outer', on = 'date')

I get:

                 date  num_x  num_y
0 2015-01-01 00:00:00    1.0    NaN
1 2015-01-01 00:15:00    2.0    NaN
2 2015-01-01 00:30:00    3.0    NaN
3 2015-01-01 00:45:00    NaN    NaN
4 2015-01-01 01:00:00    NaN    NaN
5 2015-01-01 01:15:00    NaN    4.0
6 2015-01-01 01:30:00    NaN    5.0
7 2015-01-01 01:45:00    NaN    6.0

这也不是我想要的（只想要一个num柱子）。任何帮助，将不胜感激。

dfa.set_index('date').combine_first(dfb.set_index('date')) \
    .asfreq('15T').reset_index()

                 date    num
0 2015-01-01 00:00:00 1.0000
1 2015-01-01 00:15:00   2.00
2 2015-01-01 00:30:00   3.00
3 2015-01-01 00:45:00    nan
4 2015-01-01 01:00:00    nan
5 2015-01-01 01:15:00   4.00
6 2015-01-01 01:30:00   5.00
7 2015-01-01 01:45:00   6.00

另一种解决方案

dfa.append(dfb).set_index('date').asfreq('15T').reset_index()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

MERGE

按时间合并 pandas 数据框和另一列的相关文章

Django 管理中的嵌套内联？

好吧我有一个相当简单的设计 class Update models Model pub date models DateField title models CharField max length 512 class Post mode
在 Windows 上使用 Python 打开设备句柄

我正在尝试使用 Giveio sys 驱动程序该驱动程序需要先打开一个文件然后才能访问受保护的内存我正在查看 WinAVR AVRdude 中的 C 示例它使用以下语法 define DRIVERNAME giveio HANDL
不要在异常堆栈中显示 Python raise-line

当我在 Python 库中引发自己的异常时异常堆栈将引发行本身显示为堆栈的最后一项这显然不是一个错误在概念上是正确的但是当您在外部使用代码例如作为模块时它会将重点放在对调试无用的东西上有没有办法避免这种情况并强制 Pytho
为什么 Dash 在上传文件时会出现解析错误？

上传 Excel 或 CSV 会导致错误我遵循了 Dash 演示但是当我尝试扩展它来执行绘图之类的操作时它就不起作用了我不想只显示一张桌子 Dash Table 函数已更新因此之前使用 Dash Table Experiments
AWS Lambda - 在区域之间自动复制 EC2 快照？

我想创建一个 Lambda 函数 python 它将自动将已创建的快照复制到另一个区域我已联系 AWS Support 他们只向我发送了用于 RDS 数据库的 GitHub 脚本没有 EC2 快照复制脚本任何帮助都会很棒谢谢是的
Python 3：如何更改GDAL中的图像数据？

我有一个 GeoTIFF 图像其中包含颜色表和带有 8 位表键的单个栅格带并且使用 LZW 压缩我加载该图像gdal Open https gdal org python osgeo gdal module html 我还有一个包含
Unpickle 二进制文件为文本[重复]

这个问题在这里已经有答案了我需要对基本上如下所示的系统进行一些维护复杂的遗留Python程序 gt 二进制pickle文件 gt 另一个复杂的遗留Python程序这需要准确弄清楚中间 pickle 文件中的内容我怀疑文件格式比生成和
多级QTreeView

我很难理解如何使用 QTreeView 和 QStandardItemModel 设置多级 QTree 这是我所拥有的 from PySide QtGui import import sys class MainFrame QWidget
如何在 Python 中重命名文件并保留创建日期

我知道创建日期不存储在文件系统本身中但是当我使用时我遇到了问题os rename 它正在更新我正在使用的文件的创建日期是否可以重命名文件而不更改其原始创建日期正如都铎所说你可以使用os stat http docs python o
有没有更快的方法将数字转换为名称？

以下代码定义了映射到数字的名称序列它的设计目的是获取一个号码并检索一个特定的名称该类通过确保名称存在于其缓存中来进行操作然后通过索引到其缓存中来返回名称问题在这如何在不存储缓存的情况下根据数字计算出名称该名称可以被认为是一个以
Python Peeweeexecute_sql() 示例

我使用 Peewee 模块作为我的项目的 ORM 我看了整个文档没有明确的有关如何处理 db execute sql 结果的示例我跟踪代码只能发现db execute sql 返回游标有谁知道如何处理光标例如迭代它并获取返回复
为什么删除 DataFrame 的列或部分会增加内存使用量，以及如何确保对未使用的 DataFrame 切片进行垃圾回收

处理大型 DataFrame 时您需要小心内存使用情况例如您可能想要分块下载大数据处理这些块然后从内存中删除所有不必要的部分我找不到任何有关处理垃圾收集的最佳程序的资源pandas 但我尝试了以下方法并得到了令人惊讶的结果 im
Python - Map/Reduce - 如何在使用 DISCO 计数单词示例中读取 JSON 特定字段

我正在按照 DISCO 示例来计算文件中的单词数将单词数作为 Map Reduce 作业 http discoproject org doc disco start tutorial html 我对此工作没有任何问题但是我想尝试从包含
Kivy：滚动缩放

有没有办法在桌面 kivy 应用程序上放大图像例如使用鼠标滚轮缩放这里似乎讨论过 https github com kivy kivy issues 3563 https github com kivy kivy issues 3563
查找一个列表在另一个列表中的值的索引

我有两个 Python 整数列表 x and y 的所有元素x出现在某处y 而且只有一次对于每个元素x 我想知道对应值的索引y 然后我想将这些索引设置为一个列表z 下面的代码按照我刚刚描述的方式工作然而对于一项任务来说这似乎有点笨拙
分别计算男女宿舍

我想要的结果是这样的 males 1990 Q1 value Q2 value Q3 Value Q4 Value females Q1 value Q2 value Q3 Value Q4 value 如果任何值不存在则默认值 0 imp
对二进制数的字符串表示进行按位运算 python 2.7

我想对二进制数的两个字符串表示执行按位或但我不知道如何将字符串转换为原始二进制 a 010110 b 100000 a b 应该产生 110110 然后我想计算 on 位的数量这应该返回 4 您可以使用内置的将字符串转换为二进制int
将数值和分类数据混合到具有密集层的 keras 序列模型中

我在 Pandas 数据框中有一个训练集我将此数据框传递到model fit with df values 以下是有关 df 的一些信息 df values shape 981 5 df values 0 array 163 0 6 83
保存 Jupyter Notebook，并显示 Plotly Express 小部件

我有一个 Jupyter 笔记本 python 我使用plotlyexpress 在笔记本中绘图以进行分析我想与非编码人员共享此笔记本并让交互式视觉效果仍然可用但它似乎不起作用我尝试以下此处提出的建议 https community
安装 confluence-kafka 时“文件名或扩展名太长”？

我在使用 pip install confluence kafka 安装 confluence kafka 时遇到一些问题但我收到此错误文件名或扩展名太长详细信息如下 Collecting confluent kafka Using

随机推荐

自定义 Flask-Admin 表单，其中一些选择字段选项根据另一个选择字段设置

我正在尝试使用 Flask Admin 为下面所示的模型 Matriline 创建一个创建编辑表单该模型有一个字符串字段 name 和一个字段 pod id 该字段具有对另一个模型 Pod 的外键约束该模型本身也有一个外键字段氏族模型
如何忽略 OpenCV python 中的内部黑色轮廓？

在上图中我只需要以下轮廓 8 7 0 2 4 里面每隔一个轮廓都是黑色的空盒子有没有办法使用 cv2 RETR TREE 自动提取此类轮廓 cv2 RETR EXTERNAL 将忽略我实际需要的 2 和 4 gt gt heirarch
使用环境变量在 AWS Elastic Beanstalk 上通过 django 运行 celery

我想使用我的 Django 应用程序在 AWS Elastic Beanstalk 上运行 celery 我遵循了 yellowcap 的这个很棒的答案如何使用 AWS Elastic Beanstalk 运行工作线程 https sta
如何在 R 中使用“<<-”（范围分配）？

我刚刚读完R 介绍中的范围界定 http cran r project org doc manuals R intro html Scope 并且我很好奇 lt lt 任务该手册展示了一个非常有趣的示例 lt lt 我觉得我明白了我
模拟器未运行

在我将硬盘更换为另一个 MotherBoard i5 3GHz 处理器而未重新安装操作系统后我的 AVD 模拟器无法运行操作系统 Ubuntu 10 10 我的模拟器没有通过 Eclipse 运行当我单击 Run As Android
Web 测试记录器不允许我记录测试 IE11 windows 7

我正在尝试使用以下方法记录 Web 性能测试网络测试记录器 12 00VS 2013 自带的插件 This is what I get when the toolbar opens 如您所见按钮呈灰色且禁用我已关注这个解决办法 http
Primefaces FileUpload 不适用于 PrettyFaces 和 Spring Boot

我将 Spring Boot 1 5 2 RELEASE 与 JSF 2 2 14 Primefaces 6 1 和 PrettyFaces 3 4 1 Final 一起使用我的pom文件如下
HTML
标签导致 Rails 表单提交 GET 而不是 POST 请求

我有一个可以正常工作的表单直到我添加样式标签我正在使用 twitter bootstrap 该应用程序是 Rails 3 1 我使用的是 Mac 这是一个可以正常工作的表格没有任何问题 div class alert message
Android 数据库 - 无法执行此操作，因为连接池已关闭

我对 android 数据库和游标有奇怪的问题有时很少发生我收到客户的崩溃报告很难找出它崩溃的原因因为我有大约 150 000 个活跃用户可能每周大约有 1 个报告所以这确实是一些小错误这是例外 STACK TRACE j
找不到 db4o 数据库文件

您好我正在编写一个简单的 CRUDE 应用程序该应用程序使用 JSF 和 DB4O 完美运行我可以正常添加并列出所有实体不会出现错误我使用此代码来保存实体 bd Db4oEmbedded openFile configuratio
如何在传递一些上下文时在expressjs中重定向？

我正在使用express 在node js 中制作一个网络应用程序这是我所拥有的内容的简化 var express require express var jade require jade var http require http v
iOS照片框架

我想检索所有照片local设备上的相册基本上设备上的所有照片本地标识符列表是否唯一使用照片框架的最佳方法是什么我的问题不重复因为另一个问题还讨论了云资产和设备上没有的资产当检索图像的实际数据时它会在尝试获取同步时返回空数据我
ModuleWithProviders 需要 1 个类型参数 - angular-autofocus-fix

安装后angular autofocus fix 导入自动对焦模块当我运行角度项目时它显示以下错误 ERROR in node modules angular autofocus fix index d ts 4 23 error TS
从数据表中获取隐藏行内容并将其与表单一起提交

我遇到了一个问题现在它占用了我的时间我有一个包含 7 条记录的表例如该表具有 input 和 textarea 元素用户可以在其中输入内容现在分页的值为每页 5 条记录我有两个页面用户在评论部分输入数据单击分页中的下一
viewWillAppear 与 Viewdidload ios

当使用 iOS 导航应用程序编写代码时我遇到了以下问题我可以在哪里放置 UITableView 的 initdata 方法在 viewWillAppear 或 viewDidLoad 中请帮帮我您可以根据应用程序的要求放置 ini
sql Sparklyr Sparkr Databricks 上的数据帧转换

我在使用以下代码创建的数据块上有 sql 表 sql CREATE TABLE data USING CSV OPTIONS header true inferSchema true LOCATION url data csv 以下代码分别
Iptables v1.6.1 无法初始化 iptables 表“过滤器”Ubuntu 18.04 Bash Windows

我正在从 Windows Bash 运行 Ubuntu 18 04 uname a Linux DESKTOP M87DGAS 4 4 0 17134 Microsoft 112 Microsoft Thu Jun 07 22 57 00
Mongo $in 与复合索引

如何高效地做好 in使用复合索引查找集合下面的示例中索引位于字段 a 和 b 上例如 db foo createIndex a 1 b 1 SQL 中的示例 SELECT FROM foo WHERE a b IN aVal1 bVa
实体框架上下文 6.1.3 未刷新/销毁？

在此单元测试中我将验证内容字节列的 MD5 是否已正确计算保存和获取但是实体框架 6 1 3 上下文似乎没有刷新销毁因为在原始 SQL UPDATE 明显生效之后但在使用新上下文获取行时没有显示 namespace UnitT
按时间合并 pandas 数据框和另一列

我有两个熊猫数据框我正在尝试将它们组合成一个数据框我是这样设置它们的 a date 1 1 2015 00 00 1 1 2015 00 15 1 1 2015 00 30 num 1 2 3 b date 1 1 2015 01 15

按时间合并 pandas 数据框和另一列

按时间合并 pandas 数据框和另一列 的相关文章

随机推荐

热门标签

按时间合并 pandas 数据框和另一列的相关文章