Pandas Python：合并一个数据框中的每两行

2024-03-16

我如何从

Idx            A B C
2004-04-01     1 1 0
2004-04-02     1 1 0
2004-05-01     0 0 0
2004-05-02     0 0 0

Idx            A B C
2004-04        2 2 0
2004-05        0 0 0

笔记：如何折叠索引（更具体地说，使索引转换为月份）和每两行？

使用滚动平均值是最好的方法吗？

更新 - 我使上述版本变得简单，但 unutbu 的答案似乎不起作用

                       Time      A   B
1    2004-01-04 - 2004-01-10     0   0
2    2004-01-11 - 2004-01-17     0   0
3    2004-01-18 - 2004-01-24     0   0
4    2004-01-25 - 2004-01-31     0   0
5    2004-02-01 - 2004-02-07     56  0
6    2004-02-08 - 2004-02-14     67  0

您可以使用聚合行groupby/sum手术 http://pandas.pydata.org/pandas-docs/stable/groupby.html:

import pandas as pd
import numpy as np

df = pd.DataFrame([('2004-04-01', 1L, 1L, 0L), ('2004-04-02', 1L, 1L, 0L),
       ('2004-05-01', 0L, 0L, 0L), ('2004-05-02', 0L, 0L, 0L)],
                  columns=['Idx', 'A', 'B', 'C'])
df['Idx'] = pd.DatetimeIndex(df['Idx'])

您可以按年份和月份分组：

print(df.groupby([d.strftime('%Y-%m') for d in df['Idx']]).sum())
#          A  B  C
# 2004-04  2  2  0
# 2004-05  0  0  0

# [2 rows x 3 columns]

或者，按每两行分组：

result = df.groupby(np.arange(len(df))//2).sum()
result.index = df.loc[1::2, 'Idx']
print(result)
#             A  B  C
# Idx                
# 2004-04-02  2  2  0
# 2004-05-02  0  0  0

# [2 rows x 3 columns]

Note: df.loc[1::2, 'Idx']被使用，而不是df.loc[::2, 'Idx'] so the Idx因为聚合行将对应于每组中的第二个日期，而不是第一个日期。

如果您只想要年份和月份，那么您可以使用此列表理解来设置索引：

result.index = [d.strftime('%Y-%m') for d in df.loc[1::2, 'Idx']]
print(result)
#          A  B  C
# 2004-04  2  2  0
# 2004-05  0  0  0

# [2 rows x 3 columns]

但是，在处理日期时，使用 DatetimeIndex 作为索引比使用字符串值索引更强大。因此，您可能希望保留 DatetimeIndex，使用 DatetimeIndex 完成大部分工作，并在最后转换为年月字符串以用于演示目的...

关于更新的问题：

import pandas as pd
import numpy as np

data = np.rec.array([('2004-01-04 - 2004-01-10', 0L, 0L),
       ('2004-01-11 - 2004-01-17', 0L, 0L),
       ('2004-01-18 - 2004-01-24', 0L, 0L),
       ('2004-01-25 - 2004-01-31', 0L, 0L),
       ('2004-02-01 - 2004-02-07', 56L, 0L),
       ('2004-02-08 - 2004-02-14', 67L, 0L)], 
      dtype=[('Time', 'O'), ('A', '<i8'), ('B', '<i8')])
df = pd.DataFrame(data)

让一个时间列包含两个日期会使数据操作变得更加困难。最好有两个DatetimeIndex列，Start and End:

df[['Start', 'End']] = df['Time'].str.extract('(?P<Start>.+) - (?P<End>.+)')
del df['Time']
df['Start'] = pd.DatetimeIndex(df['Start'])
df['End'] = pd.DatetimeIndex(df['End'])

然后你可以按Start column:

print(df.groupby([d.strftime('%Y-%m') for d in df['Start']]).sum())
#            A  B
# 2004-01    0  0
# 2004-02  123  0

# [2 rows x 2 columns]

或者按每两行分组，本质上与之前相同：

result = df.groupby(np.arange(len(df))//2).sum()
result.index = df.loc[1::2, 'Start']
print(result)
#               A  B
# Start             
# 2004-01-11    0  0
# 2004-01-25    0  0
# 2004-02-08  123  0

# [3 rows x 2 columns]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Pandas Python：合并一个数据框中的每两行的相关文章

在 Django 中获取数据库类型[重复]

这个问题在这里已经有答案了我需要能够确定 Django 运行时使用的数据库类型 MYSQL False if
顶级棉花糖模式验证

From 棉花糖 validation http marshmallow readthedocs org en latest quickstart html validation 我知道我可以在架构中的特定字段上注册验证器如果验证器失败
如何跳过财务图中的空日期（周末）

ax plot date dates dates highs lows 我目前正在使用此命令来绘制财务高点和低点Matplotlib http en wikipedia org wiki Matplotlib 效果很好但如何删除 x 轴上
Python Pandas 从宽到长的格式更改以及列标题拆分

我有一个包含以下列标题和行示例的表 Subject Test1 Result1 Test1 Result2 Test2 Result1 Test2 Result2 0 John 10 0 5 20 0 3 我想将其改造成 Subject l
如何在不破坏默认行为的情况下覆盖 __getattr__ ？

我如何覆盖 getattr https docs python org 3 reference datamodel html object getattr 类的方法而不破坏默认行为压倒一切 getattr 应该没事 getattr 仅作为
使用Python进行图像识别[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个想法就是我想识别图像中的字母可能是 bmp或 jpg 例如这是一个包含字母 S 的 bmp 图像我想做的是使用Pyth
使用 OpenCV 进行相机校准 - 如何调整棋盘方块大小？

我正在使用 OpenCV Python 示例开发相机校准程序来自 OpenCV 教程 http opencv python tutroals readthedocs io en latest py tutorials py calib3d
将分布拟合到直方图

I want to know the distribution of my data points so first I plotted the histogram of my data My histogram looks like th
如何在返回的 AJAX 调用上使用 django 模板标签？

我有一个简单的 AJAX 脚本它在名为的搜索字段中获取输入的字符串AJAXBox并调用一个视图函数该函数使用过滤器查询数据库并返回与输入参数匹配的所有 User 对象的查询集当我使用 django 模板标签迭代查询集时它不起作用我
Microsoft Azure 数据仓库和 SqlAlchemy

我正在尝试使用 python 的 sqlalchemy 库连接到 microsoft azure 数据仓库并收到以下错误 pyodbc Error HY000 HY000 Microsoft ODBC SQL Server Driver
PyPI 上的轮子平台约束有什么限制吗？

是否有任何地方 PEP 或其他地方声明关于 Linux 轮子上传范围的限制 PyPI http pypi io 应该有具体来说上传是否被认为是可接受的做法linux x86 64轮子到 PyPI 而不是manylinux1 x86 6
Numpy 通过一个数组的值总结另一个数组

我正在尝试找到一种矢量化方法来完成以下任务假设我有一个 x 和 y 值的数组请注意 x 值并不总是整数并且可以为负数 import numpy as np x np array 1 1 1 3 2 2 2 5 4 4 dtype flo
使用 .map() 在 pandas DataFrame 中高效创建附加列

我正在分析形状与以下示例类似的数据集我有两种不同类型的数据 abc数据和xyz data abc1 abc2 abc3 xyz1 xyz2 xyz3 0 1 2 2 2 1 2 1 2 1 1 2 1 1 2 2 2 1 2 2 2 3
Python `concurrent.futures`：根据完成顺序迭代 future

我想要类似的东西executor map 除了当我迭代结果时我想根据完成的顺序迭代它们例如首先完成的工作项应该首先出现在迭代中等等这样当且仅当序列中的每个工作项尚未完成时迭代就会阻塞我知道如何使用队列自己实现这一点但我想知道
如何使用 Selenium Webdriver (Python) 在上下文菜单中选择“将图像另存为...”来保存图像

我正在尝试使用 selenium webdriver 将特定图像保存到目录中我希望通过模拟右键单击 img 元素并选择将图像另存为来实现此目的使用以下代码我可以打开上下文菜单但无法选择正确的选项 browser WebDriver
django 中的“管理器”是什么？

我已经阅读了Django官方中的定义文档 https docs djangoproject com en dev topics db managers 我仍然对什么感到困惑Manager does 文档说它们允许您操作数据库表模型但我仍
在Python中将罗马数字转换为整数

根据 user2486 所说这是我当前的代码 def romanMap map M 1000 CM 900 D 500 CD 400 C 100 XC 90 L 50 XL 40 X 10 IX 9 V 5 V 4 I 1 return
Django 迁移错误 'TypeError: 序列项 1: 需要一个类似字节的对象，在 mysql-connector-pythoncursor_cent.py 文件上找到 str'

我正在 Django 项目中使用 mysql connector 来处理 mysql 请求问题是我正在使用 django admin startproject project 设置一个简单的项目当我尝试进行简单的管理 py 迁移时这是
如何有效地计算另一列中每个元素的较大元素的数量？

我有以下内容df name created utc 0 t1 cqug90j 1430438400 1 t1 cqug90k 1430438400 2 t1 cqug90z 1430438400 3 t1 cqug91c 143043840
需要一个从 yaml 文件中提取内容并输出为 csv 文件的脚本

我对 python 很陌生但我很感激您帮助指导我创建一个简单的脚本该脚本读取一堆 yaml 文件同一目录中的大约 300 个文件并从 yaml 文件并将其转换为 csv yaml 文件中内容的示例 code 9313 degrees

随机推荐

Kubernetes Minikube hostPath 安装未重新加载

我有一个通过 Minikube 在本地运行的 Kubernetes 集群我的 Mac 上有一个本地文件夹通过 hostPath 卷配置安装并且可以访问位于以下位置的 Docker 容器 code bot 我可以创建一个服务并加载网页
仅设计时错误：WPF“StaticExtension”异常

我有这个组合框
cookie 如何影响 Varnish 缓存？

Varnish 缓存如何影响 Omniture 设置的第三方 Cookie 和 Google Analytics 设置的第一方 Cookie 到目前为止我看到了反对的意见有些人说因为跟踪统计数据是由 JavaScript 创建的这是事
如何在ansible中为不同主机使用另一个任务中一个任务的返回值

我试图使用ansible为由2个mysql主机组成的主机组设置mysql主从复制这是我的场景我在第一台主机上运行一个任务并跳过第二台主机因此第一个任务即主复制状态返回一些值例如位置文件等然后我在第二个主机中运行另一个任务
java.lang.IllegalArgumentException：输入== null！使用 ImageIO.read 将图像加载为 bufferedImage 时

这个问题在这个网站上已经被问了大约 100 次但我已经查看了所有这些问题尽管它们都得到了解决但没有一个解决方案对我有用我的代码如下所示 public Button1 Client client String imgName this
如何获取 GitHub Actions 中特定步骤的输出？

我有一个运行测试的 GitHub Actions 工作流程但现在我在其中集成了松弛通知我想得到的输出Run tests步骤并在松弛步骤中将其作为消息发送 name Run tests run mix compile warnings a
将 JSON 数组从 C# 传递到 jQuery

我正在做 jQuery 自动完成如果我放置硬编码的 JSON 数组则效果很好但是当我从 C 传递数组时它失败了请帮忙我花了足够的时间来处理它但我被困住了这是我在 AutoComplete aspx 中的 jQuery 代码
在C中，malloc(256)和malloc(sizeof(char)*256)等价吗？

我看到人们经常编写 C 代码例如 char ptr malloc sizeof char 256 这真的有必要吗标准说sizeof char 1根据定义这样写是不是有意义 char ptr malloc 256 是的 C 定义了siz
为什么用户/代理不能选择电子邮件地址或号码？

Chrome 推出了对数字输入的更改导致我的测试中出现此错误 Uncaught InvalidStateError Failed to read the selectionStart property from HTMLInputElem
如何向 Spring Soap 客户端添加自定义安全标头

我正在开发一个带有肥皂客户端的 Spring Boot 应用程序尝试连接到使用标头保护的肥皂网络服务以便我尝试使用基于Wss4j安全拦截器这是我的客户端配置当我调用 Soap WS 时出现以下错误 org springframewo
最佳 STL 转换 - 类似三元运算符的模板函数

STL定义了两种风格转换 http www cplusplus com reference algorithm transform 功能第一个是对于一元运算符 template
根据特定标准在 DataFrame 中包含/排除行

我有大量数据其中包含许多个体的病理测试数据我提供了一个按比例缩小的数据集来描述案例类型 library plyr library tidyr library dplyr library lubridate options strings
在共享内存上使用 volatile 安全吗？

让我们假设如下我在 Linux Mac OS 上有两个进程 I have mmap在共享内存上或在文件中然后在这两个过程中我都有以下内容 struct Data volatile int reload 0 using int beca
如何正确地除微小的双精度数而没有精度误差？

我正在尝试诊断并修复一个错误该错误归结为当 X 和 Y 很小时 X Y 会产生不稳定的结果在这种情况下 cx和patharea都平滑增加它们的比率在大数时是平滑的渐近线但在小数时是不稳定的显而易见的第一个想法是我们已经达到了浮
jQuery 如何处理注释元素？

我一直以为jQuery只能操作DOMelements 即那些具有nodeType 1 然而令我震惊的是在创建 HTML 时 p p 结果是 p Comment data comment length 21 nodeName comment
未捕获的引用错误：$未定义[重复]

这个问题在这里已经有答案了我收到了未定义的错误但我不知道如何修复它这是我的代码
Android——如何将应用程序的名称与标题栏分离？

我向 Android 应用程序添加了一个自定义标题栏并且该标题栏纯 png 显示在主活动中问题是主活动还使用label像这样的标签
Outlook VBA 中需要对象错误

我收到此需要对象错误请参阅下面的代码我不明白为什么我会得到它 oitem 变量被声明为对象并且在尝试移动它之前我对类型 MailItem 进行了测试请指教 Alan Public StatsArchiveFolder As Ou
如何强制 GitLab 在启动新管道之前运行完整的管道？

我有一个与我的项目关联的运行程序以避免并发构建 GitLab 在开始新管道之前处理完整的管道并发设置为 1 运行器的配置文件 before script echo CI COMMIT SHA echo CI PROJECT DIR sta
Pandas Python：合并一个数据框中的每两行

我如何从 Idx A B C 2004 04 01 1 1 0 2004 04 02 1 1 0 2004 05 01 0 0 0 2004 05 02 0 0 0 to Idx A B C 2004 04 2 2 0 2004 05 0

Pandas Python：合并一个数据框中的每两行

Pandas Python：合并一个数据框中的每两行 的相关文章

随机推荐

热门标签

Pandas Python：合并一个数据框中的每两行的相关文章