Pandas 对具有固定行数的数据帧进行重新采样

2024-03-27

With pandas.DataFrame.resample https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.resample.html我可以将 DataFrame 下采样到特定的持续时间：

df.resample("3s").mean()

但是，我不想指定某个时间，而是指定原始数据框中的固定行数，例如“重新采样，使得之前的三行现在聚合为一行”。这在熊猫身上怎么可能呢？

可能有点晚了，但这是我为每个寻求解决此问题的人提供的答案。

一种解决方案是使用 pandas滚动(n) https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.rolling.html滑动窗口功能，然后选择每个第 n 个值。例如。对于 n=3

df_sub = df.rolling(3).mean()[::3]

这对于计算来说有点浪费，因为您重新计算整个数据帧，然后只保留其中的 1/n%。

另一种类似的解决问题的方法是使用 numpy 的方法，即不计算平均值，而是按列插值整个数据帧interp1 https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.interp.html功能。

例如：假设您有一个 DataFrame，其中索引是单调递增的数值/时间戳值（通常与时间序列数据一样），并且您想要单独调整每一列，您可以这样做：

def resample_fixed(df, n_new):
    n_old, m = df.values.shape
    mat_old = df.values
    mat_new = np.zeros((n_new, m))
    x_old = np.linspace(df.index.min(), df.index.max(), n_old)
    x_new = np.linspace(df.index.min(), df.index.max(), n_new)

    for j in range(m):
        y_old = mat_old[:, j]
        y_new = np.interp(x_new, x_old, y_old)
        mat_new[:, j] = y_new

    return pd.DataFrame(mat_new, index=x_new, columns=df.columns)

但要小心， interp1 确实会改变您的数据，因为它线性插值您的数据点。我建议检查插值后的结果。

您可以在我为此所做的要点文件中找到有关插值的完整示例here https://gist.github.com/TobiasGlaubach/68298acdd637860f115c83ff439ac8b7.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Pandas 对具有固定行数的数据帧进行重新采样的相关文章

Pytest：如何使用从夹具返回的列表来参数化测试？

我想使用由固定装置动态创建的列表来参数化测试如下所示 pytest fixture def my list returning fixture depends on other fixtures return a dynamically
如何在“python setup.py test”中运行 py.test 和 linter

我有一个项目setup py文件我用pytest作为测试框架我还在我的代码上运行各种 linter pep8 pylint pydocstyle pyflakes ETC 我用tox在多个 Python 版本中运行它们并使用以下命令构
无法将较大的 blob 上传到 Azure：azure.core.exceptions.ServiceRequestError：操作未完成（写入）(_ssl.c:2317)

我正在尝试使用 Python SDK 将一些较大的 blob gt 50MB 上传到我的 Azure 存储容器 connect str os environ AZURE STORAGE CONNECTION STRING blob serv
将 Django 表单中的所有 CharField 表单字段输入转换为小写

我使用 Django 表单进行用户注册用户可以在其中输入优惠券代码我希望在优惠券代码字段中输入的所有字符都转换为小写我尝试过在保存方法自定义清理方法和自定义验证器中使用 lower 但这些方法没有运气下面是我的代码 class S
如何从网站中提取冠状病毒病例？

我正在尝试从网站中提取冠状病毒 https www trackcorona live https www trackcorona live 但我得到了一个错误这是我的代码 response requests get https www t
使用 Python 中的 IAM 角色访问 AWS API Gateway

我有一个 AWS API 网关我想使用它来保护其安全IAM 角色 http docs aws amazon com apigateway latest developerguide permissions html 我正在寻找一个包来帮助
基于 True/False 值的 Python 优雅赋值

我想根据三个布尔值中的值设置一个变量最直接的方法是 if 语句后跟一系列 elif if a and b and c name first elif a and b and not c name second elif a and not
如何检查包含 NaN 的列表 [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案在我的 for 循环中我的代码生成一个如下所示的列表 list 0 0 0 0 sum 0 0 0 0 该循环生成所有其他数字向量但它也
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
如何获取 Matplotlib 生成的散点图的像素坐标？

我使用 Matplotlib 生成散点图的 PNG 文件现在对于每个散点图除了 PNG 文件之外我还会also就像生成散点图中各个点的像素坐标列表一样我用来生成散点图 PNG 文件的代码基本上是这样的 from matplotli
如何将reportlab与Google应用程序引擎一起使用

我无法在谷歌应用程序引擎下正确导入reportlab 根据以下guide http blog notdot net 2010 04 Generating PDFs on App Engine Python and introducing M
django如何将字符串转换为模块？

我试图了解 django 的另一个神奇之处它可以将字符串转换为模块 In settings py INSTALLED APPS声明如下 INSTALLED APPS django contrib auth django contrib c
向伪 shell (pty) 发出命令

我尝试使用 subprocess popen os spawn 来运行进程但似乎需要伪终端 import pty master slave pty openpty os write master ls l 应该发送 ls l 到从属终端
如何表示类的实例与将其作为输入的类之间的关系？

我有一堂课叫House 这个类的实例是house class House def init self height length self height height self length length def housePlan hou
SpaCy 中的自定义句子边界检测

我正在尝试在 spaCy 中编写一个自定义句子分段器它将整个文档作为单个句子返回我编写了一个自定义管道组件它使用以下代码来执行此操作here https github com explosion spaCy issues 1850 但
Melt() 函数复制数据集

我有一个这样的表 id name doggo floofer puppo pupper 1 rowa NaN NaN NaN NaN 2 ray NaN NaN NaN NaN 3 emma NaN NaN NaN pupper 4 sop
字母尺度和随机文本上的马尔可夫链

我想使用 txt 文件中的一本书中的字母频率生成随机文本以便每个新字符 string lowercase 取决于前一个如何使用马尔可夫链来做到这一点或者使用每个字母都有条件频率的 27 个数组更简单我想使用来自的字母频率生成随机文本
如何使用 FastAPI 在 HTMX 前端中使用 HX-Redirect？

我试图在登录后在前端重定向我像这样从我的 htmx 前端发出请求
Django - 缺少 1 个必需的位置参数：'request'

我收到错误 get indiceComercioVarejista 缺少 1 个必需的位置参数要求当尝试访问 get indiceComercioVarejista 方法时我不知道这是怎么回事 views from django ht
bool() 和operator.truth() 有什么区别？

bool https docs python org 3 library functions html bool and operator truth https docs python org 3 library operator htm

随机推荐

如何在 python 中对 POST 方法进行单元测试？

我有一个方法可以将包含 JSON 的 POST 发送到 Elasticsearch 实例我正在尝试编写一个单元测试来验证发送的 JSON 的内容但我不确定如何进行我应该在 python 中创建一个本地服务器并让它验证 POST 的内容
.NET 4 构建期间未找到 LC.exe 文件

我在迁移到 net 4 0 时遇到问题在尝试构建时出现以下错误 C WINDOWS Microsoft NET Framework v4 0 30319 Microsoft Common targets 1917 9 error MSB3
vb6 打开文件以追加问题路径未找到

Open App Path Folder str 0 For Output 似乎找不到一条路径但是如果就在这之前我就找到了 MsgBox App Path Folder str 0 它提供了我想要的正确目录文件名如果我用引号中的直接路
有没有办法访问之前在“heightForRowAtIndexPath”中计算的行高？

我在方法 heightForRowAtIndexPath 中计算行的高度但我需要在方法 cellForRowAtIndexPath 中使用该值有没有办法访问已经计算的值或者我需要再次进行计算 Thks Gotye None
Rails 使用缩写对模型进行非正统命名

在我正在构建的应用程序中我使用以下命令在数据库中存储 XML 文件acts as tree协会我想给班级起个名字XMLElement但这会偏离轨道因为大写是非标准的它正在寻找XMLElement从文件名xml element rb
Scavenger：分配失败 - JavaScript 堆内存不足

这是错误消息 lt Last few GCs gt 2383 0x7efe08001450 6100 ms Scavenge 30 3 39 5 gt 30 5 42 7 MB 73 5 0 0 ms average mu 1 000 cu
为什么“git mergetool”（meld）显示冲突标记？

为什么 git mergetool meld 向我显示带有 conclict 标记的祖先视图这是完全错误的我一直不明白为什么会这样做我该如何修复它应该显示 3 路合并 Your Changes Common Base Upstrea
chaquopy代码在哪个目录中搜索Android应用程序代码的Python代码中导入的Python包

我已在 chaquopy Android 应用程序的 Python 代码的主要方法中导入了 nltk 库它要求我实施nltk download punkt 供我处理所以我想知道代码在哪个目录中查找包以便我可以在所需的文件夹中下载它们
如何将数据传回父窗口？

我找到了一个链接显示如何将参数发送回打开器浏览器窗口但它仅适用于window showmodal 如果我使用的话应该有一个简单的方法可以做到同样的事情window open right 如果您使用 window open 则可以调用父
QThread::start(优先级) 与 Linux

我正在使用一些QThread基于 KDE Neon 18 04 中的工作线程基于 Ubuntu 18 04 内核 4 15 0 46 generic 工作线程干扰了我的桌面应用程序因此我决定降低它们的优先级 Qt 文档QThread s
Syslog 真的有 1KB 消息限制吗？

Syslog 似乎有 1KB 消息限制这是硬编码到 Syslog 协议中的还是可以为每个服务器设置的参数我希望我读到的文章已经过时所以如果您有任何信息请分享这是正确的正如在系统日志协议 RFC https www rfc ed
从 PHP/Apache 返回 100-Continue

我正在尝试找到一种方法来防止脚本将不必要的数据上传到 PHP 脚本我最初试图终止传入的读取连接这显然违反了 HTTP 协议我无法让它工作但我一直在研究替代方案发现100 Continue状态码正是我所需要的我的客户应该发送所需的
AES密钥导出函数

我有一个 bash 脚本它使用 openssl 加密数据并使用 Java 代码解密结果根据我之前的post https stackoverflow com questions 8343894 aes encrypt with open
使用 Selenium 测试 Sencha 2 应用程序

我无法单击 Sencha 2 生成的按钮因为它不是输入字段它用 div 和 span 构建了按钮找到这个链接它描述了如何通过 Selenium 测试单击按钮http mobilewebqa blogspot com http mob
如何获取 sqlalchemy 中受影响的行数？

我有一个关于 Python 和 sqlalchemy 模块的问题相当于什么cursor rowcount在 sqlalchemy Python 中 ResultProxy对象有一个rowcount https docs sqlalchem
替换交叉过滤器数据，恢复维度和组

我在用着dc js http dc js github io渲染数据集的漂亮气泡图底层的 dc js 是交叉过滤器 https github com square crossfilter 我想使用来自服务器的新数据顺利刷新我的图表这个问
如何获取 Matplotlib 当前可用的所有字体的列表？

例如当我想设置时font in matplotlib rc font font import matplotlib font manager matplotlib font manager findSystemFonts fontpaths
Spring-data-mongo无法使用构造函数实例化java.util.List

Using spring data mongodb 1 5 4 and mongodb driver 3 4 2 我有课Hotel public class Hotel private String name private int pri
如何计算数字的正确宽度（以像素为单位）？

我有一个自定义控件将来可能有用户可自定义的字体缩放已经实现我必须在两位数字下方填充一个矩形形成以 10 为基数的数字我对零个一个或两个数字有不同的颜色使用字体 Name Microsoft Sans Serif Size 16
Pandas 对具有固定行数的数据帧进行重新采样

With pandas DataFrame resample https pandas pydata org pandas docs stable generated pandas DataFrame resample html我可以将 D

Pandas 对具有固定行数的数据帧进行重新采样

Pandas 对具有固定行数的数据帧进行重新采样 的相关文章

随机推荐

热门标签

Pandas 对具有固定行数的数据帧进行重新采样的相关文章