Pandas 中的 Groupby 和插值

2023-12-30

我的数据包含周数、帐户 ID 和几个使用情况列。我想 a) 按帐户 ID 分组，b) 将每周数据重新采样为每日数据，c) 均匀插值每日数据（将每周数据除以 7），然后将其全部重新组合在一起。我已经记下了大部分，但是 Pandasgroupby让我有点困惑。它也非常慢，这让我认为这可能不是最佳解决方案。

数据如下：

    Account Id  year week         views stats foo_col 
31133   213     2017-03-05          4.0     2.0     11.0
10085   456     2017-03-12          1.0     6.0     3.0
49551   789     2017-03-26          1.0     6.0     27.0

这是我的代码：

def interpolator(mini_df):
    mini_df = mini_df[cols_to_interpolate].set_index('year week')
    return mini_df.resample('D').ffill().interpolate() / 7

example = list(grp)[0][1]
interpolator(example) # This works perfectly

df.groupby('Account Id').agg(interpolator)                # doesn't work
df.groupby('Account Id').transform(interpolator)          # doesn't work

for name,group in grp:
    group = group[cols_to_interpolate].set_index('year week')
    group = group.resample('D').ffill().interpolate() / 7 # doesn't work

for acc_id in df['Account Id'].unique():
    mask = df.loc[df['Account Id'] == acc_id]
    print(df[mask])                                     # doesn't work

我希望你的功能应该与groupby对象如：

df = (df.set_index('year week')
        .groupby('Account Id')[cols_to_interpolate]
        .resample('D')
        .ffill()
        .interpolate() / 7)

评论中的解决方案是不同的 -interpolate适用于每个组：

df.groupby('Account Id').apply(interpolator)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

interpolation

pandasgroupby

Pandas 中的 Groupby 和插值的相关文章

Python2 math.fsum 不准确？

我正在使用 python2 数学模块来计算 fsum 的总和据我所知 0 1通常不能存储二进制据我了解 math fsum 应该以某种方式解决这个问题 import math math fsum 0 0 0 1 0 1 math fsu
如何显示 pymongo.errors.OperationFailure 详细信息？

写入 MongoDB 时我在 python 中遇到 pymongo OperationsFailure 除了回溯之外还有没有办法打印出详细信息或代码属性另请参阅 http api mongodb org python current
url 查询中的字符 %7D 意味着什么？

如果我使用 url 访问我的 web 应用程序 vi 5907399890173952 html 然后它就可以工作了但是当我查看日志文件时 googlebot 会尝试访问一个类似的网址该网址会生成异常 vi 59073998901739
在 Windows 中安装 IPOPT 求解器以与 pyomo 一起使用

如何安装 IPOPT 求解器以在 Windows 中与 pyomo 一起使用我尝试了 pip install ipopt 但收到此错误错误为 ipopt 构建轮子失败我正在使用 Windows 10 和 Python 3 7 4 在
SQLAlchemy如何为同一个表定义两个模型

我有一个表其中一列是具有两个值的 varchar groupA groupB 当我创建模型时我想实现两件事 A 组模型包含 X 数量的相关函数 B 组模型包含 Y 数量的相关函数两个模型的功能并不相同尽管它们代表了same ta
尝试将行附加到按对象分组中的每个组时出现奇怪的行为

这个问题是关于一个函数在应用于两个不同的数据帧时以意想不到的方式表现的更准确地说是 groupby 对象要么是我遗漏了一些明显错误的东西要么是 pandas 中存在错误我编写了以下函数将一行附加到 groupby 对象中的每个组
从两个列表中查找总和等于 x 的 2 个数字的最快方法

我的代码 n 3 a1 0 b1 10 a2 2 b2 2 if b1 gt n b1 n if b2 gt n b2 n diap1 x for x in range a1 b1 1 diap2 x for x in range a2 b
Tastypie：GET 的身份验证和 POST 的匿名

我使用 Django Tastypie 来管理我的用户集合是否可以允许匿名用户在 API 中发布在某个端点创建新用户时并限制经过身份验证的用户仅获取自己的用户而不是所有用户感谢您的帮助我发现最简单的事情就是对我正在使用的身份验证
如何实例化具有已知系数的 Scikit-Learn 线性模型而不进行拟合

背景作为实验的一部分我正在测试各种保存的模型但其中一个模型来自我编写的算法而不是来自 sklearn 模型拟合但是我的自定义模型仍然是线性模型所以我想实例化一个LinearModel实例并设置coef and intercep
如何从数据存储区刷新 NDB 实体？

我希望能够在我的代码调用的测试中断言Model put 对于已修改的实体不幸的是似乎正在进行一些缓存例如以下代码 from google appengine ext import ndb class MyModel ndb Model
从 paramiko 获取 PID

我找不到一个简单的答案我正在使用 paramiko 远程登录并执行多个进程我需要每个进程的 PID 以便稍后检查它们 paramiko 中似乎没有函数来获取执行命令的 PID 所以我尝试使用以下命令 stdin stdout stder
如何设置 pandas DataFrame _repr_html_ 方法的默认样式？

我有一个 pandas DataFrame 其中有一列是 url 并且我编写了以下格式化程序以将其作为链接呈现在我的笔记本中 def make clickable val target blank to open new window re
Pygame - 两个圆圈的碰撞检测

我正在制作一个碰撞检测程序其中我的光标是一个半径为 20 的圆当它碰到另一个圆时应该将值更改为 TRUE 出于测试目的我在屏幕中心有一个半径为 50 的固定圆我可以测试光标圆是否击中固定圆但它不能正常工作因为它实际上是在测试它是
python中matlab find函数的替换

我正在尝试寻找合适的python函数来替代matlabfind在我的脚本和一些谷歌搜索中我看到np where 大多数时候都能解决目的但在双重条件的情况下我有不同的输出有人可以告诉我这种方法有什么问题以及如何继续吗示例代码和差异如下
当使用 cx_Freeze 和 tkinter 时，我得到：“DLL 加载失败：找不到指定的模块。” （Python 3.5.3）

当使用 cx Freeze 和 Tkinter 时我收到以下消息 File C Users VergilTheHuragok AppData Local Programs Python Python35 32 lib tkinter in
Numpy 相当于 if/else 不带循环

有没有任何Pythonic方法可以删除下面代码中的for循环和if else 此代码迭代 NumPy 数组并检查条件并根据条件更改值 gt gt gt import numpy as np gt gt gt x np random rand
从线程队列中获取所有项目

我有一个线程将结果写入队列在另一个线程 GUI 中我定期在 IDLE 事件中检查队列中是否有结果如下所示 def queue get all q items while 1 try items append q get nowai
如何在 python setup.py 中 chmod 文件？

我使用 setup py 创建了一个 python 包安装我希望它复制文件夹为临时创建的 did 中的数据文件问题是我必须使用 sudo 权限调用 setup py 因为它写入 usr local 因此当我的数据文件复制到 did
使用 Python 和 lxml 从 HTML 中删除类属性

Question 如何使用 python 和 lxml 从 html 中删除类属性 Example I have p class DumbClass Lorem ipsum dolor sit amet consectetur adipis
Dash ImportError：无法从“werkzeug.debug.tbtools”导入名称“get_current_traceback”

我正在尝试在 Pycharm 的 conda 环境中运行一个简单的破折号应用程序但是我遇到了标题中的错误奇怪的是我在互联网上找不到提到这个错误的地方除了here https community plotly com t dash w

随机推荐

查找给定列表的所有 2 组合的某些排列

给定一个包含偶数 2k 个元素的列表 L 我正在寻找一种算法来生成具有以下属性的 2k 1 个子列表的列表每个子列表恰好包含 L 中元素的 k 个 2 组合顺序无关紧要的对每个子列表只包含 L 中的每个元素一次并且所有子列表中所有
Paho MqttAndroidClient.connect 总是失败

我想从 Android 发布消息service到本地服务器这是我的代码的一部分以最简单的形式基于片段here https stackoverflow com questions 24791118 android paho mqtt se
Tomcat运行在8080端口，但无法使用IP地址远程访问？

我在我的服务器上新安装了 apache tomcat 7 0 62 当我启动 tomcat 时它启动时没有错误但是当我想使用浏览器访问它时它说页面不可用我使用以下命令来检查 tomcat 是否正常运行 netstat ntlp gr
在 google colab 上安装 graph-tool 包时遇到问题

我按照以下链接中的图形工具安装说明进行操作 https colab research google com github count0 colab gt blob master colab gt ipynb scrollTo d j7nNb
使用 Git 分叉 SVN 项目的最佳方式

我使用 Git 分叉了一个 SVN 项目因为我需要添加他们不想要的功能但与此同时我希望能够继续将他们添加到上游版本的功能或修复引入到我的分支中它们不冲突因此我的 Git 项目具有以下分支 master 我实际构建和部署的分支 f
从命令行启用/禁用网络连接

我知道谷歌中有大量的结果 results https www google com tr q netsh 20interface 20set 20interface 20disabled q netsh 20interface 20set
C++：在派生类中重用运算符+()

有没有办法重复使用operator 基类的方法与赋值运算符类似operator 下面的例子中使用的是重要提示我不想使用抽象类虚拟方法我只是对下面的示例感到好奇以便我充分理解继承的基本用法而不必过多地了解多态性下面的例子中用
C 编译器要求定义二维数组中的列数的原因是什么？

给出以下函数签名 void readFileData FILE fp double inputMatrix int parameters 这不能编译以及更正后的 void readFileData FILE fp double input
如何向 leaflet.js 多边形添加 html 标题（工具提示）？

我有一个leaflet http leafletjs com 地图我想向我的多边形添加一个 html 标题工具提示如果我使用普通的 JQuery appendTo 标题被添加到 DOM 但不可见看here https stackov
删除重复的数组元素

我有以下遍历数组的循环 for var j 0 j lt 10 j for var k 0 k lt 10 k if final k ya j final k changeRankScore ya j score final k score
从 flake8 测试中排除 .env 目录？

Problem 我收到了数千个源自本地 env 的 flake8 错误一些错误消息的示例 env lib python3 7 site packages pip vendor pyparsing py 3848 80 E501 line
如何撤消上次提交[重复]

这个问题在这里已经有答案了我做了以下评论 git add file1 path git rm file path git commit m message 如何使用 git 撤消上次提交就像我不想提交这些文件一样警告如果您已经推送了
重写“漂亮的 URL”时如何处理变音符号（重音）

我重写 URL 以包含用户生成的旅行博客的标题我这样做是为了提高 URL 的可读性和 SEO 的目的 http www example com gallery 280 Gorges du Todra 第一个整数是 id 其余的整数是我们人
kotlin 中密封类与密封接口有什么区别

与科特林1 5被介绍的是sealed interface 即使我知道类和接口之间的区别我也不清楚使用的最佳实践和好处是什么sealed interface over sealed class 我应该总是使用interface现在什至什么时
尽管获得许可，但写入外部存储的权限被拒绝

我有一个 Android 7 0 测试设备我的 APK 目标 targetSdkVersion 22 其中
如何在代码隐藏中访问在 XAML 中创建的 DataContext 类实例？

MyData是一个简单存储的类ColorName财产在 XAML 中我可以通过以下方式为我的 XAML 数据上下文创建一个实例
Java用POI事件模型编写Excel文件

是否可以使用 POI 的事件驱动 API 创建并写入新 Excel 文件我找到了如何使用该 API 进行读取的示例但没有找到如何编写的示例谢谢杰夫这是一种可能性但写得不太好 http www docjar org html a
bourne shell 脚本中的正则表达式匹配运算符是什么？

我正在尝试根据正则表达式验证用户输入 vari A if vari A Z then echo hurray fi 我得到的输出是 swf sh 3 未知的测试运算符您能让我知道我可以使用的测试操作员吗它没有内置到 Bourne she
选项卡仅在第一次激活时安装选项卡内容

我想仅在第一次激活时加载选项卡内容之后内容保留在 DOM 中这就是我所拥有的
Pandas 中的 Groupby 和插值

我的数据包含周数帐户 ID 和几个使用情况列我想 a 按帐户 ID 分组 b 将每周数据重新采样为每日数据 c 均匀插值每日数据将每周数据除以 7 然后将其全部重新组合在一起我已经记下了大部分但是 Pandasgroupby让我有

Pandas 中的 Groupby 和插值

Pandas 中的 Groupby 和插值 的相关文章

随机推荐

热门标签

Pandas 中的 Groupby 和插值的相关文章