有没有办法对分组进行加权平均滚动总和？

2024-01-24

我想对 DataFrame 应用加权和。过去我用过

for sec_id, sec_df_unidx in grouped:
    if sec_df_unidx.shape[0] > 3:
        pd.rolling_sum(sec_df[added_cols], 4)

我想对最近的乘以 0.6、第二个乘以 0.2、第三个和第四个乘以 0.1 的总和应用加权平均值。

DF:

DATE    ID  VALUE
2012-12-31  A   100
2013-03-31  A   120
2013-06-30  A   140
2013-09-30  A   160
2013-12-31  A   180
2013-03-31  B   0
2013-06-30  B   5
2013-09-30  B   1
2013-12-31  B   3
2012-12-31  C   45
2013-03-31  C   46
2013-06-30  C   42
2013-09-30  C   30
2013-12-31  C   11
2012-12-31  D   18
2013-03-31  D   9
2013-06-30  D   13
2013-09-30  D   5
2013-12-31  D   11
2012-12-31  E   0

DF 与新列：

DATE    ID  VALUE   Weight_Sum
2012-12-31  A   100 NaN
2013-03-31  A   120 NaN
2013-06-30  A   140 NaN
2013-09-30  A   160 146
2013-12-31  A   180 166
2013-03-31  B   0   NaN
2013-06-30  B   5   NaN
2013-09-30  B   1   NaN
2013-12-31  B   3   2.5
2012-12-31  C   45  NaN
2013-03-31  C   46  NaN
2013-06-30  C   42  NaN
2013-09-30  C   30  35.5
2013-12-31  C   11  21.4
2012-12-31  D   18  NaN
2013-03-31  D   9   NaN
2013-06-30  D   13  NaN
2013-09-30  D   5   8.3
2013-12-31  D   11  9.8
2012-12-31  E   0   NaN

我可以使用rolling_apply 或rolling_sum 来做到这一点吗？或者我必须做一个for循环？

谢谢。

我认为你可以做到rolling_apply在正常调用的函数内groupby/apply。所以像下面这样：

def roll_wsum(g,w,p):
    rsum = pd.rolling_apply(g.values,p,lambda x: np.dot(w,x),min_periods=p)
    return pd.Series(rsum,index=g.index)

weights = np.array([0.1,0.1,0.2,0.6])
df['wsum'] = df.groupby('ID')['VALUE'].apply(roll_wsum,weights,4)
print df

Output:

         DATE ID  VALUE   wsum
0  2012-12-31  A    100    NaN
1  2013-03-31  A    120    NaN
2  2013-06-30  A    140    NaN
3  2013-09-30  A    160  146.0
4  2013-12-31  A    180  166.0
5  2013-03-31  B      0    NaN
6  2013-06-30  B      5    NaN
7  2013-09-30  B      1    NaN
8  2013-12-31  B      3    2.5
9  2012-12-31  C     45    NaN
10 2013-03-31  C     46    NaN
11 2013-06-30  C     42    NaN
12 2013-09-30  C     30   35.5
13 2013-12-31  C     11   21.4
14 2012-12-31  D     18    NaN
15 2013-03-31  D      9    NaN
16 2013-06-30  D     13    NaN
17 2013-09-30  D      5    8.3
18 2013-12-31  D     11    9.8
19 2012-12-31  E      0    NaN

因此，我只是按“ID”对数据进行分组，然后将一组的“VALUE”列发送到我的 roll_wsum 函数（以及加权和和周期的权重）。这roll_wsum函数调用rolling_apply并将一个简单的 lambda 函数提供给rolling_apply：“VALUE”和权重的点积。此外，这里强制实施min_periods=4条件，因为我们需要数组的长度（权重和 df['VALUE'].values）相同。

鉴于我使用点积来计算加权和，它可能无法按照您想要的方式处理缺失值。因此，例如，您可能更喜欢以下内容（尽管它对于示例数据没有影响）：

def roll_wsum(g,w,p):
    rsum = pd.rolling_apply(g.values,p,lambda x: np.nansum(w*x),min_periods=p)
    return pd.Series(rsum,index=g.index)

weights = np.array([0.1,0.1,0.2,0.6])
df['wsum'] = df.groupby('ID')['VALUE'].apply(roll_wsum,weights,4)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

有没有办法对分组进行加权平均滚动总和？的相关文章

与区域指示符字符类匹配的 python 正则表达式

我在 Mac 上使用 python 2 7 10 表情符号中的标志由一对表示区域指示符号 https en wikipedia org wiki Regional Indicator Symbol 我想编写一个 python 正则表达式来在
在 django ORM 中查询时如何将 char 转换为整数？

最近开始使用 Django ORM 我想执行这个查询 select student id from students where student id like 97318 order by CAST student id as UNSIG
安装了 32 位的 Python，显示为 64 位

我需要运行 32 位版本的 Python 我认为这就是我在我的机器上运行的因为这是我下载的安装程序当我重新运行安装程序时它会将当前安装的 Python 版本称为 Python 3 5 32 位然而当我跑步时platform arch
使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
使用 kivy textinput 的 'input_type' 属性的问题

您好我在使用 kivy 的文本输入小部件的 input type 属性时遇到问题问题是我制作了两个自定义文本输入其中一个称为 StrText 其中设置了 input type text 然后是第二个文本输入名为 NumText 其
将 python2.7 与 Emacs 24.3 和 python-mode.el 一起使用

我是 Emacs 新手我正在尝试设置我的 python 环境到目前为止我已经了解到在 python 缓冲区中使用 python mode el C c C c将当前缓冲区的内容加载到交互式 python shell 中显然使用了什么
您可以格式化 pandas 整数以进行显示，例如浮点数的“pd.options.display.float_format”？

我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
为什么 PyYAML 花费这么多时间来解析 YAML 文件？

我正在解析一个大约 6500 行的 YAML 文件格式如下 foo1 bar1 blah name john age 123 metadata whatever1 whatever whatever2 whatever stuff thi
在 Sphinx 文档中*仅*显示文档字符串？

Sphinx有一个功能叫做automethod从方法的文档字符串中提取文档并将其嵌入到文档中但它不仅嵌入了文档字符串还嵌入了方法签名名称参数我如何嵌入only文档字符串不包括方法签名 ref http www sphinx do
如何通过 TLS 1.2 运行 django runserver

我正在本地 Mac OS X 机器上测试 Stripe 订单我正在实现这段代码 stripe api key settings STRIPE SECRET order stripe Order create currency usd em
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
javascript 是否有等效的 __repr__ ？

我最接近Python的东西repr这是 function User name password this name name this password password User prototype toString function r
Jupyter Notebook 找不到 Python 模块

不知道发生了什么但每当我使用 ipython 氢原子或 jupyter 笔记本时都找不到任何已安装的模块我知道我安装了 pandas 但笔记本说找不到我应该补充一点当我正常运行脚本时 python script py 它确实导入
Pandas 将多行列数据帧转换为单行多列数据帧

我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍，而速度却没有任何提升？

我正在测试 Python 3 4 我注意到 pickle 模块有一个新协议因此我对 2 个协议进行了基准测试 def test1 pickle3 open pickle3 wb for i in range 1000000 pickle
Python：XML 内所有标签名称中的字符串替换（将连字符替换为下划线）

我有一个格式不太好的 XML 标签名称内有连字符我想用下划线替换它以便能够与 lxml objectify 一起使用我想替换所有标签名称包括嵌套的子标签示例 XML
Scipy Sparse：SciPy/NumPy 更新后出现奇异矩阵警告

我的问题是由大型电阻器系统的节点分析产生的我基本上是在设置一个大的稀疏矩阵A 我的解向量b 我正在尝试求解线性方程A x b 为了做到这一点我正在使用scipy sparse linalg spsolve method 直到最近一切都
Django-tables2 列总计

我正在尝试使用此总结列中的所有值文档 https github com bradleyayers django tables2 blob master docs pages column headers and footers rst 但页
如何应用一个函数 n 次？ [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案假设我有一个函数它接受一个参数并返回相同类型的结果 def increment x return x 1 如何制作高阶函数repeat可以
更改 Tk 标签小部件中单个单词的颜色

我想更改 Tkinter 标签小部件中单个单词的字体颜色我知道可以使用文本小部件来实现与我想要完成的类似的事情例如使单词 YELLOW 显示为黄色 self text tag config tag yel fg clr yellow s

随机推荐

C++：默认复制构造函数是否受到其他构造函数和析构函数存在的影响？

据我们所知 https stackoverflow com questions 4286190 why does copy constructor hide the default constructor in c 如果声明了任何构造函数
Html.BeginForm() 与 GET 方法

如何指定我的表单应使用带有 Html BeginForm 的 GET 方法 using Html BeginForm method FormMethod Get 这里 VS 抱怨最佳重载没有参数方法谢谢你有一个overload http
Node.js Buffer.from(string) 的 Deno 等价物是什么

如何将字符串转换为缓冲区我试过 Uint8Array from hello world 但它不起作用相当于Buffer from Hello World is const encoder new TextEncoder const bu
在Scheme中生成项链的简单好算法？

长度为 n 的 k 元项链是一个长度为 n 的有序列表其项目是从长度为 k 的字母表中抽取的它是共享旋转排序的所有列表中按字典顺序排列的第一个列表例子 1 2 3 和 1 3 2 是字母表 1 2 3 中长度为 3 的项链更多信息
“”的本地声明隐藏实例和不完整的实现[关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions imple
从 Vimeo url 获取视频 ID

我正在尝试找到从 URL 获取 vimeo 视频 ID 的最佳正则表达式示例网址 https vimeo com 11111111 http vimeo com 11111111 https www vimeo com 11111111
iCloud 同步普遍性错误

我将 iCloud 集成到我的应用程序中并且同步工作正常但有时我会收到此错误 PFUbiquityTransactionLog loadPlistAtLocation withError 324 CoreData Ubiquity Enc
在 Spring Boot 中进行测试时跳过与 mysql 的数据库连接

我在 Spring Boot 项目中使用以下依赖项在 gradle 中以使其与 mysql 一起使用 compile org springframework boot spring boot starter data jpa sprin
从 OpenCV (C++) 为 Matlab 以双精度保存矩阵

我想将 OpenCV 创建的矩阵与 Matlab 中创建的矩阵进行比较如果矩阵是 uint8 将它们保存为 pgm 图像就可以了但我的矩阵是 CV 64FC1 双精度无法保存为图像有没有简单的方法可以保存我的双矩阵以便在 Matla
在两个单独的页面上抓取需要登录用户名和密码的网站

我正在尝试从公司内联网中抓取信息以便我可以通过仪表板在办公室墙板上显示信息我正在尝试使用以下提供的信息本网站 http scraperblog blogspot com 2012 12 scraping site that requi
如何使用 pop3 检索未读电子邮件？

我正在使用开源组件使用 vb net pop3 从我的邮件服务器检索电子邮件但因为我有很多消息它给了我响应超时我想如果我刚刚收到新消息它会让阅读速度更快这是我的代码 Dim popp As New Pop3Client email
需要有关缩进、线程注释的 html/css 结构的建议

我希望我的应用程序中有一个评论部分如下所示 response1 response1a response1b response1b1 response2 response2a response2b response2c response2c
是否有适用于 Netbeans 7.3 的谷歌应用程序引擎插件

是否有适用于 Netbeans 7 3 的 google 应用引擎插件我一直在寻找以前版本的旧链接所有链接都不起作用但我在任何地方都找不到该插件的新版本我正在寻找创建一个基于 java 的谷歌应用程序引擎项目在这里试试 https
R - WordCloud2 并不总是呈现最常见的单词

我用wordcloud2渲染词云的包看起来wordcloud2并不总是显示最常用的单词我说并不总是因为问题不是永久性的看来结果大多是随机的 Code library wordcloud2 library htmlwidgets D
Cocos2d 肖像模式在 iPhone 上不工作

我正在构建一个 cocos2d 游戏它应该处于纵向模式我将 RootViewController m 更改为纵向模式无论是在模拟器上还是在我的 iPad 上一切都工作正常然而当我在 iPhone 上运行游戏时它会默认回到横向模
我如何知道警卫是否拒绝了转换

我的转换配置如下参考文档 http docs spring io spring statemachine docs 1 2 0 RELEASE reference htmlsingle sm guards public void confi
SKStoreReviewController requestReview 对话框中缺少文本

我正在尝试实现 StoreKit 的 requestReview API SKStoreReviewController requestReview 当对话框出现时它缺少正在享受应用程序和点击一颗星即可在 App Store 上对
使用 openpyxl 将图像插入 Excel

我的电脑崩溃了所以我不得不重新安装所有的库完成安装后我意识到一些库更新到了新版本并且我的代码不再工作由于 openpyxl 的新版本我正在尝试将图像插入 Excel 文件但我不明白出现的错误消息其他问题似乎适用于旧版本的 o
如果退出程序而不执行 fclose() 会发生什么？

问题如果我退出程序而不关闭文件会发生什么是否发生了一些不好的事情例如某些操作系统级别的文件描述符数组未释放两种情况下的答案相同程序退出意外崩溃代码示例对于程序退出我的意思是这样的 int main fopen foo t
有没有办法对分组进行加权平均滚动总和？

我想对 DataFrame 应用加权和过去我用过 for sec id sec df unidx in grouped if sec df unidx shape 0 gt 3 pd rolling sum sec df added co

有没有办法对分组进行加权平均滚动总和？

有没有办法对分组进行加权平均滚动总和？ 的相关文章

随机推荐

热门标签

有没有办法对分组进行加权平均滚动总和？的相关文章