Python、Pandas：使用 GroupBy.groups 描述将其应用于另一个分组

2023-12-28

让我们考虑一个 DataFrame，它在 2010 年 1 月的每一天包含 1 行 2 个值：

date_range = pd.date_range(dt(2010,1,1), dt(2010,1,31), freq='1D')
df = pd.DataFrame(data = np.random.rand(len(date_range),2), index = date_range)

我将该 DataFrame 拆分为 5 个 DataFrame 的列表，每个 DataFrame 都包含原始数据的 1 周数据：df_weeks = [g for n, g in df.groupby(pd.TimeGrouper('W'))]

如果我输入df.groupby(pd.TimeGrouper('W')).groups我可以看到一个字典解释如何分组：

{Timestamp('2010-01-03 00:00:00', freq='W-SUN'): 3,
 Timestamp('2010-01-10 00:00:00', freq='W-SUN'): 10,
 Timestamp('2010-01-17 00:00:00', freq='W-SUN'): 17,
 Timestamp('2010-01-24 00:00:00', freq='W-SUN'): 24,
 Timestamp('2010-01-31 00:00:00', freq='W-SUN'): 31}

让我们考虑另一个具有稀疏数据但与第一个重叠的 TimeSeries：

observations = pd.DataFrame(data =np.random.rand(5,2), index = (dt(2010,1,12), dt(2010,1,18), dt(2010,1,20), dt(2010,1,22), dt(2010,1,28)))

如果我运行相同的代码obs_weeks = [g for n, g in observations.groupby(pd.TimeGrouper('W'))]，显然它会在列表中返回更少的 DataFrame，因为数据覆盖的范围更小。observations.groupby(pd.TimeGrouper('W')).groups返回：

{Timestamp('2010-01-17 00:00:00', freq='W-SUN'): 1,
 Timestamp('2010-01-24 00:00:00', freq='W-SUN'): 4,
 Timestamp('2010-01-31 00:00:00', freq='W-SUN'): 5}

但有没有办法重用第一个 DataFrame.GroupBy 的组将其应用到第二个？即，这意味着在特定情况下最终会出现一个变量obs_weeks包含 5 个数据帧，跨越相同的时间范围df_weeks，其中 2 个是空的？

解决您的问题的一种简单方法是确保观测数据框包含 df 数据框包含的所有日期。您可以使用reindex方法。然后您将拥有完全相同的组。您还可以使用resample('W')代替groupby(pd.Timegrouper('W'))

obs2 = observations.reindex(df.index)

obs2.resample('W').groups

{Timestamp('2010-01-03 00:00:00', freq='W-SUN'): 3,
 Timestamp('2010-01-10 00:00:00', freq='W-SUN'): 10,
 Timestamp('2010-01-17 00:00:00', freq='W-SUN'): 17,
 Timestamp('2010-01-24 00:00:00', freq='W-SUN'): 24,
 Timestamp('2010-01-31 00:00:00', freq='W-SUN'): 31}

如果我们进行简单的聚合（例如求和），我们可以看到两个帧的结果

df.resample('W').sum()

                 0         1
2010-01-03  1.990558  2.555191
2010-01-10  2.707777  3.771756
2010-01-17  2.799897  3.353363
2010-01-24  3.165479  2.778870
2010-01-31  4.946577  3.394211

现在与obs2其中有 2 个缺失组

obs2.resample('W').sum()

                   0         1
2010-01-03       NaN       NaN
2010-01-10       NaN       NaN
2010-01-17  0.172341  0.137136
2010-01-24  1.752472  2.375306
2010-01-31  0.711525  0.124271

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Python、Pandas：使用 GroupBy.groups 描述将其应用于另一个分组的相关文章

如何在序列化器创建方法中获取 URL Id？

我有以下网址 url r member P
Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
通过列表理解压平列表列表

我正在尝试使用 python 中的列表理解来展平列表我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目我编写了这个函数 def flat listoflist for item in listoflis
将数据帧行转换为字典

我有像下面的示例数据这样的数据帧我正在尝试将数据帧中的一行转换为类似于下面所需输出的字典但是当我使用 to dict 时我得到了索引和列值有谁知道如何将行转换为像所需输出那样的字典任何提示都非常感激 Sample data pri
如何在 pytest 中将单元测试和集成测试分开

根据维基百科 https en wikipedia org wiki Unit testing Description和各种articles https techbeacon com devops 6 best practices inte
从零开始的 numpy 形状意味着什么

好的我发现数组的形状中可以包含 0 对于将 0 作为唯一维度的情况这对我来说是有意义的它是一个空数组 np zeros 0 但如果你有这样的情况 np zeros 0 100 让我很困惑为什么这么定义呢据我所知这只是表达空数组的
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
如何通过在 Python 3.x 上按键来启动和中断循环

我有这段代码当按下 P 键时会中断循环但除非我按下非 P 键否则循环不会工作 def main openGame while True purchase imageGrab if a sum gt 1200 fleaButton ti
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
使用鼻子获取设置中当前测试的名称

我目前正在使用鼻子编写一些功能测试我正在测试的库操作目录结构为了获得可重现的结果我存储了一个测试目录结构的模板并在执行测试之前创建该模板的副本我在测试中执行此操作 setup功能这确保了我在测试开始时始终具有明确定义的状态现在
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
创建嵌套字典单行

您好我有三个列表我想使用一行创建一个三级嵌套字典 i e l1 a b l2 1 2 3 l3 d e 我想创建以下嵌套字典 nd a 1 d 0 e 0 2 d 0 e 0 3 d 0 e 0 b a 1 d 0 e 0 2 d 0
mac osx 10.8 上的初学者 python

我正在学习编程并且一直在使用 Ruby 和 ROR 但我觉得我更喜欢 Python 语言来学习编程虽然我看到了 Ruby 和 Rails 的优点但我觉得我需要一种更容易学习编程概念的语言因此是 Python 但是我似乎找不到适用于
使用yield 进行字典理解

作为一个人为的例子 myset set a b c d mydict item yield join item s for item in myset and list mydict gives as cs bs ds a None b N
当鼠标悬停在上面时，intellisense vscode 不显示参数或文档

我正在尝试将整个工作流程从 Eclipse 和 Jupyter Notebook 迁移到 VS Code 我安装了 python 扩展它应该带有 Intellisense 但它只是部分更糟糕我在输入句点后收到建议但当将鼠标悬停在其上方
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
列表值的意外更改

这是我的课 class variable object def init self name name alias parents values table name of the variable self name 这是有问题的函数 f
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

未捕获错误：初始化之前无法调用页面上的方法；尝试调用方法“bindRemove”[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我正在使用 jQuery mobile 1 4 5 开发一个 Web 应用程序错误未捕获错误初始化之前无法调用页面上的方法
让 div 充当弹出窗口

I am designing a simple webpage I want to display a popup window in the same page just like the image attached below 我不知
服务器是否在主机“localhost”(::1) 上运行并接受端口 5432 上的 TCP/IP 连接？

首先请注意我在 Stack Overflow 上和网络上的文章中发现了几个类似的问题但这些都没有帮助我解决我的问题 PG 错误无法连接到服务器连接被拒绝服务器是否在端口 5432 上运行 https stackoverflow c
SSL 问题 - Jenkins 从属设备与 TFS 的连接问题

升级了詹金斯创建了一个奴隶在从机上安装最新的 JDK 并启动从机当用奴隶标记一个作业并运行它时出现以上错误在谷歌上进行了搜索并根据搜索将我的目标 TFS 的公共证书添加到位于 C Program Files x86 Java j
从 Netbeans 启动 Tomcat 失败

我从 Netbeans IDE 7 4 启动 Apache Tomcat 6 时遇到问题在 7 3 版本上我也遇到了同样的问题其他人提到这个问题也存在于其他版本中例如 8 0 等我做了什么删除已安装的Tomcat 7 不删除它我
是否有宏可以有条件地将行复制到另一个工作表？

在 Excel 2003 中是否有宏或方法可以有条件地将行从一个工作表复制到另一个工作表我通过 Web 查询将 SharePoint 中的数据列表提取到 Excel 中的空白工作表中然后我想将特定月份的行复制到特定工作表例如将 Sh
批处理脚本不运行，尽管其代码在 CMD 中运行

我正在寻找一种简单的方法来获取以 GB 为单位的系统卷信息批量所以我得到了这个 for f tokens 1 3 a in WMIC LOGICALDISK GET FreeSpace Name Size FINDSTR I V Nam
我应该将 useSelector 传递给 useState

大家好我有一个关于您喜欢哪种方法的问题在使用 TypeScript 的 React 功能组件中使用 useSelector 从 Redux State 获取值是 1 const campaign useSelector campaig
无法将 DispatcherServlet 映射到上下文根

这是我用于 spring mvc 的当前配置 1 web xml
我的 C 程序读取一个文本文件。当我将它放入 Xcode 时，它失败了。发生了什么？

我有一个打开 txt 的函数使用 fscanf 读取格式如下的数字 532 2 234 32 当我使用 GCC 编译时它成功地做到了这一点但我无法在 Xcode 中打开文件为什么相关代码是 int main void FILE in
如何禁用 WinForms DataGrid 中的按钮单元格？

我有一个 WinForms 应用程序其中包含一个 DataGridView 控件和一列 DataGridViewButtonCell 单元格当我单击其中一个按钮时它会启动一项后台任务我想禁用这些按钮直到该任务完成我可以禁用 Da
Gekko 长期性能

在下面的代码中全年 PV 斜率优化每小时时间步长 CSV 数据下载link https drive google com file d 172HaD87t9V PDElMER4MwDaWyuCZ3KA5 view usp sharing
如何在使用rescue_from时使用Rails4和RSpec测试渲染状态：404

我有一个带有 PagesController 的 Rails4 应用程序当找不到页面时 show method 会抛出自定义异常 PageNotFoundError 在我定义的控制器之上rescue from PageNotFoundEr
转换输出中不需要的字符编码转换

我这里有一个情况 JAVA版本1 6 Linux RH 5 6 Tikanga Windows 7 Cygwin最新版本等级 1 6 在一台机器 Linux 上当我运行 Gradle 构建时我得到生成的 xsl 文件这些文件与我运行
iOS：Objective-C 中的事件监听器相当于什么？

在我的一些学习中我看到有人提到在视图控制器中您可以拥有一个模型并在模型上有某种监听器来监听其中的变化我认为我没有使用正确的名称这可能就是为什么我的搜索没有找到任何结果的原因本质上我想将服务器调用从控制器移到我的模型中但我需
使用 Netty 的多线程 UDP 服务器

我正在尝试使用 Netty 实现 UDP 服务器这个想法是只绑定一次因此只创建一个Channel This Channel仅使用一个处理程序进行初始化该处理程序通过一个线程在多个线程之间分派传入数据报的处理ExecutorServic
Google Drive API 使用浏览器版本创建空的“无标题”文件

我正在尝试使用 Google Drive API 的浏览器版本它似乎主要遵循 Nodejs 语法但除了浏览器的第一个 hello world 示例之外似乎没有太多示例现在我正在尝试创建一个文件夹然后在该文件夹内创建一个简单的
当任务计划程序启动时隐藏 C# 控制台应用程序窗口

我已经在谷歌上搜索了这个并阅读了一些资源但我无法找到一个好的答案有谁知道如何防止控制台应用程序窗口在任务计划程序启动时打开 Ref 改变output type to Windows application会解决你的问题转到项目 gt
从 XAML 中的 *.resx 文件获取值

是否可以将资源文件中的某些值直接添加到 XAML 标记中或者为了本地化我们总是必须在 cs 文件中制作类似的内容 txtMessage Text Messages WarningUserMessage Where Messages是资源
Python、Pandas：使用 GroupBy.groups 描述将其应用于另一个分组

让我们考虑一个 DataFrame 它在 2010 年 1 月的每一天包含 1 行 2 个值 date range pd date range dt 2010 1 1 dt 2010 1 31 freq 1D df pd DataFrame

Python、Pandas：使用 GroupBy.groups 描述将其应用于另一个分组

Python、Pandas：使用 GroupBy.groups 描述将其应用于另一个分组 的相关文章

随机推荐

热门标签

Python、Pandas：使用 GroupBy.groups 描述将其应用于另一个分组的相关文章