Python Pandas 按小时对日期时间进行分组并计算行数

2024-01-11

这是我的交易数据框，其中每一行表示一个交易：

date               station
30/10/2017 15:20    A
30/10/2017 15:45    A
31/10/2017 07:10    A
31/10/2017 07:25    B
31/10/2017 07:55    B

我需要将 start_date 按小时间隔分组并计算每个城市，因此最终结果将是：

date        hour      station   count
30/10/2017  16:00        A       2
31/10/2017  08:00        A       1
31/10/2017  08:00        B       2

其中第一行表示2017年10月30日15:00到16:00，A站有2笔交易

如何在 Pandas 中做到这一点？

我尝试了这段代码，但结果是错误的：

df_start_tmp = df_trip[['Start Date', 'Start Station']]

times = pd.DatetimeIndex(df_start_tmp['Start Date'])

df_start = df_start_tmp.groupby([times.hour, df_start_tmp['Start Station']]).count()

非常感谢您的帮助

IIUC size+pd.Grouper

df.date=pd.to_datetime(df.date)
df.groupby([pd.Grouper(key='date',freq='H'),df.station]).size().reset_index(name='count')
Out[235]: 
                 date station  count
0 2017-10-30 15:00:00       A      2
1 2017-10-31 07:00:00       A      1
2 2017-10-31 07:00:00       B      2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

datetime

DataFrame

Python Pandas 按小时对日期时间进行分组并计算行数的相关文章

Pandas read_sql 读取时更改大量 ID

我将 Oracle 数据库转移到 SQL Server 一切似乎都很顺利各种 ID 列都是很大的数字因此我不得不使用 Decimal 因为它们对于 BigInt 来说太大了我现在尝试使用 pandas read sql 使用 pyod
如何使用 pandas.to_excel() 创建 Excel **表格**？

Need the achieve this programmatically from a dataframe https learn microsoft com en us power bi service admin troublesh
如何在 Windows 上检查子进程是否被信号杀死

问题给定一个在 python 中启动的子进程其代码类似于 import subprocess p subprocess Popen command stdout subprocess PIPE stderr subprocess PIP
Scikit-learn：如何获得 True Positive、True Negative、False Positive 和 False Negative

我的问题我有一个数据集它是一个很大的 JSON 文件我读取它并将其存储在trainList多变的接下来我对其进行预处理以便能够使用它完成后我开始分类我用kfold交叉验证方法以获得平均值准确性并训练分类器我做出预测并获
匹配字典集。最优雅的解决方案。 Python

给定两个字典列表新的和旧的字典在两个列表中表示相同的对象我需要找到差异并生成新的字典列表其中仅包含新字典中的对象和旧字典中的更新属性例子 list new id 1 name bob desc cool guy id 2 name
优化 Django Queryset for 循环

如何优化以下查询集 link goal for link in self child links all 我想摆脱 for 循环并只访问数据库一次我有以下代码 class Goal models Model name models Cha
Django + 后台任务如何初始化

我有一个基本的 django 项目用作 Condor 计算集群的前端接口来生成模拟用户可以从 django 应用程序开始模拟在 Condor 中与仿真相关的元数据和仿真状态保存在数据库中我需要添加一个新功能某些模拟完成时发出通
这个 Python 字符串切片语句中的两个冒号的用途是什么？

例如 str hello str 1 3 我在 Python 文档中哪里可以找到它 in 序列描述 http docs python org library stdtypes html index 510 s i j k slice of
如何定期向数组添加新元素，使其出现在每 500 个元素之后？

如果我有一个包含 500k 个元素仅限数字的数组列我如何能够在每 500 个元素之后添加一个新元素新的数字应该是相邻元素的平均值例如在元素 499 和 500 之间有一个值为 499 的值 500 的值 2 的新元素依此类推
是否有像 python 的 issubclass 这样的东西，如果第一个参数不是类，它将返回 False？

我想要issubclass 1 str 返回 false 1不是的子类str 因为它根本不是一个类所以我收到了 TypeError 有没有一个好的方法来测试这个而不诉诸try except try if issubclass value
检查空查询集

我想确认这是否是检查空查询集的正确方法如果这就是为什么我会遇到 UNIQUE 约束错误 syn check Synonym objects filter MD objects get filter dict synonym type St
替换 Python 列表/字典中的值？

好的我正在尝试过滤传递给我的列表字典并稍微清理它因为其中有某些值我需要删除所以如果它看起来像这样 records key1 AAA key2 BBB key3 CCC key4 AAA 我如何快速轻松地运行所有内容并将 AAA
django 创建多类型用户的最佳方法

我想在 django 中创建多个用户我想知道哪种方法是最好的 class Teachers models Model user models ForeignKey User is teacher models BooleanField d
Django 模型表单中的必填字段

我有一个表格当我也不想要它们时会根据需要显示几个字段这是来自 models py 的表格 class CircuitForm ModelForm class Meta model Circuit exclude lastPaged d
在Python中将字符串转换为变量？ [复制]

这个问题在这里已经有答案了我对 python 和编程都很陌生并且已经尝试弄清楚如何做到这一点有一段时间了这是我需要帮助的内容 y 0 x 2 p01 hello p02 bye print p str y str x 输出当然是 p0
Python代码检测OS X El Capitan中的暗模式以更改状态栏菜单图标

我有目标 C 代码来检测暗模式以更改状态栏 NSDistributedNotificationCenter defaultCenter addObserver self selector selector darkModeChanged n
我可以在不同的计算机上使用相同的虚拟环境吗

在我的办公室电脑上我做了virtualenv one for rule them all在 Dropbox 文件夹中我想在工作和家庭中使用这个环境这可能吗目前我还没有成功考虑使用relocatablevirtualenv 的选项
AttributeError：模块“matplotlib”没有属性“font_manager”

我安装了 matplotlib 但 python 3 8 10 显示了这个错误 AttributeError module matplotlib has no attribute font manager What i am doing w
从 pandas 值序列创建 pandas 区间序列

我能找到的最接近的答案似乎太复杂如何在 pandas 中创建间隔列 https stackoverflow com a 47396828 575530 如果我有一个看起来像这样的 pandas 数据框 Value 6 12 56 60 1
无法让我的脚本自动生成一些值以在有效负载中使用

我创建了一个脚本通过随后发送两个 https 请求来从目标页面获取 html 元素我的脚本可以完美地完成这件事但是我必须从 chrome 开发工具复制四个值来填充其中的四个键payload为了发送最终的http请求到达目标页面这是

随机推荐

Android 地图性能因叠加层过多而变差？

我的 Android 应用程序中有一张地图显示了许多标记 20 50 但当我尝试滚动缩放时该应用程序的性能非常差在 Google Android 地图中我对披萨进行了示例搜索还发现了一些 20 50 个结果并且在缩放滚动时我
angular2：如何测试具有可观察时间间隔的组件

我有一个幻灯片放映组件它有一个幻灯片对象的输入数组并显示每个幻灯片对象只要它是在slide time其本身还有两个按钮单击它们必须滑动到下一个项目并重置计时器为了完成这项工作我使用如下 Observables a SUBJEC
即使使用 babel 插件，解构赋值在 IE 11 中也不起作用

我遇到了一种情况我添加了一个包含破坏性参数的中间件当在谷歌浏览器中打开时它工作正常但它在互联网浏览器中打开失败这是我的 webpack 配置文件 var path require path var webpack require
'KMeansModel' 对象在 apache pyspark 中没有属性 'computeCost'

我正在 pyspark 中试验聚类模型我试图获得适合不同 K 值的簇的均方成本 def meanScore k df inputCol df columns 38 assembler VectorAssembler inputCols i
在 directx 11 中一次渲染到多个纹理

我正在尝试使用 C directx 11 SDK 一次渲染到两个纹理我希望一个纹理包含结果图像的每个像素的颜色渲染 3D 场景时我通常在屏幕上看到的颜色另一个纹理包含每个像素的法线和深度 3 个浮点表示法线 1 个浮点表示法线为深度
PHP中计算cron下次运行时间

我正在我自己的个人框架中设计一个任务调度程序并试图避免不那么灵活的运行每个n分钟小时天的方法会更容易实现我想做的是模仿 cron 调度我有适当的函数来分割模式并计算下一个日期一个月中的某一天的下一个值目前但如果有比我正
如何在多线程应用程序中使用Hibernate？

我正在尝试将 Hibernate 用于多线程应用程序其中每个线程检索一个对象并尝试将其插入表中我的代码如下所示我每个线程都有本地休眠会话对象并且在每个 InsertData 中我执行 beginTransaction 和提交我面临
如何将复选框绑定到 mvc3 中的视图模型

我真的很难理解这个问题我有一个 UserModel 和一个 UserRoleModel public class UserModel Required Display Name User name public string UserNa
从 R Shiny renderTable 中排除行名称

我正在使用 R Shiny 包中的 renderTable 函数它返回一个包含行名称的表理想情况下我希望显示一个仅包含两列的表格一列代表月份一列代表值我当前获得的输出包括行名称我尝试了一些方法来排除行名称但没有成功有什
如何告诉 clang 我的 LLVM 目标应该使用 16 位“int”？

对于我的 PIC 后端我希望 int 为 16 位我我的目标如何告诉 clang int 的大小应该是多少仅定义 16 位寄存器似乎还不够目前 clang O2 emit llvm target pic 转换 int foo in
选项标签中的 html 标签

看来 html 标签无法插入选项标签中说
Hibernate SchemaFilterProvider获取Java实体名称

我希望 Hibernate 禁用某些类在启动时进行验证我的具体用例 spring jpa hibernate ddl auto validate Table name SAME TABLE public class Entity1 Col
OpenCV 2.1 托管 C++ (CLI/C++) 中的 cvSetMouseCallback

我的类名称是 HandMotionRecognition 我在鼠标回调中调用 getColorPixel 方法这是使用 Visual Studio 2010 的 OpenCV 项目类型是 c gt cli 处理鼠标事件的标准代码除非我弄
从 IBAction 以编程方式设置 UISwitch isOn 再次调用 IBAction

我刚刚注意到设置 UISwitchisOn在其 IBAction 中会导致再次调用 IBAction 所以下面的代码 class ViewController UIViewController var count 0 IBOutlet we
是否可以有一个从释放存储操作到不同线程中的存储的释放序列？

我知道线程 2 中的释放存储操作和线程 1 中的获取加载操作之间会出现同步关系即使该加载操作不直接读取线程 2 存储的值前提是有一个释放存储操作和实际读取的存储之间的释放顺序只要实际读取的存储与释放存储操作位于同一线程中在修改顺
在 Powershell 中运行 Start-Website 命令时出现“无法创建文件”错误

目前我正在尝试运行这个 powershell 脚本 Param websiteName physicalPath import module WebAdministration website get website where objec
在运行时清除日志文件：被另一个进程错误使用

我在我的应用程序中使用 Serilog 框架在我的应用程序中当日志文件大小达到 2MB 时我通过将现有文件从 file log 重命名为 file log bak 并创建新的 file log 来创建日志文件的备份在运行时我在读取
如何检测 React Native 应用程序何时关闭（而不是暂停）？

我到处都找过但找不到这个问题的答案我如何检测用户何时尝试关闭我的 React Native 应用程序如进程正在运行并且他们手动管理其应用程序并强制退出它我想在发生这种情况时添加注销功能但是找不到检测它的方法 AppState似乎
SQLCipher 与 DBFlow

我曾经使用过 DBFlow 它在数据库方面非常简单但我想问是否有一个很好的例子来将 SQLCipher 与 DBFlow 一起使用我已点击此链接寻求帮助 Raizlabs DBFlow https github com Raizlabs
Python Pandas 按小时对日期时间进行分组并计算行数

这是我的交易数据框其中每一行表示一个交易 date station 30 10 2017 15 20 A 30 10 2017 15 45 A 31 10 2017 07 10 A 31 10 2017 07 25 B 31 10 201

Python Pandas 按小时对日期时间进行分组并计算行数

Python Pandas 按小时对日期时间进行分组并计算行数 的相关文章

随机推荐

热门标签

Python Pandas 按小时对日期时间进行分组并计算行数的相关文章