我有一个大的 pandas 数据框,其中包含时间戳、名称和值列
index timestamp name value
0 1999-12-31 23:59:59.000107 A 16
1 1999-12-31 23:59:59.000385 B 12
2 1999-12-31 23:59:59.000404 C 25
3 1999-12-31 23:59:59.000704 B 15
4 1999-12-31 23:59:59.001281 A 300
5 1999-12-31 23:59:59.002211 C 20
6 1999-12-31 23:59:59.002367 C 3
我想按时间段(例如 20 毫秒或 20 分钟)和名称进行分组,并计算每组的平均值。
最有效的方式是什么?
您可以使用pd.Grouper
,但它要求您在索引上有时间戳。所以你可以尝试这样的事情:
df.set_index('timestamp').groupby([pd.Grouper(freq='20Min'), 'name']).mean()
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)