Python DataFrame 中 Timedelta 值的聚合

2024-01-10

我有一个大 DataFrame (df),如下所示:


  Acc_num date_diff
0   29  0:04:43
1   29  0:01:43
2   29  2:22:45
3   29  0:16:21
4   29  0:58:20
5   30  0:00:35
6   34  7:15:26
7   34  4:40:01
8   34  0:56:02
9   34  6:53:44
10  34  1:36:58
.....
Acc_num                    int64
date_diff        timedelta64[ns]
dtype: object
  

我需要计算每个帐号的“date_diff”平均值(以 timedelta 格式)。
df.date_diff.mean()工作正常。但是当我接下来尝试时:
df.groupby('Acc_num').date_diff.mean()它引发了一个异常:


"DataError: No numeric types to aggregate"  

我也尝试过df.pivot_table()方法,但没有取得任何成果。

有人可以帮我解决这个问题吗?先感谢您!


确实很奇怪的限制。但一个简单的解决方案是:

df.groupby('Acc_num').date_diff.agg(lambda g:g.sum()/g.count())

Edit:
如果您通过,Pandas 实际上会尝试聚合非数字列numeric_only=False

df.groupby('Acc_num').date_diff.mean(numeric_only=False)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python DataFrame 中 Timedelta 值的聚合 的相关文章

随机推荐