按列分组并找到每组的最小值和最大值

2024-02-11

我有以下数据集,

        Day    Element  Data_Value
6786    01-01   TMAX    112
9333    01-01   TMAX    101
9330    01-01   TMIN    60
11049   01-01   TMIN    0
6834    01-01   TMIN    25
11862   01-01   TMAX    113
1781    01-01   TMAX    115
11042   01-01   TMAX    105
1110    01-01   TMAX    111
651     01-01   TMIN    44
11350   01-01   TMIN    83
1798    01-02   TMAX    70
4975    01-02   TMAX    79
12774   01-02   TMIN    0
3977    01-02   TMIN    60
2485    01-02   TMAX    73
4888    01-02   TMIN    31
11836   01-02   TMIN    26
11368   01-02   TMAX    71
2483    01-02   TMIN    26

我想按天分组,然后找到 TMIN 的总体最小值和 TMAX 的最大值,并将它们放入数据框中,所以我得到如下输出:

Day    DayMin    DayMax
01-01  0         115
01-02  0         79

我知道我需要做的,

df.groupby(by='Day')

但我对下一步感到困惑 - 是否应该创建列来存储 TMAX 和 TMIN 值?


您可以使用assign + abs, 其次是groupby + agg:

df = (df.assign(Data_Value=df['Data_Value'].abs())
       .groupby(['Day'])['Data_Value'].agg([('Min' , 'min'), ('Max', 'max')])
       .add_prefix('Day'))

df 
       DayMin  DayMax
Day                  
01-01       0     115
01-02       0      79
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

按列分组并找到每组的最小值和最大值 的相关文章

随机推荐