我有一个 df 如下:
Store Spend_1 Spend_2 Spend_3 Spend_4 Variance_1 Variance_2 Variance_3 Variance_4
0 1 200 230 189 200 -14 16 -6 18
1 2 224 104 240 203 -17 -11 17 -18
2 3 220 168 131 210 10 -9 12 19
3 4 143 187 139 188 -1 -17 -20 -9
4 5 179 121 162 131 6 -25 5 20
5 6 208 158 140 191 16 -14 -22 -6
我正在尝试对列名称应用自定义排序以按如下方式排序:
Store Spend_1 Variance_1 Spend_2 Variance_2 Spend_3 Variance_3 Spend_4 Variance_4
0 1 200 -14 230 16 189 -6 200 18
1 2 224 -17 104 -11 240 17 203 -18
2 3 220 10 168 -9 131 12 210 19
3 4 143 -1 187 -17 139 -20 188 -9
4 5 179 6 121 -25 162 5 131 20
5 6 208 16 158 -14 140 -22 191 -6
我尝试过简单的sorted
但显然这适用于字母顺序,忽略末尾的整数。
我已经玩过enumerating
as number
, cols
the df.columns
将字符串更改为整数,应用排序,然后使用中的数字iloc
但我不确定如何应用自定义排序。
有人能帮忙吗?
想法就是使用key
参数由 2 个值组成 - 之后的值_
转换成inetegr
s 之前有第一个值_
,但解决方案适用于没有第一个的所有列df.columns[1:]
,所以最后添加第一列df.columns[:1].tolist()
:
cols = df.columns[:1].tolist() +sorted(df.columns[1:],
key=lambda x: (int(x.split('_')[1]), x.split('_')[0]))
df = df[cols]
print (df)
Store Spend_1 Variance_1 Spend_2 Variance_2 Spend_3 Variance_3 \
0 1 200 -14 230 16 189 -6
1 2 224 -17 104 -11 240 17
2 3 220 10 168 -9 131 12
3 4 143 -1 187 -17 139 -20
4 5 179 6 121 -25 162 5
5 6 208 16 158 -14 140 -22
Spend_4 Variance_4
0 200 18
1 203 -18
2 210 19
3 188 -9
4 131 20
5 191 -6
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)