我想重新采样 pandas 数据框并将不同的函数应用于不同的列。问题是我无法正确处理带有字符串的列。我想应用一个将字符串与分隔符(例如“ - ”)合并的函数。这是一个数据示例:
import pandas as pd
import numpy as np
idx = pd.date_range('2017-01-31', '2017-02-03')
data=list([[1,10,"ok"],[2,20,"merge"],[3,30,"us"]])
dates=pd.DatetimeIndex(['2017-01-31','2017-02-03','2017-02-03'])
d=pd.DataFrame(data, index=,columns=list('ABC'))
A B C
2017-01-31 1 10 ok
2017-02-03 2 20 merge
2017-02-03 3 30 us
使用总和和均值聚合器对数字列 A 和 B 进行重新采样是可行的。然而,C 列可以与 sum 一起使用(但它被放置在第二位,这可能意味着某些事情失败)。
d.resample('D').agg({'A': sum, 'B': np.mean, 'C': sum})
A C B
2017-01-31 1.0 a 10.0
2017-02-01 NaN 0 NaN
2017-02-02 NaN 0 NaN
2017-02-03 5.0 merge us 25.0
我想得到这个:
...
2017-02-03 5.0 merge - us 25.0
我尝试以不同的方式使用 lambda 但没有成功(未显示)。
如果我可以问第二个相关问题:我可以为此进行一些后处理,但是如何用零或“”填充不同列中缺失的单元格?