所以我目前有一个名为的 DataFramedf
这些都不在了:
date tag
2011-02-18 12:57:00-07:00 A
2011-02-19 12:57:00-07:00 A
2011-03-18 12:57:00-07:00 B
2011-04-01 12:57:00-07:00 C
2011-05-19 12:57:00-07:00 Z
2011-06-03 12:57:00-07:00 A
2011-06-05 12:57:00-07:00 A
...
我正在尝试按标签和日期(年/月)进行 GroupBy,所以它看起来像:
date A B C Z
2011-02 2 0 0 0
2011-03 0 1 0 0
2011-04 0 0 1 0
2011-05 0 0 0 1
2011-06 2 0 0 0
...
我已经尝试过以下方法,但它并没有完全给我我想要的。
grouped_series = df.groupby([["%s-%s" % (d.year, d.month) for d in df.date], df.tag]).size()
我知道存在哪个标签等。任何帮助将不胜感激。
更新(对于展望未来的人):
最终保留日期时间,而不是字符串格式。相信我,这在绘图时会更好:
grouped_df = df.groupby([[ datetime.datetime(d.year, d.month, 1, 0, 0) for d in df.date], df.name]).size()
grouped_df = grouped_df.unstack().fillna(0)