具有以下时间序列:
In [65]: p
Out[65]:
Date
2008-06-02 125.20
2008-06-03 124.47
2008-06-04 124.40
2008-06-05 126.89
2008-06-06 122.84
2008-06-09 123.14
2008-06-10 122.53
2008-06-11 120.73
2008-06-12 121.19
Name: SPY
我如何在特定日期 +/- 2 个相邻(营业)日进行切片,即如果 d = '2008-06-06':
-2 2008-06-04 124.40
-1 2008-06-05 126.89
0 2008-06-06 122.84
1 2008-06-09 123.14
2 2008-06-10 122.53
Pandas 内置了一些非常好的工作日功能,可以自动处理这个问题。对于这个确切的问题,实际上最终会需要更多的代码,但它会很容易地处理更一般的情况。
In [1]: ind = pd.date_range('2008-06-02', '2008-06-12', freq='B')
In [2]: p = pd.Series(np.random.random(len(ind)), index=ind)
In [3]: p
Out[3]:
2008-06-02 0.606132
2008-06-03 0.328327
2008-06-04 0.842873
2008-06-05 0.272547
2008-06-06 0.013640
2008-06-09 0.357935
2008-06-10 0.517029
2008-06-11 0.992851
2008-06-12 0.053158
Freq: B, dtype: float64
In [4]: t0 = pd.Timestamp('2008-6-6')
In [5]: from pandas.tseries import offsets
In [6]: delta = offsets.BDay(2)
这将创建两个工作日的抵消。您还可以对其他时间单位进行任意偏移,甚至可以对时间单位进行组合。现在有了起点和增量,您可以以标准方式智能切片:
In [7]: p[t0 - delta:t0 + delta]
Out[7]:
2008-06-04 0.842873
2008-06-05 0.272547
2008-06-06 0.013640
2008-06-09 0.357935
2008-06-10 0.517029
Freq: B, dtype: float64
这种方法的好处是间隔与行数无关。因此,举例来说,如果您有每小时的数据,可能还有一些缺失的点,您仍然可以以完全相同的方式捕获两个工作日。或者,如果您的数据源碰巧也有周末数据,但您仍然需要 +/- 2 个工作日。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)