我正在尝试使用 Pandas (0.23.3) 计算 Series 对象的滚动自相关
设置示例:
dt_index = pd.date_range('2018-01-01','2018-02-01', freq = 'B')
data = np.random.rand(len(dt_index))
s = pd.Series(data, index = dt_index)
创建窗口大小 = 5 的滚动对象:
r = s.rolling(5)
Getting:
Rolling [window=5,center=False,axis=0]
现在,当我尝试计算相关性时(很确定这是错误的方法):
r.corr(other=r)
我只得到 NaN
我尝试了另一种基于文档: https://pandas.pydata.org/pandas-docs/stable/computation.html#computing-rolling-pairwise-covariances-and-correlations:
df = pd.DataFrame()
df['a'] = s
df['b'] = s.shift(-1)
df.rolling(window=5).corr()
得到类似的东西:
...
2018-03-01 a NaN NaN
b NaN NaN
真的不知道我哪里出了问题。任何帮助将不胜感激!该文档也使用 float64。认为这是因为相关性非常接近于零,所以显示为 NaN?有人提出了错误报告here https://github.com/pandas-dev/pandas/issues/18430,但我认为 jreback 在之前的错误修复中解决了该问题。
这是另一个相关答案,但它正在使用pd.rolling_apply https://pandas.pydata.org/pandas-docs/version/0.17.0/generated/pandas.rolling_apply.html,Pandas 0.23.3 版本似乎不支持?