我尝试了这个,但无法让它适用于我的数据:使用 Scikit Learn 对时间序列 pandas 数据框进行线性回归 https://stackoverflow.com/questions/29748717/use-scikit-learn-to-do-linear-regression-on-a-time-series-pandas-data-frame
我的数据由 2 个 DataFrame 组成。DataFrame_1.shape = (40,5000)
and DataFrame_2.shape = (40,74)
。我正在尝试进行某种类型的线性回归,但是DataFrame_2
包含NaN
缺少数据值。当我DataFrame_2.dropna(how="any")
形状下降到(2,74)
.
sklearn中有没有可以处理的线性回归算法NaN
values?
我在之后建模load_boston
from sklearn.datasets
where X,y = boston.data, boston.target = (506,13),(506,)
这是我的简化代码:
X = DataFrame_1
for col in DataFrame_2.columns:
y = DataFrame_2[col]
model = LinearRegression()
model.fit(X,y)
#ValueError: Input contains NaN, infinity or a value too large for dtype('float64').
我执行了上述格式以使形状与矩阵相匹配
如果发布DataFrame_2
如果有帮助,请在下面评论,我会添加它。