我正在对两组数据 Y 和 X 执行 OLS。我使用 statsmodel.api.OLS。然而,无论我之前是否向 X 添加常量,我发现一些非常不同的结果。这是代码:
import statsmodels.api as sm
import numpy as np
mess = "SELECT .... FROM... WHERE ...."
data = np.array(db.extractData(mess))
Y = data[,:0]
X = data[,:1]
#Option1
res = sm.OLS(Y,X).fit().rsquared ---> will return 0.76
#Option2
X = sm.add_constant(X)
res = sm.OLS(Y,X).fit().rsquared ---> will return 0.06
考虑到是否添加常量所带来的巨大差异,我认为我做错了什么。非常感谢你花时间陪伴。
您需要添加常数。从文档中:http://www.statsmodels.org/devel/ generated/statsmodels.regression.linear_model.OLS.html http://www.statsmodels.org/devel/generated/statsmodels.regression.linear_model.OLS.html
An intercept is not included by default and should be added by the user. See statsmodels.tools.add_constant.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)