了解当我将模型中的类别变量传递给statsmodels
fit
将为类别自动生成虚拟变量。例如,如果我有一个变量“Location”,其值为“IndianOcean”、“Thailand”、“China”和“Mars”,我将在我的模型中获得以下形式的变量
Location[T.Thailand]
与未表示的值之一。默认情况下,排除的变量似乎是最不常见的变量。有没有办法指定(最好在模型规范内)哪个值被视为“基值”并被排除?
你可以通过一个reference
arg 到治疗对比,使用如下语法
"y ~ C(Location, Treatment(reference='China'))"
http://patsy.readthedocs.org/en/latest/API-reference.html#patsy.Treatment http://patsy.readthedocs.org/en/latest/API-reference.html#patsy.Treatment
如果您对命名约定有更好的建议,请向 patsy 提出问题。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)